JP2004192276A - 情報検索システム、情報検索装置、及びコンピュータプログラム - Google Patents
情報検索システム、情報検索装置、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2004192276A JP2004192276A JP2002358624A JP2002358624A JP2004192276A JP 2004192276 A JP2004192276 A JP 2004192276A JP 2002358624 A JP2002358624 A JP 2002358624A JP 2002358624 A JP2002358624 A JP 2002358624A JP 2004192276 A JP2004192276 A JP 2004192276A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search
- data
- character string
- layout
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】検索対象となったコンテンツページのレイアウトを保持した検索結果を送信することができる情報検索システム、情報検索装置、及びコンピュータプログラムの提供。
【解決手段】クライアントコンピュータから検索キーワードを受信した場合(S4)、検索サーバは、当該検索キーワードに対応付けられたコンテンツページに関する情報を検索データベースから検索し(S5)、検索結果ページのHTMLを取得する(S6)。そして、検索結果ページにクライアント側プログラムを埋込み(S7)、クライアントコンピュータへ送信する(S8)。クライアントコンピュータでは、クライアント側プログラムを実行することによって、キーワード周辺領域のHTMLに対する送信要求を行う。
【選択図】 図12
【解決手段】クライアントコンピュータから検索キーワードを受信した場合(S4)、検索サーバは、当該検索キーワードに対応付けられたコンテンツページに関する情報を検索データベースから検索し(S5)、検索結果ページのHTMLを取得する(S6)。そして、検索結果ページにクライアント側プログラムを埋込み(S7)、クライアントコンピュータへ送信する(S8)。クライアントコンピュータでは、クライアント側プログラムを実行することによって、キーワード周辺領域のHTMLに対する送信要求を行う。
【選択図】 図12
Description
【0001】
【発明の属する技術分野】
本発明は、コンテンツページのレイアウトを保持したまま検索結果を表示させることができる情報検索システム及び情報検索装置、並びに該情報検索装置を実現させるためのコンピュータプログラムに関する。
【0002】
【従来の技術】
現在、インターネット網を利用してテキストデータ、画像データ、映像データ、音楽データ等の様々なコンテンツを取得することができる。ユーザはコンテンツを取得するために、ウェブブラウザをインストールしてあるクライアントコンピュータを操作し、所望のコンテンツを提供するウェブサーバへアクセスする。具体的には、コンテンツを提供するコンテンツページのURL(Uniform Resource Locator)をウェブブラウザ上で直接入力するか、又は他のウェブページに貼られているリンクを選択することによって、コンテンツに対する送信要求を行う。
【0003】
ところで、インターネット網には数多くのウェブサーバが接続されている。これらのウェブサーバから提供されるコンテンツは多種多様なものであり、しかも膨大な数に上る。そこで、ユーザは所望のコンテンツを検索する際に検索サーバを利用することが多い。検索サーバでは、ウェブページのURLとキーワードとを関連付けた情報を蓄積したデータベースを有しており、ユーザが利用するクライアントコンピュータからの要求に応じて検索結果を提供するようにしている。すなわち、ユーザは検索サーバが提供する検索ページにおいて検索キーワードを入力し、検索サーバでは入力された検索キーワードに基づいてデータベースを検索し、該当するページの情報をユーザのクライアントコンピュータへ送信するようにしている。
検索サーバがクライアントコンピュータに送信するページの情報には、そのページのタイトル、URL、要約情報が含まれており(例えば、特許文献1参照)、ユーザはそれらの情報を活用して所望のコンテンツにたどり着くことができる。
【0004】
【特許文献1】
特開2001−297103号公報
【0005】
【発明が解決しようとする課題】
しかしながら、従来の検索サーバがクライアントコンピュータに対して提供する検索結果の情報は基本的にプレーンテキストで記述されており、表形式のスタイル、箇条書きのスタイル等はその表示メタファが失われることとなり、ユーザにとって非常に見づらい情報となっていた。
【0006】
そこで、このような問題点を解決するために、検索結果の項目となっている対象ページから、レイアウトに関する記述も含めて要約情報を抽出し、検索結果のページに表示することが考えられるが、これを実行するには以下の問題点を有している。
すなわち、検索サーバが検索結果をユーザが利用しているウェブブラウザに返すとき、一度にすべての結果項目の対象ページをHTTP(Hypertext TransferProtocol)により取得し、それらの要約情報を抽出して検索結果のページに挿入しようとすると、応答時間が長くなってしまうという問題点がある。
また、検索サーバに予め結果項目の対象ページを保存しておくことは、検索サーバの記憶容量を考慮した場合、現実的に不可能である。
更に、CSS(Cascading Style Sheets)のようなスタイルシートを定義している部分は、ウェブ文書中に散在しており、単純にタグを含めて抽出しただけでは必ずしも元のレイアウトを保持しているとは限らないという問題点を有している。
【0007】
本発明は斯かる事情に鑑みてなされたものであり、外部から検索要求を受信した場合、検索要求に関する文字列データを含んだ文書データを記憶した情報処理装置を検索し、検索した文書データに対する送信要求を行い、送信要求に基づいて情報処理装置から送信されたレイアウト情報を含む文書データを受信し、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを文書データと同一のレイアウトで表示させるために、文書データのレイアウト情報から部分レイアウト情報を生成し、抽出したデータ及び生成した部分レイアウト情報を検索要求の送信元へ送信する構成とすることにより、検索結果の一部を元の文書と同一のレイアウトで提供することができる情報検索システム、情報検索装置、及びコンピュータプログラムを提供することを目的とする。
【0008】
本発明の他の目的は、元の文書データから一部を抽出したデータ及び部分レイアウト情報を受信し、受信したデータを部分レイアウト情報に従い表示する構成とすることにより、検索結果の一部を元の文書と同一のレイアウトで表示させることができる情報検索システムを提供することにある。
【0009】
本発明の更に他の目的は、元の文書データが有するレイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含む構成とすることにより、検索結果の一部を元の文書と同一のレイアウトで提供し、その提供先で表示させることができる情報検索システム及び情報検索装置を提供することにある。
【0010】
【課題を解決するための手段】
第1発明に係る情報検索システムは、検索すべき文字列データの入力を受付け、受付けた文字列データに基づき検索要求情報を送信する第1情報処理装置と、該第1情報処理装置から送信された検索要求情報を受信した場合、前記文字列データを含む情報を検索し、検索した結果に係る情報を前記第1情報処理装置へ送信する第2情報処理装置とを備える情報検索システムにおいて、前記文字列データ及びレイアウト情報を含む文書データを記憶する手段と、前記文書データを外部へ送信する手段とを備える複数の第3情報処理装置を備え、前記第2情報処理装置は、複数の文字列データと各文字列データを含む文書データが記憶された複数の第3情報処理装置とを関連付けて記憶する記憶手段と、前記第1情報処理装置から送信された検索要求情報を受信した場合、前記検索要求情報に係る文字列データを含む文書データが記憶された第3情報処理装置を前記記憶手段から検索する手段と、前記文書データを送信すべき旨の送信要求情報を検索した第3情報処理装置へ送信する手段と、前記送信要求情報に基づいて前記第3情報処理装置から送信された文書データを受信する手段と、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成する手段とを備え、抽出したデータ及び生成した部分レイアウト情報を前記第1情報処理装置へ送信すべくなしてあることを特徴とする。
【0011】
第2発明に係る情報検索システムは、第1発明に係る情報検索システムにおいて、前記第1情報処理装置は、前記第2情報処理装置から送信されたデータ及び部分レイアウト情報を受信する手段と、受信したデータを前記部分レイアウト情報に従い表示する手段とを備えることを特徴とする。
【0012】
第3発明に係る情報検索システムは、第1発明又は第2発明に係る情報検索システムにおいて、前記レイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含むことを特徴とする。
【0013】
第4発明に係る情報検索装置は、文字列データに対する検索要求情報を外部から受信し、受信した検索要求情報に基づき前記文字列データを含む情報を検索する情報検索装置において、複数の情報処理装置へ接続可能になしてあり、複数の文字列データと各文字列データを含む文書データが記憶された複数の情報処理装置とを関連付けて記憶する記憶手段と、外部から検索要求情報を受信した場合、検索要求情報に係る文字列データを含む文書データが記憶された情報処理装置を前記記憶手段から検索する手段と、前記文書データを送信すべき旨の送信要求情報を検索した情報処理装置へ送信する手段と、前記送信要求情報に基づいて前記情報処理装置から送信された前記文字列データ及びレイアウト情報を含む文書データを受信する手段と、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成する手段と、抽出したデータ及び生成した部分レイアウト情報を前記検索要求情報の送信元へ送信する手段とを備えることを特徴とする。
【0014】
第5発明に係る情報検索装置は、第4発明に係る情報検索装置において、前記レイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含むことを特徴とする。
【0015】
第6発明に係るコンピュータプログラムは、コンピュータに、外部から受付けた文字列データに対する検索要求情報に基づき、前記文字列データを含む情報を検索させるステップを含むコンピュータプログラムにおいて、コンピュータに、文字列データと各文字列データを含む文書データが記憶された複数の情報処理装置とを関連付けて記憶する記憶手段から、検索要求情報に係る文字列データを含む文書データが記憶された情報処理装置を検索させるステップと、コンピュータに、前記文書データを送信すべき旨の送信要求情報を検索した情報処理装置へ送信させるステップと、コンピュータに、前記情報処理装置から受信した前記文字列データ及びレイアウト情報を含む文書データから前記文字列データを含む一部のデータを抽出させるステップと、コンピュータに、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成させるステップと、コンピュータに、抽出したデータ及び生成した部分レイアウト情報を前記検索要求情報の送信元へ送信させるステップとを有することを特徴とする。
【0016】
第1発明、第4発明、及び第6発明にあっては、外部から文字列データを検索キーワードとした検索要求を受けた場合、この文字列データを含んだ文書データを取得し、その文書データから前記文字列データを含んだ一部のデータを抽出し、抽出したデータを元の文書データと同一のレイアウトで表示するために部分レイアウト情報を生成し、生成した部分データを抽出したデータと共に検索要求元へ送信するようにしている。したがって、検索対象となった元の文書と同一のレイアウトで表示させることができる検索結果をユーザに提供することが可能となる。また、元の文書データは外部から取得するようにしているため、文書データそのものを記憶するスペースを確保する必要がない。
更に、検索対象となる文書データの要求、部分レイアウト情報の要求を逐次的に行うことによって、既存の検索サーバを利用した場合と比較しても、検索結果が得られるまでの応答時間を短縮することができる。
【0017】
第2発明にあっては、元の文書データから一部を抽出したデータ及び部分レイアウト情報を受信し、受信したデータを部分レイアウト情報に従い表示するようにしている。したがって、本発明の情報検索システムを利用して検索結果を受信した情報処理装置は、元の文書と同一のレイアウトで検索結果を表示させることが可能であり、ユーザにとって見やすい検索結果を提供することが可能となる。また、ユーザ側が利用している情報処理装置に特別な機能、プログラム等を付加することなく、元のレイアウトを保持させたまま表示させることが可能となる。
【0018】
第3発明及び第5発明にあっては、元の文書データが有するレイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含んでいるため、様々なレイアウト情報を取得して、元の文書と同一のレイアウトを有するデータを作成することが可能となる。
【0019】
【発明の実施の形態】
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
実施の形態1.
図1は本実施の形態に係る情報検索システムの概略構成を示す模式図である。図中100は、ユーザが利用するクライアントコンピュータ(以下、クライアント装置と称する)であり、クライアント装置100はインターネット網Nを介して検索サーバ200及びウェブサーバ300,300,…,300に接続されている。
【0020】
クライアント装置100は、具体的にはパーソナルコンピュータであり、CPU、ROM、RAM等を備え、CRTディスプレイ等の表示部、マウス、キーボード等の操作部、ハードディスク等の記憶部、回線終端装置等の通信部のような各種ハードウェア(不図示)を備える。記憶部には予めウェブブラウザがインストールされており、ウェブブラウザを利用することによって、ウェブサーバ300が提供するコンテンツページにアクセスし、テキストデータ、画像データ、映像データ、音楽データ等の各種コンテンツを取得することができるようになっている。
【0021】
また、クライアント装置100は、ウェブブラウザを利用して検索サーバ200に接続することもできる。検索サーバ200は、ウェブサーバ300,300,…,300が提供するコンテンツページを検索するためのウェブページ(検索ページ)を提供する。クライアント装置100から接続要求を受けた検索サーバ200は、検索ページのHTML(HTML : Hypertext Markup Language)を当該クライアント装置100へ送信する。
クライアント装置100は自身のウェブブラウザに検索ページを表示させ、1又は複数の検索キーワードの入力を受付ける。入力された検索キーワードは、検索サーバ200へ送信される。
検索サーバ200は、クライアント装置100から送信された検索キーワードに基づいて、当該検索キーワードを含むコンテンツページを検索データベース210から検索し、検索したコンテンツページのURL及び検索キーワード周辺のテキストデータを検索結果ページとしてクライアント装置100へ送信する。
【0022】
本実施の形態では、更に、検索対象となったコンテンツページから検索キーワードを含んだ領域(以下、キーワード周辺領域と称する)を抽出し、そのキーワード周辺領域のHTMLを前述の検索結果ページに挿入するようにしている。具体的には、検索サーバ200は、検索キーワードを含むコンテンツページと、そのレイアウトを定義するスタイルシートとをウェブサーバ300から取得して、元のコンテンツページと同じレイアウトでキーワード周辺領域を表示するためにスタイルシートから適当な階層のオブジェクト、タグ等を抽出する。そして、抽出したスタイルシートを埋込んだ検索キーワード周辺領域のHTMLを作成し、クライアント装置100へ送信して検索結果ページに挿入するようにしている。
このように本実施の形態では、検索結果をプレーンテキストで表示させるだけでなく、元のコンテンツページのレイアウトを保持させたまま表示させることができる。そのとき、コンテンツページ全体を表示するのではなく、検索キーワードを含んだ一部の領域のみ表示させるようにしており、検索に対する応答時間を短縮することが可能となる。
【0023】
図2は検索サーバ200の内部構成を示すブロック図である。検索サーバ200は、CPU201を備えており、バス202を介して、ROM203、RAM204、表示部205、操作部206、通信部207、補助記憶部208、及び記憶部209等の各種ハードウェアに接続されている。また、検索サーバ200には、複数の検索キーワードと、各検索キーワードが含まれるコンテンツページのURL及びプレーンテキストで記述されたコンテンツページの要約情報とが関連付けられて記憶されている検索データベース(検索DB)210が接続されている。
CPU201は、ROM203に格納された制御プログラムに従って、それらのハードウェアを制御する。RAM204は、SRAM又はフラッシュメモリ等で構成され、ROM203に格納された制御プログラムの実行時に発生するデータを記憶する。
【0024】
表示部205は、CRT、液晶ディスプレイ等の表示装置であり、操作部206は、キーボード、マウス等の入力装置である。表示部205及び操作部206は、例えば、前述の検索データベース210に記憶された内容を表示・更新する際に利用される。なお、クライアント装置を別途接続して、検索サーバ200を操作する構成である場合には必ずしも表示部205及び入力部206が備えられている必要はない。
【0025】
通信部207は、モデム等の回線終端装置を備えている。通信部207は、クライアント装置100から送信された検索ページの送信要求、検索キーワード等を受信するとともに、検索サーバ200が提供する検索ページ、検索結果ページをクライアント装置100へ送信する。通信部207では、このような各種情報の送受信の制御を行う。
【0026】
補助記憶部208は、本発明のコンピュータプログラム及びデータを記録したFD、CD−ROM等の記録媒体(不図示)からコンピュータプログラム及びデータを読取るFDドライブ、CD−ROMドライブ等からなり、読取られたコンピュータプログラム及びデータは、記憶部209に記憶される。記憶部209に記憶されているコンピュータプログラム及びデータはRAM204に読込まれ、CPU201が実行することで本発明の検索サーバ200として動作する。
なお、本発明のコンピュータプログラムは、記録媒体により提供されるだけでなく、通信回線を通じて提供される形態であってもよいことは勿論である。また、必ずしも検索サーバ200に外付けの検索データベース210を用意する必要はなく、記憶部209の記憶領域の一部を利用してデータベースを構築する構成であってもよい。
【0027】
図3は情報検索システムにおけるクライアント装置100、検索サーバ200、及びウェブサーバ300がそれぞれ実行する処理を説明する模式図である。
クライアント装置100では、検索サーバ200から提供される検索ページを自身のウェブブラウザ10に表示させ、1又は複数の検索キーワードの入力を受付ける。そして、入力された検索キーワードを検索サーバ200へ送信することによって検索要求を行う(処理(1))。
検索要求を受けた検索サーバ200は、受信した検索キーワードを検索データベース210から検索して、検索結果のウェブページをクライアント装置100へ送信する(処理(2))。この時点でクライアント装置100へ送信される検索結果ページには、検索キーワードを含むコンテンツページのURL、及び検索キーワードを含んだテキストデータが含まれている。すなわち、この時点でクライアント装置100のウェブブラウザ10に表示される検索結果ページは、従来の検索サーバを利用した検索結果を示しているに過ぎない。
本実施の形態では、検索結果ページをクライアント装置100に送信する際、クライアント装置100にて実行させるプログラム(以下、クライアント側プログラムという)を検索結果ページに埋込んで送信するようにしている。ここで、クライアント側プログラムは、検索結果ページ中に記述されたスクリプト、及び当該スクリプトにより呼出されるアプレットにより構成されており、クライアント装置100のウェブブラウザ10に検索結果ページが表示されたときに実行されるようにしている。
【0028】
クライアント装置100は、検索結果ページを従来と同様の表示形式にてウェブブラウザ10に表示させた後、検索キーワードを含んだコンテンツページの一部を検索結果ページに挿入させるために、キーワード周辺領域の要求を検索サーバ200に対して行う(処理(3))。このような要求は前述のクライアント側プログラムが実行されたときになされる。すなわち、検索結果ページがウェブブラウザ10に表示されたとき、検索結果ページに埋込まれたスクリプト及び当該スクリプトにより呼び出されるアプレットが実行され、このアプレットによってキーワード周辺領域に対する送信要求が実行される。
【0029】
キーワード周辺領域の送信要求を受けた検索サーバ200は、検索結果の対象ウェブサーバ300から検索キーワードを含んだコンテンツページを取得するためにHTTPリクエストを行う(処理(4))。このとき、検索サーバ200に予めインストールされたサーバ側プログラムが実行される。検索サーバ200がウェブサーバ300に対して行うリクエストの対象は、検索キーワードを含むコンテンツページのHTML、当該HTMLによりリンクされた画像ファイル、コンテンツページのレイアウトを定義するCSSファイル等である。
なお、ウェブサーバ300では、HTMLとは別にCSSファイルを用意してコンテンツページのレイアウトを定義する場合もあり、HTMLにCSSを埋込んでレイアウトを定義する場合もある。HTMLにCSSが埋込まれている場合には、CSSファイルを取得する必要はなく、検索サーバ200にて取得したHTMLからスタイルシートを展開する構成となる。
一般にHTMLとは別に用意するCSSは読込み型スタイルシートと呼ばれており、HTML中に記述するCSSは埋込み型スタイルシートと呼ばれている。本実施の形態ではどちらのスタイルシートを利用したコンテンツページにも対処することができる。
【0030】
HTTPリクエストを受けたウェブサーバ300は、リクエストに応じてコンテンツページのHTML、画像ファイル、CSSファイル等を検索サーバ200へ送信する(処理(5))。
検索サーバ200は、ウェブサーバ300から取得したHTMLを解析して、検索キーワードの周辺領域を抽出する。抽出対象は、検索キーワードを含んだオブジェクト、及び予め定めた階層の親オブジェクトを対象としている。抽出の際、オブジェクトのインライン型スタイルシートの属性値も同時に抽出する。
更に、検索サーバ200は、取得したHTML及びCSSファイルからスタイルシートの該当部分を抽出し、それを抽出した全てのオブジェクトについてインライン型スタイルシートとして埋込み、新たなHTMLを作成する。そして、作成したキーワード周辺領域のHTMLをクライアント装置100へ送信する(処理(6))。
【0031】
図4〜図6は、検索結果ページの表示例を示す模式図である。クライアント装置100にインストールされたウェブブラウザ10は、検索キーワードを入力するためのキーワード入力欄11、入力された検索キーワードを検索サーバ200へ送信する際に押下操作される検索ボタン12、コンテンツページの表示領域をスライドさせるスライドバー13等を備えている。
図4に示した例では、検索キーワードとして「セマンティックWeb」が入力され、検索ボタン12が押下操作された後、検索サーバ200から送信された検索結果ページが表示された状態を示している。
この時点でウェブブラウザ10に表示される検索結果は、該当コンテンツページのタイトル、検索キーワードを含む数行程度のプレーンテキスト、及び該当コンテンツページのURLを含むものであり、それらを1つの検索結果項目として1つ以上の検索結果項目をウェブブラウザ10上に表示する。図4は、1件目の検索結果項目14aと2件目の検索結果項目14bとが表示された状態を示している。3件目以降の検索結果項目がある場合はスライドバー13を利用して表示領域をスライドさせることによって表示させることができる。
【0032】
前述したように検索サーバ200から送信される検索結果ページには、クライアント装置100において実行させるクライアント側プログラムが埋込まれている。クライアント側プログラムが実行された場合、クライアント側プログラムから検索サーバ200に対してキーワード周辺領域の送信要求がなされる。キーワード周辺領域の送信要求を受けた検索サーバ200は、検索対象となったコンテンツページを提供するウェブサーバ300からコンテンツページのHTML、画像ファイル、CSSファイル等を取得して、元のコンテンツページと同一のレイアウトを持つキーワード周辺領域のHTMLを作成し、クライアント装置100へ送信する。
キーワード周辺領域の送信要求は各検索結果項目に対して逐次的になされる。各検索結果項目に対応したキーワード周辺領域のHTMLが検索サーバ200にて作成され、クライアント装置100へ送信され、各検索結果項目の下側に逐次的に挿入される。
図5では、図4に示した1件目の検索結果項目14aの下側に当該検索結果項目14aに対応したキーワード周辺領域15aを挿入して表示した状態を示しており、図6では、図4に示した2件目の検索結果項目14bの下側に当該検索結果項目14bに対応したキーワード周辺領域15bを挿入して表示した状態を示している。図5及び図6に示したように、検索結果項目14a,14bは基本的にプレーンテキストにより表示されているが、キーワード周辺領域15a,15bは、箇条書きのスタイル、表形式のスタイル、テキストの属性、画像データ等が取込まれて元のコンテンツページと同じレイアウトにより表示されている。
【0033】
なお、本実施の形態では、各検索結果項目14a,14b,…に対して、キーワード周辺領域15a,15b,…が逐次的に挿入される形態としたが、クライアント装置100のユーザが所望する検索結果項目に対してのみキーワード周辺領域を表示させる形態であってもよい。その場合、検索結果ページの各検索結果項目の近傍にキーワード周辺領域のHTMLを要求するためのボタンを設けておき、そのボタンがユーザによって押下操作された場合に、要求するようにすれば良い。
【0034】
図7及び図8は、コンテンツページのHTMLと検索サーバ200が作成するキーワード周辺領域のHTMLとの関係を説明する模式図である。
図7(a)はウェブサーバ300が提供するコンテンツページの一例を示している。すなわち、「マイワシ」という項目に対して、その解説項目を箇条書きのスタイルで表示したテキストのみからなるコンテンツページを示している。このコンテンツページのHTMLの一例を示したものが図7(b)であり、<DL>及び</DL>という1組のタグを利用することにより、両タグで囲まれる領域が箇条書きのスタイルで表示されることを定義している。そして、1つの大きな項目に対して<DT>というタグを付して記述し、その解説項目にはそれぞれ<DD>というタグを付して記述している。
【0035】
図7(b)に示したコンテンツページのHTMLに対し、図8は検索サーバ200が作成するキーワード周辺領域のHTMLの一例を示している。検索キーワードを「サビキ」とした場合、例えば従来では、図7(b)の破線で囲まれた領域からテキストのみを抽出して検索結果ページの1つの検索結果項目を作成する。一方、キーワード周辺領域を抽出する場合、破線で囲まれた領域からタグを含めて抽出したとしても、箇条書きのスタイルを定義する<DL>及び</DL>というタグが抽出されていないため、元のコンテンツページのレイアウトは保持されていない。そこで本実施の形態では、<DL>及び</DL>というタグを含めてキーワード周辺領域のHTMLを抽出する。
【0036】
具体的には、検索キーワード「サビキ」を含んだテキスト周辺のオブジェクト「<DD>様々な…がある。」、「<DD>冬は特に…うまい。」、及び「<DD>主にサビキで釣れる。」をオブジェクト集合として抽出するとともに、その親オブジェクトを特定する。親オブジェクトは、検索キーワードを含んだオブジェクトよりも上位の階層を含んだ部分であり、図7(b)の例では、「<DL>」、「<DT>マイワシ」、及び「</DL>」からなる部分である。そして、抽出したオブジェクト集合の前後に親オブジェクトを追加することによって、図8に示したようなキーワード周辺領域のHTMLを作成する。このような手法によりHTMLを作成することによって、元のコンテンツページが有していた箇条書きのスタイルを保持することができる。
なお、この例では、検索キーワードを含むオブジェクトに対して上位の層は1つしか無かったが、場合によっては複数の上位層が存在することがあり、どの階層までの親オブジェクトをとるかについては予め検索サーバ200の内部にて定めておく必要がある。
【0037】
図9はコンテンツページ及び埋込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。図9(a)はウェブサーバ300が提供するコンテンツページの一例を示している。このコンテンツページでは「Sample text 1」、「Sample text 2」、「Sample text 3」という各行のテキストをそれぞれフォント属性を変えて表示している。
1行目のテキストは例えば赤色で表示しており、2行目のテキストはフォントサイズを大きくして表示しており、3行目のテキストはフォントスタイルをイタリックにして表示している。
【0038】
図9(b)は、図9(a)に示したコンテンツページに対するHTMLの一例を示している。このHTMLでは、いわゆる埋込み型スタイルシートを利用しており、HTML中でオブジェクトのスタイルを定義している。
埋込み型スタイルシートでは、<STYLE>及び</STYLE>で囲まれるスタイル定義領域21内でスタイルが定義されており、ページ内容が記述されたページ内容記述領域22において、スタイル定義領域21内のスタイルが参照される。
スタイルの参照は、基本セレクタ、クラスセレクタ、IDセレクタ等を通じて行われる。図9(b)に示した例では、<H1>という基本セレクタを用いて「Sample text 1」のフォント色を定義しており、「.class1」というクラスセレクタを用いて「Sample text 2」のフォントサイズを定義しており、「#id1」というIDセレクタにより「Sample text 3」のフォントスタイルを定義している。
なお、スタイルシートにより定義できるスタイルは、フォントの属性に限定されるものではなく、文字の配置、文字の装飾、テキストの配置、テキストボックスのスタイル、オブジェクト同士の配置、テーブルの表示形式等を定義することができる。
【0039】
図10は読込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。図10(a)に示したHTMLでは、いわゆる読込み型スタイルシートを利用しており、図10(b)に示したCSSファイルを当該HTMLの中で読出すことによってコンテンツページのスタイルを定めている。図10(a)のHTML、及び図10(b)のスタイルシートにより表示されるコンテンツページは図9(a)に示したものと同じである。
読込み型スタイルシートでは、ページのヘッダ領域23においてリンク先のCSSファイルを指定しており、ページ内容記述領域24においてCSSファイルで定義されたスタイルが参照される。スタイルの参照は、埋込み型スタイルシートの場合と同様に基本セレクタ、クラスセレクタ、IDセレクタ等を通じて行われる。
【0040】
本実施の形態では、検索対象となったHTMLからキーワード周辺領域のHTMLを作成する。そのとき、埋込み型スタイルシート又は読込み型スタイルシートからインライン型スタイルシートへ展開される。
図11は、インライン型スタイルシートの一例を示す模式図である。インライン型スタイルシートでは、各オブジェクトの定義領域においてそのオブジェクトのみに有効なスタイルが定義される。例えば、図11に示した例では、「Sample text 1」というテキストのオブジェクトのみに有効なスタイルとして、フォントの色をそのオブジェクト内で定めている。他の2つのオブジェクトについても同様である。
【0041】
このようなインライン型スタイルシートの作成手順について以下に簡単に説明する。埋込み型スタイルシート、又は読込み型スタイルシートからインライン型スタイルシートを作成するには、スタイル定義領域21又はCSSファイル内のテキストを解析して、スタイルシートを適用する対象オブジェクトのセレクタと設定内容とを取得し、対象オブジェクトのタグ中に取得した設定内容を埋込む処理を実行する。
例えば、図9(b)に示した埋込み型スタイルシートを例に取った場合、基本セレクタ<H1>とその設定内容(color:red)とを読出しておき、HTML全体から<H1>を検索して、その中に対応するスタイルシートを埋込むようにしている。クラスセレクタ「.class1」、IDセレクタ「#id1」についても同様である。このような処理を行うことにより図11に示したようなスタイルシートが生成される。
【0042】
以下では、本実施の形態に係る情報検索システムにより実行される処理の手順について説明してゆく。
図12は、情報検索システムの処理手順を説明するフローチャートである。クライアント装置100は、検索サーバ200が提供する検索ページを自身のウェブブラウザ10に表示することによって、検索キーワードの入力を受付ける(ステップS1)。
そして、クライアント装置100は、検索実行の指示がなされたか否かを判断し(ステップS2)、検索実行の指示がない場合(S2:NO)、検索実行の指示があるまで待機する。検索実行指示の有無は、ウェブブラウザ10において検索ボタン12が押下操作されたか否かを判断することによって行う。
検索実行の指示があった場合(S2:YES)、入力された検索キーワードを検索サーバ200へ送信する(ステップS3)。
【0043】
検索サーバ200がクライアント装置100から送信された検索キーワードを受信した場合(ステップS4)、受信した検索キーワードに対応付けられているHTMLを検索データベース210から検索することにより検索処理を実行し(ステップS5)、検索結果ページのHTMLを取得する(ステップS6)。この時点で取得するHTMLは、図4に示したようなHTML、すなわち各検索結果項目について元のコンテンツページのレイアウトを保持するための情報を含んでいないHTMLである。
そして、検索サーバ200は、送信すべき検索結果ページにクライアント側プログラムのロード用スクリプトの埋込みを行う(ステップS7)。すなわち、クライアント装置100のブラウザにて当該スクリプトが実行された場合、所定のアプレットが実行されるようにスクリプト及びアプレットを検索結果ページに実装する。
次いで、検索サーバ200は、検索結果ページのHTMLをクライアント装置100へ送信する(ステップS8)。
【0044】
クライアント装置100にて検索結果ページのHTMLを受信した場合(ステップS9)、クライアント装置100は、受信したHTMLに基づいて検索結果ページをウェブブラウザ10に表示させるとともに、検索結果ページに埋込まれたクライアント側プログラムの実行処理を行い(ステップS10)、キーワード周辺領域のHTMLを取得する。
【0045】
図13〜図15は、クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
クライアント装置100のウェブブラウザ10にてクライアント側プログラムが実行された場合、クライアント側プログラムは、まず、検索結果ページに表示された複数の検索結果項目の中から1つの検索結果項目を選択し、対象コンテンツページのURLを取得する(ステップS11)。そして、取得したURLを検索サーバ200へ送信する(ステップS12)。
【0046】
検索サーバ200が、クライアント装置100から送信されたURLを受信した場合(ステップS13)、当該URLで指定されるコンテンツページをウェブサーバ300から取得するために、コンテンツページのHTMLに対する送信要求をウェブサーバ300へ送信する(ステップS14)。
ウェブサーバ300がコンテンツページのHTMLに対する送信要求を受信した場合(ステップS15)、コンテンツページのHTMLを検索サーバ200へ送信する(ステップS16)。
【0047】
検索サーバ200がコンテンツページのHTMLを受信した場合(ステップS17)、受信したHTMLからキーワード周辺領域を特定する(ステップS18)。次いで、検索サーバ200は、キーワード周辺領域を含むオブジェクト集合を抽出する(ステップS19)。オブジェクトを抽出するには、受信したHTMLにおいて検索キーワードの前にあるHTMLの開始タグと、検索キーワードの後にあるHTMLの終了タグとから判断することができる。但し、HTMLでは一のオブジェクトに含まれるテキストの中に他のオブジェクトを含めた記述方式が許されるため、テキスト中のオブジェクトの存在を無視する必要がある。本実施の形態では、検索キーワードの前を調べてゆくときに終了タグが検出された場合、その終了タグを含むオブジェクトを無視するようにしている。
【0048】
次いで、検索サーバ200は、抽出したオブジェクト集合に対して親オブジェクトを特定し(ステップS20)、特定した親オブジェクトをステップS19で抽出したオブジェクト集合の前後に追加する(ステップS21)。
【0049】
次いで、検索サーバ200は、元のコンテンツページのレイアウトに関する情報を取得するために、CSSファイルに対する送信要求をウェブサーバ300へ送信する(ステップS22)。なお、ステップS17にて受信したHTMLの中でCSSファイルが参照されている場合にのみ本処理を実行すれば足り、HTMLの中でレイアウトが定義されている場合、すなわち埋込み型スタイルシートを利用している場合には本処理を省略してもよい。
【0050】
ウェブサーバ300が、CSSファイルに対する送信要求を受信した場合(ステップS23)、先に送信したHTMLの中で参照されるCSSファイルを検索サーバ200へ送信する(ステップS24)。
【0051】
ウェブサーバ300から送信されたCSSファイルは、検索サーバ200によって受信される(ステップS25)。検索サーバ200は、受信したCSSファイルに基づいて、前述のオブジェクト集合に関する属性をインライン型スタイルシートへ展開し(ステップS26)、対応するHTMLを作成する(ステップS27)。なお、インライン型スタイルシートへの展開処理については、後に詳述することにする。
そして、作成したHTMLをクライアント装置100へ送信する(ステップS28)。
【0052】
クライアント装置100がHTMLを受信した場合(ステップS29)、該当する検索結果項目の下に受信したHTMLを埋込む(ステップS30)。そして、クライアント側プログラムは、全ての検索結果項目についてHTMLの埋込み処理が終了したか否かを判断し(ステップS31)、埋込みが終了していないと判断した場合(S31:NO)、処理をステップS11へ戻し、埋込みが終了したと判断した場合(S31:YES)、本ルーチンを終了する。
【0053】
図16は、インライン型スタイルシートへの展開処理の手順を説明するフローチャートである。
検索サーバ200は、ウェブサーバ300から受信したHTMLのヘッダ部分、又はCSSファイルからスタイルエレメントを特定する(ステップS41)。すなわち、埋込み型スタイルシートを利用しているHTMLでは、そのヘッダ部分からスタイルエレメントを特定し、読込み型スタイルシートを利用しているHTMLでは、そのHTMLにて参照されるCSSファイルからスタイルエレメントを特定する。
【0054】
次いで、検索サーバ200は、エレメント内のテキストからスタイル設定項目の数を算出し(ステップS42)、各スタイル設定項目での対象オブジェクトのセレクタ(基本セレクタ、クラスセレクタ、又はIDセレクタ)と設定内容とを記憶部209内に設けたスタイル設定リストに記憶させる(ステップS43)。
【0055】
次いで、スタイル設定リストを参照しながらオブジェクト集合のHTMLをパージングすることで対象オブジェクトのタグの位置を特定し(ステップS44)、タグ内でスタイル属性がオーバーライドされているか否かを判断する(ステップS45)。
スタイル設定リストを参照してスタイル属性がオーバーライドされていないと判断した場合(S45:NO)、スタイル設定リスト中の設定内容をタグの中に挿入する(ステップS46)。
スタイル属性がタグ内にオーバライドされている場合(S45:YES)、又はスタイル設定リスト中の設定内容をタグの中に挿入した場合(S46)、検索サーバ200は、最後までパージングしたか否かを判断し(ステップS47)、最後までパージングしていないと判断した場合(S47:NO)、処理をステップS44へ戻す。そして、最後までパージングしたと判断した場合(S47:YES)、本ルーチンを終了する。
【0056】
このように、本実施の形態に係る情報検索システムを利用した場合、元のコンテンツページと同一のレイアウトで検索結果を表示させることが可能であり、ユーザにとって見やすい検索結果を提供することが可能となる。また、ユーザが利用しているクライアント装置100に特別な機能、プログラム等を付加することなく、元のレイアウトを保持させたまま表示させることが可能となる。
【0057】
実施の形態2.
実施の形態1ではキーワード周辺領域のHTMLを検索サーバ200を介して取得していたが、前記HTMLをウェブサーバ300から取得し、そのHTLMからキーワード周辺領域のHTMLを抽出し、スタイルシートを展開するモジュールをクライアント側プログラムに置くことで、検索サーバ200を介することなく、キーワード周辺領域のHTMLを取得することも可能である。
【0058】
以下では、本実施の形態に係る情報検索システムについて説明する。なお、システムの構成は実施の形態1と全く同一であるため、説明を省略する。
図17は情報検索システムにおけるクライアント装置100、検索サーバ200、及びウェブサーバ300がそれぞれ実行する処理を説明する模式図である。
クライアント装置100では、検索サーバ200から提供される検索ページを自身のウェブブラウザ10に表示させ、1又は複数の検索キーワードの入力を受付ける。そして、入力された検索キーワードを検索サーバ200へ送信することによって検索要求を行う(処理(1))。
検索要求を受けた検索サーバ200は、受信した検索キーワードを検索データベース210から検索して、検索結果のウェブページ(検索結果ページ)をクライアント装置100へ送信する(処理(2))。この時点でクライアント装置100へ送信される検索結果ページには、検索キーワードを含むコンテンツページのURL、及び検索キーワードを含んだテキストデータが含まれている。
【0059】
クライアント装置100は、検索結果ページを従来と同様の表示形式にてウェブブラウザ10に表示させた後、検索キーワードを含んだコンテンツページの一部を検索結果ページに挿入させるために、HTTPリクエストをウェブサーバ300に対して行う(処理(3))。このような要求は前述のクライアント側プログラムが実行されたときになされる。すなわち、検索結果ページがウェブブラウザ10に表示されたとき、予めウェブブラウザ10に埋込まれたクライアント側プログラムが実行され、HTTPリクエストがなされる。
【0060】
HTTPリクエストを受けたウェブサーバ300は、リクエストに応じてコンテンツページのHTML、画像ファイル、CSSファイル等をクライアント装置100へ送信する(処理(4))。
クライアント装置100は、ウェブサーバ300から取得したHTMLを解析して、検索キーワードの周辺領域を抽出する。抽出対象は、検索キーワードを含んだオブジェクト、及び予め定めた階層の親オブジェクトを対象としている。抽出の際、オブジェクトのインライン型スタイルシートの属性値も同時に抽出する。
更に、クライアント装置100は、取得したHTML及びCSSファイルからスタイルシートの該当部分を抽出し、それを抽出した全てのオブジェクトについてインライン型スタイルシートとして埋込み、新たなHTMLを作成する。そして、作成したキーワード周辺領域のHTMLを検索結果ページに埋込む。
【0061】
図18は、情報検索システムの処理手順を説明するフローチャートである。クライアント装置100は、検索サーバ200が提供する検索ページを自身のウェブブラウザに表示することによって、検索キーワードの入力を受付ける(ステップS51)。
そして、クライアント装置100は、検索実行の指示がなされたか否かを判断し(ステップS52)、検索実行の指示がない場合(S52:NO)、検索実行の指示があるまで待機する。検索実行指示の有無は、ウェブブラウザ10において検索ボタン12が押下操作されたか否かを判断することによって行う。
検索実行の指示があった場合(S52:YES)、入力された検索キーワードを検索サーバ200へ送信する(ステップS53)。
【0062】
検索サーバ200がクライアント装置100から送信された検索キーワードを受信した場合(ステップS54)、受信した検索キーワードに対応付けられているHTMLを検索データベース210から検索することにより検索処理を実行し(ステップS55)、検索結果ページのHTMLを取得する。この時点で取得するHTMLは、図4に示したようなHTML、すなわち各検索結果項目について元のコンテンツページのレイアウトを保持するための情報を含んでいないHTMLである。
そして、検索サーバ200は、検索結果ページのHTMLをクライアント装置100へ送信する(ステップS56)。
【0063】
クライアント装置100にて検索結果ページのHTMLを受信した場合(ステップS57)、クライアント装置100は、受信したHTMLに基づいた検索結果ページをウェブブラウザ10に表示させるとともに、ウェブブラウザ10が予め備えるクライアント側プログラムの実行処理を行い(ステップS58)、キーワード周辺領域のHTMLを取得する。すなわち、クライアント側プログラムは、受信した検索結果のHTMLを解析して、直接ウェブサーバ300に検索対象のコンテンツページのHTML、画像データ、CSSファイル等の送信要求を行う。そして、ウェブサーバ300から送信されコンテンツページ等を利用してインライン型スタイルシートのHTMLを作成し、検索結果ページに埋込む処理を行う。
【0064】
本実施の形態では、ユーザが利用するウェブブラウザに予めクライアント側プログラムを埋め込んでおく必要があるが、実施の形態1と同様に、検索対象となった元のコンテンツページのレイアウトを保持した検索結果が得られる。
【0065】
【発明の効果】
以上、詳述したように、第1発明、第4発明、及び第6発明による場合は、外部から文字列データを検索キーワードとした検索要求を受けた場合、この文字列データを含んだ文書データを取得し、その文書データから前記文字列データを含んだ一部のデータを抽出し、抽出したデータを元の文書データと同一のレイアウトで表示するために部分レイアウト情報を生成し、生成した部分データを抽出したデータと共に検索要求元へ送信するようにしている。したがって、検索対象となった元の文書と同一のレイアウトで表示させることができる検索結果をユーザに提供することが可能となる。また、元の文書データは外部から取得するようにしているため、文書データそのものを記憶するスペースを確保する必要がない。
更に、検索対象となる文書データの要求、部分レイアウト情報の要求を逐次的に行うことによって、既存の検索サーバを利用した場合と比較しても、検索結果が得られるまでの応答時間を短縮することができる。
【0066】
第2発明による場合は、元の文書データから一部を抽出したデータ及び部分レイアウト情報を受信し、受信したデータを部分レイアウト情報に従い表示するようにしている。したがって、本発明の情報検索システムを利用して検索結果を受信した情報処理装置は、元の文書と同一のレイアウトで検索結果を表示させることが可能であり、ユーザにとって見やすい検索結果を提供することが可能となる。また、ユーザ側が利用している情報処理装置に特別な機能、プログラム等を付加することなく、元のレイアウトを保持させたまま表示させることが可能となる。
【0067】
第3発明及び第5発明による場合は、元の文書データが有するレイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含んでいるため、様々なレイアウト情報を取得して、元の文書と同一のレイアウトを有するデータを作成することが可能となる等、本発明は優れた効果を奏する。
【図面の簡単な説明】
【図1】本実施の形態に係る情報検索システムの概略構成を示す模式図である。
【図2】検索サーバの内部構成を示すブロック図である。
【図3】情報検索システムにおけるクライアント装置、検索サーバ、及びウェブサーバがそれぞれ実行する処理を説明する模式図である。
【図4】検索結果ページの表示例を示す模式図である。
【図5】検索結果ページの表示例を示す模式図である。
【図6】検索結果ページの表示例を示す模式図である。
【図7】コンテンツページのHTMLと検索サーバが作成するキーワード周辺領域のHTMLとの関係を説明する模式図である。
【図8】コンテンツページのHTMLと検索サーバが作成するキーワード周辺領域のHTMLとの関係を説明する模式図である。
【図9】コンテンツページ及び埋込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。
【図10】読込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。
【図11】インライン型スタイルシートの一例を示す模式図である。
【図12】情報検索システムの処理手順を説明するフローチャートである。
【図13】クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
【図14】クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
【図15】クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
【図16】インライン型スタイルシートへの展開処理の手順を説明するフローチャートである。
【図17】情報検索システムにおけるクライアント装置、検索サーバ、及びウェブサーバがそれぞれ実行する処理を説明する模式図である。
【図18】情報検索システムの処理手順を説明するフローチャートである。
【符号の説明】
100 クライアントコンピュータ
200 検索サーバ
201 CPU
202 バス
203 ROM
204 RAM
205 表示部
206 操作部
207 通信部
208 補助記憶部
209 記憶部
210 検索データベース
300 ウェブサーバ
N インターネット網
【発明の属する技術分野】
本発明は、コンテンツページのレイアウトを保持したまま検索結果を表示させることができる情報検索システム及び情報検索装置、並びに該情報検索装置を実現させるためのコンピュータプログラムに関する。
【0002】
【従来の技術】
現在、インターネット網を利用してテキストデータ、画像データ、映像データ、音楽データ等の様々なコンテンツを取得することができる。ユーザはコンテンツを取得するために、ウェブブラウザをインストールしてあるクライアントコンピュータを操作し、所望のコンテンツを提供するウェブサーバへアクセスする。具体的には、コンテンツを提供するコンテンツページのURL(Uniform Resource Locator)をウェブブラウザ上で直接入力するか、又は他のウェブページに貼られているリンクを選択することによって、コンテンツに対する送信要求を行う。
【0003】
ところで、インターネット網には数多くのウェブサーバが接続されている。これらのウェブサーバから提供されるコンテンツは多種多様なものであり、しかも膨大な数に上る。そこで、ユーザは所望のコンテンツを検索する際に検索サーバを利用することが多い。検索サーバでは、ウェブページのURLとキーワードとを関連付けた情報を蓄積したデータベースを有しており、ユーザが利用するクライアントコンピュータからの要求に応じて検索結果を提供するようにしている。すなわち、ユーザは検索サーバが提供する検索ページにおいて検索キーワードを入力し、検索サーバでは入力された検索キーワードに基づいてデータベースを検索し、該当するページの情報をユーザのクライアントコンピュータへ送信するようにしている。
検索サーバがクライアントコンピュータに送信するページの情報には、そのページのタイトル、URL、要約情報が含まれており(例えば、特許文献1参照)、ユーザはそれらの情報を活用して所望のコンテンツにたどり着くことができる。
【0004】
【特許文献1】
特開2001−297103号公報
【0005】
【発明が解決しようとする課題】
しかしながら、従来の検索サーバがクライアントコンピュータに対して提供する検索結果の情報は基本的にプレーンテキストで記述されており、表形式のスタイル、箇条書きのスタイル等はその表示メタファが失われることとなり、ユーザにとって非常に見づらい情報となっていた。
【0006】
そこで、このような問題点を解決するために、検索結果の項目となっている対象ページから、レイアウトに関する記述も含めて要約情報を抽出し、検索結果のページに表示することが考えられるが、これを実行するには以下の問題点を有している。
すなわち、検索サーバが検索結果をユーザが利用しているウェブブラウザに返すとき、一度にすべての結果項目の対象ページをHTTP(Hypertext TransferProtocol)により取得し、それらの要約情報を抽出して検索結果のページに挿入しようとすると、応答時間が長くなってしまうという問題点がある。
また、検索サーバに予め結果項目の対象ページを保存しておくことは、検索サーバの記憶容量を考慮した場合、現実的に不可能である。
更に、CSS(Cascading Style Sheets)のようなスタイルシートを定義している部分は、ウェブ文書中に散在しており、単純にタグを含めて抽出しただけでは必ずしも元のレイアウトを保持しているとは限らないという問題点を有している。
【0007】
本発明は斯かる事情に鑑みてなされたものであり、外部から検索要求を受信した場合、検索要求に関する文字列データを含んだ文書データを記憶した情報処理装置を検索し、検索した文書データに対する送信要求を行い、送信要求に基づいて情報処理装置から送信されたレイアウト情報を含む文書データを受信し、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを文書データと同一のレイアウトで表示させるために、文書データのレイアウト情報から部分レイアウト情報を生成し、抽出したデータ及び生成した部分レイアウト情報を検索要求の送信元へ送信する構成とすることにより、検索結果の一部を元の文書と同一のレイアウトで提供することができる情報検索システム、情報検索装置、及びコンピュータプログラムを提供することを目的とする。
【0008】
本発明の他の目的は、元の文書データから一部を抽出したデータ及び部分レイアウト情報を受信し、受信したデータを部分レイアウト情報に従い表示する構成とすることにより、検索結果の一部を元の文書と同一のレイアウトで表示させることができる情報検索システムを提供することにある。
【0009】
本発明の更に他の目的は、元の文書データが有するレイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含む構成とすることにより、検索結果の一部を元の文書と同一のレイアウトで提供し、その提供先で表示させることができる情報検索システム及び情報検索装置を提供することにある。
【0010】
【課題を解決するための手段】
第1発明に係る情報検索システムは、検索すべき文字列データの入力を受付け、受付けた文字列データに基づき検索要求情報を送信する第1情報処理装置と、該第1情報処理装置から送信された検索要求情報を受信した場合、前記文字列データを含む情報を検索し、検索した結果に係る情報を前記第1情報処理装置へ送信する第2情報処理装置とを備える情報検索システムにおいて、前記文字列データ及びレイアウト情報を含む文書データを記憶する手段と、前記文書データを外部へ送信する手段とを備える複数の第3情報処理装置を備え、前記第2情報処理装置は、複数の文字列データと各文字列データを含む文書データが記憶された複数の第3情報処理装置とを関連付けて記憶する記憶手段と、前記第1情報処理装置から送信された検索要求情報を受信した場合、前記検索要求情報に係る文字列データを含む文書データが記憶された第3情報処理装置を前記記憶手段から検索する手段と、前記文書データを送信すべき旨の送信要求情報を検索した第3情報処理装置へ送信する手段と、前記送信要求情報に基づいて前記第3情報処理装置から送信された文書データを受信する手段と、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成する手段とを備え、抽出したデータ及び生成した部分レイアウト情報を前記第1情報処理装置へ送信すべくなしてあることを特徴とする。
【0011】
第2発明に係る情報検索システムは、第1発明に係る情報検索システムにおいて、前記第1情報処理装置は、前記第2情報処理装置から送信されたデータ及び部分レイアウト情報を受信する手段と、受信したデータを前記部分レイアウト情報に従い表示する手段とを備えることを特徴とする。
【0012】
第3発明に係る情報検索システムは、第1発明又は第2発明に係る情報検索システムにおいて、前記レイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含むことを特徴とする。
【0013】
第4発明に係る情報検索装置は、文字列データに対する検索要求情報を外部から受信し、受信した検索要求情報に基づき前記文字列データを含む情報を検索する情報検索装置において、複数の情報処理装置へ接続可能になしてあり、複数の文字列データと各文字列データを含む文書データが記憶された複数の情報処理装置とを関連付けて記憶する記憶手段と、外部から検索要求情報を受信した場合、検索要求情報に係る文字列データを含む文書データが記憶された情報処理装置を前記記憶手段から検索する手段と、前記文書データを送信すべき旨の送信要求情報を検索した情報処理装置へ送信する手段と、前記送信要求情報に基づいて前記情報処理装置から送信された前記文字列データ及びレイアウト情報を含む文書データを受信する手段と、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成する手段と、抽出したデータ及び生成した部分レイアウト情報を前記検索要求情報の送信元へ送信する手段とを備えることを特徴とする。
【0014】
第5発明に係る情報検索装置は、第4発明に係る情報検索装置において、前記レイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含むことを特徴とする。
【0015】
第6発明に係るコンピュータプログラムは、コンピュータに、外部から受付けた文字列データに対する検索要求情報に基づき、前記文字列データを含む情報を検索させるステップを含むコンピュータプログラムにおいて、コンピュータに、文字列データと各文字列データを含む文書データが記憶された複数の情報処理装置とを関連付けて記憶する記憶手段から、検索要求情報に係る文字列データを含む文書データが記憶された情報処理装置を検索させるステップと、コンピュータに、前記文書データを送信すべき旨の送信要求情報を検索した情報処理装置へ送信させるステップと、コンピュータに、前記情報処理装置から受信した前記文字列データ及びレイアウト情報を含む文書データから前記文字列データを含む一部のデータを抽出させるステップと、コンピュータに、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成させるステップと、コンピュータに、抽出したデータ及び生成した部分レイアウト情報を前記検索要求情報の送信元へ送信させるステップとを有することを特徴とする。
【0016】
第1発明、第4発明、及び第6発明にあっては、外部から文字列データを検索キーワードとした検索要求を受けた場合、この文字列データを含んだ文書データを取得し、その文書データから前記文字列データを含んだ一部のデータを抽出し、抽出したデータを元の文書データと同一のレイアウトで表示するために部分レイアウト情報を生成し、生成した部分データを抽出したデータと共に検索要求元へ送信するようにしている。したがって、検索対象となった元の文書と同一のレイアウトで表示させることができる検索結果をユーザに提供することが可能となる。また、元の文書データは外部から取得するようにしているため、文書データそのものを記憶するスペースを確保する必要がない。
更に、検索対象となる文書データの要求、部分レイアウト情報の要求を逐次的に行うことによって、既存の検索サーバを利用した場合と比較しても、検索結果が得られるまでの応答時間を短縮することができる。
【0017】
第2発明にあっては、元の文書データから一部を抽出したデータ及び部分レイアウト情報を受信し、受信したデータを部分レイアウト情報に従い表示するようにしている。したがって、本発明の情報検索システムを利用して検索結果を受信した情報処理装置は、元の文書と同一のレイアウトで検索結果を表示させることが可能であり、ユーザにとって見やすい検索結果を提供することが可能となる。また、ユーザ側が利用している情報処理装置に特別な機能、プログラム等を付加することなく、元のレイアウトを保持させたまま表示させることが可能となる。
【0018】
第3発明及び第5発明にあっては、元の文書データが有するレイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含んでいるため、様々なレイアウト情報を取得して、元の文書と同一のレイアウトを有するデータを作成することが可能となる。
【0019】
【発明の実施の形態】
以下、本発明をその実施の形態を示す図面に基づいて具体的に説明する。
実施の形態1.
図1は本実施の形態に係る情報検索システムの概略構成を示す模式図である。図中100は、ユーザが利用するクライアントコンピュータ(以下、クライアント装置と称する)であり、クライアント装置100はインターネット網Nを介して検索サーバ200及びウェブサーバ300,300,…,300に接続されている。
【0020】
クライアント装置100は、具体的にはパーソナルコンピュータであり、CPU、ROM、RAM等を備え、CRTディスプレイ等の表示部、マウス、キーボード等の操作部、ハードディスク等の記憶部、回線終端装置等の通信部のような各種ハードウェア(不図示)を備える。記憶部には予めウェブブラウザがインストールされており、ウェブブラウザを利用することによって、ウェブサーバ300が提供するコンテンツページにアクセスし、テキストデータ、画像データ、映像データ、音楽データ等の各種コンテンツを取得することができるようになっている。
【0021】
また、クライアント装置100は、ウェブブラウザを利用して検索サーバ200に接続することもできる。検索サーバ200は、ウェブサーバ300,300,…,300が提供するコンテンツページを検索するためのウェブページ(検索ページ)を提供する。クライアント装置100から接続要求を受けた検索サーバ200は、検索ページのHTML(HTML : Hypertext Markup Language)を当該クライアント装置100へ送信する。
クライアント装置100は自身のウェブブラウザに検索ページを表示させ、1又は複数の検索キーワードの入力を受付ける。入力された検索キーワードは、検索サーバ200へ送信される。
検索サーバ200は、クライアント装置100から送信された検索キーワードに基づいて、当該検索キーワードを含むコンテンツページを検索データベース210から検索し、検索したコンテンツページのURL及び検索キーワード周辺のテキストデータを検索結果ページとしてクライアント装置100へ送信する。
【0022】
本実施の形態では、更に、検索対象となったコンテンツページから検索キーワードを含んだ領域(以下、キーワード周辺領域と称する)を抽出し、そのキーワード周辺領域のHTMLを前述の検索結果ページに挿入するようにしている。具体的には、検索サーバ200は、検索キーワードを含むコンテンツページと、そのレイアウトを定義するスタイルシートとをウェブサーバ300から取得して、元のコンテンツページと同じレイアウトでキーワード周辺領域を表示するためにスタイルシートから適当な階層のオブジェクト、タグ等を抽出する。そして、抽出したスタイルシートを埋込んだ検索キーワード周辺領域のHTMLを作成し、クライアント装置100へ送信して検索結果ページに挿入するようにしている。
このように本実施の形態では、検索結果をプレーンテキストで表示させるだけでなく、元のコンテンツページのレイアウトを保持させたまま表示させることができる。そのとき、コンテンツページ全体を表示するのではなく、検索キーワードを含んだ一部の領域のみ表示させるようにしており、検索に対する応答時間を短縮することが可能となる。
【0023】
図2は検索サーバ200の内部構成を示すブロック図である。検索サーバ200は、CPU201を備えており、バス202を介して、ROM203、RAM204、表示部205、操作部206、通信部207、補助記憶部208、及び記憶部209等の各種ハードウェアに接続されている。また、検索サーバ200には、複数の検索キーワードと、各検索キーワードが含まれるコンテンツページのURL及びプレーンテキストで記述されたコンテンツページの要約情報とが関連付けられて記憶されている検索データベース(検索DB)210が接続されている。
CPU201は、ROM203に格納された制御プログラムに従って、それらのハードウェアを制御する。RAM204は、SRAM又はフラッシュメモリ等で構成され、ROM203に格納された制御プログラムの実行時に発生するデータを記憶する。
【0024】
表示部205は、CRT、液晶ディスプレイ等の表示装置であり、操作部206は、キーボード、マウス等の入力装置である。表示部205及び操作部206は、例えば、前述の検索データベース210に記憶された内容を表示・更新する際に利用される。なお、クライアント装置を別途接続して、検索サーバ200を操作する構成である場合には必ずしも表示部205及び入力部206が備えられている必要はない。
【0025】
通信部207は、モデム等の回線終端装置を備えている。通信部207は、クライアント装置100から送信された検索ページの送信要求、検索キーワード等を受信するとともに、検索サーバ200が提供する検索ページ、検索結果ページをクライアント装置100へ送信する。通信部207では、このような各種情報の送受信の制御を行う。
【0026】
補助記憶部208は、本発明のコンピュータプログラム及びデータを記録したFD、CD−ROM等の記録媒体(不図示)からコンピュータプログラム及びデータを読取るFDドライブ、CD−ROMドライブ等からなり、読取られたコンピュータプログラム及びデータは、記憶部209に記憶される。記憶部209に記憶されているコンピュータプログラム及びデータはRAM204に読込まれ、CPU201が実行することで本発明の検索サーバ200として動作する。
なお、本発明のコンピュータプログラムは、記録媒体により提供されるだけでなく、通信回線を通じて提供される形態であってもよいことは勿論である。また、必ずしも検索サーバ200に外付けの検索データベース210を用意する必要はなく、記憶部209の記憶領域の一部を利用してデータベースを構築する構成であってもよい。
【0027】
図3は情報検索システムにおけるクライアント装置100、検索サーバ200、及びウェブサーバ300がそれぞれ実行する処理を説明する模式図である。
クライアント装置100では、検索サーバ200から提供される検索ページを自身のウェブブラウザ10に表示させ、1又は複数の検索キーワードの入力を受付ける。そして、入力された検索キーワードを検索サーバ200へ送信することによって検索要求を行う(処理(1))。
検索要求を受けた検索サーバ200は、受信した検索キーワードを検索データベース210から検索して、検索結果のウェブページをクライアント装置100へ送信する(処理(2))。この時点でクライアント装置100へ送信される検索結果ページには、検索キーワードを含むコンテンツページのURL、及び検索キーワードを含んだテキストデータが含まれている。すなわち、この時点でクライアント装置100のウェブブラウザ10に表示される検索結果ページは、従来の検索サーバを利用した検索結果を示しているに過ぎない。
本実施の形態では、検索結果ページをクライアント装置100に送信する際、クライアント装置100にて実行させるプログラム(以下、クライアント側プログラムという)を検索結果ページに埋込んで送信するようにしている。ここで、クライアント側プログラムは、検索結果ページ中に記述されたスクリプト、及び当該スクリプトにより呼出されるアプレットにより構成されており、クライアント装置100のウェブブラウザ10に検索結果ページが表示されたときに実行されるようにしている。
【0028】
クライアント装置100は、検索結果ページを従来と同様の表示形式にてウェブブラウザ10に表示させた後、検索キーワードを含んだコンテンツページの一部を検索結果ページに挿入させるために、キーワード周辺領域の要求を検索サーバ200に対して行う(処理(3))。このような要求は前述のクライアント側プログラムが実行されたときになされる。すなわち、検索結果ページがウェブブラウザ10に表示されたとき、検索結果ページに埋込まれたスクリプト及び当該スクリプトにより呼び出されるアプレットが実行され、このアプレットによってキーワード周辺領域に対する送信要求が実行される。
【0029】
キーワード周辺領域の送信要求を受けた検索サーバ200は、検索結果の対象ウェブサーバ300から検索キーワードを含んだコンテンツページを取得するためにHTTPリクエストを行う(処理(4))。このとき、検索サーバ200に予めインストールされたサーバ側プログラムが実行される。検索サーバ200がウェブサーバ300に対して行うリクエストの対象は、検索キーワードを含むコンテンツページのHTML、当該HTMLによりリンクされた画像ファイル、コンテンツページのレイアウトを定義するCSSファイル等である。
なお、ウェブサーバ300では、HTMLとは別にCSSファイルを用意してコンテンツページのレイアウトを定義する場合もあり、HTMLにCSSを埋込んでレイアウトを定義する場合もある。HTMLにCSSが埋込まれている場合には、CSSファイルを取得する必要はなく、検索サーバ200にて取得したHTMLからスタイルシートを展開する構成となる。
一般にHTMLとは別に用意するCSSは読込み型スタイルシートと呼ばれており、HTML中に記述するCSSは埋込み型スタイルシートと呼ばれている。本実施の形態ではどちらのスタイルシートを利用したコンテンツページにも対処することができる。
【0030】
HTTPリクエストを受けたウェブサーバ300は、リクエストに応じてコンテンツページのHTML、画像ファイル、CSSファイル等を検索サーバ200へ送信する(処理(5))。
検索サーバ200は、ウェブサーバ300から取得したHTMLを解析して、検索キーワードの周辺領域を抽出する。抽出対象は、検索キーワードを含んだオブジェクト、及び予め定めた階層の親オブジェクトを対象としている。抽出の際、オブジェクトのインライン型スタイルシートの属性値も同時に抽出する。
更に、検索サーバ200は、取得したHTML及びCSSファイルからスタイルシートの該当部分を抽出し、それを抽出した全てのオブジェクトについてインライン型スタイルシートとして埋込み、新たなHTMLを作成する。そして、作成したキーワード周辺領域のHTMLをクライアント装置100へ送信する(処理(6))。
【0031】
図4〜図6は、検索結果ページの表示例を示す模式図である。クライアント装置100にインストールされたウェブブラウザ10は、検索キーワードを入力するためのキーワード入力欄11、入力された検索キーワードを検索サーバ200へ送信する際に押下操作される検索ボタン12、コンテンツページの表示領域をスライドさせるスライドバー13等を備えている。
図4に示した例では、検索キーワードとして「セマンティックWeb」が入力され、検索ボタン12が押下操作された後、検索サーバ200から送信された検索結果ページが表示された状態を示している。
この時点でウェブブラウザ10に表示される検索結果は、該当コンテンツページのタイトル、検索キーワードを含む数行程度のプレーンテキスト、及び該当コンテンツページのURLを含むものであり、それらを1つの検索結果項目として1つ以上の検索結果項目をウェブブラウザ10上に表示する。図4は、1件目の検索結果項目14aと2件目の検索結果項目14bとが表示された状態を示している。3件目以降の検索結果項目がある場合はスライドバー13を利用して表示領域をスライドさせることによって表示させることができる。
【0032】
前述したように検索サーバ200から送信される検索結果ページには、クライアント装置100において実行させるクライアント側プログラムが埋込まれている。クライアント側プログラムが実行された場合、クライアント側プログラムから検索サーバ200に対してキーワード周辺領域の送信要求がなされる。キーワード周辺領域の送信要求を受けた検索サーバ200は、検索対象となったコンテンツページを提供するウェブサーバ300からコンテンツページのHTML、画像ファイル、CSSファイル等を取得して、元のコンテンツページと同一のレイアウトを持つキーワード周辺領域のHTMLを作成し、クライアント装置100へ送信する。
キーワード周辺領域の送信要求は各検索結果項目に対して逐次的になされる。各検索結果項目に対応したキーワード周辺領域のHTMLが検索サーバ200にて作成され、クライアント装置100へ送信され、各検索結果項目の下側に逐次的に挿入される。
図5では、図4に示した1件目の検索結果項目14aの下側に当該検索結果項目14aに対応したキーワード周辺領域15aを挿入して表示した状態を示しており、図6では、図4に示した2件目の検索結果項目14bの下側に当該検索結果項目14bに対応したキーワード周辺領域15bを挿入して表示した状態を示している。図5及び図6に示したように、検索結果項目14a,14bは基本的にプレーンテキストにより表示されているが、キーワード周辺領域15a,15bは、箇条書きのスタイル、表形式のスタイル、テキストの属性、画像データ等が取込まれて元のコンテンツページと同じレイアウトにより表示されている。
【0033】
なお、本実施の形態では、各検索結果項目14a,14b,…に対して、キーワード周辺領域15a,15b,…が逐次的に挿入される形態としたが、クライアント装置100のユーザが所望する検索結果項目に対してのみキーワード周辺領域を表示させる形態であってもよい。その場合、検索結果ページの各検索結果項目の近傍にキーワード周辺領域のHTMLを要求するためのボタンを設けておき、そのボタンがユーザによって押下操作された場合に、要求するようにすれば良い。
【0034】
図7及び図8は、コンテンツページのHTMLと検索サーバ200が作成するキーワード周辺領域のHTMLとの関係を説明する模式図である。
図7(a)はウェブサーバ300が提供するコンテンツページの一例を示している。すなわち、「マイワシ」という項目に対して、その解説項目を箇条書きのスタイルで表示したテキストのみからなるコンテンツページを示している。このコンテンツページのHTMLの一例を示したものが図7(b)であり、<DL>及び</DL>という1組のタグを利用することにより、両タグで囲まれる領域が箇条書きのスタイルで表示されることを定義している。そして、1つの大きな項目に対して<DT>というタグを付して記述し、その解説項目にはそれぞれ<DD>というタグを付して記述している。
【0035】
図7(b)に示したコンテンツページのHTMLに対し、図8は検索サーバ200が作成するキーワード周辺領域のHTMLの一例を示している。検索キーワードを「サビキ」とした場合、例えば従来では、図7(b)の破線で囲まれた領域からテキストのみを抽出して検索結果ページの1つの検索結果項目を作成する。一方、キーワード周辺領域を抽出する場合、破線で囲まれた領域からタグを含めて抽出したとしても、箇条書きのスタイルを定義する<DL>及び</DL>というタグが抽出されていないため、元のコンテンツページのレイアウトは保持されていない。そこで本実施の形態では、<DL>及び</DL>というタグを含めてキーワード周辺領域のHTMLを抽出する。
【0036】
具体的には、検索キーワード「サビキ」を含んだテキスト周辺のオブジェクト「<DD>様々な…がある。」、「<DD>冬は特に…うまい。」、及び「<DD>主にサビキで釣れる。」をオブジェクト集合として抽出するとともに、その親オブジェクトを特定する。親オブジェクトは、検索キーワードを含んだオブジェクトよりも上位の階層を含んだ部分であり、図7(b)の例では、「<DL>」、「<DT>マイワシ」、及び「</DL>」からなる部分である。そして、抽出したオブジェクト集合の前後に親オブジェクトを追加することによって、図8に示したようなキーワード周辺領域のHTMLを作成する。このような手法によりHTMLを作成することによって、元のコンテンツページが有していた箇条書きのスタイルを保持することができる。
なお、この例では、検索キーワードを含むオブジェクトに対して上位の層は1つしか無かったが、場合によっては複数の上位層が存在することがあり、どの階層までの親オブジェクトをとるかについては予め検索サーバ200の内部にて定めておく必要がある。
【0037】
図9はコンテンツページ及び埋込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。図9(a)はウェブサーバ300が提供するコンテンツページの一例を示している。このコンテンツページでは「Sample text 1」、「Sample text 2」、「Sample text 3」という各行のテキストをそれぞれフォント属性を変えて表示している。
1行目のテキストは例えば赤色で表示しており、2行目のテキストはフォントサイズを大きくして表示しており、3行目のテキストはフォントスタイルをイタリックにして表示している。
【0038】
図9(b)は、図9(a)に示したコンテンツページに対するHTMLの一例を示している。このHTMLでは、いわゆる埋込み型スタイルシートを利用しており、HTML中でオブジェクトのスタイルを定義している。
埋込み型スタイルシートでは、<STYLE>及び</STYLE>で囲まれるスタイル定義領域21内でスタイルが定義されており、ページ内容が記述されたページ内容記述領域22において、スタイル定義領域21内のスタイルが参照される。
スタイルの参照は、基本セレクタ、クラスセレクタ、IDセレクタ等を通じて行われる。図9(b)に示した例では、<H1>という基本セレクタを用いて「Sample text 1」のフォント色を定義しており、「.class1」というクラスセレクタを用いて「Sample text 2」のフォントサイズを定義しており、「#id1」というIDセレクタにより「Sample text 3」のフォントスタイルを定義している。
なお、スタイルシートにより定義できるスタイルは、フォントの属性に限定されるものではなく、文字の配置、文字の装飾、テキストの配置、テキストボックスのスタイル、オブジェクト同士の配置、テーブルの表示形式等を定義することができる。
【0039】
図10は読込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。図10(a)に示したHTMLでは、いわゆる読込み型スタイルシートを利用しており、図10(b)に示したCSSファイルを当該HTMLの中で読出すことによってコンテンツページのスタイルを定めている。図10(a)のHTML、及び図10(b)のスタイルシートにより表示されるコンテンツページは図9(a)に示したものと同じである。
読込み型スタイルシートでは、ページのヘッダ領域23においてリンク先のCSSファイルを指定しており、ページ内容記述領域24においてCSSファイルで定義されたスタイルが参照される。スタイルの参照は、埋込み型スタイルシートの場合と同様に基本セレクタ、クラスセレクタ、IDセレクタ等を通じて行われる。
【0040】
本実施の形態では、検索対象となったHTMLからキーワード周辺領域のHTMLを作成する。そのとき、埋込み型スタイルシート又は読込み型スタイルシートからインライン型スタイルシートへ展開される。
図11は、インライン型スタイルシートの一例を示す模式図である。インライン型スタイルシートでは、各オブジェクトの定義領域においてそのオブジェクトのみに有効なスタイルが定義される。例えば、図11に示した例では、「Sample text 1」というテキストのオブジェクトのみに有効なスタイルとして、フォントの色をそのオブジェクト内で定めている。他の2つのオブジェクトについても同様である。
【0041】
このようなインライン型スタイルシートの作成手順について以下に簡単に説明する。埋込み型スタイルシート、又は読込み型スタイルシートからインライン型スタイルシートを作成するには、スタイル定義領域21又はCSSファイル内のテキストを解析して、スタイルシートを適用する対象オブジェクトのセレクタと設定内容とを取得し、対象オブジェクトのタグ中に取得した設定内容を埋込む処理を実行する。
例えば、図9(b)に示した埋込み型スタイルシートを例に取った場合、基本セレクタ<H1>とその設定内容(color:red)とを読出しておき、HTML全体から<H1>を検索して、その中に対応するスタイルシートを埋込むようにしている。クラスセレクタ「.class1」、IDセレクタ「#id1」についても同様である。このような処理を行うことにより図11に示したようなスタイルシートが生成される。
【0042】
以下では、本実施の形態に係る情報検索システムにより実行される処理の手順について説明してゆく。
図12は、情報検索システムの処理手順を説明するフローチャートである。クライアント装置100は、検索サーバ200が提供する検索ページを自身のウェブブラウザ10に表示することによって、検索キーワードの入力を受付ける(ステップS1)。
そして、クライアント装置100は、検索実行の指示がなされたか否かを判断し(ステップS2)、検索実行の指示がない場合(S2:NO)、検索実行の指示があるまで待機する。検索実行指示の有無は、ウェブブラウザ10において検索ボタン12が押下操作されたか否かを判断することによって行う。
検索実行の指示があった場合(S2:YES)、入力された検索キーワードを検索サーバ200へ送信する(ステップS3)。
【0043】
検索サーバ200がクライアント装置100から送信された検索キーワードを受信した場合(ステップS4)、受信した検索キーワードに対応付けられているHTMLを検索データベース210から検索することにより検索処理を実行し(ステップS5)、検索結果ページのHTMLを取得する(ステップS6)。この時点で取得するHTMLは、図4に示したようなHTML、すなわち各検索結果項目について元のコンテンツページのレイアウトを保持するための情報を含んでいないHTMLである。
そして、検索サーバ200は、送信すべき検索結果ページにクライアント側プログラムのロード用スクリプトの埋込みを行う(ステップS7)。すなわち、クライアント装置100のブラウザにて当該スクリプトが実行された場合、所定のアプレットが実行されるようにスクリプト及びアプレットを検索結果ページに実装する。
次いで、検索サーバ200は、検索結果ページのHTMLをクライアント装置100へ送信する(ステップS8)。
【0044】
クライアント装置100にて検索結果ページのHTMLを受信した場合(ステップS9)、クライアント装置100は、受信したHTMLに基づいて検索結果ページをウェブブラウザ10に表示させるとともに、検索結果ページに埋込まれたクライアント側プログラムの実行処理を行い(ステップS10)、キーワード周辺領域のHTMLを取得する。
【0045】
図13〜図15は、クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
クライアント装置100のウェブブラウザ10にてクライアント側プログラムが実行された場合、クライアント側プログラムは、まず、検索結果ページに表示された複数の検索結果項目の中から1つの検索結果項目を選択し、対象コンテンツページのURLを取得する(ステップS11)。そして、取得したURLを検索サーバ200へ送信する(ステップS12)。
【0046】
検索サーバ200が、クライアント装置100から送信されたURLを受信した場合(ステップS13)、当該URLで指定されるコンテンツページをウェブサーバ300から取得するために、コンテンツページのHTMLに対する送信要求をウェブサーバ300へ送信する(ステップS14)。
ウェブサーバ300がコンテンツページのHTMLに対する送信要求を受信した場合(ステップS15)、コンテンツページのHTMLを検索サーバ200へ送信する(ステップS16)。
【0047】
検索サーバ200がコンテンツページのHTMLを受信した場合(ステップS17)、受信したHTMLからキーワード周辺領域を特定する(ステップS18)。次いで、検索サーバ200は、キーワード周辺領域を含むオブジェクト集合を抽出する(ステップS19)。オブジェクトを抽出するには、受信したHTMLにおいて検索キーワードの前にあるHTMLの開始タグと、検索キーワードの後にあるHTMLの終了タグとから判断することができる。但し、HTMLでは一のオブジェクトに含まれるテキストの中に他のオブジェクトを含めた記述方式が許されるため、テキスト中のオブジェクトの存在を無視する必要がある。本実施の形態では、検索キーワードの前を調べてゆくときに終了タグが検出された場合、その終了タグを含むオブジェクトを無視するようにしている。
【0048】
次いで、検索サーバ200は、抽出したオブジェクト集合に対して親オブジェクトを特定し(ステップS20)、特定した親オブジェクトをステップS19で抽出したオブジェクト集合の前後に追加する(ステップS21)。
【0049】
次いで、検索サーバ200は、元のコンテンツページのレイアウトに関する情報を取得するために、CSSファイルに対する送信要求をウェブサーバ300へ送信する(ステップS22)。なお、ステップS17にて受信したHTMLの中でCSSファイルが参照されている場合にのみ本処理を実行すれば足り、HTMLの中でレイアウトが定義されている場合、すなわち埋込み型スタイルシートを利用している場合には本処理を省略してもよい。
【0050】
ウェブサーバ300が、CSSファイルに対する送信要求を受信した場合(ステップS23)、先に送信したHTMLの中で参照されるCSSファイルを検索サーバ200へ送信する(ステップS24)。
【0051】
ウェブサーバ300から送信されたCSSファイルは、検索サーバ200によって受信される(ステップS25)。検索サーバ200は、受信したCSSファイルに基づいて、前述のオブジェクト集合に関する属性をインライン型スタイルシートへ展開し(ステップS26)、対応するHTMLを作成する(ステップS27)。なお、インライン型スタイルシートへの展開処理については、後に詳述することにする。
そして、作成したHTMLをクライアント装置100へ送信する(ステップS28)。
【0052】
クライアント装置100がHTMLを受信した場合(ステップS29)、該当する検索結果項目の下に受信したHTMLを埋込む(ステップS30)。そして、クライアント側プログラムは、全ての検索結果項目についてHTMLの埋込み処理が終了したか否かを判断し(ステップS31)、埋込みが終了していないと判断した場合(S31:NO)、処理をステップS11へ戻し、埋込みが終了したと判断した場合(S31:YES)、本ルーチンを終了する。
【0053】
図16は、インライン型スタイルシートへの展開処理の手順を説明するフローチャートである。
検索サーバ200は、ウェブサーバ300から受信したHTMLのヘッダ部分、又はCSSファイルからスタイルエレメントを特定する(ステップS41)。すなわち、埋込み型スタイルシートを利用しているHTMLでは、そのヘッダ部分からスタイルエレメントを特定し、読込み型スタイルシートを利用しているHTMLでは、そのHTMLにて参照されるCSSファイルからスタイルエレメントを特定する。
【0054】
次いで、検索サーバ200は、エレメント内のテキストからスタイル設定項目の数を算出し(ステップS42)、各スタイル設定項目での対象オブジェクトのセレクタ(基本セレクタ、クラスセレクタ、又はIDセレクタ)と設定内容とを記憶部209内に設けたスタイル設定リストに記憶させる(ステップS43)。
【0055】
次いで、スタイル設定リストを参照しながらオブジェクト集合のHTMLをパージングすることで対象オブジェクトのタグの位置を特定し(ステップS44)、タグ内でスタイル属性がオーバーライドされているか否かを判断する(ステップS45)。
スタイル設定リストを参照してスタイル属性がオーバーライドされていないと判断した場合(S45:NO)、スタイル設定リスト中の設定内容をタグの中に挿入する(ステップS46)。
スタイル属性がタグ内にオーバライドされている場合(S45:YES)、又はスタイル設定リスト中の設定内容をタグの中に挿入した場合(S46)、検索サーバ200は、最後までパージングしたか否かを判断し(ステップS47)、最後までパージングしていないと判断した場合(S47:NO)、処理をステップS44へ戻す。そして、最後までパージングしたと判断した場合(S47:YES)、本ルーチンを終了する。
【0056】
このように、本実施の形態に係る情報検索システムを利用した場合、元のコンテンツページと同一のレイアウトで検索結果を表示させることが可能であり、ユーザにとって見やすい検索結果を提供することが可能となる。また、ユーザが利用しているクライアント装置100に特別な機能、プログラム等を付加することなく、元のレイアウトを保持させたまま表示させることが可能となる。
【0057】
実施の形態2.
実施の形態1ではキーワード周辺領域のHTMLを検索サーバ200を介して取得していたが、前記HTMLをウェブサーバ300から取得し、そのHTLMからキーワード周辺領域のHTMLを抽出し、スタイルシートを展開するモジュールをクライアント側プログラムに置くことで、検索サーバ200を介することなく、キーワード周辺領域のHTMLを取得することも可能である。
【0058】
以下では、本実施の形態に係る情報検索システムについて説明する。なお、システムの構成は実施の形態1と全く同一であるため、説明を省略する。
図17は情報検索システムにおけるクライアント装置100、検索サーバ200、及びウェブサーバ300がそれぞれ実行する処理を説明する模式図である。
クライアント装置100では、検索サーバ200から提供される検索ページを自身のウェブブラウザ10に表示させ、1又は複数の検索キーワードの入力を受付ける。そして、入力された検索キーワードを検索サーバ200へ送信することによって検索要求を行う(処理(1))。
検索要求を受けた検索サーバ200は、受信した検索キーワードを検索データベース210から検索して、検索結果のウェブページ(検索結果ページ)をクライアント装置100へ送信する(処理(2))。この時点でクライアント装置100へ送信される検索結果ページには、検索キーワードを含むコンテンツページのURL、及び検索キーワードを含んだテキストデータが含まれている。
【0059】
クライアント装置100は、検索結果ページを従来と同様の表示形式にてウェブブラウザ10に表示させた後、検索キーワードを含んだコンテンツページの一部を検索結果ページに挿入させるために、HTTPリクエストをウェブサーバ300に対して行う(処理(3))。このような要求は前述のクライアント側プログラムが実行されたときになされる。すなわち、検索結果ページがウェブブラウザ10に表示されたとき、予めウェブブラウザ10に埋込まれたクライアント側プログラムが実行され、HTTPリクエストがなされる。
【0060】
HTTPリクエストを受けたウェブサーバ300は、リクエストに応じてコンテンツページのHTML、画像ファイル、CSSファイル等をクライアント装置100へ送信する(処理(4))。
クライアント装置100は、ウェブサーバ300から取得したHTMLを解析して、検索キーワードの周辺領域を抽出する。抽出対象は、検索キーワードを含んだオブジェクト、及び予め定めた階層の親オブジェクトを対象としている。抽出の際、オブジェクトのインライン型スタイルシートの属性値も同時に抽出する。
更に、クライアント装置100は、取得したHTML及びCSSファイルからスタイルシートの該当部分を抽出し、それを抽出した全てのオブジェクトについてインライン型スタイルシートとして埋込み、新たなHTMLを作成する。そして、作成したキーワード周辺領域のHTMLを検索結果ページに埋込む。
【0061】
図18は、情報検索システムの処理手順を説明するフローチャートである。クライアント装置100は、検索サーバ200が提供する検索ページを自身のウェブブラウザに表示することによって、検索キーワードの入力を受付ける(ステップS51)。
そして、クライアント装置100は、検索実行の指示がなされたか否かを判断し(ステップS52)、検索実行の指示がない場合(S52:NO)、検索実行の指示があるまで待機する。検索実行指示の有無は、ウェブブラウザ10において検索ボタン12が押下操作されたか否かを判断することによって行う。
検索実行の指示があった場合(S52:YES)、入力された検索キーワードを検索サーバ200へ送信する(ステップS53)。
【0062】
検索サーバ200がクライアント装置100から送信された検索キーワードを受信した場合(ステップS54)、受信した検索キーワードに対応付けられているHTMLを検索データベース210から検索することにより検索処理を実行し(ステップS55)、検索結果ページのHTMLを取得する。この時点で取得するHTMLは、図4に示したようなHTML、すなわち各検索結果項目について元のコンテンツページのレイアウトを保持するための情報を含んでいないHTMLである。
そして、検索サーバ200は、検索結果ページのHTMLをクライアント装置100へ送信する(ステップS56)。
【0063】
クライアント装置100にて検索結果ページのHTMLを受信した場合(ステップS57)、クライアント装置100は、受信したHTMLに基づいた検索結果ページをウェブブラウザ10に表示させるとともに、ウェブブラウザ10が予め備えるクライアント側プログラムの実行処理を行い(ステップS58)、キーワード周辺領域のHTMLを取得する。すなわち、クライアント側プログラムは、受信した検索結果のHTMLを解析して、直接ウェブサーバ300に検索対象のコンテンツページのHTML、画像データ、CSSファイル等の送信要求を行う。そして、ウェブサーバ300から送信されコンテンツページ等を利用してインライン型スタイルシートのHTMLを作成し、検索結果ページに埋込む処理を行う。
【0064】
本実施の形態では、ユーザが利用するウェブブラウザに予めクライアント側プログラムを埋め込んでおく必要があるが、実施の形態1と同様に、検索対象となった元のコンテンツページのレイアウトを保持した検索結果が得られる。
【0065】
【発明の効果】
以上、詳述したように、第1発明、第4発明、及び第6発明による場合は、外部から文字列データを検索キーワードとした検索要求を受けた場合、この文字列データを含んだ文書データを取得し、その文書データから前記文字列データを含んだ一部のデータを抽出し、抽出したデータを元の文書データと同一のレイアウトで表示するために部分レイアウト情報を生成し、生成した部分データを抽出したデータと共に検索要求元へ送信するようにしている。したがって、検索対象となった元の文書と同一のレイアウトで表示させることができる検索結果をユーザに提供することが可能となる。また、元の文書データは外部から取得するようにしているため、文書データそのものを記憶するスペースを確保する必要がない。
更に、検索対象となる文書データの要求、部分レイアウト情報の要求を逐次的に行うことによって、既存の検索サーバを利用した場合と比較しても、検索結果が得られるまでの応答時間を短縮することができる。
【0066】
第2発明による場合は、元の文書データから一部を抽出したデータ及び部分レイアウト情報を受信し、受信したデータを部分レイアウト情報に従い表示するようにしている。したがって、本発明の情報検索システムを利用して検索結果を受信した情報処理装置は、元の文書と同一のレイアウトで検索結果を表示させることが可能であり、ユーザにとって見やすい検索結果を提供することが可能となる。また、ユーザ側が利用している情報処理装置に特別な機能、プログラム等を付加することなく、元のレイアウトを保持させたまま表示させることが可能となる。
【0067】
第3発明及び第5発明による場合は、元の文書データが有するレイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含んでいるため、様々なレイアウト情報を取得して、元の文書と同一のレイアウトを有するデータを作成することが可能となる等、本発明は優れた効果を奏する。
【図面の簡単な説明】
【図1】本実施の形態に係る情報検索システムの概略構成を示す模式図である。
【図2】検索サーバの内部構成を示すブロック図である。
【図3】情報検索システムにおけるクライアント装置、検索サーバ、及びウェブサーバがそれぞれ実行する処理を説明する模式図である。
【図4】検索結果ページの表示例を示す模式図である。
【図5】検索結果ページの表示例を示す模式図である。
【図6】検索結果ページの表示例を示す模式図である。
【図7】コンテンツページのHTMLと検索サーバが作成するキーワード周辺領域のHTMLとの関係を説明する模式図である。
【図8】コンテンツページのHTMLと検索サーバが作成するキーワード周辺領域のHTMLとの関係を説明する模式図である。
【図9】コンテンツページ及び埋込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。
【図10】読込み型スタイルシートを利用して記述されたHTMLの一例を示す模式図である。
【図11】インライン型スタイルシートの一例を示す模式図である。
【図12】情報検索システムの処理手順を説明するフローチャートである。
【図13】クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
【図14】クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
【図15】クライアント側プログラムの実行処理に伴って情報検索システムが実行する処理の手順を示すフローチャートである。
【図16】インライン型スタイルシートへの展開処理の手順を説明するフローチャートである。
【図17】情報検索システムにおけるクライアント装置、検索サーバ、及びウェブサーバがそれぞれ実行する処理を説明する模式図である。
【図18】情報検索システムの処理手順を説明するフローチャートである。
【符号の説明】
100 クライアントコンピュータ
200 検索サーバ
201 CPU
202 バス
203 ROM
204 RAM
205 表示部
206 操作部
207 通信部
208 補助記憶部
209 記憶部
210 検索データベース
300 ウェブサーバ
N インターネット網
Claims (6)
- 検索すべき文字列データの入力を受付け、受付けた文字列データに基づき検索要求情報を送信する第1情報処理装置と、該第1情報処理装置から送信された検索要求情報を受信した場合、前記文字列データを含む情報を検索し、検索した結果に係る情報を前記第1情報処理装置へ送信する第2情報処理装置とを備える情報検索システムにおいて、
前記文字列データ及びレイアウト情報を含む文書データを記憶する手段と、前記文書データを外部へ送信する手段とを備える複数の第3情報処理装置を備え、
前記第2情報処理装置は、複数の文字列データと各文字列データを含む文書データが記憶された複数の第3情報処理装置とを関連付けて記憶する記憶手段と、前記第1情報処理装置から送信された検索要求情報を受信した場合、前記検索要求情報に係る文字列データを含む文書データが記憶された第3情報処理装置を前記記憶手段から検索する手段と、前記文書データを送信すべき旨の送信要求情報を検索した第3情報処理装置へ送信する手段と、前記送信要求情報に基づいて前記第3情報処理装置から送信された文書データを受信する手段と、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成する手段とを備え、抽出したデータ及び生成した部分レイアウト情報を前記第1情報処理装置へ送信すべくなしてあることを特徴とする情報検索システム。 - 前記第1情報処理装置は、前記第2情報処理装置から送信されたデータ及び部分レイアウト情報を受信する手段と、受信したデータを前記部分レイアウト情報に従い表示する手段とを備えることを特徴とする請求項1に記載の情報検索システム。
- 前記レイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含むことを特徴とする請求項1又は請求項2に記載の情報検索システム。
- 文字列データに対する検索要求情報を外部から受信し、受信した検索要求情報に基づき前記文字列データを含む情報を検索する情報検索装置において、
複数の情報処理装置へ接続可能になしてあり、複数の文字列データと各文字列データを含む文書データが記憶された複数の情報処理装置とを関連付けて記憶する記憶手段と、外部から検索要求情報を受信した場合、検索要求情報に係る文字列データを含む文書データが記憶された情報処理装置を前記記憶手段から検索する手段と、前記文書データを送信すべき旨の送信要求情報を検索した情報処理装置へ送信する手段と、前記送信要求情報に基づいて前記情報処理装置から送信された前記文字列データ及びレイアウト情報を含む文書データを受信する手段と、受信した文書データから前記文字列データを含む一部のデータを抽出する手段と、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成する手段と、抽出したデータ及び生成した部分レイアウト情報を前記検索要求情報の送信元へ送信する手段とを備えることを特徴とする情報検索装置。 - 前記レイアウト情報は、表示すべき文書データの段落情報、階層情報、色情報、文字種情報の何れかを含むことを特徴とする請求項4に記載の情報検索装置。
- コンピュータに、外部から受付けた文字列データに対する検索要求情報に基づき、前記文字列データを含む情報を検索させるステップを含むコンピュータプログラムにおいて、
コンピュータに、文字列データと各文字列データを含む文書データが記憶された複数の情報処理装置とを関連付けて記憶する記憶手段から、検索要求情報に係る文字列データを含む文書データが記憶された情報処理装置を検索させるステップと、コンピュータに、前記文書データを送信すべき旨の送信要求情報を検索した情報処理装置へ送信させるステップと、コンピュータに、前記情報処理装置から受信した前記文字列データ及びレイアウト情報を含む文書データから前記文字列データを含む一部のデータを抽出させるステップと、コンピュータに、抽出したデータを前記文書データと同一のレイアウトで表示させるべく、前記文書データのレイアウト情報から部分レイアウト情報を生成させるステップと、コンピュータに、抽出したデータ及び生成した部分レイアウト情報を前記検索要求情報の送信元へ送信させるステップとを有することを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002358624A JP2004192276A (ja) | 2002-12-10 | 2002-12-10 | 情報検索システム、情報検索装置、及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002358624A JP2004192276A (ja) | 2002-12-10 | 2002-12-10 | 情報検索システム、情報検索装置、及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004192276A true JP2004192276A (ja) | 2004-07-08 |
Family
ID=32758292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002358624A Pending JP2004192276A (ja) | 2002-12-10 | 2002-12-10 | 情報検索システム、情報検索装置、及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004192276A (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007102339A (ja) * | 2005-09-30 | 2007-04-19 | Ricoh Co Ltd | 蔵書目録検索方法、蔵書目録検索システム及び蔵書目録検索結果表示プログラム |
JP2010041401A (ja) * | 2008-08-05 | 2010-02-18 | Fujitsu Ltd | 中継装置、通信中継方法、そのプログラム、及び中継システム |
JP2012506576A (ja) * | 2008-10-20 | 2012-03-15 | グーグル・インコーポレーテッド | サーチ結果の提供 |
JP2014013579A (ja) * | 2013-08-06 | 2014-01-23 | Toshiba Corp | 電子機器、情報の検索を行うための方法及びプログラム |
US8930335B2 (en) | 2010-12-24 | 2015-01-06 | Kabushiki Kaisha Toshiba | Information processing apparatus, information search method and program |
CN105786977A (zh) * | 2016-02-05 | 2016-07-20 | 北京百度网讯科技有限公司 | 基于人工智能的移动搜索方法和装置 |
-
2002
- 2002-12-10 JP JP2002358624A patent/JP2004192276A/ja active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007102339A (ja) * | 2005-09-30 | 2007-04-19 | Ricoh Co Ltd | 蔵書目録検索方法、蔵書目録検索システム及び蔵書目録検索結果表示プログラム |
JP4641480B2 (ja) * | 2005-09-30 | 2011-03-02 | 株式会社リコー | 蔵書目録検索方法、蔵書目録検索システム及び蔵書目録検索結果表示プログラム |
JP2010041401A (ja) * | 2008-08-05 | 2010-02-18 | Fujitsu Ltd | 中継装置、通信中継方法、そのプログラム、及び中継システム |
JP2012506576A (ja) * | 2008-10-20 | 2012-03-15 | グーグル・インコーポレーテッド | サーチ結果の提供 |
US8930335B2 (en) | 2010-12-24 | 2015-01-06 | Kabushiki Kaisha Toshiba | Information processing apparatus, information search method and program |
JP2014013579A (ja) * | 2013-08-06 | 2014-01-23 | Toshiba Corp | 電子機器、情報の検索を行うための方法及びプログラム |
CN105786977A (zh) * | 2016-02-05 | 2016-07-20 | 北京百度网讯科技有限公司 | 基于人工智能的移动搜索方法和装置 |
CN105786977B (zh) * | 2016-02-05 | 2020-03-03 | 北京百度网讯科技有限公司 | 基于人工智能的移动搜索方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7809710B2 (en) | System and method for extracting content for submission to a search engine | |
US6697838B1 (en) | Method and system for annotating information resources in connection with browsing, in both connected and disconnected states | |
US7606794B2 (en) | Active Abstracts | |
CA2687473C (en) | System and method for content navigation | |
KR101475126B1 (ko) | 검색 결과 페이지에 인터랙티브 요소를 포함하는 시스템 및 그 방법 | |
JP3588337B2 (ja) | ウェブ・ブラウザ内にグラフィカル印刷技法を取り込む方法及びシステム | |
US6694484B1 (en) | Relating a HTML document with a non-browser application | |
US20020016801A1 (en) | Adaptive profile-based mobile document integration | |
EP0762297A2 (en) | Use of proxy servers to provide annotation overlays | |
JP2002334014A (ja) | ファイルを複数言語で提供するシステム | |
US20090241016A1 (en) | Display control apparatus, display control method and computer product | |
JP2004192276A (ja) | 情報検索システム、情報検索装置、及びコンピュータプログラム | |
JPH10289250A (ja) | Wwwブラウザにおけるurl登録及び表示方式 | |
JP3843390B2 (ja) | ウェブページ閲覧方法およびウェブページ閲覧プログラム | |
US20080114786A1 (en) | Breaking documents | |
JP2002082936A (ja) | コンテンツデータ表示装置とコンテンツデータ表示システム | |
JP2001022788A (ja) | 情報検索装置および情報検索プログラムを記録した記録媒体 | |
JPH10134087A (ja) | 文書要求装置および関連文書の先取り方法 | |
KR19990078876A (ko) | 일괄된 자원 위치기 입력을 통한 정보 검색 방법 | |
JP2000235578A (ja) | マルチメディア情報検索・提示方法、システム、およびマルチメディア情報検索・提示システムを記録した記録媒体 | |
JP2006164045A (ja) | 共起グラフ作成方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
JP2002014991A (ja) | ネットワーク上の情報フィルタリング装置 | |
JP4998558B2 (ja) | リンク作成プログラム、リンク作成装置及びリンク作成方法 | |
JP2006004308A (ja) | ハイパーリンク自動生成システム | |
JP5276903B2 (ja) | 閲覧システム、プラグインプログラム、ならびに、紹介プログラム |