JP2007172092A - ウェブログ検索サーバ - Google Patents
ウェブログ検索サーバ Download PDFInfo
- Publication number
- JP2007172092A JP2007172092A JP2005365741A JP2005365741A JP2007172092A JP 2007172092 A JP2007172092 A JP 2007172092A JP 2005365741 A JP2005365741 A JP 2005365741A JP 2005365741 A JP2005365741 A JP 2005365741A JP 2007172092 A JP2007172092 A JP 2007172092A
- Authority
- JP
- Japan
- Prior art keywords
- web log
- search
- category
- screen
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】インターネット上のウェブログを紹介するウェブログ検索サーバに係り、全文検索エンジンやディレクトリによるナビゲーションの不便を解消し、網羅性が高く、容易な検索操作性を実現する。
【解決手段】上位のカテゴリー(第1カテゴリー、第2カテゴリーなど)に対しては、下位のカテゴリーの選択を促すカテゴリー検索画面を提供し、最下層のカテゴリー(第nカテゴリー)では、検索キーワードの選択を促す検索キーワード一覧画面を提供し、検索キーワード一覧画面で検索キーワードが選択されると、当該検索キーワードあるいは予め設定されている設定式を検索条件式としてウェブログを検索して、抽出したウェブログをウェブログ一覧として提供する。
【選択図】図14
【解決手段】上位のカテゴリー(第1カテゴリー、第2カテゴリーなど)に対しては、下位のカテゴリーの選択を促すカテゴリー検索画面を提供し、最下層のカテゴリー(第nカテゴリー)では、検索キーワードの選択を促す検索キーワード一覧画面を提供し、検索キーワード一覧画面で検索キーワードが選択されると、当該検索キーワードあるいは予め設定されている設定式を検索条件式としてウェブログを検索して、抽出したウェブログをウェブログ一覧として提供する。
【選択図】図14
Description
本発明は、インターネット上のウェブログを紹介するウェブログ検索サーバに係り、全文検索エンジンやディレクトリによるナビゲーションの不便を解消し、網羅性が高く、容易な検索操作性を実現する技術に関する。
インターネット上のホームページ検索方法や企業イントラネット上の電子ドキュメント検索方法として、大きく分けて全文検索エンジンとディレクトリによるナビゲーションの技術がある。
全文検索エンジンでは、検索対象とする全テキストデータを予めネットワーク経由で収集し、収集したテキストデータからインバーテッドインデクスと呼ばれる単語から文書を引くためのデータ構造を構築する。そして、検索時には、与えられたキーワードから、インバーテッドインデクスを介してそのキーワードが含まれるテキストデータを列挙する
一方、ディレクトリによるナビゲーションでは、対象とする全テキスト群(ホームページ等)をどのような分類に分けたら良いか、大分類から小分類へ階層的に予め決定し、大分類から小分類へ順に辿っていける手順で画面を出力する。このため、サイトの運営側で手作業により検索対象となるテキスト(ホームページ)を参照し、どの分類に属するべきかを決定して対応する画面からリンクを張っていく。そして、検索時には、探したいものの分類を順に具体的なものへ辿り、目的とするテキストデータに至る。
しかし、これらの従来技術には欠点がある。全文検索エンジンでは、自動で収集したインバーテッドインデクスを生成するため、検索の網羅性は高いが、探したい文書を含む単語を知らないと検索そのものが出来ないという問題がある。例えば、「電子辞書を買おうとして、評判の良い製品を知りたい」という状況を想定した場合に、製品の名前や型番など具体的な「キーワード」がわからないと検索できない。「電子辞書」で検索しただけでは、膨大な検索ヒット結果が得られるだけで、評判を知るところまでたどりつくことは容易でない。
このように全文検索エンジンは、「どのようなキーワードを用いてどのような検索条件で検索すれば良いか」が初心者にはわかりにくく、目的とするコンテンツに辿り着くことが困難である。
一方ディレクトリによるナビゲーションでは、調べたいことを提示された分類から辿っていけばよいので、キーワードが分からなくても比較的容易に検索が可能である。しかし、サイトの運営側で手作業によりあらゆる分類を用意する必要があり、網羅性に欠けるという問題がある。また、日々新しいテキストが追加更新される状況では、分類を常に更新して維持する運用コストも大きな負担となる。また、利用者が期待するディレクトリが存在しない、あるいは以前は存在したコンテンツが後に消滅した場合に、利用者が階層をたどっていった挙句にコンテンツに辿り着けない等の問題もある。
特にインターネットを対象としたディレクトリによるナビゲーションによる検索の場合には、量的な限界および存在の安定性から、ホームページのサイト単位で分類し、ホームページのトップページを指すようになっている。このため、目的のはっきりした企業ホームページの分類には向いているが、最近増えているウェブログのような個人の日記を主体としたさまざまな内容を含むサイトの分類には不向きである。ウェブログを検索するためには、サイト内の文書単位での分類が必要となるからである。
特開2002−63211号公報
特開2002−351900号公報
本発明では、階層を持たない単なるキーワード検索でもなく、階層構造に編集したディレクトリを用意するものでもなく、「こうやったらうまく検索できる。絞り込める」という検索式(単語とAND、OR、NOTなどによる論理式)を予め用意し、どの検索式を使うべきかを階層的メニューを介して提示することにより、上述の問題を解決する。
本発明に係るウェブログ検索サーバは、
PINGサーバと利用者端末にインターネットを介して接続し、以下の要素を有することを特徴とする
(1)PINGサーバから、更新されたウェブログのURL、見出し、及び要約を含むウェブログ更新情報を取得するウェブログ更新情報取得部
(2)取得したウェブログ更新情報をウェブログIDと対応付けて記憶するウェブログ更新情報記憶部
(3)ウェブログ更新情報に含まれるURLにアクセスして、ウェブログデータを収集するウェブログデータ収集部
(4)収集したウェブログデータから、キーワードと当該キーワードを含むウェブログデータのウェブログIDを対応付けるインデックス(索引表)を生成するインデックス生成部
(5)インデックス(索引表)を記憶するインデックス記憶部
(6)利用者端末から、パラメータを含むアクセス要求を受信するアクセス要求受信部
(7)アクセス要求に含まれるパラメータが最下層以外のカテゴリーIDである場合にカテゴリー検索画面を出力画面と判定し、アクセス要求に含まれるパラメータが最下層のカテゴリーIDである場合に検索キーワード一覧画面を出力画面と判定し、アクセス要求に含まれるパラメータが検索条件式である場合にウェブログ一覧画面を出力画面と判定する出力画面判定部
(8)階層型のカテゴリー構造と、最下層のカテゴリーに対する検索キーワード及び任意で設定可能な設定式を対応付けて記憶する階層型検索キーワード辞書記憶部
(9)カテゴリー検索画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータであるカテゴリーIDに対して下位に相当する下位カテゴリーIDを階層型検索キーワード辞書記憶部から取得し、下位カテゴリーIDのカテゴリー名を、利用者端末のブラウザの表示画面で選択された場合に下位カテゴリーIDをパラメータとしてアクセス要求に含めて返信するように配置したカテゴリー検索画面を生成するカテゴリー検索画面生成部
(10)生成したカテゴリー検索画面を、利用者端末へ返信するカテゴリー検索画面出力部
(11)検索キーワード一覧画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータであるカテゴリーIDに対応する検索キーワードあるいは設定式を階層型検索キーワード辞書記憶部から取得し、検索キーワードあるいは設定式を検索条件式としてインデックス記憶部のインデックス(索引表)を検索して、検索条件式に適合したウェブログIDの数をカウントしてウェブログ数を求めるインデックス検索部
(12)検索キーワードを、利用者端末のブラウザの表示画面で選択された場合に検索条件式をパラメータとしてアクセス要求に含めて返信するようにウェブログ数とともに配置した検索キーワード一覧画面を生成する検索キーワード一覧画面生成部
(13)生成した検索キーワード一覧画面を、利用者端末へ返信する検索キーワード一覧画面出力部
(14)ウェブログ一覧画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータである検索条件式によりインデックス記憶部のインデックス(索引表)を検索して、検索条件式に適合したウェブログIDを抽出するウェブログ抽出部
(15)抽出したカテゴリーIDに対応するウェブログ更新情報をウェブログ更新情報記憶部から取得し、ウェブログ更新情報記憶部に含まれるURL、見出し、及び要約を、利用者端末のブラウザの表示画面で選択された場合に当該URLへのアクセス要求を送信するように配置したウェブログ一覧画面を生成するウェブログ一覧画面生成部
(16)生成したウェブログ一覧画面を、利用者端末へ返信するウェブログ一覧画面出力部。
PINGサーバと利用者端末にインターネットを介して接続し、以下の要素を有することを特徴とする
(1)PINGサーバから、更新されたウェブログのURL、見出し、及び要約を含むウェブログ更新情報を取得するウェブログ更新情報取得部
(2)取得したウェブログ更新情報をウェブログIDと対応付けて記憶するウェブログ更新情報記憶部
(3)ウェブログ更新情報に含まれるURLにアクセスして、ウェブログデータを収集するウェブログデータ収集部
(4)収集したウェブログデータから、キーワードと当該キーワードを含むウェブログデータのウェブログIDを対応付けるインデックス(索引表)を生成するインデックス生成部
(5)インデックス(索引表)を記憶するインデックス記憶部
(6)利用者端末から、パラメータを含むアクセス要求を受信するアクセス要求受信部
(7)アクセス要求に含まれるパラメータが最下層以外のカテゴリーIDである場合にカテゴリー検索画面を出力画面と判定し、アクセス要求に含まれるパラメータが最下層のカテゴリーIDである場合に検索キーワード一覧画面を出力画面と判定し、アクセス要求に含まれるパラメータが検索条件式である場合にウェブログ一覧画面を出力画面と判定する出力画面判定部
(8)階層型のカテゴリー構造と、最下層のカテゴリーに対する検索キーワード及び任意で設定可能な設定式を対応付けて記憶する階層型検索キーワード辞書記憶部
(9)カテゴリー検索画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータであるカテゴリーIDに対して下位に相当する下位カテゴリーIDを階層型検索キーワード辞書記憶部から取得し、下位カテゴリーIDのカテゴリー名を、利用者端末のブラウザの表示画面で選択された場合に下位カテゴリーIDをパラメータとしてアクセス要求に含めて返信するように配置したカテゴリー検索画面を生成するカテゴリー検索画面生成部
(10)生成したカテゴリー検索画面を、利用者端末へ返信するカテゴリー検索画面出力部
(11)検索キーワード一覧画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータであるカテゴリーIDに対応する検索キーワードあるいは設定式を階層型検索キーワード辞書記憶部から取得し、検索キーワードあるいは設定式を検索条件式としてインデックス記憶部のインデックス(索引表)を検索して、検索条件式に適合したウェブログIDの数をカウントしてウェブログ数を求めるインデックス検索部
(12)検索キーワードを、利用者端末のブラウザの表示画面で選択された場合に検索条件式をパラメータとしてアクセス要求に含めて返信するようにウェブログ数とともに配置した検索キーワード一覧画面を生成する検索キーワード一覧画面生成部
(13)生成した検索キーワード一覧画面を、利用者端末へ返信する検索キーワード一覧画面出力部
(14)ウェブログ一覧画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータである検索条件式によりインデックス記憶部のインデックス(索引表)を検索して、検索条件式に適合したウェブログIDを抽出するウェブログ抽出部
(15)抽出したカテゴリーIDに対応するウェブログ更新情報をウェブログ更新情報記憶部から取得し、ウェブログ更新情報記憶部に含まれるURL、見出し、及び要約を、利用者端末のブラウザの表示画面で選択された場合に当該URLへのアクセス要求を送信するように配置したウェブログ一覧画面を生成するウェブログ一覧画面生成部
(16)生成したウェブログ一覧画面を、利用者端末へ返信するウェブログ一覧画面出力部。
本発明によれば、階層的な手順に従って検索キーワード一覧画面を提示し、検索キーワード一覧画面で検索キーワードを選択させることにより、予め設定されている検索条件式でウェブログを検索するので、調査事項に対する適切なキーワードを想起できない利用者に対しても、随時適したウェブログを紹介することができる。
実施の形態1.
図1は、ネットワーク構成を示す図である。ウェブログ検索サーバは、インターネットを介して、PINGサーバと利用者端末と接続している。ウェブログ検索サーバは、PINGサーバからウェブログ更新情報を取得して、インデックス(索引表)を自動的に更新する。
図1は、ネットワーク構成を示す図である。ウェブログ検索サーバは、インターネットを介して、PINGサーバと利用者端末と接続している。ウェブログ検索サーバは、PINGサーバからウェブログ更新情報を取得して、インデックス(索引表)を自動的に更新する。
図2は、ウェブログ検索サーバの構成のうちインデックス自動更新処理に係る部分を示す図である。ウェブログ検索サーバは、ウェブログ更新情報取得部201、ウェブログ更新情報記憶部202、インデックス生成時刻記録部203、インデックス記憶部204、ウェブログデータ収集部205、ウェブログデータ記憶部206、及びインデックス生成部207を有している。
インデックス自動更新の処理について説明する。図3は、インデックス自動更新処理フローを示す図である。処理開始待ち(S301)で、所定間隔毎に以下の処理を起動する。
まず、ウェブログ更新情報記憶部202によるウェブログ更新情報取得処理(S302)を行なう。図4は、ウェブログ更新情報取得処理フローを示す図である。PINGサーバに対して、ウェブログ更新情報の要求を送信し(S401)、PINGサーバから、ウェブログ更新情報を受信する(S402)。ウェブログ更新情報は、ウェブログURL、見出し、要約、及び更新時刻を有している。そして、受信したウェブログ更新情報群を、ウェブログ更新情報記憶部202に記憶させる(S403)。
図5は、ウェブログ更新情報記憶部の構成を示す図である。ウェブログ更新情報記憶部202では、ウェブログ毎にレコードを設け、ウェブログID、ウェブログURL、見出し、要約、及び更新時刻を対応付けて記憶するように構成されている。
次に、インデックス生成時刻記録部203によるインデックス生成時刻記録処理(図3のS303)を行なう。図6は、インデックス生成時刻記録処理フローを示す図である。ウェブログ検索サーバ内部に設けられている時計部より、現在時刻を取得し(S601)、その現在時刻を、インデックス生成時刻としてインデックス記憶部に記憶させる(S602)。
図7は、インデックス記憶部の構成を示す図である。インデックス記憶部204は、インデックス(索引表)とインデックス生成時刻から構成さている。インデックス(索引表)は、キーワード毎にレコードを設け、キーワードに対応するウェブログID群を記憶するように構成さている。
次に、ウェブログデータ収集部205によるウェブログデータ収集処理(図3のS304)を行なう。図8は、ウェブログデータ収集処理フローを示す図である。ウェブログ更新情報に含まれるウェブログ単位に以下の処理を繰り返す(S801)。ウェブログ更新情報に含まれるウェブログIDとウェブログURLを取得して(S802)、ウェブログURLにアクセスして(S803)、ウェブログデータ(ex.HTMLデータ、XMLデータ、RSSデータ)を取得する(S804)。そして、取得したウェブログデータ(通常は、ファイル形式のデータである。)を、ウェブログIDと対応付けてウェブログデータ記憶部に記憶させる(S805)。すべての更新ウェブログについて処理した時点で終了する(S806)。
図9は、ウェブログデータ記憶部の構成を示す図である。取得したウェブログデータファイルを記憶するウェブログデータファイル記憶部と、ウェブログデータを管理するウェブログデータテーブルから構成さている。ウェブログデータテーブルは、ウェブログ毎にレコードを有し、ウェブログIDに対応するウェブログデータファイル名群を記憶するように構成されている。
次に、インデックス生成部207によるインデックス生成処理(図3のS305)を行なう。図10は、インデックス生成処理フローを示す図である。ウェブログデータからテキストを抽出し、収集ウェブログリストファイルを生成する(S1001)。収集ウェブログリストファイルは、複数のウェブログデータから抽出したテキスト群を、元のウェブログIDやデータ形式とともにまとめたファイルである。この収集ウェブログリストファイルのテキストをキーワードとなる単語に分解し、そのキーワードが含まれていたウェブログデータのウェブログIDと組み合わせる(S1002)。そして、単語とウェブログIDの組を単語毎にまとめ、ウェブログIDのリストを生成し(S1003)、辞書順にリストを並び替えて、インデックス(索引表)を生成する(S1004)。そして、生成したインデックス(索引表)をインデックス記憶部に記憶させる(S1005)。
ウェブログ検索サーバは、生成したインデックス(索引表)を用いてウェブログの検索サービスを行なう。具体的には、階層的な検索の過程で、カテゴリー検索画面と検索キーワード一覧画面とウェブログ一覧画面を提供するが、まずカテゴリー検索画面と検索キーワード一覧画面の提供動作について説明する。
図11は、ウェブログ検索サーバの構成のうちカテゴリー検索画面と検索キーワード一覧画面を提供する処理に係る部分を示す図である。ウェブログ検索サーバは、更にアクセス要求受信部1101、出力画面判定部1102、階層型検索キーワード辞書記憶部1103、カテゴリー検索画面生成部1104、カテゴリーテーブル1105、カテゴリー検索画面出力部1106、インデックス検索部1107、キャッシュメモリ1108、検索キーワード一覧画面生成部1109、及び検索キーワード一覧画面出力部1110を有している。
カテゴリー検索画面を提供する処理について説明する。図12は、カテゴリー検索画面を提供する処理フローを示す図である。ウェブログ検索サーバは、アクセス要求受信部1101によるアクセス要求受信処理(S1201)で利用者端末からのアクセス要求を受信するように構成されている。アクセス要求は、ウェブログ検索サーバのサーバ名と特定のパス名からなるURLとパラメータから構成されている。
出力画面判定部1102による出力画面判定処理(図12のS1202)では、受信したアクセス要求に含まれていたパラメータに基づいて、カテゴリー検索画面と検索キーワード一覧画面とウェブログ一覧画面のうちのいずれを出力画面とするか(提供するか)を判定する。
図13は、出力画面判定処理フローを示す図である。アクセス要求に含まれるパラメータを取得し(S1301)、パラメータの種類を判定する(S1302)。パラメータが検索条件式の場合には、ウェブログ一覧画面を出力画面とする(S1304)。
一方、パラメータがカテゴリーID(パラメータが無い場合を含む)の場合には、カテゴリーテーブルから、「与えられたパラメータのカテゴリーID=カテゴリーテーブル中の上位カテゴリー」なるエントリーを取得し、最下層フラグを取り出す(S1303)。階層型検索キーワード辞書記憶部1103は、予め設定されている。図14は、階層型検索キーワード辞書記憶部の構成を示す図である。検索キーワード毎に、階層的に上位から順に、その検索キーワードが属する第1カテゴリー、第2カテゴリー、・・・第nカテゴリー(最下層カテゴリー)の各層のカテゴリーID、属性、検索キーワード、及び設定式を記憶している。パラメータのカテゴリーIDが、最下層カテゴリーのIDであるか判断し(S1305)、「10101」のように最下層カテゴリーのIDである場合には、検索キーワード一覧画面を出力画面とし(S1306)、「1」あるいは「101」のように最下層より上の層のカテゴリーIDである場合には、カテゴリー検索画面を出力画面とする(S1307)。
このようにして、図12のS1202で、カテゴリー検索画面を出力画面とすると判定した場合には、次に、カテゴリー検索画面生成部1104によるカテゴリー検索画面生成処理(図12のS1203)を行なう。図15は、カテゴリー検索画面生成処理フローを示す図である。パラメータのカテゴリーIDを出力画面判定部1102から取得し(S1501)、カテゴリーテーブルIDから、パラメータのカテゴリーIDと上位カテゴリーIDが一致するエントリーを取得し、それぞれのエントリーからカテゴリー名を取得する(S1502)。カテゴリーテーブルは、図16に示すように、カテゴリー毎に、カテゴリーIDとカテゴリー名を対応付けて予め記憶している。そして、カテゴリー検索画面を生成する(S1503)。カテゴリー検索画面は、利用者端末のブラウザに表示され、当該カテゴリー名がクリックなどにより選択された場合に、対応するカテゴリーIDをパラメータとして返信するように、カテゴリー名が配置されている。図17は、カテゴリー検索画面の例を示す図である。
次に、カテゴリー検索画面出力部1106によるカテゴリー検索画面出力処理(図12のS1204)により、生成したカテゴリー検索画面をアクセス要求に対する返信として利用者端末に送信する。
続いて、検索キーワード一覧画面を提供する処理について説明する。図18は、検索キーワード一覧画面を提供する処理フローを示す図である。前述と同様に、アクセス要求受信部1101によるアクセス要求受信処理(S1801)と出力画面判定部1102による出力画面判定処理(S1802)を行ない、検索キーワード一覧画面を出力画面とすると判定した場合には、次に、インデックス検索部1107によるインデックス検索処理(S1803)を行なう。
インデックス検索処理(S1803)について詳述する。図19は、インデックス検索処理フローを示す図である。まず、キャッシュ有効性判定処理(S1901)により、キャッシュメモリ1108のデータが有効であるか否かを判定する。有効である場合には、キャッシュメモリ1108のデータを用いるので以下の処理を省略して終了する。
キャッシュ有効性判定処理(S1901)では、図20に示すように、インデックス記憶部204からインデックス生成時刻を取得し(S2001)、更にキャッシュ記憶部1108からキャッシュ生成時刻を取得する(S2002)。
キャッシュメモリは、図21に示すように、検索キーワード毎にレコードを設け、検索キーワード、検索条件式、及びヒット数を対応付けて記憶するように構成されている。また、これらのデータが生成された時刻をキャッシュ生成時刻として記憶するように構成されている。
そして、図20に示すように、キャッシュ生成時刻とインデックス生成時刻を比較し(S2003)、キャッシュ生成時刻が後の場合には、キャッシュを有効とし(S2004)、インデックス生成時刻が後の場合には、キャッシュを無効とする(S2005)。
キャッシュが無効と判断された場合には、図19に示すように、出力画面判定部1102からパラメータのカテゴリーIDを取得する(S1902)。階層型検索キーワード辞書記憶部1103(図14)で、パラメータのカテゴリーIDを有するレコードについて、以下の処理を繰り返す(S1903)。当該レコードから検索キーワードと設定式を取得し(S1904)、検索キーワードと設定式に基づいて、検索条件式を決定する(S1905)。設定式がある場合には、その設定式を検索条件式とし、設定式がない場合には、検索キーワードを検索条件式とする。そして、検索条件式によりインデックス記憶部を検索し(S1906)、ヒットしたウェブログIDの数を、ヒット数としてカウントし(S1907)、検索キーワードと検索条件式とヒット数を対応付ける組を、キャッシュメモリのレコードに記憶させる(S1908)。上述のすべてのレコードについて処理し(S1909)、最後にキャッシュ生成時刻記録処理(S1910)を行なう。
最後にキャッシュ生成時刻記録処理(S1910)では、図22に示すように、ウェブログ検索サーバの内部に設けられている時計部より、現在時刻を取得し(S2201)、その現在時刻を、キャッシュ生成時刻としてキャッシュ記憶部に記憶させる(S2202)。
このようにしてインデックス検索処理(図18のS1803)が終了すると、検索キーワード一覧画面生成部1109による検索キーワード一覧画面生成処理(S1804)を行なう。
図23は、検索キーワード一覧画面生成処理フローを示す図である。キャッシュメモリ1108の各レコードについて、ブラウザ上で当該検索キーワードがクリックなどにより選択された場合に、検索条件式をパラメータとして返信するように検索キーワードをヒット数とともに配置して、カテゴリー検索画面を生成する(S2301)。図24に検索キーワード一覧画面の例を示す。
そして、検索キーワード一覧画面出力部1110による検索キーワード一覧画面出力処理(S1805)により、生成した検索キーワード一覧画面をアクセス要求に対する返信として利用者端末に送信する。
続いて、ウェブログ一覧画面を提供する動作について説明する。図25は、ウェブログ検索サーバの構成のうちウェブログ一覧画面を提供する処理に係る部分を示す図である。ウェブログ検索サーバは、更にウェブログ抽出部2501、ウェブログ一覧画面生成部2502、及びウェブログ一覧画面出力部2503を有している。
図26は、ウェブログ一覧画面を提供する処理フローを示す図である。前述と同様に、アクセス要求受信部1101によるアクセス要求受信処理(S2601)と出力画面判定部1102による出力画面判定処理(S2602)を行なう。ウェブログ一覧画面を出力画面と判定した場合には、ウェブログ抽出部2501によるウェブログ抽出処理(S2603)を行なう。
図27は、ウェブログ抽出処理フローを示す図である。まず、出力画面判定部1102からパラメータの検索条件式を取得し(S2701)、検索条件式によりインデックス記憶部を検索する(S2702)。そして、ヒットしたウェブログIDの数をヒット数としてカウントする(S2703)。
次に、ウェブログ一覧画面生成部2502によるウェブログ一覧画面生成処理(S2604)を行なう。図28は、ウェブログ一覧画面生成処理フローを示す図である。ウェブログ更新情報記憶部202から、ヒットしたウェブログID群に対応するウェブログ更新情報(ウェブログURL、見出し、要約、更新時間)を取得し(S2801)、ウェブログ更新情報を更新時間の新しい順にソートする(S2802)。そして、所定数のウェブログ更新情報を、ソート順に並べてウェブログ一覧画面を生成する(S2803)。ウェブログ一覧画面は、利用者端末のブラウザ上でいずれかのウェブログ更新情報がクリックなどにより選択された場合に、当該ウェブログ更新情報に含まれるウェブログURLにアクセス要求を送信するように構成される。図29は、ウェブログ一覧画面の例を示す図である。
そして、ウェブログ一覧画面出力部2503によるウェブログ一覧画面出力処理(S2605)により、生成したウェブログ一覧画面をアクセス要求に対する返信として利用者端末に送信する。
ウェブログ検索サーバは、コンピュータであり、各要素はプログラムにより処理を実行することができる。また、プログラムを記憶媒体に記憶させ、記憶媒体からコンピュータに読み取られるようにすることができる。
201 ウェブログ更新情報取得部、202 ウェブログ更新情報記憶部、203 インデックス生成時刻記録部、204 インデックス記憶部、205 ウェブログデータ収集部、206 ウェブログデータ記憶部、207 インデックス生成部、1101 アクセス要求受信部、1102 出力画面判定部、1103 階層型検索キーワード辞書記憶部、1104 カテゴリー検索画面生成部、1105 カテゴリーテーブル、1106 カテゴリー検索画面出力部、1107 インデックス検索部、1108 キャッシュメモリ、1109 検索キーワード一覧画面生成部、1110 検索キーワード一覧画面出力部、2501 ウェブログ抽出部、2502 ウェブログ一覧画面生成部、2503 ウェブログ一覧画面出力部。
Claims (1)
- PINGサーバと利用者端末にインターネットを介して接続し、以下の要素を有することを特徴とするウェブログ検索サーバ
(1)PINGサーバから、更新されたウェブログのURL、見出し、及び要約を含むウェブログ更新情報を取得するウェブログ更新情報取得部
(2)取得したウェブログ更新情報をウェブログIDと対応付けて記憶するウェブログ更新情報記憶部
(3)ウェブログ更新情報に含まれるURLにアクセスして、ウェブログデータを収集するウェブログデータ収集部
(4)収集したウェブログデータから、キーワードと当該キーワードを含むウェブログデータのウェブログIDを対応付けるインデックス(索引表)を生成するインデックス生成部
(5)インデックス(索引表)を記憶するインデックス記憶部
(6)利用者端末から、パラメータを含むアクセス要求を受信するアクセス要求受信部
(7)アクセス要求に含まれるパラメータが最下層以外のカテゴリーIDである場合にカテゴリー検索画面を出力画面と判定し、アクセス要求に含まれるパラメータが最下層のカテゴリーIDである場合に検索キーワード一覧画面を出力画面と判定し、アクセス要求に含まれるパラメータが検索条件式である場合にウェブログ一覧画面を出力画面と判定する出力画面判定部
(8)階層型のカテゴリー構造と、最下層のカテゴリーに対する検索キーワード及び任意で設定可能な設定式を対応付けて記憶する階層型検索キーワード辞書記憶部
(9)カテゴリー検索画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータであるカテゴリーIDに対して下位に相当する下位カテゴリーIDを階層型検索キーワード辞書記憶部から取得し、下位カテゴリーIDのカテゴリー名を、利用者端末のブラウザの表示画面で選択された場合に下位カテゴリーIDをパラメータとしてアクセス要求に含めて返信するように配置したカテゴリー検索画面を生成するカテゴリー検索画面生成部
(10)生成したカテゴリー検索画面を、利用者端末へ返信するカテゴリー検索画面出力部
(11)検索キーワード一覧画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータであるカテゴリーIDに対応する検索キーワードあるいは設定式を階層型検索キーワード辞書記憶部から取得し、検索キーワードあるいは設定式を検索条件式としてインデックス記憶部のインデックス(索引表)を検索して、検索条件式に適合したウェブログIDの数をカウントしてウェブログ数を求めるインデックス検索部
(12)検索キーワードを、利用者端末のブラウザの表示画面で選択された場合に検索条件式をパラメータとしてアクセス要求に含めて返信するようにウェブログ数とともに配置した検索キーワード一覧画面を生成する検索キーワード一覧画面生成部
(13)生成した検索キーワード一覧画面を、利用者端末へ返信する検索キーワード一覧画面出力部
(14)ウェブログ一覧画面を出力画面と判定した場合に、アクセス要求に含まれるパラメータである検索条件式によりインデックス記憶部のインデックス(索引表)を検索して、検索条件式に適合したウェブログIDを抽出するウェブログ抽出部
(15)抽出したカテゴリーIDに対応するウェブログ更新情報をウェブログ更新情報記憶部から取得し、ウェブログ更新情報記憶部に含まれるURL、見出し、及び要約を、利用者端末のブラウザの表示画面で選択された場合に当該URLへのアクセス要求を送信するように配置したウェブログ一覧画面を生成するウェブログ一覧画面生成部
(16)生成したウェブログ一覧画面を、利用者端末へ返信するウェブログ一覧画面出力部。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005365741A JP2007172092A (ja) | 2005-12-20 | 2005-12-20 | ウェブログ検索サーバ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005365741A JP2007172092A (ja) | 2005-12-20 | 2005-12-20 | ウェブログ検索サーバ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007172092A true JP2007172092A (ja) | 2007-07-05 |
Family
ID=38298610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005365741A Pending JP2007172092A (ja) | 2005-12-20 | 2005-12-20 | ウェブログ検索サーバ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007172092A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011505782A (ja) * | 2007-12-04 | 2011-02-24 | クゥアルコム・インコーポレイテッド | モバイルデバイス電子番組ガイドのコンテンツへのマッピング |
JP2011141641A (ja) * | 2010-01-06 | 2011-07-21 | Dainippon Printing Co Ltd | ブログ投稿画像コミュニケーションシステム、ブログ投稿画像コミュニケーション方法、サーバ、プログラム、記憶媒体 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282826A (ja) * | 2000-04-03 | 2001-10-12 | Nippon Telegr & Teleph Corp <Ntt> | 情報ナビゲーション方法及び装置及び情報ナビゲーションプログラムを格納した記憶媒体 |
JP2002189742A (ja) * | 2000-12-21 | 2002-07-05 | Music Gate Inc | ウェブサイト検索方法 |
JP2002312383A (ja) * | 2001-04-10 | 2002-10-25 | Sharp Corp | 文書検索装置、文書検索システム、文書検索方法、並びにプログラム |
JP2003016085A (ja) * | 2001-06-29 | 2003-01-17 | Nippon Telegraph & Telephone West Corp | コンテンツ検索システム、コンテンツ検索方法、コンテンツ検索プログラムおよび記録媒体 |
-
2005
- 2005-12-20 JP JP2005365741A patent/JP2007172092A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001282826A (ja) * | 2000-04-03 | 2001-10-12 | Nippon Telegr & Teleph Corp <Ntt> | 情報ナビゲーション方法及び装置及び情報ナビゲーションプログラムを格納した記憶媒体 |
JP2002189742A (ja) * | 2000-12-21 | 2002-07-05 | Music Gate Inc | ウェブサイト検索方法 |
JP2002312383A (ja) * | 2001-04-10 | 2002-10-25 | Sharp Corp | 文書検索装置、文書検索システム、文書検索方法、並びにプログラム |
JP2003016085A (ja) * | 2001-06-29 | 2003-01-17 | Nippon Telegraph & Telephone West Corp | コンテンツ検索システム、コンテンツ検索方法、コンテンツ検索プログラムおよび記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011505782A (ja) * | 2007-12-04 | 2011-02-24 | クゥアルコム・インコーポレイテッド | モバイルデバイス電子番組ガイドのコンテンツへのマッピング |
US8973036B2 (en) | 2007-12-04 | 2015-03-03 | Qualcomm Incorporated | Mapping mobile device electronic program guide to content |
JP2011141641A (ja) * | 2010-01-06 | 2011-07-21 | Dainippon Printing Co Ltd | ブログ投稿画像コミュニケーションシステム、ブログ投稿画像コミュニケーション方法、サーバ、プログラム、記憶媒体 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7890485B2 (en) | Knowledge management tool | |
Bansal et al. | BlogScope: A System for Online Analysis of High Volume Text Streams. | |
US9146999B2 (en) | Search keyword improvement apparatus, server and method | |
Koshman et al. | Web searching on the Vivisimo search engine | |
JP5494454B2 (ja) | 検索結果生成方法、検索結果生成プログラムおよび検索システム | |
US8280878B2 (en) | Method and apparatus for real time text analysis and text navigation | |
Blanco et al. | Finding support sentences for entities | |
Nguyen et al. | Federated search in the wild: the combined power of over a hundred search engines | |
US20120059822A1 (en) | Knowledge management tool | |
Pickens et al. | Reverted indexing for feedback and expansion | |
CN105183884A (zh) | 一种基于大数据技术的搜索引擎系统及搜索引擎方法 | |
Niu | Functionalities of web archives | |
Wolfram | The symbiotic relationship between information retrieval and informetrics | |
Davison et al. | Finding Relevant Website Queries. | |
Klein et al. | Evaluating methods to rediscover missing web pages from the web infrastructure | |
Beitzel et al. | Using titles and category names from editor-driven taxonomies for automatic evaluation | |
Gurrin et al. | Replicating web structure in small-scale test collections | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP2007172092A (ja) | ウェブログ検索サーバ | |
KR101008877B1 (ko) | 디지털 포렌식에서의 검색 및 검색 결과를 제시하는 방법, 그리고 그 장치 | |
Sigurbjörnsson et al. | Tagexplorer: Faceted browsing of flickr photos | |
Jain et al. | Organizing query completions for web search | |
Lu et al. | DataExpo: A One-Stop Dataset Service for Open Science Research | |
Wang et al. | Crawling ranked deep web data sources | |
Xue et al. | THUIR at NTCIR-10 INTENT-2 Task. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070717 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100608 |