JP2002024270A - 情報検索蓄積装置 - Google Patents

情報検索蓄積装置

Info

Publication number
JP2002024270A
JP2002024270A JP2000200342A JP2000200342A JP2002024270A JP 2002024270 A JP2002024270 A JP 2002024270A JP 2000200342 A JP2000200342 A JP 2000200342A JP 2000200342 A JP2000200342 A JP 2000200342A JP 2002024270 A JP2002024270 A JP 2002024270A
Authority
JP
Japan
Prior art keywords
information
search
page
unit
meta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000200342A
Other languages
English (en)
Inventor
Akihiro Yamada
晃弘 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP2000200342A priority Critical patent/JP2002024270A/ja
Publication of JP2002024270A publication Critical patent/JP2002024270A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 検索に不慣れなユーザがインターネットで情
報を探すとき、正しい情報にたどり着くために試行錯誤
が必要で、またサイトへのアクセス自体にも時間がかか
る。 【解決手段】 検索部18によって所望のページが得ら
れたとき、メタ情報生成部28はその内容を解析してメ
タ情報を追加してキャッシュメモリ32へ格納する。つ
ぎにユーザが同様の情報を検出したとき、キャッシュ検
索部24が先に追加されたメタ情報を参考に、所望のペ
ージがすでにキャッシングされていればキャッシュメモ
リ32からそのページを読み出してユーザへ提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、情報検索技術に
関する。この発明はとくに、キーワードを利用して情報
を検索し、適宜蓄積する情報検索蓄積装置に関する。
【0002】
【従来の技術】インターネットの利用が進むにつれ、そ
の主要なアプリケーションであるWWW(World Wide W
eb)の利用者が激増し、WWWのふたつの利用形態、す
なわち情報の発信と検索がユーザに広く浸透した。情報
の発信が増えるにつれ、たいがいの情報はいずれかのW
ebサイトのいずれかのページにあるという状況が現実
になった。しかし、情報過多による弊害も指摘されてい
る。すなわち、検索対象であるWebサイトやそのペー
ジがあまりにも多く、短時間で自分の欲する情報にたど
り着けない、「Web迷子」ともいえる状況が起こって
いる。
【0003】こうした状況に敏感な検索系ポータルサイ
トでは、以前より、高度な検索式の設定による効率的な
検索や、条件絞り込みのヒントをサポートしている。す
なわち、ユーザは論理和、論理積などの条件を駆使する
ことにより、情報の洪水から欲しい情報を少ない回数の
検索で効率的に発見できるというものである。
【0004】
【発明が解決しようとする課題】しかし、インターネッ
ト利用が専門家に限られていた時代ならともかく、検索
の実務に不慣れなユーザによるWWWの利用が増えた今
日、高度な検索式の利用を一般ユーザに求めることは困
難である。そうしたユーザが試行錯誤を繰り返し、結果
的に欲しい情報にたどり着く確率は決して高くない。日
夜そうした状況で多数のユーザが時間をロスしているこ
とは確かであり、そうした弊害による時間的ロスは、も
はや国家経済レベルの問題と認識されるべきである。
【0005】本発明は、そうした課題に鑑みてなされた
ものであり、その目的は、ユーザが望む情報をより容易
かつ効果的に検索することの可能な技術の提供にある。
【0006】本発明の別の目的は、ユーザが望む情報を
より短時間でユーザに提示する技術の提供にある。
【0007】本発明のさらに別の目的は、ユーザごとに
異なる要望をくみ取り、カスタマイズされた情報検索を
実現する技術の提供にある。
【0008】
【課題を解決するための手段】本発明のある態様は、情
報検索蓄積装置(以下単に「装置」または「本装置」と
もいう)に関する。本装置は、ユーザの意図を反映する
キーワードをもとに、情報を記載したページに対するグ
ローバルな検索を実施する検索部と、前記検索で得られ
たページを解析して、そのページの内容に関するメタ情
報を生成するメタ情報生成部と、前記検索で得られたペ
ージとそのページについて生成された前記メタ情報とを
関連づけてローカルなメモリ装置へ格納する書込制御部
とを含む。
【0009】「ユーザの意図を反映するキーワード」
は、ユーザが自ら明示的に示したキーワードのほか、ユ
ーザが欲するであろうとの前提のもとで推量したユーザ
の意図に関するキーワードでもよい。
【0010】検索に関する「グローバル」ということば
は、メモリ装置に関する「ローカル」ということばとの
対比に用いられる。すなわち、ローカルなメモリ装置
は、本装置内部またはその近傍に設けられ、一方、検索
部による検索は、例えばインターネットなど、本装置内
部またはその近傍を超えるなんらかのネットワークを介
して実施される。
【0011】「ページ」はひとかたまりのデータをい
い、例としてWWWで検索されるホームページその他の
アクセス対象データをいう。「メタ情報」は、もともと
メタデータが「データに関するデータ」の意味であるこ
とに沿い、ページの内容に関する情報をさす。
【0012】この構成では、まずユーザの意図を反映す
るキーワードを利用してページが検索され、つづいてそ
のページが解析され、メタ情報が生成される。そのペー
ジと生成されたメタ情報は組み合わされ、または一方が
他方へ埋め込まれ、またはそれらの間にリンク情報が設
けられるなどの方法により、関連づけられる。その状態
で、ローカルなメモリ装置へ格納される。このため、メ
タ情報を利用してそのページの内容または主題を大まか
に知り、または検索でき、そのページがローカルなメモ
リ装置、例えばキャッシュメモリに存在する限り、前記
グローバルな検索に比べて一般に速く当該ページを読み
出すことができる。
【0013】前記メタ情報生成部は、前記検索で得られ
たページに含まれるキーワードを検出するキーワード検
出部と、前記検出されたキーワードをもとに、そのペー
ジの主題、すなわち意図、目的、またはテーマなどを解
析する主題解析部と、前記解析の結果判明した前記主題
に沿ってそのページからメタ情報を抽出するメタ情報抽
出部とをさらに含んでもよい。その場合、前記抽出され
たメタ情報は前記検索で得られたページと関連づけられ
て前記メモリ装置へ格納される。
【0014】前記メタ情報生成部は、前記検出されたキ
ーワードをもとに、そのページが所望のページであるか
否か判定するプリチェック部をさらに含み、そのページ
が所望のページでないと判定されたとき、そのページの
前記メモリ装置への格納が中止されてもよい。逆にいえ
ば、そのページが所望のページであると判定されたと
き、そのページを前記メモリ装置へ格納してもよい。
【0015】前記メタ情報生成部は、前記解析の結果判
明した前記主題に沿ってそのページに含まれないメタ情
報を推測してもよい。例えば、あるページの主題が料理
であるが、メタ情報としてその料理の「材料」がなかっ
たとする。その場合、例えばページのタイトルが「おい
しい和食の簡単な献立」であれば、「和食」の料理に
「しょうゆ」が利用される場合が非常に多いため、例え
ばメタ情報として「材料:しょうゆ」を推測して追加し
てもよい。たとえば、献立が煮物であれば、「しょう
ゆ」はかなり高い確率で使用されているという判断もで
きる。したがって、ある情報と、それをもとに高い確率
で推測できるメタ情報を組み合わせて示すテーブルを設
けておいてもよい。推測されたメタ情報もメモリ装置へ
格納されてもよい。
【0016】本装置は、キャッシュ検索部を有してもよ
い。キャッシュ検索部は、前記キーワードを前記メモリ
装置に格納されたメタ情報へ照合することにより、前記
情報を記載したページがすでに前記ローカルなメモリ装
置の中に存在するか否かを判定する。キャッシュ検索部
は、そのページが存在する場合、当該ページの前記メモ
リ装置からの読み出しを指示し、そのページが存在しな
い場合、前記検索部による検索の再実行を指示してもよ
い。再実行がなされた場合、そうして得られたページに
対して、前記メタ情報生成部による処理がなされ、その
結果生成されたメタ情報がそのページと関連づけられて
新たに前記メモリ装置へ格納されてもよい。
【0017】本装置はさらに、前記ユーザの意図を反映
したキーワードに所定の加工を施して前記検索部による
検索を支援する検索前処理部を含んでもよい。この検索
前処理部は例えば、前記ユーザの意図を反映したキーワ
ードから推定されるユーザの検索意図に応じて客観化さ
れたキーワードを付与する条件付加部と、前記キーワー
ドおよび前記付与されたキーワードをもとに、例えばそ
れらの論理和を含む形で検索のための条件式を設定する
検索式設定部とを含む。
【0018】本装置はさらに、ユーザの個人情報をもと
に当該ユーザが問い合わせる情報を予め想定する事前検
索制御部を含んでもよい。その場合、想定された情報に
ついて、バックグラウンドで、すなわちユーザから指示
されず、またはユーザが本装置を使用していない合間に
検索をかけてもよい。そうして取得されたページもメタ
情報とともにメモリ装置へ格納しておけば、ユーザの問
い合わせに対して迅速に対応することができる。
【0019】
【発明の実施の形態】図1は、実施の形態に係る情報検
索蓄積装置10の構成を示す。この構成は、ハードウエ
アコンポーネントでいえば、任意のコンピュータのCP
U、メモリ、その他の素子、およびソフトウエアとして
メモリのロードされた情報検索および蓄積機能のあるプ
ログラムなどによって実現されるが、ここではそれらの
連携によって実現される機能ブロックを描いている。し
たがって、これらの機能ブロックがハードウエアのみ、
ソフトウエアのみ、またはそれらの組合せによっていろ
いろな形で実現できることは、当業者には理解されると
ころである。
【0020】とくに、情報検索蓄積装置10のうちソフ
トウエアによる部分は、例えばWebブラウザの機能を
主体に、この実施の形態に特徴的なメタ情報の生成とキ
ャッシュ制御機能を組み入れることで実現する。ここで
はそうした態様を前提とし、情報の検索をWWW上で行
うものとする。以下、まずは全体構成を大まかに説明し
た後、処理の流れを説明する。
【0021】入力部12は、キーボード、マウスその他
の外部機器を介してユーザから入力されたデータ、ここ
では検索要求文を取得する。検索要求文は、例えば「牛
肉を使った料理のレシピが知りたい」というように自然
文の形式をとるが、もちろん、最初からキーワード単位
で入力してもよい。以下、自然文を例にとる。
【0022】検索要求文はキーワード抽出部14へ送ら
れ、形態素へ分解され、主に名詞、ここでは「牛肉」
「料理」「レシピ」などがユーザの意図を反映するキー
ワードとして抽出される。以下、こうして取得されたキ
ーワードを「初期キーワード」といい、後述の検索前処
理部16で新たに付与されるキーワードと区別する。
【0023】初期キーワードは検索前処理部16へ送ら
れる。検索前処理部16の機能は後述するが、ここでは
初期キーワードが検索に最適な形で選ばれているとは限
らないため、一部キーワードを削除し、かつより客観化
された適切なキーワード(以下「客観キーワード」とも
いう)を生成する。つづいて、初期キーワードのうち削
除されずに残ったキーワード(以下「選定された初期キ
ーワード」ともいう)と客観キーワードの論理積、つま
りアンドをとり、こうして得られる検索式を検索部18
へ送付する。
【0024】検索部18は自身が検索エンジンであって
もよいが、インターネットに接続されたポータルサイト
などが有する検索エンジンに指示を出す制御機能を有し
てもよい。いずれにしても、通信部20を介し、先の検
索式を用いてWebサイトやそのページへの検索が実行
され、その結果ヒットした情報(以下単に「目的ペー
ジ」という)が通信部20を介して検索結果取得部30
で取得され、これが表示画面生成部34で整形され、表
示装置36へ一覧表示される。
【0025】目的ページはメタ情報生成部28へも送ら
れる。メタ情報生成部28は、後述のごとく必要なメタ
情報を生成し、これを目的ページに関連づけてキャッシ
ュメモリ32へ格納する。以降、キャッシュメモリ32
内のデータが将来のユーザによる検索に対して待機状態
となる。なお、キャッシュメモリ32は、ディスク、半
導体メモリなど、その形態は問わない。
【0026】キーワード抽出部14で抽出された初期キ
ーワードは、キャッシュ検索部24へも送られる。キャ
ッシュ検索部24は、先の「牛肉」等のキーワードをも
とにキャッシュメモリ32内を検索し、もしユーザが求
めるページがすでにキャッシングされていれば、検索前
処理部16または検索部18へ指示を出すことにより、
インターネットへのアクセスが必要なグローバルな検索
は中止し、ローカルなキャッシュメモリ32から所望の
ページを読み出す。読み出されたページは表示装置36
で表示される。一方、所望のページがキャッシュメモリ
32に存在しない場合は、先に述べたごとく、検索前処
理部16、検索部18を経てページが取得される。
【0027】ユーザ情報データベース22は、ユーザに
関するいろいろな情報(以下「個人情報」ともいう)、
たとえば趣味などのある程度恒久的な情報や、今週の予
定または今週食べたものといった一過性のある情報など
を保持している。個人情報は、入力部12から直接的に
取得される他、ユーザの興味の対象を初期キーワードの
形でキーワード抽出部14から得てもよい。また本装置
は、図示しないPIM(個人情報管理装置)としてスケ
ジュール管理機能、食べたものからカロリーを計算する
健康管理機能、買った物やその価格を記録する会計機能
などを備えていてもよく、そうした機能の利用記録から
取得できる情報を格納してもよい。
【0028】事前検索制御部26は、ユーザ情報データ
ベース22に保持された個人情報をもとに、ユーザが興
味を示しそうな情報を特定し、その情報に関するキーワ
ードを検索前処理部16へ送る。検索前処理部16は、
事前検索制御部26からキーワードが送られてきたこと
を契機として客観キーワードの生成と検索式の生成を行
い、検索部18が検索を実行する。事前検索制御部26
が検索を起動するこのプロセスはバッグラウンド的に処
理されることが望ましく、例えばユーザが本装置を利用
していない夜間、または昼間であってもユーザから指示
がない時間がある程度続いたとき、または図示しないメ
ールプログラムがメールのダウンロードのためにインタ
ーネットへダイヤルアップ接続しにいったときなどに合
わせて実行してもよい。いずれの場合も、バックグラン
ド的な処理であれば、メタ情報生成部28による処理に
も時間がとれるため、好都合である。
【0029】図2はメタ情報生成部28の内部構成を示
す。検索結果取得部30から送付された目的ページは、
キーワード検出部50へ入力される。キーワード検出部
50は目的ページから形態素解析その他既知の解析方法
によりキーワードを検出する。検出されたキーワード
(以下「チェック用キーワード」ともいう)はプリチェ
ック部52へ送られる。
【0030】プリチェック部52は、チェックデータ保
持部62に予め格納されたデータをもとに、目的ページ
が本当にユーザの希望するページであるかどうか判定す
る。チェックデータ保持部62には、細分化されたテー
マごとに出現頻度の高いキーワードが格納されている。
テーマ分類の例として、ポータルサイトが提供するごと
く、まず大分類に「ニュース」「コンピュータ」「トラ
ベル」「グルメ」「オークション」「マネー」「スポー
ツ」「娯楽」「音楽」「仕事」などがあり、例えば「グ
ルメ」の下の中分類として「全国のレストラン」「イベ
ント」「プロの献立」「エスニック料理」「料理番組」
「栄養」「耳より情報」などがある。チェックデータ保
持部62は例えば、こうした中分類ごとにポータルサイ
トに登録されているサイトのページを、過去のいずれか
のタイミングでサンプルして得られたキーワードを保持
している。
【0031】プリチェック部52は、チェック用キーワ
ードのそれぞれとチェックデータ保持部62に保持され
ているキーワードとのマッチングをとり、各キーワード
が上記のいずれの大分類または中分類に属するかを判定
する。その結果、例えばチェック用キーワードの過半数
が大分類の「グルメ」に属していたとする。一方、当初
のユーザの意図を示す初期キーワード「牛肉」「料理」
「レシピ」も同一の「グルメ」に存在すれば、目的ペー
ジはチェックに合格したと判断する。もちろん、大分類
「グルメ」以外に中分類の「プロの献立」などを利用し
てもよく、その場合、チェック用キーワードの例えば2
0%が「プロの献立」に含まれていれば合格としてもよ
い。ただし、プリチェック部52は厳密なチェックが目
的ではなく、あきらかにユーザの意図からはずれるペー
ジのみを弾けばよく、合格の判定を非常に緩く設定して
もよい。チェックの結果はメタ情報書込制御部60に伝
えられる。
【0032】主題解析部54もプリチェック部52とほ
ぼ同様の構成であり、キーワード検出部50からチェッ
ク用キーワードを取得するが、主題解析部54は初期キ
ーワードについては関知せず、チェック用キーワードの
多数が含まれる大分類または中分類を特定する。これが
例えば「プロの献立」であれば、目的ページの主題は
「料理」またはその中の特に「献立」であると判断し、
ここでは「献立」をメタ情報抽出部56およびメタ情報
推測部58へ伝える。
【0033】メタ情報抽出部56は、「献立」が目的ペ
ージの主題であるとの判断のもとに、「献立」に関する
情報を目的ページ内から検索し、メタ情報の集合体であ
るファイル(以下「メタ情報ファイル」という)を生成
する。図3はそうして生成されたメタ情報ファイル70
の例を示す。ここでは、予め「料理分類」「料理名」そ
の他の項目を定めた料理用テンプレートが準備され、そ
れらの項目に目的ページから該当する情報を埋め込んで
いる。
【0034】メタ情報推測部58は、メタ情報ファイル
70の項目のうち、目的ページ中に該当する情報が発見
されなかった項目について、そのメタ情報を推測する。
例えば、いま図3の項目のうち「カロリー」が不明であ
れば、「成分表」や「材料リスト」、および必要に応じ
て「作り方」を参照し、カロリーの概算を計算してもよ
い。そのための計算式は料理用テンプレートを作成する
際にメタ情報推測部58に記録しておいてもよい。料理
以外にも、例えば旅行用テンプレートを作る場合、「電
車による所要時間」「交通費」「付近の名所」などを項
目として設ける傍ら、それらの情報が目的ページに発見
できない場合、地図情報、列車時刻表、各県観光案内情
報などを予め調べておいてメタ情報を推測してもよい。
ユーザの趣味が旅行であることがわかっていれば、事前
検索制御部26は予めWWW上で利用可能な地図情報等
を利用し、メタ情報推測のための情報を入手してもよい
し、その情報源であるページを、ユーザが興味をもちそ
うなページとして予めキャッシュメモリ32へ格納して
もよい。
【0035】メタ情報抽出部56で生成され、メタ情報
推測部58によって情報が追加されたメタ情報ファイル
70はメタ情報書込制御部60へ送られる。メタ情報書
込制御部60は、プリチェック部52による合否チェッ
クが合格であった場合、メタ情報ファイル70と目的ペ
ージを関連づけてキャッシュメモリ32へ格納する。
【0036】図4は、メタ情報ファイル70と目的ペー
ジのページデータ72の関連づけの方法を示す。ここで
はページデータ72の先頭その他任意の箇所にメタ情報
ファイル70の内容が埋め込まれる。そのため、例えば
XML(eXtensible MarkupLanguage)で両者を一体の
テキストファイルとして生成してもよく、図3の記述
は、 <献立メタ情報> <URL>www.kondate.com</URL> <料理分類>中華</料理分類> : </献立メタ情報> などの記述に変換して埋め込まれる。
【0037】図5は、メタ情報ファイル70と目的ペー
ジのページデータ72の別の関連づけを示す。ここで
は、メタ情報ファイル70をページデータ72と別ファ
イルとして生成し、それらのリンク情報74が別途記録
されている。この方法の場合、キャッシュ検索部24に
よる検索はメタ情報ファイル70に対して行われ、リン
ク情報74を介して所望のページがキャッシュメモリ3
2から読み出される。
【0038】図6は、検索前処理部16の内部構成を示
す。キーワード抽出部14で抽出された初期キーワード
は条件緩和部100へ送られる。条件緩和部100は、
参照テーブル104を検索することにより、削除すべき
キーワードを決定する。参照テーブル104には、過去
の検索における経験則をもとに、検索の際、大幅にヒッ
ト数を減らすようなキーワード、いいかえれば、条件と
して厳しすぎるキーワードが削除すべきものとして記録
されている。以下、そうして削除されたキーワードを
「無効キーワード」ともいう。条件緩和部100は、キ
ーワードを削除して残ったキーワード、すなわち、選定
された初期キーワードを条件付加部102および検索式
設定部106へ送付する。条件付加部102にはさらに
無効キーワードも通知される。
【0039】条件付加部102は、選定された初期キー
ワードおよび無効キーワード、または例えば後者のみを
もとに、参照テーブル104を参照して客観キーワード
を特定し、これを検索式設定部106へ通知する。検索
式設定部106は、選定された初期キーワードと客観キ
ーワードの論理積、つまりアンドをとり、こうして得ら
れる検索式を検索部18へ送付する。
【0040】図7は参照テーブル104の内部データの
一例を示す。参照テーブル104は、キーワード欄14
0、削除欄142、および客観キーワード欄144が設
けられている。キーワード欄140には初期キーワード
が記録され、削除欄142はそれらのうち無効キーワー
ドに「1」のフラグが立っている。このフラグが「0」
の場合、それは選定されたキーワードとして検索式の中
に残される。客観キーワード欄144は、各初期キーワ
ードに対応して過去の検索から経験則的に、またはオペ
レータが自主的に設定した客観キーワードが優先順に記
述されている。汎用の検索サイトを用いた例を紹介すれ
ば、「牛肉」というキーワードで検索したときのヒット
数は数万を越えるが、「レシピ」をアンド条件として検
索をすると、そのヒット数が大きく下がる。この状態で
は、ユーザの求めるレシピに関する情報も相当数捨てら
れている。その理由は、レシピを記述したページには、
実は「レシピ」という単語が含まれない場合も多いこと
による。このため、参照テーブル104において初期キ
ーワード「レシピ」は、削除すべきキーワードとしてフ
ラグが「1」にセットされ、それを代替する効果的な客
観キーワードとして「塩」「こしょう」がこの順に記述
されている。以上が情報検索蓄積装置10の構成であ
る。
【0041】図8は、この構成による処理の手順を示
す。牛肉に関するレシピを知りたいユーザは、まず検索
要求文「牛肉を使った料理のレシピを知りたい」を入力
する。検索要求文は入力部12で取得され(S10)、
初期キーワード「牛肉」「料理」「レシピ」が抽出され
る(S12)。これらの初期キーワードはキャッシュ検
索部24へ送られ、キャッシュメモリ32に対する検索
が掛けられ(S14)、所望のページがすでにキャッシ
ングされていれば(S14のY)、そのページが読み出
されて表示画面生成部34を経て表示される(S1
6)。
【0042】一方、所望のページがキャッシングされて
いなければ(S14のN)、検索前処理部16により、
無効キーワードの特定と客観キーワードの付与および検
索式の設定という検索の前処理がなされる(S18)。
ここでは、「レシピ」というキーワードが削除され、代
わりに「塩」と「こしょう」がアンド条件で追加され
る。したがって、検索式としては、 牛肉 and (塩 and こしょう) が立てられ、これをもとに検索部18がWWWを用いた
ページ検索を実施する(S20)。
【0043】検索によって発見されたページ、すなわち
目的ページは検索結果取得部30、表示画面生成部34
を経て表示される(S22)。また、目的ページはメタ
情報生成部28へも送られ、ここでプリチェック、主題
の解析、メタ情報の抽出と推測を経てメタ情報が図3に
示すファイルとして生成される(S24)。つづいて、
このメタ情報は目的ページと図4または図5のような方
法で関連づけられ、キャッシュメモリ32へ格納される
(S26)。
【0044】その結果、次回ユーザが情報を検索すると
きに「牛肉」という初期キーワードがあればメタ情報フ
ァイル70の「材料リスト」の項目から有効な検索が行
われるし、レシピを知りたければ客観キーワードとして
追加された「塩」「こしょう」などが同じく「材料リス
ト」または「作り方」などの項目から有効に検索され
る。したがって、ユーザがある程度主観的に入力した検
索要求文をもとに、ユーザが求める情報が迅速に提供さ
れる。とくに、この実施の形態に特徴的なメタ情報の追
加とキャッシングによれば、ユーザが求めるページがキ
ャッシュメモリ32に存在するときには非常に高い精度
で検索にかかるし、そうしたキャッシュメモリ32から
読み出されたページがユーザの満足にかなう確率も高ま
る。とくに、メタ情報生成部28ではキャッシングすべ
きページをプリチェックするため、無駄のないキャッシ
ングを行うことができる。
【0045】図9は、事前検索制御部26によってバッ
クグラウンド的に実施される事前検索の手順を示す。い
まユーザは前述の健康管理機能を利用して、毎日食事の
内容を本装置へ記録しているとする。また、個人情報か
らこのユーザは中華料理が好きであり、かつ自分で調理
することが好きなことがわかったとする(S30)。そ
の場合、事前検索制御部26は例えば一週間にわたって
ユーザがまったく中華料理を食べていないことを検知す
れば、そろそろ中華料理の献立に対する問い合わせがあ
ると予測し、事前検索制御部26はキーワードとして
「中華」「料理」「献立」などを生成する(S32)。
【0046】つづいて事前検索制御部26は、ユーザが
本装置を利用しない例えば夜中になったとき、バックグ
ラウンド的な検索のためのタイミングが到来したと認識
し(S34のY)、生成したキーワードを検索前処理部
16へ送る。以下の処理は図8と同様であり、ユーザが
問い合わせる可能性のあるページが予めキャッシングさ
れる。その結果、ユーザからの要求に迅速に対応でき、
カスタマイズ度の高いエージェントマシンが実現する。
【0047】なお、ユーザが頻繁に「今日の株価」「お
勧め温泉情報」などのページへアクセスしていれば、事
前検索制御部26は予めそれらのページをキャッシング
するよう作用してもよく、その場合はキーワードに代え
て、直接それらのページのURLを検索部18または通
信部20へ通知してもよい。ユーザが個人情報として
「いま買いたいはパーソナルコンピュータ」を登録して
いる場合、事前検索制御部26はコンピュータやPCな
どに関連するページを検索し、メタ情報としてCPUス
ピード、メモリ容量などを生成してキャッシュメモリ3
2へ格納すればよい。その場合も、ユーザがそうした情
報へアクセスしたとき、ローカルなキャッシュメモリ3
2から、しかも精度の高い検索の結果得られたページが
読み出されるため、ユーザの利便性は高まる。
【0048】以上、本発明をいくつかの実施の形態をも
とに説明した。これらの実施の形態は例示であり、それ
らの各構成要素や各処理プロセスの組合せにいろいろな
変形例が可能なこと、またそうした変形例も本発明の範
囲にあることは当業者に理解されるところである。
【0049】そうした変形例として、事前検索制御部2
6はさらに、お勧め情報をユーザへ提示するプッシュ機
能を備えてもよい。事前検索制御部26は予めユーザの
問い合わせを予測するため、例えば「今日の夕食は、中
華料理はいかがですか。最新のレシピが届きました」な
どと表示することにより、キャッシングされているペー
ジに対するユーザの興味を喚起してもよい。
【0050】同様に、メタ情報を生成する段階で、例え
ばカロリーの高低、塩分の多寡をメタ情報に組み入れて
もよい。その場合、ユーザが「太らないメニューを知り
たい」という問いかけをすることにより、カロリーの低
い献立がキャッシュメモリ32から読み出され、または
外部から検索される。
【0051】さらに別の変形例として、本実施の形態で
は情報検索蓄積装置10をユーザ側に存在するクライア
ント装置として描いたが、これはサーバ側の装置であっ
ても一向に差し支えない。例えば、家庭内の機器を制御
するホームサーバ、OA/FA機器を制御するサーバを
はじめ、多数のクライアントに検索サービスを提供する
Webサーバ側に設けることができる。例えばWebサ
ーバが情報検索装置10を兼ねる場合、図1の入力部1
2はインターネットを介してユーザから送信された検索
要求文を受け付け、以降、当該サーバ内で一連の処理を
なせばよい。
【0052】さらに別の構成として、情報検索蓄積装置
10をクライアントおよびサーバの協働によって実現し
てもよい。一例として、図1の入力部12とキーワード
抽出部14をクライアント側に設け、それら以外の機能
ブロックをサーバ側に置いてもよい。当然ながら、図1
の構成をこれ以外の部分で分割してクライアント側とサ
ーバ側に分配することができる。どのような分配がよい
かについては、クライアント側のユーザの利便性、サー
バ側の負荷、両者の通信量などの要素を考慮して定める
ことができる。
【0053】
【発明の効果】本発明によれば、ユーザが望む情報をよ
り容易かつ効果的に検索および蓄積することができる。
【図面の簡単な説明】
【図1】 実施の形態に係る情報検索蓄積装置の構成図
である。
【図2】 実施の形態に係るメタ情報生成部の構成図で
ある。
【図3】 メタ情報ファイルの内部データを示す図であ
る。
【図4】 メタ情報ファイルとページデータが一体化さ
れた状態を示す図である。
【図5】 メタ情報ファイルとページデータがリンク情
報をもとに関連づけられた状態を示す図である。
【図6】 実施の形態に係る検索前処理部の構成図であ
る。
【図7】 検索前処理部の参照テーブルの内部データを
示す図である。
【図8】 実施の形態によって情報が検索され、蓄積さ
れる手順を示すフローチャートである。
【図9】 実施の形態によって情報が事前に検索され、
蓄積される手順を示すフローチャートである。
【符号の説明】
10 情報検索蓄積装置、 12 入力部、 14 キ
ーワード抽出部、 16 検索前処理部、 18 検索
部、 22 ユーザ情報データベース、 24キャッシ
ュ検索部、 26 事前検索制御部、 28 メタ情報
生成部、 30 検索結果取得部、 32 キャッシュ
メモリ、 50 キーワード検出部、52 プリチェッ
ク部、 54 主題解析部、 56 メタ情報抽出部、
58 メタ情報推測部、 70 メタ情報ファイル、
100 条件緩和部、 102 条件付加部、 10
6 検索式設定部。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 ユーザの意図を反映するキーワードをも
    とに、所望の情報を記載したページに対するグローバル
    な検索を実施する検索部と、 前記検索で得られたページを解析して、そのページの内
    容に関するメタ情報を生成するメタ情報生成部と、 前記検索で得られたページとそのページについて生成さ
    れた前記メタ情報とを関連づけてローカルなメモリ装置
    へ格納する書込制御部と、 を含むことを特徴とする情報検索蓄積装置。
  2. 【請求項2】 前記メタ情報生成部は、 前記検索で得られたページに含まれるキーワードを検出
    するキーワード検出部と、 前記検出されたキーワードをもとに、そのページの主題
    を解析する主題解析部と、 前記解析の結果判明した前記主題に沿ってそのページか
    らメタ情報を抽出するメタ情報抽出部とをさらに含み、 前記抽出されたメタ情報が前記検索で得られたページと
    関連づけられて前記メモリ装置へ格納されることを特徴
    とする請求項1に記載の情報検索蓄積装置。
  3. 【請求項3】 前記メタ情報生成部は、前記検出された
    キーワードをもとに、そのページが所望のページである
    か否か判定するプリチェック部をさらに含み、 そのページが所望のページでないと判定されたとき、そ
    のページの前記メモリ装置への格納が中止されることを
    特徴とする請求項2に記載の情報検索蓄積装置。
  4. 【請求項4】 前記メタ情報生成部は、前記解析の結果
    判明した前記主題に沿ってそのページに含まれないメタ
    情報を推測するメタ情報推測部をさらに含み、 前記推測されたメタ情報が含まれる形で前記メモリ装置
    への格納が行われることを特徴とする請求項2、3のい
    ずれかに記載の情報検索蓄積装置。
  5. 【請求項5】 前記ユーザの意図を反映するキーワード
    を前記メモリ装置に格納された前記メタ情報へ照合する
    ことにより、前記所望の情報を記載したページがすでに
    前記ローカルなメモリ装置の中に存在するか否かを判定
    するキャッシュ検索部をさらに含み、 当該キャッシュ検索部は、そのページが存在する場合、
    当該ページの前記メモリ装置からの読み出しを指示し、
    そのページが存在しない場合、前記検索部による検索の
    再実行を指示することを特徴とする請求項1から4のい
    ずれかに記載の情報検索蓄積装置。
  6. 【請求項6】 前記検索の再実行によって得られたペー
    ジに対して、前記メタ情報生成部による処理がなされ、
    その結果生成されたメタ情報がそのページと関連づけら
    れて新たに前記メモリ装置へ格納されることを特徴とす
    る請求項5に記載の情報検索蓄積装置。
  7. 【請求項7】 前記ユーザの意図を反映するキーワード
    に所定の加工を施して前記検索部による検索を支援する
    検索前処理部をさらに含み、 当該検索前処理部は、前記ユーザの意図を反映するキー
    ワードから推定されるユーザの検索意図に応じて客観化
    されたキーワードを付与する条件付加部と、 前記キーワードおよび前記付与されたキーワードをもと
    に検索のための条件式を設定する検索式設定部と、 を含むことを特徴とする請求項1から6のいずれかに記
    載の情報検索蓄積装置。
  8. 【請求項8】 前記ユーザの個人情報をもとに当該ユー
    ザが問い合わせる情報を予め想定する事前検索制御部を
    さらに含み、 前記想定された情報について前記検索部による検索がバ
    ックグラウンド処理として実施されることを特徴とする
    請求項1から7のいずれかに記載の情報検索蓄積装置。
JP2000200342A 2000-06-30 2000-06-30 情報検索蓄積装置 Pending JP2002024270A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000200342A JP2002024270A (ja) 2000-06-30 2000-06-30 情報検索蓄積装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000200342A JP2002024270A (ja) 2000-06-30 2000-06-30 情報検索蓄積装置

Publications (1)

Publication Number Publication Date
JP2002024270A true JP2002024270A (ja) 2002-01-25

Family

ID=18698230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000200342A Pending JP2002024270A (ja) 2000-06-30 2000-06-30 情報検索蓄積装置

Country Status (1)

Country Link
JP (1) JP2002024270A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007108541A (ja) * 2005-10-14 2007-04-26 Nec Corp メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末
JP2009077761A (ja) * 2007-09-25 2009-04-16 Toshiba Corp 医療画像管理装置、及び医用画像管理方法
US8549017B2 (en) 2003-05-27 2013-10-01 Sony Corporation Information processing apparatus and method, program, and recording medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8549017B2 (en) 2003-05-27 2013-10-01 Sony Corporation Information processing apparatus and method, program, and recording medium
US9495438B2 (en) 2003-05-27 2016-11-15 Sony Corporation Information processing apparatus and method, program, and recording medium
JP2007108541A (ja) * 2005-10-14 2007-04-26 Nec Corp メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末
JP2009077761A (ja) * 2007-09-25 2009-04-16 Toshiba Corp 医療画像管理装置、及び医用画像管理方法

Similar Documents

Publication Publication Date Title
US10929487B1 (en) Customization of search results for search queries received from third party sites
JP4921152B2 (ja) 検索方法、システム、プログラム記憶装置
JP5572596B2 (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
US7353246B1 (en) System and method for enabling information associations
US7730054B1 (en) Systems and methods for providing searchable prior history
JP4638439B2 (ja) ウェブ検索の個人化
US7606794B2 (en) Active Abstracts
KR100932999B1 (ko) 사용자 정보 및 콘텐츠에 기초하여 자동으로 생성된 링크에의한 문서 브라우징
US9323808B1 (en) Predictive query suggestion caching
US6665658B1 (en) System and method for automatically gathering dynamic content and resources on the world wide web by stimulating user interaction and managing session information
JP4805929B2 (ja) インラインのコンテキストクエリを用いた検索システムおよび方法
US7107264B2 (en) Content bridge for associating host content and guest content wherein guest content is determined by search
JP2002024285A (ja) ユーザ支援方法およびユーザ支援装置
US20040267815A1 (en) Searchable personal browsing history
US20020198962A1 (en) Method, system, and computer program product for distributing a stored URL and web document set
JP4962945B2 (ja) ブックマーク・タグ設定装置
JP2002082748A (ja) ユーザ支援装置
JPH10154162A (ja) ハイパーテキストマークアップ言語(html)ファイルに対するマルチメディアブックマークを提供するためのシステムおよび方法
KR20070039072A (ko) 검색 엔진에서의 결과물 기반의 광고 개인화
US20100145934A1 (en) On-demand search result details
KR20090006464A (ko) 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체
KR101103766B1 (ko) 태그 정보를 이용하여 사용자 취향정보를 수집하는 단말기기, 그 방법 및 기록매체
US20100057695A1 (en) Post-processing search results on a client computer
TWI399657B (zh) A provider, a method of providing information, a program, and an information recording medium
JP2002024270A (ja) 情報検索蓄積装置