JP2001282812A

JP2001282812A - 情報処理装置および方法、並びにプログラム格納媒体

Info

Publication number: JP2001282812A
Application number: JP2000089317A
Authority: JP
Inventors: Hiroyuki Hobayashi; 浩之法林
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2000-03-28
Filing date: 2000-03-28
Publication date: 2001-10-12

Abstract

(57)【要約】【課題】ユーザに適した情報の提示を行うためのデー
タを、効率よく取得できるようにする。【解決手段】ステップＳ１において、例えば、ハード
ディスクドライブに蓄積されている電子メールが読み出
され、ステップＳ２，Ｓ３において、その電子メールの
属性情報およびキーワードが所定の処理により抽出され
る。抽出されたこれらの情報に基づき、ステップＳ４乃
至Ｓ７の各処理により、データベースが作成される。デ
ータベースは、複数のファイルから構成されており、各
ファイルは、メッセージIDにより一意に区別が付くよう
になっている。ファイルには、キーワードより得られる
参照用の過去の電子メールや、関連する情報、例えば、
Webのタイトルやアドレスなどが、それぞれ関連付けら
れて記憶されている。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は情報処理装置および
方法、並びにプログラム格納媒体に関し、特に、ユーザ
に適した情報を提示するために用いられるデータベース
を作成する装置に用いて好適な情報処理装置および方
法、並びにプログラム格納媒体に関する。

【０００２】

【従来の技術】インターネットの普及に伴い、さまざま
な情報をインターネット上で検索し、取得することがで
きるようになってきている。さまざまな情報として、所
定の地域のイベント、商店の広告、割引などの優待サー
ビスなどがある。また、インターネット上で公開してい
る情報は、紙媒体の情報誌として提供される場合もあ
る。ユーザは、これらのインターネットや情報誌などか
ら、情報を取得することができる。

【０００３】

【発明が解決しようとする課題】上述したインターネッ
トや情報誌から情報を取得する場合、ユーザの方から、
例えば、インターネットにアクセスし、検索し、所望の
情報を取得するといった処理を行わなくてはならなかっ
た。すなわち、能動的に情報を取得することしかできな
かった。

【０００４】このように、ユーザは、能動的にしか情報
を取得できないといった課題があった。そこで、ユーザ
が送受信した電子メールなどの文書から、キーワードを
検出し、データベース化し、そのデータベースを用い
て、情報を取得することにより、ユーザの嗜好に適した
情報を提示する方法、換言すれば、ユーザが受動的に所
望するであろう情報を得られる方法を、本出願人は、先
に、例えば、特願2000-042303において提案している。

【０００５】提案されている方法において、例えば、電
子メールの文書からキーワードを抽出するような場合、
その文書が膨大な量になったときに、処理が低下した
り、データベースを更新、移転、統合するとき、データ
ベースの一貫性が維持できない可能性があるといった課
題があった。

【０００６】本発明はこのような状況に鑑みてなされた
ものであり、文書のメッセージIDにより、データベース
内のファイルを区別して記憶することにより、データベ
ースの作成処理にかかる負担を軽減し、作成されるデー
タベースの一貫性を維持することを目的とする。

【０００７】

【課題を解決するための手段】請求項１に記載の情報処
理装置は、テキストデータからキーワードを抽出する抽
出手段と、抽出手段により抽出されたキーワードに対応
する関連情報を検索し、取得する取得手段と、抽出手段
により抽出されたキーワードと、取得手段により取得さ
れた関連情報を、テキストデータのメッセージIDをファ
イル名とするファイルで管理する管理手段とを含むこと
を特徴とする。

【０００８】前記関連情報は、過去の時点において授受
されたテキストデータに関する情報を含み、前記管理手
段は、過去の時点において授受されたテキストデータに
関する情報を、そのテキストデータに対応するメッセー
ジIDで管理するようにすることができる。

【０００９】前記管理手段は、キーワードを、キーワー
ドがテキストデータに出現した回数、所定の方法により
算出した重み、および、キーワードが取得手段により関
連情報が検索される際のキーワードとして所定の条件を
満たしているか否かを示す情報とを、それぞれ関連付け
て管理するようにすることができる。

【００１０】請求項４に記載の情報処理方法は、テキス
トデータからキーワードを抽出する抽出ステップと、抽
出ステップの処理で抽出されたキーワードに対応する関
連情報を検索し、取得する取得ステップと、抽出ステッ
プの処理で抽出されたキーワードと、取得ステップの処
理で取得された関連情報を、テキストデータのメッセー
ジIDをファイル名とするファイルで管理するための制御
を行う管理制御ステップとを含むことを特徴とする。

【００１１】請求項５に記載のプログラム格納媒体のプ
ログラムは、テキストデータからキーワードを抽出する
抽出ステップと、抽出ステップの処理で抽出されたキー
ワードに対応する関連情報を検索し、取得する取得ステ
ップと、抽出ステップの処理で抽出されたキーワード
と、取得ステップの処理で取得された関連情報を、テキ
ストデータのメッセージIDをファイル名とするファイル
で管理するための制御を行う管理制御ステップとを含む
ことを特徴とする。

【００１２】請求項１に記載の情報処理装置、請求項４
に記載の情報処理方法、および請求項５に記載のプログ
ラム格納媒体においては、テキストデータからキーワー
ドが抽出され、そのキーワードに対応する関連情報が検
索され、取得され、抽出されたキーワードと、取得され
た関連情報が、テキストデータのメッセージIDをファイ
ル名とするファイルで管理される。

【００１３】

【発明の実施の形態】以下に本発明の実施の形態につい
て、図面を参照しながら説明する。図１に示すように、
本実施の形態においては、ユーザが用いる端末１と、情
報を検索する検索サーバ２とが、インターネット３を介
して互いに情報の授受ができるように接続されている。
インターネットは一例であり、無線や有線などの他のネ
ットワークを用いるようにしても良い。

【００１４】端末１は、パーソナルコンピュータ、携帯
可能なモバイルコンピュータ、PHS（Personal Handy ph
one System）などである。

【００１５】図２は、パーソナルコンピュータとしての
端末１の内部構成例を示す図である。端末１は、CPU(Ce
ntral Processing Unit)１１を内蔵している。CPU１１
にはバス１４を介して、入出力インタフェース１５が接
続されている。入出力インタフェース１５には、キーボ
ード、マウスなどの入力デバイスよりなる入力部１６、
処理結果としての例えば音声信号を出力する出力部１
７、処理結果としての画像を表示するディスプレイなど
よりなる表示部１８、プログラムや各種データを格納す
るハードディスクドライブなどよりなる記憶部１９、LA
N(Local Area Network)やインタネットを介してデータ
を通信するモデムなどよりなる通信部２０、および、磁
気ディスク３１乃至半導体メモリ３４などのプログラム
格納媒体に対してデータを読み書きするドライブ２１が
接続されている。

【００１６】バス１４には、ROM(Read Only Memory)１
２およびRAM(Random Access Memory)１３が接続されて
いる。

【００１７】本発明を適用した情報処理プログラムは、
磁気ディスク３１乃至半導体メモリ３４に格納された状
態で端末１に供給され、ドライブ２１によって読み出さ
れて、記憶部１９に内蔵されるハードディスクドライブ
にインストールされている。記憶部１９にインストール
されている情報処理プログラムは、入力部１６に入力さ
れるユーザからのコマンドに対応するCPU１１の指令に
よって、記憶部１９からRAM１３にロードされて実行さ
れる。なお、端末１の起動時において自動的にプログラ
ムが実行されるように設定しておくようにしてもよい。

【００１８】なお、記憶部１９に内蔵されるハードディ
スクドライブには、情報処理プログラムの他、WWWブラ
ウザ、メーラ、およびワードプロセッサなどのアプリケ
ーションプログラムもインストールされており、情報処
理プログラムと同様に、入力部１６に入力されるユーザ
からの起動コマンドに対応するCPU１１の指令によっ
て、記憶部１９からRAM１３にロードされて実行され
る。

【００１９】検索サーバ２は、基本的に端末１と同様の
構成をしている。

【００２０】図３は、端末１で情報処理プログラムが起
動された場合の機能ブロック図である。情報処理プログ
ラムの機能ブロックは、関連情報のデータベースを蓄積
する蓄積部４１と、対象となる文書に対応する関連情報
をユーザに提示する提示部４７から構成される。

【００２１】蓄積部４１の文書取得部４２は、電子メー
ルを送受信するアプリケーションプログラム（以下、メ
ーラ(mailer)と記述する）によって送受信した文書やワ
ードプロセッサプログラムによって編集された文書など
のうち、文書取得部４２が未取得の文書を取得して文書
属性処理部４３および文書内容処理部４４に供給する。
なお、以下においては、主に、メーラにより電子メール
として送受信された文書を例として説明する。

【００２２】文書属性処理部４３は、文書取得部４２か
ら供給される文書の属性情報を抽出し、属性情報に基づ
き、文書をグループ化して、文書内容処理部４４および
文書特徴データベース作成部４５に供給する。電子メー
ルである場合、文書の属性情報としてヘッダに記述され
ている情報（対象となっているメールを特定するメッセ
ージＩＤ、参照しているメールのメッセージＩＤ(Refer
ences,In-Reply-To)、宛先(To,Cc,Bcc)、送信元(Fro
m)、日付(Date)）が抽出される。

【００２３】文書内容処理部４４は、文書属性処理部４
３でグループ化された文書の文面を抽出し、形態素解析
を施してキーワード（単語）に分割し、キーワードの出
現頻度、複数の文書に亘る分布状況を求め、文書のグル
ープ毎に、キーワードの重み（文書の主旨に関係する程
度を示す値）を演算する。重みの演算には、例えば、tf
・idf法(Salton,G.:Automatic Text Processing:The Tra
nsformation,Analysis, and Retrieval of Information
by Computer,Addison-Wesley,1989)等を用いる。ただ
し、広範囲に亘って分布している単語、すなわち、例え
ば、ほぼ全ての文書に含まれている「よろしく」や「お
願いします」等の単語は、キーワードには成り得ないの
で除外する。

【００２４】文書特徴データベース作成部４５は、文書
属性処理部４３でグループ化された文書毎に、各文書の
属性情報と、文書内に含まれる全てのキーワードの重み
をデータベース化してハードディスクドライブなどより
なる記憶部１９に記録させる。文書特徴データベース作
成部４５はまた、キーワードの重みに基づき、検索用の
キーワード（重要語）を選択して記録する。文書特徴デ
ータベース作成部４５はさらに、検索用のキーワードを
関連情報検索部４６に供給し、それに対応して関連情報
検索部４６から返される関連情報を、検索用のキーワー
ドに対応付けて記録する。

【００２５】関連情報検索部４６は、文書特徴データベ
ース作成部４５が選択して記録した検索用のキーワード
の関連情報を検索し、検索結果のインデックスを文書特
徴データベース作成部４５に返す。キーワードの関連情
報を検索するには、インターネット３上の検索サーバ２
を用いる方法がある。この場合、WebページのURL(Unifo
rm Resource Locator)やWebページのタイトルが関連情
報として文書特徴データベース作成部４５に返される。

【００２６】提示部４７のイベント抽出部４８は、メー
ラが電子メールの送信や受信を終えたことことや、編集
中の文書のテキストデータが所定の閾値を超えたことを
検知して、データベース問い合わせ部４９に通知する。
以下、メーラが電子メールの送信や受信を終えたことこ
とや、編集中の文書のテキストデータが所定の閾値を超
えたことをイベント発生と記述する。

【００２７】データベース問い合わせ部４９は、イベン
ト抽出部４８からのイベント発生の通知に対応して、イ
ベント発生に対応する文書（例えば、受信した電子メー
ル）を取得し、文書属性処理部４３および文書内容処理
部４４の処理と同様に、当該文書から属性情報とキーワ
ードを取得する。データベース問い合わせ部４９はさら
に、取得した属性情報とキーワードを検索条件として文
書特徴データベース作成部４５が作成したデータベース
を検索し、類似度のある一定の条件を満たす電子メール
（グループ化されたもの）を抽出する。類似度の算出
は、例えば、文書のキーワードの重みをベクトルの構成
要素とする多次元のベクトルの内積で表すなどの方法を
用いることにより行われる。

【００２８】関連情報提示部５０は、イベント抽出部４
８を介してデータベース問い合わせ部４９から供給され
る関連情報（詳細は後述する）をデスクトップ上に表示
させる。

【００２９】なお、蓄積部４１の各処理は、所定の頻度
（１日に１回程度、例えば、情報処理プログラムの起動
時または終了等）に実行される。一方、提示部４７の処
理は、イベント抽出部４８がイベント発生を検知する毎
に実行される。

【００３０】次に、情報処理プログラムのデータベース
作成処理について、図４のフローチャートを参照して説
明する。このデータベース作成処理は、情報処理プログ
ラムが実行する処理のうちの１つであり、一日に一回程
の頻度で例えば、情報処理プログラムの起動開始直後や
起動終了直前などの予め設定されているタイミングに開
始される。

【００３１】ステップＳ１において、文書取得部４２
は、未取得の文書（例えば、前回のデータベース作成処
理が終了した以降に送受信された電子メール）を、記録
部１９に内蔵されるハードディスクドライブから取得し
て文書属性処理部４３および文書内容処理部４４に供給
する。

【００３２】ステップＳ２において、文書属性処理部４
３は、文書取得部４２から供給された電子メールの文書
から属性情報（メッセージＩＤ等のヘッダ情報）を抽出
し、属性情報に基づき、文書をグループ化して、文書内
容処理部４４および文書特徴データベース作成部４５に
供給する。

【００３３】ステップＳ３において、文書内容処理部４
４は、文書属性処理部４３でグループ化された文書の本
文のテキストデータを抽出し、形態素解析を施し、キー
ワードとして抽出する。ステップＳ４において、文書内
容処理部４４は、キーワードの出現頻度、複数の文書に
亘る分布状況を求め、文書のグループ毎にキーワードと
なる単語の重みを、例えばtf・idf法を用いて演算する。

【００３４】ステップＳ５において、文書特徴データベ
ース作成部４５は、文書属性処理部４３でグループ化さ
れた文書毎に、各文書の属性情報と文書内に含まれる全
てのキーワードの重みをデータベース化する。具体的に
は、グループ化された文書を時系列順にソートした後、
グループ化された文書に含まれる全キーワードの重みも
時系列順にソートして記憶部１９に記録する。

【００３５】ステップＳ６において、文書特徴データベ
ース作成部４５は、重みが所定の閾値以上であるキーワ
ードを検索用キーワード（重要語）に選択し、または、
重みが大きい順に指定した個数のキーワードを選択し、
関連情報検索部４６に供給する。関連情報検索部４６
は、文書特徴データベース作成部４５からの検索用キー
ワードを検索条件として、インターネット３上の検索サ
ーバ２にアクセスして検索結果を取得し、得られたWeb
ページのURLやタイトルを関連情報として文書特徴デー
タベース作成部４５に出力する。

【００３６】ステップＳ７において、文書特徴データベ
ース作成部４５は、関連情報検索部４６からの関連情報
を検索用キーワードに対応付けて記憶部１９に記録する
ことにより、データベースを作成する。なお、ステップ
Ｓ６の処理とステップＳ７の処理は、ステップＳ５まで
の一連の処理に継続して実行する場合と、一連の処理に
継続せず、所定のタイミングにおいて実行する場合があ
る。

【００３７】以上のように、データベース作成処理が１
日に１回程の頻度で実行されることにより、送受信した
電子メールの文書に対応した関連情報がデータベース内
に蓄積されることになる。なお、データベース作成処理
を任意のタイミングで開始させることも可能である。

【００３８】上述した処理により作成されるデータベー
スのデータ構造について、図５を参照して説明する。デ
ータベースは、複数のファイルから構成されており、各
ファイルには、一意に区別が付くようなファイル名が付
けられている。このファイル名は、電子メールの場合、
その電子メールに付けられたメッセージIDが、そのまま
用いられる。”発信時刻”の欄には、処理対象となって
いる文書が発信された時刻が記憶される。”送受信相
手”の欄には、処理対象となっている文書をやりとりし
た、この場合、電子メールを送受信した相手のメールア
ドレスが記憶される。

【００３９】”話題”の欄には、処理対象となっている
文書に与えられた題名（Subject）が記憶される。”参
照メール”には、参照関係として抽出された電子メール
（文書）のメッセージIDが、複数記憶される。”検索キ
ーワード情報”の欄には、図４のフローチャートのステ
ップＳ３の処理において抽出されたキーワード（単
語）、その単語が出現した頻度、ステップＳ４の処理に
おいて算出された重み、および、その単語が検索キーワ
ードとしての条件を満たしているか否かを表す情報（tr
ue：検索キーワードの条件を満たす、false：検索キー
ワードとしての条件を満たさない）が、それぞれ関連付
けられて記憶されている。

【００４０】”関連情報”の欄には、図４のフローチャ
ートのステップＳ６の処理において取得された関連情報
が記憶される。図５に示した例では、Webページのタイ
トルとURLである。

【００４１】このように、蓄積された文書（この場合、
電子メールの文書）から抽出した情報に基づいてデータ
ベースを作成し、その作成されたデータベース内の情報
を基に、ユーザに提示する関連情報を検索することによ
り、イベントを発生させた電子メールの文書に関連す
る、過去の時点において送受信された電子メールに関す
る情報を容易に検索することが可能となる。

【００４２】なお、上述したデータベースは一例であ
り、他の情報を追加して記憶させるようにしても良い
し、逆に、必要ない項目は削除しても良い。また、例え
ば、”検索キーワード情報”の欄に記憶される重みは、
複数の算出方法で算出された複数の重みを記憶するよう
にしても良い。

【００４３】端末１の記憶部１９に記憶されている電子
メールに追加、または、削除などの処理が発生した場
合、その処理が発生した電子メールに関する情報を、デ
ータベースに追加、または、データベースから削除する
といった処理を行う必要があるが、メッセージIDにより
管理することにより、追加、または、削除といった処理
の対象となる電子メールを容易に推定し、発生した処理
を実行することが可能である。

【００４４】上述したような処理によりデータベースを
作成するため、データベースに新たに追加する情報があ
ったような場合でも、既にデータベースに記憶されてい
る情報と重複するようなことを防ぐことができるので、
重複する情報がないか否かを検査する必要がなく、もっ
て、データベースの作成処理の効率を向上させることが
可能となる。

【００４５】このようなデータベースに基づいて行われ
る、情報処理プログラムの関連情報提示処理について、
図６のフローチャートを参照して説明する。この関連情
報提示処理は、上述したデータベース作成処理とは異な
り、情報処理プログラムが実行されている間、繰り返し
て実行される。

【００４６】ステップＳ１１において、情報処理プログ
ラムの終了が指示されたか否かが判定され、情報処理プ
ログラムの終了が指示されていないと判定された場合、
ステップＳ１２に進む。ステップＳ１２において、イベ
ント抽出部４８は、イベント発生（電子メールの送受信
の終了等）を監視する。イベント発生が検知されない場
合、ステップＳ１１に戻り、それ以降の処理が繰り返さ
れ、ステップＳ１２において、イベント発生が検知され
た場合、ステップＳ１３に進む。

【００４７】ステップＳ１３において、イベント抽出部
４８は、イベント発生をデータベース問い合わせ部４９
に通知する。データベース問い合わせ部４９は、イベン
ト抽出部４８からのイベント発生の通知に対応して、イ
ベント発生に対応する文書を取得し、当該文書から属性
情報を抽出する。ステップＳ１４において、データベー
ス問い合わせ部４９は、イベント発生の原因となった文
書からキーワードを抽出する。

【００４８】ステップＳ１５において、データベース問
い合わせ部４９は、ステップＳ１３およびステップＳ１
４の処理で抽出した属性情報とキーワードを条件とし
て、文書特徴データベース作成部４５が作成したデータ
ベースを検索し、類似度が一定の条件を満たす電子メー
ル（グループ化されたもの）を抽出する。類似度の算出
には、例えば、文書のキーワードの重みをベクトルの構
成要素とする多次元ベクトルの内積として表す方法によ
り行うことができる。

【００４９】さらに、データベース問い合わせ部４９
は、検索結果として抽出した電子メールに対応するメッ
セージID（ファイル名）のファイルに記憶されている情
報を取得し、”参照メール”の欄に書き込まれているメ
ッセージIDに対応する電子メールのなかから、代表とな
る電子メールを選択する。電子メールの選択の仕方とし
ては、イベントを発生させた電子メールの文書から抽出
されたキーワードの内、重みが最大なキーワードを含
み、かつ、グループ内の他の文書より、当該キーワード
の重みが大きい電子メールの文書が選択されるようにす
る。

【００５０】このようにして選択された電子メールに対
応するメッセージIDをファイル名にもつファイルから情
報が読み出される。関連情報提示部５０は、ステップＳ
１６にいおいて、上述したような処理により、データベ
ース問い合わせ部４９が選択し、読み出した情報（関連
情報）を表示するか否かをユーザに問う入力ウィンドウ
（不図示）をデスクトップ上に表示する。その際、ステ
ップＳ１５の処理で選択したキーワードが含まれている
文書の属性情報も、選択した理由として、入力ウィンド
ウに表示される。

【００５１】ステップＳ１７において、ステップＳ１６
の処理で表示された入力ウィンドウに呼応して、ユーザ
が「見る」ボタンを選択したか否かが判定される。ユー
ザが「見る」ボタンを選択したと判定された場合、ステ
ップＳ１８に進む。ステップＳ１８において、関連情報
提示部５０は、イベント抽出部４８を介してデータベー
ス問い合わせ部４９から供給された関連情報をデスクト
ップに表示させる。

【００５２】なお、関連情報として表示される情報は、
キーワードが付与された所定のデータベースに蓄積され
た情報であれば、Webページのタイトルでなくてもかま
わない。例えば、所定のデータベースに蓄積されている
情報のインデックスを表示するようにして、ユーザのア
クセス指令に対応して、当該インデックスの更に詳細な
情報を表示させるようにしてもよい。

【００５３】ステップＳ１９において、ステップＳ１８
の処理により関連情報として表示されたWebページのタ
イトルに対して、ユーザがアクセスを指令したと判定さ
れた場合、ステップＳ２０に進む。ステップＳ２０にお
いて、WWWブラウザが起動され、当該Webページへのアク
セスが行われる。

【００５４】ステップＳ１９において、ステップＳ１８
の処理により関連情報として表示されたWebページのタ
イトルに対して、ユーザが記録を指令したと判定された
場合、ステップＳ２１に進む。ステップＳ２１におい
て、当該WebページのタイトルおよびURLはスクラップ帳
ウィンドウ（不図示）に記録される。なお、ステップＳ
１９において、ステップＳ１８の処理により関連情報と
して表示されたWebページのタイトルに対して、ユーザ
から何の指令もなされずに所定の時間が経過したと判定
された場合、ステップＳ２０またはステップＳ２１の処
理はスキップされて、ステップＳ１１に戻る。

【００５５】なお、ステップＳ１７において、ユーザが
「見る」ボタンを選択しないと判定された場合、ステッ
プＳ１８乃至ステップＳ２１の処理はスキップされて、
ステップＳ１１に戻る。

【００５６】上述したように、ユーザが授受した電子メ
ールから抽出したキーワードから関連情報を取得するよ
うにしたので、ユーザの興味に適した情報提供を行うこ
とが可能となる。

【００５７】次に、本発明のプログラム格納媒体につい
て説明する。上述した一連の処理は、ハードウェアによ
り実行させることもできるが、ソフトウェアにより実行
させることも可能である。一連の処理をソフトウェアに
より実行させる場合には、そのソフトウェアを構成する
プログラムが、専用のハードウェアに組み込まれている
コンピュータ、または、各種のプログラムをインストー
ルすることで、各種の機能を実行することが可能な、例
えば汎用のパーソナルコンピュータなどに、プログラム
格納媒体からインストールされる。

【００５８】コンピュータにインストールされ、コンピ
ュータによって実行可能な状態とされるプログラムを格
納するプログラム格納媒体は、図２に示すように、コン
ピュータ（端末１）とは別に、ユーザにプログラムを提
供するために配布される、プログラムが記録されている
磁気ディスク３１（フロッピディスクを含む）、光ディ
スク３２（CD-ROM(Compact Disc-Read Only Memory)、D
VD(Digital VersatileDisc)を含む）、光磁気ディスク
３３（ＭＤ(Mini Disc)を含む）、もしくは半導体メモ
リ３４などよりなるパッケージメディア、または、プロ
グラムが一時的もしくは永続的に格納されるROM１２や
記憶部１９を構成するハードディスクなどにより構成さ
れる。プログラム格納媒体へのプログラムの格納は、必
要に応じてルータ、モデムなどのインタフェースを介し
て、ローカルエリアネットワーク、インタネット３、デ
ィジタル衛星放送といった、有線または無線の通信媒体
を利用して行われる。

【００５９】なお、本明細書において、プログラム格納
媒体に格納されるプログラムを記述するステップは、記
載された順序に従って時系列的に行われる処理はもちろ
ん、必ずしも時系列的に処理されなくとも、並列的ある
いは個別に実行される処理をも含むものである。

【００６０】また、本明細書において、システムとは、
複数の装置により構成される装置全体を表すものであ
る。

【００６１】

【発明の効果】以上の如く、請求項１に記載の情報処理
装置、請求項４に記載の情報処理方法、および請求項５
に記載のプログラム格納媒体によれば、テキストデータ
からキーワードを抽出し、そのキーワードに対応する関
連情報を検索し、取得し、抽出されたキーワードと、取
得された関連情報を、テキストデータのメッセージIDを
ファイル名とするファイルで管理するようにしたので、
情報を簡便に、かつ、効率よく管理することが可能とな
る。

【図面の簡単な説明】

【図１】本発明を適用した情報処理システムの一実施の
形態の構成を示す図である。

【図２】端末１の内部構成例を示す図である。

【図３】情報処理プログラムが起動された際の機能ブロ
ック図である。

【図４】文書特徴データベースの作成処理について説明
するフローチャートである。

【図５】蓄積部により作成されるデータベースについて
説明する図である。

【図６】情報提示処理について説明するフローチャート
である。

【符号の説明】

４１蓄積部，４２文書取得部，４３文書属性
処理部，４４文書内容処理部，４５文書特徴デ
ータベース作成部，４６関連情報検索部，４７提
示部，４８イベント抽出部，４９データベース
問い合わせ部，５０関連情報提示部

Claims

【特許請求の範囲】

【請求項１】テキストデータからキーワードを抽出す
る抽出手段と、前記抽出手段により抽出された前記キーワードに対応す
る関連情報を検索し、取得する取得手段と、前記抽出手段により抽出された前記キーワードと、前記
取得手段により取得された前記関連情報を、前記テキス
トデータのメッセージIDをファイル名とするファイルで
管理する管理手段とを含むことを特徴とする情報処理装
置。
【請求項２】前記関連情報は、過去の時点において授
受されたテキストデータに関する情報を含み、前記管理手段は、前記過去の時点において授受されたテ
キストデータに関する情報を、そのテキストデータに対
応するメッセージIDで管理することを特徴とする請求項
１に記載の情報処理装置。
【請求項３】前記管理手段は、前記キーワードを、前
記キーワードが前記テキストデータに出現した回数、所
定の方法により算出した重み、および、前記キーワード
が前記取得手段により関連情報が検索される際のキーワ
ードとして所定の条件を満たしているか否かを示す情報
と、それぞれ関連付けて管理することを特徴とする請求
項１に記載の情報処理装置。
【請求項４】テキストデータからキーワードを抽出す
る抽出ステップと、前記抽出ステップの処理で抽出された前記キーワードに
対応する関連情報を検索し、取得する取得ステップと、前記抽出ステップの処理で抽出された前記キーワード
と、前記取得ステップの処理で取得された前記関連情報
を、前記テキストデータのメッセージIDをファイル名と
するファイルで管理するための制御を行う管理制御ステ
ップとを含むことを特徴とする情報処理方法。
【請求項５】テキストデータからキーワードを抽出す
る抽出ステップと、前記抽出ステップの処理で抽出された前記キーワードに
対応する関連情報を検索し、取得する取得ステップと、前記抽出ステップの処理で抽出された前記キーワード
と、前記取得ステップの処理で取得された前記関連情報
を、前記テキストデータのメッセージIDをファイル名と
するファイルで管理するための制御を行う管理制御ステ
ップとを含むことを特徴とするコンピュータが実行可能
なプログラムが格納されているプログラム格納媒体。