JP2001282812A - 情報処理装置および方法、並びにプログラム格納媒体 - Google Patents

情報処理装置および方法、並びにプログラム格納媒体

Info

Publication number
JP2001282812A
JP2001282812A JP2000089317A JP2000089317A JP2001282812A JP 2001282812 A JP2001282812 A JP 2001282812A JP 2000089317 A JP2000089317 A JP 2000089317A JP 2000089317 A JP2000089317 A JP 2000089317A JP 2001282812 A JP2001282812 A JP 2001282812A
Authority
JP
Japan
Prior art keywords
information
keyword
unit
processing
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000089317A
Other languages
English (en)
Inventor
Hiroyuki Hobayashi
浩之 法林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000089317A priority Critical patent/JP2001282812A/ja
Publication of JP2001282812A publication Critical patent/JP2001282812A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 ユーザに適した情報の提示を行うためのデー
タを、効率よく取得できるようにする。 【解決手段】 ステップS1において、例えば、ハード
ディスクドライブに蓄積されている電子メールが読み出
され、ステップS2,S3において、その電子メールの
属性情報およびキーワードが所定の処理により抽出され
る。抽出されたこれらの情報に基づき、ステップS4乃
至S7の各処理により、データベースが作成される。デ
ータベースは、複数のファイルから構成されており、各
ファイルは、メッセージIDにより一意に区別が付くよう
になっている。ファイルには、キーワードより得られる
参照用の過去の電子メールや、関連する情報、例えば、
Webのタイトルやアドレスなどが、それぞれ関連付けら
れて記憶されている。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は情報処理装置および
方法、並びにプログラム格納媒体に関し、特に、ユーザ
に適した情報を提示するために用いられるデータベース
を作成する装置に用いて好適な情報処理装置および方
法、並びにプログラム格納媒体に関する。
【0002】
【従来の技術】インターネットの普及に伴い、さまざま
な情報をインターネット上で検索し、取得することがで
きるようになってきている。さまざまな情報として、所
定の地域のイベント、商店の広告、割引などの優待サー
ビスなどがある。また、インターネット上で公開してい
る情報は、紙媒体の情報誌として提供される場合もあ
る。ユーザは、これらのインターネットや情報誌などか
ら、情報を取得することができる。
【0003】
【発明が解決しようとする課題】上述したインターネッ
トや情報誌から情報を取得する場合、ユーザの方から、
例えば、インターネットにアクセスし、検索し、所望の
情報を取得するといった処理を行わなくてはならなかっ
た。すなわち、能動的に情報を取得することしかできな
かった。
【0004】このように、ユーザは、能動的にしか情報
を取得できないといった課題があった。そこで、ユーザ
が送受信した電子メールなどの文書から、キーワードを
検出し、データベース化し、そのデータベースを用い
て、情報を取得することにより、ユーザの嗜好に適した
情報を提示する方法、換言すれば、ユーザが受動的に所
望するであろう情報を得られる方法を、本出願人は、先
に、例えば、特願2000-042303において提案している。
【0005】提案されている方法において、例えば、電
子メールの文書からキーワードを抽出するような場合、
その文書が膨大な量になったときに、処理が低下した
り、データベースを更新、移転、統合するとき、データ
ベースの一貫性が維持できない可能性があるといった課
題があった。
【0006】本発明はこのような状況に鑑みてなされた
ものであり、文書のメッセージIDにより、データベース
内のファイルを区別して記憶することにより、データベ
ースの作成処理にかかる負担を軽減し、作成されるデー
タベースの一貫性を維持することを目的とする。
【0007】
【課題を解決するための手段】請求項1に記載の情報処
理装置は、テキストデータからキーワードを抽出する抽
出手段と、抽出手段により抽出されたキーワードに対応
する関連情報を検索し、取得する取得手段と、抽出手段
により抽出されたキーワードと、取得手段により取得さ
れた関連情報を、テキストデータのメッセージIDをファ
イル名とするファイルで管理する管理手段とを含むこと
を特徴とする。
【0008】前記関連情報は、過去の時点において授受
されたテキストデータに関する情報を含み、前記管理手
段は、過去の時点において授受されたテキストデータに
関する情報を、そのテキストデータに対応するメッセー
ジIDで管理するようにすることができる。
【0009】前記管理手段は、キーワードを、キーワー
ドがテキストデータに出現した回数、所定の方法により
算出した重み、および、キーワードが取得手段により関
連情報が検索される際のキーワードとして所定の条件を
満たしているか否かを示す情報とを、それぞれ関連付け
て管理するようにすることができる。
【0010】請求項4に記載の情報処理方法は、テキス
トデータからキーワードを抽出する抽出ステップと、抽
出ステップの処理で抽出されたキーワードに対応する関
連情報を検索し、取得する取得ステップと、抽出ステッ
プの処理で抽出されたキーワードと、取得ステップの処
理で取得された関連情報を、テキストデータのメッセー
ジIDをファイル名とするファイルで管理するための制御
を行う管理制御ステップとを含むことを特徴とする。
【0011】請求項5に記載のプログラム格納媒体のプ
ログラムは、テキストデータからキーワードを抽出する
抽出ステップと、抽出ステップの処理で抽出されたキー
ワードに対応する関連情報を検索し、取得する取得ステ
ップと、抽出ステップの処理で抽出されたキーワード
と、取得ステップの処理で取得された関連情報を、テキ
ストデータのメッセージIDをファイル名とするファイル
で管理するための制御を行う管理制御ステップとを含む
ことを特徴とする。
【0012】請求項1に記載の情報処理装置、請求項4
に記載の情報処理方法、および請求項5に記載のプログ
ラム格納媒体においては、テキストデータからキーワー
ドが抽出され、そのキーワードに対応する関連情報が検
索され、取得され、抽出されたキーワードと、取得され
た関連情報が、テキストデータのメッセージIDをファイ
ル名とするファイルで管理される。
【0013】
【発明の実施の形態】以下に本発明の実施の形態につい
て、図面を参照しながら説明する。図1に示すように、
本実施の形態においては、ユーザが用いる端末1と、情
報を検索する検索サーバ2とが、インターネット3を介
して互いに情報の授受ができるように接続されている。
インターネットは一例であり、無線や有線などの他のネ
ットワークを用いるようにしても良い。
【0014】端末1は、パーソナルコンピュータ、携帯
可能なモバイルコンピュータ、PHS(Personal Handy ph
one System)などである。
【0015】図2は、パーソナルコンピュータとしての
端末1の内部構成例を示す図である。端末1は、CPU(Ce
ntral Processing Unit)11を内蔵している。CPU11
にはバス14を介して、入出力インタフェース15が接
続されている。入出力インタフェース15には、キーボ
ード、マウスなどの入力デバイスよりなる入力部16、
処理結果としての例えば音声信号を出力する出力部1
7、処理結果としての画像を表示するディスプレイなど
よりなる表示部18、プログラムや各種データを格納す
るハードディスクドライブなどよりなる記憶部19、LA
N(Local Area Network)やインタネットを介してデータ
を通信するモデムなどよりなる通信部20、および、磁
気ディスク31乃至半導体メモリ34などのプログラム
格納媒体に対してデータを読み書きするドライブ21が
接続されている。
【0016】バス14には、ROM(Read Only Memory)1
2およびRAM(Random Access Memory)13が接続されて
いる。
【0017】本発明を適用した情報処理プログラムは、
磁気ディスク31乃至半導体メモリ34に格納された状
態で端末1に供給され、ドライブ21によって読み出さ
れて、記憶部19に内蔵されるハードディスクドライブ
にインストールされている。記憶部19にインストール
されている情報処理プログラムは、入力部16に入力さ
れるユーザからのコマンドに対応するCPU11の指令に
よって、記憶部19からRAM13にロードされて実行さ
れる。なお、端末1の起動時において自動的にプログラ
ムが実行されるように設定しておくようにしてもよい。
【0018】なお、記憶部19に内蔵されるハードディ
スクドライブには、情報処理プログラムの他、WWWブラ
ウザ、メーラ、およびワードプロセッサなどのアプリケ
ーションプログラムもインストールされており、情報処
理プログラムと同様に、入力部16に入力されるユーザ
からの起動コマンドに対応するCPU11の指令によっ
て、記憶部19からRAM13にロードされて実行され
る。
【0019】検索サーバ2は、基本的に端末1と同様の
構成をしている。
【0020】図3は、端末1で情報処理プログラムが起
動された場合の機能ブロック図である。情報処理プログ
ラムの機能ブロックは、関連情報のデータベースを蓄積
する蓄積部41と、対象となる文書に対応する関連情報
をユーザに提示する提示部47から構成される。
【0021】蓄積部41の文書取得部42は、電子メー
ルを送受信するアプリケーションプログラム(以下、メ
ーラ(mailer)と記述する)によって送受信した文書やワ
ードプロセッサプログラムによって編集された文書など
のうち、文書取得部42が未取得の文書を取得して文書
属性処理部43および文書内容処理部44に供給する。
なお、以下においては、主に、メーラにより電子メール
として送受信された文書を例として説明する。
【0022】文書属性処理部43は、文書取得部42か
ら供給される文書の属性情報を抽出し、属性情報に基づ
き、文書をグループ化して、文書内容処理部44および
文書特徴データベース作成部45に供給する。電子メー
ルである場合、文書の属性情報としてヘッダに記述され
ている情報(対象となっているメールを特定するメッセ
ージID、参照しているメールのメッセージID(Refer
ences,In-Reply-To)、宛先(To,Cc,Bcc)、送信元(Fro
m)、日付(Date))が抽出される。
【0023】文書内容処理部44は、文書属性処理部4
3でグループ化された文書の文面を抽出し、形態素解析
を施してキーワード(単語)に分割し、キーワードの出
現頻度、複数の文書に亘る分布状況を求め、文書のグル
ープ毎に、キーワードの重み(文書の主旨に関係する程
度を示す値)を演算する。重みの演算には、例えば、tf
・idf法(Salton,G.:Automatic Text Processing:The Tra
nsformation,Analysis, and Retrieval of Information
by Computer,Addison-Wesley,1989)等を用いる。ただ
し、広範囲に亘って分布している単語、すなわち、例え
ば、ほぼ全ての文書に含まれている「よろしく」や「お
願いします」等の単語は、キーワードには成り得ないの
で除外する。
【0024】文書特徴データベース作成部45は、文書
属性処理部43でグループ化された文書毎に、各文書の
属性情報と、文書内に含まれる全てのキーワードの重み
をデータベース化してハードディスクドライブなどより
なる記憶部19に記録させる。文書特徴データベース作
成部45はまた、キーワードの重みに基づき、検索用の
キーワード(重要語)を選択して記録する。文書特徴デ
ータベース作成部45はさらに、検索用のキーワードを
関連情報検索部46に供給し、それに対応して関連情報
検索部46から返される関連情報を、検索用のキーワー
ドに対応付けて記録する。
【0025】関連情報検索部46は、文書特徴データベ
ース作成部45が選択して記録した検索用のキーワード
の関連情報を検索し、検索結果のインデックスを文書特
徴データベース作成部45に返す。キーワードの関連情
報を検索するには、インターネット3上の検索サーバ2
を用いる方法がある。この場合、WebページのURL(Unifo
rm Resource Locator)やWebページのタイトルが関連情
報として文書特徴データベース作成部45に返される。
【0026】提示部47のイベント抽出部48は、メー
ラが電子メールの送信や受信を終えたことことや、編集
中の文書のテキストデータが所定の閾値を超えたことを
検知して、データベース問い合わせ部49に通知する。
以下、メーラが電子メールの送信や受信を終えたことこ
とや、編集中の文書のテキストデータが所定の閾値を超
えたことをイベント発生と記述する。
【0027】データベース問い合わせ部49は、イベン
ト抽出部48からのイベント発生の通知に対応して、イ
ベント発生に対応する文書(例えば、受信した電子メー
ル)を取得し、文書属性処理部43および文書内容処理
部44の処理と同様に、当該文書から属性情報とキーワ
ードを取得する。データベース問い合わせ部49はさら
に、取得した属性情報とキーワードを検索条件として文
書特徴データベース作成部45が作成したデータベース
を検索し、類似度のある一定の条件を満たす電子メール
(グループ化されたもの)を抽出する。類似度の算出
は、例えば、文書のキーワードの重みをベクトルの構成
要素とする多次元のベクトルの内積で表すなどの方法を
用いることにより行われる。
【0028】関連情報提示部50は、イベント抽出部4
8を介してデータベース問い合わせ部49から供給され
る関連情報(詳細は後述する)をデスクトップ上に表示
させる。
【0029】なお、蓄積部41の各処理は、所定の頻度
(1日に1回程度、例えば、情報処理プログラムの起動
時または終了等)に実行される。一方、提示部47の処
理は、イベント抽出部48がイベント発生を検知する毎
に実行される。
【0030】次に、情報処理プログラムのデータベース
作成処理について、図4のフローチャートを参照して説
明する。このデータベース作成処理は、情報処理プログ
ラムが実行する処理のうちの1つであり、一日に一回程
の頻度で例えば、情報処理プログラムの起動開始直後や
起動終了直前などの予め設定されているタイミングに開
始される。
【0031】ステップS1において、文書取得部42
は、未取得の文書(例えば、前回のデータベース作成処
理が終了した以降に送受信された電子メール)を、記録
部19に内蔵されるハードディスクドライブから取得し
て文書属性処理部43および文書内容処理部44に供給
する。
【0032】ステップS2において、文書属性処理部4
3は、文書取得部42から供給された電子メールの文書
から属性情報(メッセージID等のヘッダ情報)を抽出
し、属性情報に基づき、文書をグループ化して、文書内
容処理部44および文書特徴データベース作成部45に
供給する。
【0033】ステップS3において、文書内容処理部4
4は、文書属性処理部43でグループ化された文書の本
文のテキストデータを抽出し、形態素解析を施し、キー
ワードとして抽出する。ステップS4において、文書内
容処理部44は、キーワードの出現頻度、複数の文書に
亘る分布状況を求め、文書のグループ毎にキーワードと
なる単語の重みを、例えばtf・idf法を用いて演算する。
【0034】ステップS5において、文書特徴データベ
ース作成部45は、文書属性処理部43でグループ化さ
れた文書毎に、各文書の属性情報と文書内に含まれる全
てのキーワードの重みをデータベース化する。具体的に
は、グループ化された文書を時系列順にソートした後、
グループ化された文書に含まれる全キーワードの重みも
時系列順にソートして記憶部19に記録する。
【0035】ステップS6において、文書特徴データベ
ース作成部45は、重みが所定の閾値以上であるキーワ
ードを検索用キーワード(重要語)に選択し、または、
重みが大きい順に指定した個数のキーワードを選択し、
関連情報検索部46に供給する。関連情報検索部46
は、文書特徴データベース作成部45からの検索用キー
ワードを検索条件として、インターネット3上の検索サ
ーバ2にアクセスして検索結果を取得し、得られたWeb
ページのURLやタイトルを関連情報として文書特徴デー
タベース作成部45に出力する。
【0036】ステップS7において、文書特徴データベ
ース作成部45は、関連情報検索部46からの関連情報
を検索用キーワードに対応付けて記憶部19に記録する
ことにより、データベースを作成する。なお、ステップ
S6の処理とステップS7の処理は、ステップS5まで
の一連の処理に継続して実行する場合と、一連の処理に
継続せず、所定のタイミングにおいて実行する場合があ
る。
【0037】以上のように、データベース作成処理が1
日に1回程の頻度で実行されることにより、送受信した
電子メールの文書に対応した関連情報がデータベース内
に蓄積されることになる。なお、データベース作成処理
を任意のタイミングで開始させることも可能である。
【0038】上述した処理により作成されるデータベー
スのデータ構造について、図5を参照して説明する。デ
ータベースは、複数のファイルから構成されており、各
ファイルには、一意に区別が付くようなファイル名が付
けられている。このファイル名は、電子メールの場合、
その電子メールに付けられたメッセージIDが、そのまま
用いられる。”発信時刻”の欄には、処理対象となって
いる文書が発信された時刻が記憶される。”送受信相
手”の欄には、処理対象となっている文書をやりとりし
た、この場合、電子メールを送受信した相手のメールア
ドレスが記憶される。
【0039】”話題”の欄には、処理対象となっている
文書に与えられた題名(Subject)が記憶される。”参
照メール”には、参照関係として抽出された電子メール
(文書)のメッセージIDが、複数記憶される。”検索キ
ーワード情報”の欄には、図4のフローチャートのステ
ップS3の処理において抽出されたキーワード(単
語)、その単語が出現した頻度、ステップS4の処理に
おいて算出された重み、および、その単語が検索キーワ
ードとしての条件を満たしているか否かを表す情報(tr
ue:検索キーワードの条件を満たす、false:検索キー
ワードとしての条件を満たさない)が、それぞれ関連付
けられて記憶されている。
【0040】”関連情報”の欄には、図4のフローチャ
ートのステップS6の処理において取得された関連情報
が記憶される。図5に示した例では、Webページのタイ
トルとURLである。
【0041】このように、蓄積された文書(この場合、
電子メールの文書)から抽出した情報に基づいてデータ
ベースを作成し、その作成されたデータベース内の情報
を基に、ユーザに提示する関連情報を検索することによ
り、イベントを発生させた電子メールの文書に関連す
る、過去の時点において送受信された電子メールに関す
る情報を容易に検索することが可能となる。
【0042】なお、上述したデータベースは一例であ
り、他の情報を追加して記憶させるようにしても良い
し、逆に、必要ない項目は削除しても良い。また、例え
ば、”検索キーワード情報”の欄に記憶される重みは、
複数の算出方法で算出された複数の重みを記憶するよう
にしても良い。
【0043】端末1の記憶部19に記憶されている電子
メールに追加、または、削除などの処理が発生した場
合、その処理が発生した電子メールに関する情報を、デ
ータベースに追加、または、データベースから削除する
といった処理を行う必要があるが、メッセージIDにより
管理することにより、追加、または、削除といった処理
の対象となる電子メールを容易に推定し、発生した処理
を実行することが可能である。
【0044】上述したような処理によりデータベースを
作成するため、データベースに新たに追加する情報があ
ったような場合でも、既にデータベースに記憶されてい
る情報と重複するようなことを防ぐことができるので、
重複する情報がないか否かを検査する必要がなく、もっ
て、データベースの作成処理の効率を向上させることが
可能となる。
【0045】このようなデータベースに基づいて行われ
る、情報処理プログラムの関連情報提示処理について、
図6のフローチャートを参照して説明する。この関連情
報提示処理は、上述したデータベース作成処理とは異な
り、情報処理プログラムが実行されている間、繰り返し
て実行される。
【0046】ステップS11において、情報処理プログ
ラムの終了が指示されたか否かが判定され、情報処理プ
ログラムの終了が指示されていないと判定された場合、
ステップS12に進む。ステップS12において、イベ
ント抽出部48は、イベント発生(電子メールの送受信
の終了等)を監視する。イベント発生が検知されない場
合、ステップS11に戻り、それ以降の処理が繰り返さ
れ、ステップS12において、イベント発生が検知され
た場合、ステップS13に進む。
【0047】ステップS13において、イベント抽出部
48は、イベント発生をデータベース問い合わせ部49
に通知する。データベース問い合わせ部49は、イベン
ト抽出部48からのイベント発生の通知に対応して、イ
ベント発生に対応する文書を取得し、当該文書から属性
情報を抽出する。ステップS14において、データベー
ス問い合わせ部49は、イベント発生の原因となった文
書からキーワードを抽出する。
【0048】ステップS15において、データベース問
い合わせ部49は、ステップS13およびステップS1
4の処理で抽出した属性情報とキーワードを条件とし
て、文書特徴データベース作成部45が作成したデータ
ベースを検索し、類似度が一定の条件を満たす電子メー
ル(グループ化されたもの)を抽出する。類似度の算出
には、例えば、文書のキーワードの重みをベクトルの構
成要素とする多次元ベクトルの内積として表す方法によ
り行うことができる。
【0049】さらに、データベース問い合わせ部49
は、検索結果として抽出した電子メールに対応するメッ
セージID(ファイル名)のファイルに記憶されている情
報を取得し、”参照メール”の欄に書き込まれているメ
ッセージIDに対応する電子メールのなかから、代表とな
る電子メールを選択する。電子メールの選択の仕方とし
ては、イベントを発生させた電子メールの文書から抽出
されたキーワードの内、重みが最大なキーワードを含
み、かつ、グループ内の他の文書より、当該キーワード
の重みが大きい電子メールの文書が選択されるようにす
る。
【0050】このようにして選択された電子メールに対
応するメッセージIDをファイル名にもつファイルから情
報が読み出される。関連情報提示部50は、ステップS
16にいおいて、上述したような処理により、データベ
ース問い合わせ部49が選択し、読み出した情報(関連
情報)を表示するか否かをユーザに問う入力ウィンドウ
(不図示)をデスクトップ上に表示する。その際、ステ
ップS15の処理で選択したキーワードが含まれている
文書の属性情報も、選択した理由として、入力ウィンド
ウに表示される。
【0051】ステップS17において、ステップS16
の処理で表示された入力ウィンドウに呼応して、ユーザ
が「見る」ボタンを選択したか否かが判定される。ユー
ザが「見る」ボタンを選択したと判定された場合、ステ
ップS18に進む。ステップS18において、関連情報
提示部50は、イベント抽出部48を介してデータベー
ス問い合わせ部49から供給された関連情報をデスクト
ップに表示させる。
【0052】なお、関連情報として表示される情報は、
キーワードが付与された所定のデータベースに蓄積され
た情報であれば、Webページのタイトルでなくてもかま
わない。例えば、所定のデータベースに蓄積されている
情報のインデックスを表示するようにして、ユーザのア
クセス指令に対応して、当該インデックスの更に詳細な
情報を表示させるようにしてもよい。
【0053】ステップS19において、ステップS18
の処理により関連情報として表示されたWebページのタ
イトルに対して、ユーザがアクセスを指令したと判定さ
れた場合、ステップS20に進む。ステップS20にお
いて、WWWブラウザが起動され、当該Webページへのアク
セスが行われる。
【0054】ステップS19において、ステップS18
の処理により関連情報として表示されたWebページのタ
イトルに対して、ユーザが記録を指令したと判定された
場合、ステップS21に進む。ステップS21におい
て、当該WebページのタイトルおよびURLはスクラップ帳
ウィンドウ(不図示)に記録される。なお、ステップS
19において、ステップS18の処理により関連情報と
して表示されたWebページのタイトルに対して、ユーザ
から何の指令もなされずに所定の時間が経過したと判定
された場合、ステップS20またはステップS21の処
理はスキップされて、ステップS11に戻る。
【0055】なお、ステップS17において、ユーザが
「見る」ボタンを選択しないと判定された場合、ステッ
プS18乃至ステップS21の処理はスキップされて、
ステップS11に戻る。
【0056】上述したように、ユーザが授受した電子メ
ールから抽出したキーワードから関連情報を取得するよ
うにしたので、ユーザの興味に適した情報提供を行うこ
とが可能となる。
【0057】次に、本発明のプログラム格納媒体につい
て説明する。上述した一連の処理は、ハードウェアによ
り実行させることもできるが、ソフトウェアにより実行
させることも可能である。一連の処理をソフトウェアに
より実行させる場合には、そのソフトウェアを構成する
プログラムが、専用のハードウェアに組み込まれている
コンピュータ、または、各種のプログラムをインストー
ルすることで、各種の機能を実行することが可能な、例
えば汎用のパーソナルコンピュータなどに、プログラム
格納媒体からインストールされる。
【0058】コンピュータにインストールされ、コンピ
ュータによって実行可能な状態とされるプログラムを格
納するプログラム格納媒体は、図2に示すように、コン
ピュータ(端末1)とは別に、ユーザにプログラムを提
供するために配布される、プログラムが記録されている
磁気ディスク31(フロッピディスクを含む)、光ディ
スク32(CD-ROM(Compact Disc-Read Only Memory)、D
VD(Digital VersatileDisc)を含む)、光磁気ディスク
33(MD(Mini Disc)を含む)、もしくは半導体メモ
リ34などよりなるパッケージメディア、または、プロ
グラムが一時的もしくは永続的に格納されるROM12や
記憶部19を構成するハードディスクなどにより構成さ
れる。プログラム格納媒体へのプログラムの格納は、必
要に応じてルータ、モデムなどのインタフェースを介し
て、ローカルエリアネットワーク、インタネット3、デ
ィジタル衛星放送といった、有線または無線の通信媒体
を利用して行われる。
【0059】なお、本明細書において、プログラム格納
媒体に格納されるプログラムを記述するステップは、記
載された順序に従って時系列的に行われる処理はもちろ
ん、必ずしも時系列的に処理されなくとも、並列的ある
いは個別に実行される処理をも含むものである。
【0060】また、本明細書において、システムとは、
複数の装置により構成される装置全体を表すものであ
る。
【0061】
【発明の効果】以上の如く、請求項1に記載の情報処理
装置、請求項4に記載の情報処理方法、および請求項5
に記載のプログラム格納媒体によれば、テキストデータ
からキーワードを抽出し、そのキーワードに対応する関
連情報を検索し、取得し、抽出されたキーワードと、取
得された関連情報を、テキストデータのメッセージIDを
ファイル名とするファイルで管理するようにしたので、
情報を簡便に、かつ、効率よく管理することが可能とな
る。
【図面の簡単な説明】
【図1】本発明を適用した情報処理システムの一実施の
形態の構成を示す図である。
【図2】端末1の内部構成例を示す図である。
【図3】情報処理プログラムが起動された際の機能ブロ
ック図である。
【図4】文書特徴データベースの作成処理について説明
するフローチャートである。
【図5】蓄積部により作成されるデータベースについて
説明する図である。
【図6】情報提示処理について説明するフローチャート
である。
【符号の説明】
41 蓄積部, 42 文書取得部, 43 文書属性
処理部, 44 文書内容処理部, 45 文書特徴デ
ータベース作成部, 46 関連情報検索部,47 提
示部, 48 イベント抽出部, 49 データベース
問い合わせ部, 50 関連情報提示部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 テキストデータからキーワードを抽出す
    る抽出手段と、 前記抽出手段により抽出された前記キーワードに対応す
    る関連情報を検索し、取得する取得手段と、 前記抽出手段により抽出された前記キーワードと、前記
    取得手段により取得された前記関連情報を、前記テキス
    トデータのメッセージIDをファイル名とするファイルで
    管理する管理手段とを含むことを特徴とする情報処理装
    置。
  2. 【請求項2】 前記関連情報は、過去の時点において授
    受されたテキストデータに関する情報を含み、 前記管理手段は、前記過去の時点において授受されたテ
    キストデータに関する情報を、そのテキストデータに対
    応するメッセージIDで管理することを特徴とする請求項
    1に記載の情報処理装置。
  3. 【請求項3】 前記管理手段は、前記キーワードを、前
    記キーワードが前記テキストデータに出現した回数、所
    定の方法により算出した重み、および、前記キーワード
    が前記取得手段により関連情報が検索される際のキーワ
    ードとして所定の条件を満たしているか否かを示す情報
    と、それぞれ関連付けて管理することを特徴とする請求
    項1に記載の情報処理装置。
  4. 【請求項4】 テキストデータからキーワードを抽出す
    る抽出ステップと、 前記抽出ステップの処理で抽出された前記キーワードに
    対応する関連情報を検索し、取得する取得ステップと、 前記抽出ステップの処理で抽出された前記キーワード
    と、前記取得ステップの処理で取得された前記関連情報
    を、前記テキストデータのメッセージIDをファイル名と
    するファイルで管理するための制御を行う管理制御ステ
    ップとを含むことを特徴とする情報処理方法。
  5. 【請求項5】 テキストデータからキーワードを抽出す
    る抽出ステップと、 前記抽出ステップの処理で抽出された前記キーワードに
    対応する関連情報を検索し、取得する取得ステップと、 前記抽出ステップの処理で抽出された前記キーワード
    と、前記取得ステップの処理で取得された前記関連情報
    を、前記テキストデータのメッセージIDをファイル名と
    するファイルで管理するための制御を行う管理制御ステ
    ップとを含むことを特徴とするコンピュータが実行可能
    なプログラムが格納されているプログラム格納媒体。
JP2000089317A 2000-03-28 2000-03-28 情報処理装置および方法、並びにプログラム格納媒体 Withdrawn JP2001282812A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000089317A JP2001282812A (ja) 2000-03-28 2000-03-28 情報処理装置および方法、並びにプログラム格納媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000089317A JP2001282812A (ja) 2000-03-28 2000-03-28 情報処理装置および方法、並びにプログラム格納媒体

Publications (1)

Publication Number Publication Date
JP2001282812A true JP2001282812A (ja) 2001-10-12

Family

ID=18605089

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000089317A Withdrawn JP2001282812A (ja) 2000-03-28 2000-03-28 情報処理装置および方法、並びにプログラム格納媒体

Country Status (1)

Country Link
JP (1) JP2001282812A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505863A (ja) * 2002-11-07 2006-02-16 トムソン グローバル リソーシーズ アー.ゲー. 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006505863A (ja) * 2002-11-07 2006-02-16 トムソン グローバル リソーシーズ アー.ゲー. 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
JP2010211828A (ja) * 2002-11-07 2010-09-24 Thomson Reuters Global Resources 電子的ドキュメントレポジトリーマネジメントおよびアクセスシステム
US7941431B2 (en) 2002-11-07 2011-05-10 Thomson Reuters Global Resources Electronic document repository management and access system

Similar Documents

Publication Publication Date Title
US8832058B1 (en) Systems and methods for syndicating and hosting customized news content
JP4082059B2 (ja) 情報処理装置および方法、記録媒体、並びにプログラム
KR100650404B1 (ko) 온라인 광고 시스템 및 방법
US9672232B1 (en) Systems and methods for selectively storing event data
US9009153B2 (en) Systems and methods for identifying a named entity
US8918401B1 (en) Systems and methods for providing searchable prior history
JP4608740B2 (ja) 情報処理装置および方法、並びにプログラム格納媒体
US7606794B2 (en) Active Abstracts
US9031945B1 (en) Sharing and using search results
US8631001B2 (en) Systems and methods for weighting a search query result
US8010532B2 (en) System and method for automatically organizing bookmarks through the use of tag data
US8577868B1 (en) Bookmarks
WO2006001920A1 (en) Variable length snippet generation
US20060200455A1 (en) Search engine result reporter
US20060184512A1 (en) Content searching and configuration of search results
US10503803B2 (en) Animated snippets for search results
US20090094210A1 (en) Intelligently sorted search results
JP2008507041A (ja) 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ
JP2009508267A (ja) ブログ文書のランク付け
JP2003242176A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP2009211697A (ja) 情報配信システムおよび情報配信方法
JP2010538386A (ja) クエリ別検索コレクション生成方法およびシステム
JP2000132566A (ja) 所望情報加工装置、所望情報加工方法および記録媒体
KR20050050016A (ko) 온라인 광고 시스템 및 방법
CA2714454A1 (en) Methods, systems, and computer program products for retrieving a file of machine-readable data

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605