JP2003242176A - 情報処理装置および方法、記録媒体、並びにプログラム - Google Patents

情報処理装置および方法、記録媒体、並びにプログラム

Info

Publication number
JP2003242176A
JP2003242176A JP2002147225A JP2002147225A JP2003242176A JP 2003242176 A JP2003242176 A JP 2003242176A JP 2002147225 A JP2002147225 A JP 2002147225A JP 2002147225 A JP2002147225 A JP 2002147225A JP 2003242176 A JP2003242176 A JP 2003242176A
Authority
JP
Japan
Prior art keywords
weight
word
information
document information
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002147225A
Other languages
English (en)
Other versions
JP2003242176A5 (ja
Inventor
Mari Saito
真里 斎藤
Noriyuki Yamamoto
則行 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2002147225A priority Critical patent/JP2003242176A/ja
Priority to US10/316,762 priority patent/US7289982B2/en
Publication of JP2003242176A publication Critical patent/JP2003242176A/ja
Publication of JP2003242176A5 publication Critical patent/JP2003242176A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Abstract

(57)【要約】 【目的】 ユーザの興味の度合いに応じて関連情報を提
示するようにする。 【構成】 ステップS101,102において、メール
の相手毎に、送信(返信)した回数(やりとりした頻
度)がカウントされ、送信の頻度の多い順にソートされ
る。ステップS103,S104において、やりとりの
頻度が上位のメールの相手が抽出され、抽出された相手
とのメールに含まれる単語の重みが修正される。例え
ば、やりとりの頻度が1位のAさんとのメールのやりと
りが話題Aであり、その話題に含まれる単語b,c,f
の重みに、予め設定されている重み係数kが乗算されて
修正される。これにより、ユーザがより興味を感じてい
る話題に含まれる単語の重みが修正される。本発明は、
パーソナルコンピュータに適用できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報処理装置およ
び方法、記録媒体、並びにプログラムに関し、特に、例
えば、電子メールに含まれる情報の中から、ユーザの興
味があると思われる単語および関連情報を取得してデー
タベースに蓄積し、その関連情報を効果的に表示させる
ようにした情報処理装置および方法、記録媒体、並びに
プログラムに関する。
【0002】
【従来の技術】従来、パーソナルコンピュータのデスク
トップ(表示画面)に、いわゆるデスクトップマスコッ
トと呼ばれるキャラクタを表示させるアプリケーション
プログラムが存在する。
【0003】デスクトップマスコットは、例えば、電子
メールの着信等をユーザに通知する機能やデスクトップ
上を移動する機能などを有している。
【0004】ところで、例えば、ユーザが、電子メール
として送信する文書等を入力している時や、受信した文
書を閲覧している時などに、対象としている文書に関連
する情報(以下、関連情報と記載する)を、デスクトッ
プマスコットが提示するようになれば、ユーザによって
利便性が向上するとともに、デスクトップマスコットに
対して一層愛着を感じるようになると考えられる。
【0005】そこで、例えば、特開2001−3125
15号公報には、電子メールなどの処理済みのテキスト
ファイルを用いて自動的にデータベースを構築し、送受
信などの対象とした文書に関連する関連情報をユーザに
提示する方法が提案されている。
【0006】
【発明が解決しようとする課題】しかしながら、上記公
報の発明においては、単に、対象となる文書に基づい
て、データベースから関連情報を抽出して提示するだけ
であり、ユーザの興味の度合いが反映されていなかっ
た。
【0007】本発明はこのような状況に鑑みてなされた
ものであり、ユーザの興味の度合いに応じて関連情報を
提示することができるようにするものである。
【0008】
【課題を解決するための手段】本発明の情報処理装置
は、既存の文書情報から第1の特徴語を抽出するととも
に、所定の文書情報から第2の特徴語を抽出する抽出手
段と、抽出手段により抽出された、第1の特徴語の第1
の重みを算出するとともに、第2の特徴語の第2の重み
を算出する重み算出手段と、所定の条件に基づいて、重
み算出手段により算出された第1の重みを修正する重み
修正手段と、抽出手段により抽出された第1の特徴語、
および重み修正手段により修正された第1の重みに基づ
いて、既存の文書情報に対応付ける関連情報を取得する
取得手段と、第2の特徴語に基づいて、所定の文書情報
に関連する既存の文書情報を検索する検索手段と、検索
手段により検索された既存の文書情報に対応付けられて
いる関連情報の表示を制御する表示制御手段とを備える
ことを特徴とする。
【0009】取得手段は、既存の文書情報における、複
数の第1の特徴語の中から、第1の重みに基づいて重要
語を選択し、重要語に関連する関連情報を取得すること
ができる。
【0010】検索手段は、第1の重みと第2の重みから
類似度を算出し、類似度に基づいて、所定の文書情報に
対応する既存の文書情報を検索することができる。
【0011】既存の文書情報および所定の文書情報から
属性情報を抽出する属性情報抽出手段をさらに設けるこ
とができる。
【0012】属性情報抽出手段により抽出された属性情
報に基づいて、1または複数の既存の文書情報をグルー
プ化して文書情報群を作成するグループ化手段をさらに
設け、抽出手段は、文書情報群から第1の特徴語を抽出
し、重み算出手段は、第1の特徴語の第1の重みを算出
し、取得手段は、第1の特徴語および第1の重みに基づ
いて、文書情報群に対応付ける関連情報を取得し、検索
手段は、第2の特徴語に基づいて、所定の文書情報に対
応する文書情報群を検索することができる。
【0013】重み修正手段は、属性情報抽出手段により
抽出された属性情報に基づいて、第1の重みを修正する
ことができる。
【0014】重み修正手段は、特定の宛先への送信また
は特定の宛先からの受信の頻度に応じて、第1の重みを
修正することができる。
【0015】重み修正手段は、情報処理装置の使用者が
作成した既存の文書情報から抽出された第1の特徴語の
第1の重みを修正することができる。
【0016】重み修正手段は、他の既存の文書情報から
抽出された、第1の特徴語と同じ特徴語の重みを、第1
の重みと同様にさらに修正することができる。
【0017】重み修正手段は、第1の特徴語の種類に基
づいて、第1の重みを修正することができる。
【0018】既存の文書情報の第1の特徴語に関連付け
て、取得手段により取得された関連情報を用いてデータ
ベースを構築するデータベース構築手段をさらに設け、
検索手段は、第2の特徴語に基づいて、データベース構
築手段により構築されたデータベースから、所定の文書
情報に関連する既存の文書情報を検索することができ
る。
【0019】所定のイベントの発生を検知する検知手段
をさらに設け、所定の文書情報は、検知手段により検知
された所定のイベントの発生に対応する文書であるもの
とすることができる。
【0020】既存の文書情報および所定の文書情報は電
子メールであるものとすることができる。
【0021】所定のデータ構造で構成された単語群から
なる、単語間の関係を示すデータベースである分野辞書
を作成する分野辞書作成手段をさらに備え、重み修正手
段は、分野辞書作成手段により作成された分野辞書に基
づいて、重み算出手段により算出された第1の重みを修
正することができる。
【0022】前記分野辞書は、単語群が、各単語の属す
る分野によってグループ化され、記録されているデータ
ベースであるようにすることができる。
【0023】前記分野辞書は、単語群が、単語間の関係
に基づいて階層構造に配置され、記録されているデータ
ベースであるようにすることができる。
【0024】前記分野辞書は、単語群が、各単語に割り
当てられた重要度に基づいてリスト化されたデータベー
スであるようにすることができる。
【0025】前記分野辞書は、既存の辞書データベース
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
【0026】前記分野辞書は、所定のWEBページデータ
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
【0027】前記分野辞書は、以前に検索手段により用
いられた第2の特徴語のリストに含まれる単語群および
単語群が形成するデータ構造を含むようにすることがで
きる。
【0028】前記重み修正手段は、分野辞書に含まれる
単語に対応する第1の特徴語の第1の重みを修正するよ
うにすることができる。
【0029】本発明の情報記録方法は、既存の文書情報
から第1の特徴語を抽出するとともに、所定の文書情報
から第2の特徴語を抽出する抽出ステップと、抽出ステ
ップの処理により抽出された、第1の特徴語の第1の重
みを算出するとともに、第2の特徴語の第2の重みを算
出する重み算出ステップと、所定の条件に基づいて、重
み算出ステップの処理により算出された第1の重みを修
正する重み修正ステップと、抽出ステップの処理により
抽出された第1の特徴語、および重み修正ステップの処
理により修正された第1の重みに基づいて、既存の文書
情報に対応付ける関連情報の取得を制御する取得制御ス
テップと、第2の特徴語に基づいて、所定の文書情報に
関連する既存の文書情報を検索する検索ステップと、検
索ステップの処理により検索された既存の文書情報に対
応付けられている関連情報の表示を制御する表示制御ス
テップとを含むことを特徴とする。
【0030】本発明の記録媒体に記録されているプログ
ラムは、既存の文書情報から第1の特徴語を抽出すると
ともに、所定の文書情報から第2の特徴語を抽出する抽
出ステップと、抽出ステップの処理により抽出された、
第1の特徴語の第1の重みを算出するとともに、第2の
特徴語の第2の重みを算出する重み算出ステップと、所
定の条件に基づいて、重み算出ステップの処理により算
出された第1の重みを修正する重み修正ステップと、抽
出ステップの処理により抽出された第1の特徴語、およ
び重み修正ステップの処理により修正された第1の重み
に基づいて、既存の文書情報に対応付ける関連情報の取
得を制御する取得制御ステップと、第2の特徴語に基づ
いて、所定の文書情報に関連する既存の文書情報を検索
する検索ステップと、検索ステップの処理により検索さ
れた既存の文書情報に対応付けられている関連情報の表
示を制御する表示制御ステップとを含むことを特徴とす
る。
【0031】本発明のプログラムは、既存の文書情報か
ら第1の特徴語を抽出するとともに、所定の文書情報か
ら第2の特徴語を抽出する抽出ステップと、抽出ステッ
プの処理により抽出された、第1の特徴語の第1の重み
を算出するとともに、第2の特徴語の第2の重みを算出
する重み算出ステップと、所定の条件に基づいて、重み
算出ステップの処理により算出された第1の重みを修正
する重み修正ステップと、抽出ステップの処理により抽
出された第1の特徴語、および重み修正ステップの処理
により修正された第1の重みに基づいて、既存の文書情
報に対応付ける関連情報の取得を制御する取得制御ステ
ップと、第2の特徴語に基づいて、所定の文書情報に関
連する既存の文書情報を検索する検索ステップと、検索
ステップの処理により検索された既存の文書情報に対応
付けられている関連情報の表示を制御する表示制御ステ
ップとをコンピュータに実行させる。
【0032】取得制御ステップは、既存の文書情報にお
ける、複数の第1の特徴語の中から、第1の重みに基づ
いて重要語を選択し、重要語に関連する関連情報の取得
を制御することができる。
【0033】検索ステップは、第1の重みと第2の重み
から類似度を算出し、類似度に基づいて、所定の文書情
報に対応する既存の文書情報を検索することができる。
【0034】既存の文書情報および所定の文書情報から
属性情報を抽出する属性情報抽出ステップをさらに含
み、重み修正ステップは、属性情報抽出ステップの処理
により抽出された属性情報に基づいて、第1の重みを修
正することができる。
【0035】属性情報抽出ステップの処理により抽出さ
れた属性情報に基づいて、1または複数の既存の文書情
報をグループ化して文書情報群を作成するグループ化ス
テップをさらに含むことができる。
【0036】重み修正ステップは、特定の宛先への送信
または特定の宛先からの受信の頻度に応じて、第1の重
みを修正することができる。
【0037】重み修正ステップは、第1の特徴語の種類
に基づいて、第1の重みを修正することができる。
【0038】既存の文書情報の第1の特徴語に関連付け
て、取得制御ステップの処理により取得が制御された関
連情報を用いてデータベースを構築するデータベース構
築ステップをさらに含むことができる。
【0039】所定のデータ構造で構成された単語群から
なる、単語間の関係を示すデータベースである分野辞書
を作成する分野辞書作成ステップをさらに含み、重み修
正ステップは、分野辞書作成ステップの処理により作成
された分野辞書に基づいて、重み算出ステップの処理に
より算出された第1の重みを修正することができる。
【0040】前記分野辞書は、単語群が、各単語の属す
る分野によってグループ化され、記録されているデータ
ベースであるようにすることができる。
【0041】前記分野辞書は、単語群が、単語間の関係
に基づいて階層構造に配置され、記録されているデータ
ベースであるようにすることができる。
【0042】前記分野辞書は、単語群が、各単語に割り
当てられた重要度に基づいてリスト化されたデータベー
スであるようにすることができる。
【0043】前記分野辞書は、既存の辞書データベース
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
【0044】前記分野辞書は、所定のWEBページデータ
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
【0045】前記分野辞書は、以前に検索ステップの処
理により用いられた第2の特徴語のリストに含まれる単
語群および単語群が形成するデータ構造を含むようにす
ることができる。
【0046】前記重み修正ステップは、分野辞書に含ま
れる単語に対応する第1の特徴語の第1の重みを修正す
るようにすることができる。
【0047】本発明の情報処理装置および方法、並びに
プログラムにおいては、既存の文書情報から第1の特徴
語が抽出されるとともに、所定の文書情報から第2の特
徴語が抽出され、第1の特徴語の第1の重みおよび第2
の特徴語の第2の重みが算出され、所定の条件に基づい
て算出された第1の重みが修正され、第1の特徴語およ
び第1の重みに基づいて、既存の文書情報に対応付ける
関連情報が取得され、第2の特徴語に基づいて、所定の
文書情報に関連する既存の文書情報が検索され、検索さ
れた既存の文書情報に対応付けられている関連情報が表
示される。
【0048】
【発明の実施の形態】以下、図を参照して、本発明の実
施の形態について説明する。
【0049】図1は、本発明を適用したデスクトップマ
スコット(以下、エージェントと記載する)をデスクト
ップ上に表示するアプリケーションプログラム(以下、
エージェントプログラムと記載する)、電子メールを送
受信するアプリケーションプログラム(以下、メーラ
(mailer)2と記載する)、および、文書作成または編
集するワードプロセッサプログラム3の機能を説明する
図である。エージェントプログラム1乃至ワードプロセ
ッサ3は、例えば、パーソナルコンピュータ(詳細は、
図2を参照して後述する)にインストールされて実行さ
れるものである。
【0050】エージェントプログラム1は、処理の対象
となる文書の関連情報(後述)を蓄積してデータベース
を構築する蓄積部11、処理の対象となる文書に対応す
る関連情報をユーザに提示する提示部12、および、エ
ージェント72(図9)の表示等を制御するエージェン
ト制御部13から構成される。
【0051】蓄積部11の文書取得部21は、メーラ2
によって送受信した文書やワードプロセッサプログラム
3によって編集された文書などのうち、自己が未処理の
文書を取得して文書属性処理部22および文書内容処理
部23に供給する。なお、以下においては、主に、メー
ラ2により電子メールとして送受信した文書を例として
説明する。
【0052】文書属性処理部22は、文書取得部21か
ら供給される文書の属性情報を抽出し、属性情報に基づ
き、文書をグループ化して、文書内容処理部23および
文書特徴データベース作成部24に供給する。電子メー
ルである場合、文書の属性情報としてヘッダに記述され
ている情報(対象となっているメールを特定するメッセ
ージID、参照しているメールのメッセージID(Referenc
es,In-Reply-To)、宛先(To,Cc,Bcc)、送信元(Fro
m)、日付(Date)、あるいは標題(Subject))などが
抽出される。そして、抽出された属性情報に基づいて、
1または複数の文書がグループ化される。以下、属性情
報に基づいてグループ化された文書群(メールグルー
プ)を「話題」と称する。
【0053】文書内容処理部23は、文書属性処理部2
2でグループ化された文書群(話題)の文面を抽出し、
形態素解析を施して、単語(特徴語)に分類する。単語
は、品詞(名詞、形容詞、動詞、副詞、接続詞、感動
詞、助詞、および助動詞)別に分類される。ただし、広
範囲に亘って分布している単語、すなわち、例えば、ほ
ぼ全ての文書に含まれている、「こんにちは」、「よろ
しく」あるいは「お願いします」等の名詞以外の品詞
は、後述する、関連情報を検索するためのキーワードに
は成り得ないので、不要語として除外される。
【0054】文書内容処理部23は、不要語が除外され
た各単語の出現頻度および複数の文書に亘る分布状況を
求め、グループ化された文書群(話題)毎に、各単語の
重み(文書の主旨に関係する程度を示す値)を演算す
る。これにより、話題毎に、各単語の重みを構成要素と
する特徴ベクトルが算出される。例えば、全話題の単語
(特徴語)数の総計がn個の場合、すべての話題の特徴
ベクトルは、n次元空間のベクトルとなり、次式(1)
で表わされる。 特徴ベクトル=(単語1の重みw1,単語2の重みw2,・・・単語nの重みwn) (1)
【0055】重みの演算には、例えば、tf・idf法(Salt
on,G.:Automatic Text Processing:The Transformatio
n,Analysis, and Retrieval of Information by Comput
er,Addison-Wesley,1989)等が用いられる。この方法を
用いると、例えば、話題Aに含まれる単語がn個あった
場合、話題Aの特徴ベクトルのうち、含まれる単語の該
当する構成要素には重みが与えられ、話題Aに含まれな
い単語の構成要素は、頻度が0であるため、重みの値は
0となる。
【0056】なお、本発明においては、話題毎に特徴ベ
クトルを算出するものとして説明するが、これに限ら
ず、文書毎、または、その他の単位毎(例えば、所定期
間(1週間)に蓄積された文書群毎)に特徴ベクトルを
算出することも勿論可能である。
【0057】文書特徴データベース作成部24は、文書
属性処理部22でグループ化された文書群(話題)毎の
各文書の属性情報と、文書内容処理部23で算出された
話題毎の特徴ベクトル(すなわち、話題内に含まれる全
ての単語の重み)を時系列順にデータベース化してハー
ドディスクドライブなどよりなる記憶部49(図2)に
記録する。文書特徴データベース作成部24はまた、単
語の重みに基づいて、所定の条件を満たす単語を選択
し、その単語を、関連情報を検索するための検索用キー
ワード(重要語)として記録する。文書特徴データベー
ス作成部24はさらに、検索用キーワードを関連情報検
索部25に供給し、それに対応して関連情報検索部25
から返される関連情報を、検索用キーワードに対応付け
て記録する。
【0058】関連情報検索部25は、文書特徴データベ
ース作成部24が選択して記録した検索用キーワードに
対する関連情報を検索し、検索結果のインデックスを文
書特徴データベース作成部24に返す。キーワードの関
連情報を検索するには、例えば、インターネット上の検
索エンジンを用いる方法がある。この場合、Webページ
のURL(Uniform Resource Locator)やWebページのタイ
トルが、関連情報として文書特徴データベース作成部2
4に返される。
【0059】提示部12のイベント管理部31は、メー
ラ2が電子メールの送信や受信を終えたことや、編集中
の文書のテキストデータ量が所定の閾値を超えたことを
検知して、データベース問い合わせ部32に通知する。
以下、メーラ2が電子メールの送信や受信を終えたこと
や、編集中の文書のテキストデータ量が所定の閾値を超
えたことをイベント発生と記載する。
【0060】イベント管理部31は、内部にタイマ31
Aを内蔵しており、所定時間が経過したか否かを監視
し、所定時間が経過した場合、その旨をデータベース問
い合わせ部32に通知する。
【0061】データベース問い合わせ部32は、イベン
ト管理部31からのイベント発生の通知に対応して、イ
ベント発生に対応する文書(例えば、受信した電子メー
ル)を取得し、文書内容処理部23の処理と同様に、そ
の文書の形態素解析を施して、不要語を除外した単語を
抽出し、各単語の重みを演算する。これにより、イベン
ト発生に対応する文書の特徴ベクトルが算出される。
【0062】データベース問い合わせ部32はまた、文
書特徴データベース作成部24が作成したデータベース
を検索し、算出したイベント発生に対応する文書の特徴
ベクトルと、データベースに記録されている話題毎の特
徴ベクトルとの内積から類似度をそれぞれ算出する。デ
ータベース問い合わせ部32は、類似度が最も高い話題
を抽出し、抽出した話題に含まれる各単語のうち、重み
が所定の条件(詳細については図6を参照して後述す
る)を満たすものを選択し、選択された単語(重要語)
に対応する関連情報を、イベント管理部31を介して、
あるいは、直接、関連情報提示部33に供給する。
【0063】関連情報提示部33は、イベント管理部3
1を介して、あるいは、直接、データベース問い合わせ
部32から供給される関連情報を表示部48(デスクト
ップ)上に表示させる。
【0064】なお、蓄積部11によるデータベースの更
新は、所定のタイミングにおいて実行される。データベ
ースの更新処理は、図28のフローチャートを参照して
後述する。また、蓄積部11によるデータベースの更新
時に、記憶部49に記録した特徴ベクトルが、例えば、
メールのやりとりの回数、送受信の状態、または、品詞
の種類(特定の地域や名称を示す固有名詞など)に応じ
て修正される。特徴ベクトルの修正処理は、図31、図
34、および図36のフローチャートを参照して後述す
る。さらに、提示部12による関連情報の提示処理は、
イベント管理部31がイベント発生を検知する毎に実行
される。
【0065】図2は、エージェントプログラム1がイン
ストールされて実行されるパーソナルコンピュータの構
成例を示している。
【0066】パーソナルコンピュータは、CPU(Central
Processing Unit)41を内蔵している。CPU41には
バス44を介して、入出力インタフェース45が接続さ
れている。入出力インタフェース45には、キーボー
ド、マウスなどの入力デバイスよりなる入力部46、処
理結果としての例えば音声信号を出力する出力部47、
処理結果としての画像を表示するディスプレイなどより
なる表示部48、プログラムや各種データを格納するハ
ードディスクドライブなどよりなる記憶部49、LAN(Lo
cal Area Network)やインターネットを介してデータを
通信するモデムなどよりなる通信部50、および、磁気
ディスク52、光ディスク53、光磁気ディスク54、
または半導体メモリ55などのプログラム格納媒体に対
してデータを読み書きするドライブ51が接続されてい
る。バス44には、ROM(Read OnlyMemory)42および
RAM(Random Access Memory)43が接続されている。
【0067】本発明のエージェントプログラム1は、磁
気ディスク52、光ディスク53、光磁気ディスク5
4、または半導体メモリ55に格納された状態でパーソ
ナルコンピュータに供給され、ドライブ51によって読
み出されて、記憶部49に内蔵されるハードディスクド
ライブにインストールされている。記憶部49にインス
トールされているエージェントプログラム1は、入力部
46に入力されるユーザからのコマンドに対応するCPU
41の指令によって、記憶部49からRAM43にロード
されて実行される。なお、パーソナルコンピュータの起
動時において自動的にエージェントプログラム1が実行
されるように設定しておくようにしてもよい。
【0068】また記憶部49に内蔵されるハードディス
クドライブには、エージェントプログラム1、メーラ
2、およびワードプロセッサ3の他、WWW(World Wide
Web)ブラウザなどのアプリケーションプログラムもイ
ンストールされており、エージェントプログラム1と同
様に、入力部46に入力されるユーザからの起動コマン
ドに対応するCPU41の指令によって、記憶部49からR
AM43にロードされて実行される。
【0069】次に、図3のフローチャートを参照して、
エージェントプログラム1のデータベース作成処理につ
いて説明する。このデータベース作成処理は、エージェ
ントプログラム1が実行する処理のうちの1つであり、
エージェントプログラム1が実行された場合において、
データベースが未だ作成されていないときに開始され
る。
【0070】ステップS1において、文書取得部21
は、未処理の文書(例えば、エージェントプログラム1
が実行される以前に送受信された電子メール)を、記憶
部49に内蔵されるハードディスクドライブから取得し
て文書属性処理部22および文書内容処理部23に供給
する。
【0071】ステップS2において、文書属性処理部2
2は、ステップS1の処理で文書取得部21により取得
され供給された電子メールの文書から属性情報(メッセ
ージID等のヘッダ情報)を抽出し、その属性情報に基づ
き、文書をグループ化して(すなわち、話題毎にグルー
プ化して)、文書内容処理部23および文書特徴データ
ベース作成部24に供給する。
【0072】ステップS3において、文書内容処理部2
3は、ステップS2の処理で文書属性処理部22により
グループ化された文書群(話題)の本文のテキストデー
タを抽出し、さらにテキストデータの形態素解析を施
し、不要語を除く単語(特徴語)を抽出する。ステップ
S4において、文書内容処理部23は、ステップS3の
処理で抽出された各単語の出現頻度、複数の文書に亘る
分布状況を求め、話題毎に、各単語の重みを、例えば、
tf・idf法を用いて演算する。
【0073】ステップS5において、文書特徴データベ
ース作成部24は、ステップS2の処理で文書属性処理
部22によりグループ化された話題毎の各文書の属性情
報と、ステップS3の処理で文書内容処理部23により
算出されたその話題内に含まれる全ての単語の重み(特
徴ベクトル)をデータベース化する。
【0074】具体的には、図4に示されるように、グル
ープ化された各話題(話題A、話題B、話題C、・・
・)を時系列順にソートした後、各話題にそれぞれ含ま
れる全単語1乃至nの重みも時系列順にソートして記憶
部49に記録する。ここで、図4においては、例えば、
重みA1は、話題Aにおける単語1の重みの値を示し、
重みB2は、話題Bにおける単語2の重みの値を示して
いる。さらに例えば、話題Bに単語1が含まれていない
場合、重みB1は0となる。
【0075】図3の説明に戻る。ステップS6におい
て、文書特徴データベース作成部24は、単語の重みが
所定の閾値以上である単語を検索用キーワードに選択す
るか、あるいは、重みが大きい順にソートされ、予め指
定される個数の単語を選択して、関連情報検索部25に
供給する。関連情報検索部25は、文書特徴データベー
ス作成部24からの検索用キーワード(重要語)を検索
条件として、インターネット上の検索エンジンにアクセ
スして検索結果を取得し、得られたWebページのURLやタ
イトルを関連情報として文書特徴データベース作成部2
4に出力する。
【0076】ステップS7において、文書特徴データベ
ース作成部24は、関連情報検索部25からの関連情報
を検索用キーワードに対応付けて記憶部49に記録する
ことにより、データベースを作成する。なお、ステップ
S6の処理とステップS7の処理は、ステップS5まで
の一連の処理に継続して実行する場合と、一連の処理に
継続せず、所定のタイミングにおいて実行する場合があ
る。
【0077】以上のデータベース作成処理が実行される
ことにより、送受信した電子メールの文書に対応した関
連情報がデータベース内に蓄積されることになる。な
お、データベース作成処理は、エージェントプログラム
1が実行された場合に開始されるものとしたが、任意の
タイミングで開始させることも可能である。さらに、こ
のようにして作成されたデータベースは、所定の条件が
満たされたときに更新される(更新のタイミングについ
ては、図29を参照して後述する)。
【0078】また、データベース作成処理をユーザが強
制的に中断することができるようにするために、中断要
求があった場合、中断された時点で処理済みの文書を記
録し、再開要求があった場合、未処理の文書から処理を
再開するようにしてもよい。
【0079】次に、図5のフローチャートを参照して、
エージェントプログラム1の関連情報提示処理について
説明する。この関連情報提示処理は、図3を用いて上述
したデータベース作成処理とは異なり、エージェントプ
ログラム1が実行されている間、繰り返して実行され
る。
【0080】ステップS11において、エージェントプ
ログラム1は、入力部46に入力されるユーザからのコ
マンドによって、エージェントプログラム1の終了が指
示されたか否かを判定し、エージェントプログラム1の
終了が指示されていないと判定した場合、ステップS1
2に進む。
【0081】ステップS12において、イベント管理部
31は、イベント発生(メーラ2の電子メールの送受信
の終了等)を監視し、イベント発生が検知されない場
合、ステップS11に戻り、上述した処理が繰り返し実
行される。
【0082】ステップS12において、イベント発生が
検知された場合、ステップS13に進み、イベント管理
部31は、イベント発生をデータベース問い合わせ部3
2に通知する。データベース問い合わせ部32は、イベ
ント管理部31からのイベント発生の通知に対応して、
イベント発生に対応する文書(送受信された電子メー
ル)を取得し、その文書の形態素解析を施して、不要語
を除外した単語(特徴語)を抽出し、各単語の重みを演
算する。これにより、イベント発生に対応する文書の特
徴ベクトルが算出される。
【0083】ステップS14において、データベース問
い合わせ部32は、文書特徴データベース作成部24が
作成したデータベースを検索し、ステップS13の処理
で算出された特徴ベクトルと、データベースに記録され
ている話題毎の特徴ベクトルとの内積から類似度をそれ
ぞれ算出し、類似度が所定の条件(例えば、類似度が最
大、もしくは類似度が所定の閾値以上)を満たすものを
抽出する。
【0084】また、より好ましくは、話題の選択に際し
ての条件として、過去一定期間に属する話題であって、
最近送受信したメールに多く含まれている、または、集
中して使われている単語を、特徴ベクトルの重みに関し
て上位後に持たない話題を選択するようにすると良い。
話題を確定する日時としては、話題を構成する電子メー
ルの初め、終わり、若しくは、平均の送信日時、また
は、話題を構成する電子メールの初め、終わり、若しく
は、平均の受信日時等、日時を特定できれば何れでもよ
い。これにより、最近忘れていたが過去にあった話題の
内、現在の興味に類似するものを抽出することができ、
ユーザに意外性を与えるとともに、ユーザの潜在的な興
味を喚起することができる。
【0085】ステップS15において、データベース問
い合わせ部32は、ステップS14の処理で抽出された
話題に含まれる各単語のうち、重みの時系列推移に着目
して、以下に示す条件1および条件2を満たす単語(重
要語)を選択する。
【0086】なお、この処理は、必ずしも必須ではな
く、ステップS6で取得され、ステップS14で選択さ
れた話題に関連付けられた関連情報の内、ステップS6
での重みが一番大きなものから順に、または、今まで表
示していない関連情報から優先的に表示するようにして
も良い。また、表示する関連情報は1つに限られない。
【0087】ここで、図6を参照して、単語の選択条件
について説明する。図6は、データベースに蓄積されて
いる単語の重みの時系列推移の例を示している。
【0088】例えば、条件1は、「単語の重みが、現時
点以前の所定の期間X(例えば、2週間)、所定の閾値
A以下であること」である。また例えば、条件2は、
「現時点以前の所定の期間Y(例えば、5週間)におい
て、異なる2以上の話題で、単語の重みが所定の閾値B
以上であること」である。なお、条件3「条件2におけ
る異なる2以上の話題のうち、最も古い話題と最も新し
い話題が所定の期間Z以上離れていること」を追加すれ
ばさらに好ましい。
【0089】このような条件を用いることにより、ユー
ザの興味が高いと思われる単語(重要語)を選択するこ
とが可能となる。特に、条件1によって、現時点に近い
話題に含まれる単語は除外されるので、ユーザが現時点
で意識しており、意外性のないと思われる関連情報(新
しすぎる情報)を改めて選択することを避けることがで
き、かつ、かなり以前の話題に含まれる単語も除外され
るので、ユーザが現時点で思い出すことができないと思
われる関連情報(古すぎる情報)を改めて選択すること
も避けることができる。
【0090】データベース問い合わせ部32は、このよ
うにして選択した単語(重要語)に対応する関連情報
を、イベント管理部31を介して、あるいは、直接、関
連情報提示部33に供給する。
【0091】図5の説明に戻る。ステップS16におい
て、エージェント制御部13は、ステップS15の処理
で選択した単語が含まれている文書の属性情報を、選択
(推薦)した理由として表示させるとともに、対応する
関連情報を表示するか否かをユーザに問う入力ウィンド
ウ81(図14)をデスクトップに表示させる。
【0092】なお、話題は、グループ化された複数の文
書からなるため、重要語が含まれる文書も複数存在する
場合がある(すなわち、重要語が含まれている文書の属
性情報が複数存在する場合がある)。そこで、例えば、
重要語が含まれている文書のうち、最古または最新の文
書の属性情報を表示させるようにするか、あるいは、任
意に指定された文書の属性情報を表示させる。また、入
力ウィンドウ81を表示させずに、直接、デスクトップ
上に関連情報を表示させるようにしてもよい。
【0093】ステップS17において、エージェントプ
ログラム1は、入力部46に入力されるユーザからのコ
マンドによって、ステップS16の処理で表示された入
力ウィンドウ81に呼応して、ユーザが「見る」ボタン
を選択したか否かを判定する。ステップS17におい
て、ユーザが「見る」ボタンを選択したと判定された場
合、ステップS18に進む。なお、入力ウィンドウ81
には、「見る」ボタンおよび「見ない」ボタン以外にも
他の情報を表示したり、あるいは、表示しないようにす
ることもできる。
【0094】ステップS18において、関連情報提示部
33は、イベント管理部31を介してデータベース問い
合わせ部32から供給された関連情報をデスクトップに
表示させる。この関連情報は、1または複数個を提示す
ることができる。
【0095】なお、関連情報として表示される情報は、
キーワードが付与された所定のデータベースに蓄積され
た情報であれば、Webページのタイトルでなくてもかま
わない。例えば、所定のデータベースに蓄積されている
情報のインデックスを表示するようにして、ユーザのア
クセス指令に対応して、そのインデックスのさらに詳細
な情報を表示させるようにしてもよい。
【0096】ステップS19において、エージェントプ
ログラム1は、入力部46に入力されるユーザからのコ
マンドによって、ステップS18の処理により関連情報
として表示されたWebページのタイトルに対して、ユー
ザがアクセスを指令したと判定した場合、ステップS2
0に進む。ステップS20において、WWWブラウザが起
動され、対応するWebページへのアクセスが行われる。
【0097】ステップS19において、ステップS18
の処理により関連情報として表示されたWebページのタ
イトルに対して、ユーザが記録を指令したと判定された
場合、ステップS21に進む。ステップS21におい
て、エージェントプログラム1は、対応するWebページ
のタイトルおよびURLを、提示履歴を表示するスクラッ
プ帳ウィンドウ74(図9)に記録する。なお、ステッ
プS19において、ステップS18の処理により関連情
報として表示されたWebページのタイトルに対して、ユ
ーザから何の指令もなされずに所定の時間が経過したと
判定された場合、ステップS20またはステップS21
の処理はスキップされて、ステップS11に戻り、上述
した処理が繰り返し実行される。
【0098】なお、ステップS17において、ユーザが
「見る」ボタンを選択しないと判定された場合、ステッ
プS18乃至ステップS21の処理はスキップされて、
ステップS11に戻り、上述した処理が繰り返し実行さ
れる。さらに、ステップS11において、ユーザにより
エージェントプログラム1の終了が指示されたと判定さ
れた場合、処理は終了される。
【0099】ここで、関連情報提示処理に関して、イベ
ント発生に対応する電子メールを効率よく取得する手法
について説明する。
【0100】まず、大多数のメーラがメールの保持形式
に関し、次のような4つの特徴を有していることに着目
する。第1に、メーラにおける1つのフォルダは、パー
ソナルコンピュータにおける1つのメールボックスファ
イルに対応していること。第2に、新たに受信したメー
ルは、特定のフォルダに格納されるようになっており、
パーソナルコンピュータでは当該フォルダに対応するフ
ァイルの末尾に追加され、このとき、1つのファイルに
は一般に複数のメールが含まれるので、メールとメール
との境界に、特定の文字列パターン(メーラによって異
なる)からなる行が挿入されていること。第3に、送信
したメールの記録も、同様の形式で特定のファイルに保
存されること。第4に、一般に、送受信したメールが含
まれるファイルはサイズが大きいこと(数百KB乃至1M
B)。
【0101】以上の第1乃至第4の特徴を考慮して、次
の手順によってイベント発生に対応するメールを取得す
る。始めに、メールボックスファイルの更新日時を検出
し、新たなメールが追加されたか否かを判断する。次
に、新たにメールが追加されたメールボックスファイル
を末尾から先頭方向に1行ずつ操作して、メールとメー
ルとの境界を示す特定の文字列を検出する。境界を示す
文字列を検出した場合、その位置からメールボックスフ
ァイルの末尾までデータを抽出する。
【0102】このような手法を用いることにより、イベ
ント発生に対応する電子メールを効率的に取得すること
が可能となる。
【0103】次に、関連情報提示処理に関して、同一の
メールに対して何度も関連情報を提示しないようにする
手法について説明する。まず、関連情報を提示したメー
ルのメッセージIDを記録するためのデータ構造を設定す
る。そして、イベントが発生した場合、そのイベントに
対応するメールのメッセージIDを取得して、設定したデ
ータ構造と比較する。データ構造の中に同じメッセージ
IDがある場合、そのメールに対しては既に関連情報を提
示しているので、関連情報を提示しない。一方、データ
構造の中に同じメッセージIDがない場合、そのメールに
対しては関連情報を提示していないので関連情報を提示
し、メッセージIDをデータ構造に記録する。
【0104】このような手法を用いることにより、同一
のメールに対して何度も関連情報を提示するような事態
の発生を抑止することが可能となる。
【0105】次に、図7および図8のフローチャートを
参照して、図5を用いて説明した関連情報提示処理のう
ち、主にエージェントの動作および台詞等について、詳
細に説明する。
【0106】例えば、エージェントプログラム1が起動
されている状態においてメーラ2が起動された場合、ス
テップS31において、エージェント制御部13は、例
えば、図9に示されるように、メーラ2のウィンドウ
(以下、メーラウィンドウと記載する)71の表示と重
畳しない位置に、エージェント72を表示(登場)させ
る。
【0107】なお、エージェント72の登場は、例え
ば、図10A乃至図10Dに示す画像が順次表示される
ことによって、エージェント72が前転しながらデスク
トップ上に出現する動画が表現される。エージェント7
2の登場とともに、エージェント72の台詞として吹き
出し73と、保存されている関連情報が一覧表示されて
いるスクラップ帳ウィンドウ74(後述)が表示され
る。吹き出し73の中には、例えば、図11に示される
ように、登場の挨拶「おはよう、SAITOさん!」と、自
己紹介「ぼく、alfだよ。」の台詞が表示される。
【0108】また、吹き出し73の表示と同期して、吹
き出し73に表示された台詞の音声信号が音声合成部
(図示せず)によって合成されて出力するようにするこ
とができる。なお、吹き出し73に表示された台詞の音
声信号は、吹き出し73に表示された言語(図16の例
の場合、日本語)、あるいは、吹き出し73に表示され
た言語と同じ意味を持つ他の言語(例えば、英語の場
合、”Good morning,SAITO"、”I'm Alf")の音声信号
が音声合成部によって合成されて出力されるようにして
もよい。そして、以降に表示される吹き出し73にも対
応する音声信号が同期して出力される。
【0109】なお、吹き出し73や対応する音声は、出
力しなくてもよい。以降、いずれの処理においても、吹
き出し73および対応する音声は、エージェントプログ
ラム1の規定により出力するか否かを設定するようにす
るか、あるいは、ユーザにより、出力するか否かを任意
に設定できるようにする。
【0110】その後、エージェント72の表示は、ステ
ップS32において、例えば、図12に示されるよう
に、待機中の様子(手を後に組み、つま先を上下させ
る)を示す動画に推移される。
【0111】ステップS33において、エージェントプ
ログラム1は、入力部46に入力されるユーザからのコ
マンドに応じて、メーラ2が終了されたか否かを判定
し、メーラ2が終了されていないと判定した場合、ステ
ップS34に進む。
【0112】ステップS34において(上述した図5の
ステップS12に対応する)、メーラ2は、ユーザから
何らかのコマンド(メールの送受信、メールの編集、あ
るいは関連情報の編集等)が入力されたか否かを判定
し、何らかのコマンドが入力されたと判定した場合、ス
テップS35に進み、コマンドに対応する処理を開始す
る。
【0113】ステップS35において、エージェントプ
ログラム1のイベント管理部31は、メールの送信、受
信、または編集のコマンドが入力されたか否かを判定さ
し、メールの送受信または編集のコマンドが入力された
と判定した場合、ステップS36に進む。
【0114】ステップS36において、エージェント制
御部13は、エージェント72の表示を、図12に示し
た待機中の様子から、例えば、図13に示されるよう
に、作業中の様子(手足を激しく移動する)を示す動画
に推移させる。この間に、図5のステップS13乃至S
15の処理(ユーザに推薦する関連情報を選択する処
理)が実行される。
【0115】ステップS37において、エージェントプ
ログラム1は、コマンドに対応して開始されたメーラ2
の処理(例えば、メール送信など)が継続中であるか否
かを判定し、メーラ2の作業中の処理が終了するまで判
定処理を繰り返し実行する。すなわち、メーラ2の作業
中の処理が終了するまで、エージェント制御部13は、
エージェント72の表示を、図13に示した作業中の状
態のまま待機する。
【0116】ステップS37において、メーラ2の処理
が継続中ではない、すなわち、コマンドに対応して開始
されたメーラ2の作業中の処理が終了したと判定された
場合、ステップS38に進む。
【0117】ステップS38において、エージェントプ
ログラム1は、再度、入力部46に入力されるユーザか
らのコマンドに応じて、メーラ2が終了されたか否かを
判定し、メーラ2が終了されていないと判定した場合、
ステップS39に進む。
【0118】ステップS39(図5のステップS16に
対応する)において、エージェント制御部13は、ステ
ップS37のメーラ2の処理がメール送信であった場
合、エージェント72の吹き出し73に、例えば、
「今、Aさんにメール送ったけど、某月某日にAさんと
(タイトル)について話していたよね。その中にでてき
た(キーワード)について、関連するページを見つけた
よ。見てみる?」と表示させる。
【0119】また例えば、ステップS37のメーラ2の
処理がメール受信であった場合、台詞の前半が「今、A
さんからメールがきたけど」となり、ステップS37の
メーラ2の処理がメールの編集であった場合、台詞の前
半が「今、Aさんにメールを書いているけど」となる。
【0120】なお、「某月某日にAさんと(タイトル)
について話していたよね。」の部分は、関連情報が選択
(推薦)された理由に相当するが、関連情報の選択理由
の表示を、ステップS39において実行せずに、後述す
るステップS42の処理(関連情報の表示)の後に表示
するようにしてもよい。また、関連情報の選択理由の表
示をユーザの指示により任意のタイミング(例えば、メ
ニューで理由をたずねるコマンドを用意するなど)で実
行するようにしてもよい。
【0121】また、タイマ31Aによる一定時間経過時
の提示(定期的提示)に関しては、「今、Aさんからメ
ールがきたけど」など、特定のイベントを示すような表
現ではなく、例えば、「某月某日にAさんと(タイト
ル)について話していたよね。」の部分だけを表示する
ようにする。
【0122】さらに、これらの吹き出し73は、関連情
報を提示する前に表示してもよいし、あるいは、関連情
報を提示した後に表示してもよい。
【0123】吹き出し73に隣接する位置には、例え
ば、図14に示されるように、入力ウィンドウ81が表
示される。入力ウィンドウ81には、図15に示される
ように、関連情報の表示を指示するときに選択する「見
る」と示されたボタン、関連情報を表示させない時に選
択する「見ない」と示されたボタン、関連情報が選択さ
れた背景(選択理由)の再表示を指示するときに選択す
る「背景をもう一度教えて」と示されたボタンが表示さ
れる。
【0124】入力ウィンドウ81が表示された状態で、
ステップS40において、エージェント制御部13は、
エージェント72の表示を、図14に示した待機中の様
子を示す動画に推移させる。ステップS41(図5のス
テップS17に対応する)において、エージェントプロ
グラム1は、入力ウィンドウ81の中の「見る」と示さ
れたボタン、「見ない」と示されたボタン、または「背
景をもう一度教えて」と示されたボタンのいずれがユー
ザにより選択されたか否かを判定する。なお、この入力
ウィンドウ81は、表示しなくてもよい。
【0125】ステップS41において、入力ウィンドウ
81の「見る」と示されたボタンが選択されたと判定さ
れた場合、ステップS42に進む。ステップS42(図
5のステップS18に対応する)において、エージェン
ト制御部13は、例えば、図16および図17に示され
るように、関連情報として推薦URL91を表示させ、エ
ージェント72の表示を、表示された推薦URL91を指
し示す動画に推移させるとともに、吹き出し73に、台
詞「どう?」を表示させる。推薦URL91には、通常、
推薦されるWebページのタイトルが表示され、推薦URL9
1の上にマウスカーソルが置かれたときだけURLも重畳
して表示される。推薦URL91は、マウスカーソルでド
ラッグすることにより移動可能である。
【0126】ステップS43(図5のステップS19に
対応する)において、エージェントプログラム1は、表
示した推薦URL91に対するユーザのコマンドを検出す
る。表示される推薦URL91に対するユーザのコマンド
としては、記録、アクセス、または消去等がある。
【0127】推薦URL91に対する記録コマンドは、例
えば、記録する推薦URL91をスクラップ帳ウィンドウ
74までドラッグアンドドロップする方法や、マウスで
右クリックし、表示されるメニューの中から記録を選択
する方法などが考えられる。あるいは、推薦URL91
は、すべて自動的に記録されるようにしてもよい。アク
セスコマンドや消去コマンドについても同様に、WWWブ
ラウザのアイコンやゴミ箱のアイコンにドラッグアンド
ドロップする方法や、マウスで右クリックし、表示され
るメニューの中から選択する方法、あるいはクリッカブ
ルにする方法などが考えられる。
【0128】ステップS43において、推薦URL91に
対する記録コマンドが検出された場合、ステップS44
(図5のステップS21に対応する)において、エージ
ェント制御部13は、エージェント72の表示を、例え
ば、図18に示されるように、頷く動作に推移させる。
スクラップ帳ウィンドウ74の中に、記録が指示された
推薦URL91に対応するWebページのタイトルが追加され
る。
【0129】また、ステップS43で、推薦URL91に
対するアクセスコマンドが検出された場合、ステップS
44(図5のステップS20に対応する)において、エ
ージェント制御部13は、エージェント72の表示を、
例えば、図19Aおよび図19Bに示されるように、笑
顔となって喜ぶ様子に推移させる。吹き出し73には、
「わーい」と表示され、対応する音声信号が出力され
る。
【0130】また、ステップS43で、推薦URL91に
対する消去コマンドが検出された場合、ステップS44
において、エージェント制御部13は、エージェント7
2の表示を、例えば、図20Aおよび図20Bに示され
るように、泣き顔となって悲しみ失望した様子に推移さ
せる。吹き出し73には、「だめかぁ」と表示され、対
応する音声信号が出力される。
【0131】ステップS44の処理が終了した後、ステ
ップS32に戻り、それ以降の処理が繰り返し実行され
る。
【0132】なお、ステップS41において、入力ウィ
ンドウ81の「見ない」と示されたボタンが選択された
と判定された場合、ステップS32に戻り、それ以降の
処理が繰り返し実行される。また、ステップS41にお
いて、入力ウィンドウ81の「背景をもう一度教えて」
と示されたボタンが選択されたと判定された場合、ステ
ップS39に戻り、ステップS39乃至S41の処理が
繰り返される。
【0133】ステップS38において、メーラ2が終了
されたと判定された場合、ステップS45に進み、エー
ジェント制御部13は、吹き出し73に、「え、そんな
ぁ」と表示させ、対応する音声信号を出力させた後、ス
テップS46において、エージェント72の表示を消失
させる(図25を参照して後述する)。
【0134】ステップS35において、関連情報の編集
を指示するコマンドが入力されたと判定された場合、ス
テップS47に進み、関連情報提示部33は、関連情報
編集用ウィンドウ(図示せず)を表示させ、エージェン
ト制御部13は、エージェント72の表示を、図18に
示した待機中の様子から、図17と同様に、関連情報編
集用ウィンドウを指し示す様子に推移させる。その後、
ユーザが関連情報編集用ウィンドウに対して編集のため
の入力を開始すると、ステップS48において、エージ
ェント制御部13は、エージェント72の表示を、関連
情報編集用ウィンドウを指し示す様子から、図13に示
した作業中の様子を示す動画に推移させる。
【0135】ステップS49において、エージェントプ
ログラム1は、関連情報編集処理が継続中であるか否か
を判定し、関連情報編集処理が終了するまで判定処理を
繰り返し実行する。すなわち、関連情報編集処理が終了
するまで、エージェント制御部13は、エージェント7
2の表示を、図13に示した作業中の状態のまま待機す
る。
【0136】ステップS49において、関連情報編集処
理が継続中ではない、すなわち、コマンドに対応して開
始された関連情報編集処理が終了したと判定された場
合、ステップS50に進む。
【0137】ステップS50において、エージェント制
御部13は、エージェント72の表示を、図18と同様
に、頷く様子に推移させる。吹き出し73には、「変更
したよ」と表示され、対応する音声信号が出力される。
その後、処理は、ステップS32に戻り、それ以降の処
理が繰り返し実行される。
【0138】ステップS34において、メーラ2に対し
てユーザから何らかのコマンドが入力されない状態が所
定の時間以上継続した場合、ステップS51に進む。ス
テップS51において、エージェント制御部13は、エ
ージェント72の表示を、所定の時間が経過する毎に、
移動の状態、遊びの状態、または睡眠の状態に順次推移
させる。この待機中の処理の詳細について、図8のフロ
ーチャートを参照して説明する。なお、各処理は、エー
ジェント制御部13が実行する。
【0139】ステップS61において、エージェント7
2の表示は、図12に示した待機中の状態から、例え
ば、図21または図22に示した画像を用いて表現され
る移動の状態に推移する。
【0140】エージェント72の移動は、表示されてい
るウィンドウと重畳しないようにデスクトップ上を横方
向あるいは縦方向に行われる。なお、アクティブである
ウィンドウ(いまの場合、メーラウィンドウ71)を検
出して、その周囲を横方向あるいは縦方向に行うように
してもよい。エージェント72がデスクトップ上を横方
向(例えば、右方向)に移動するときには、例えば、図
21A乃至図21Dに示される画像が順次用いられるこ
とにより、いわゆるワープしたかのような動画表現が実
現される。
【0141】具体的には、エージェント72の表示は、
移動開始位置において、図21Aに示されるように、体
の向きが移動する方向とされ、その後、指向している方
向にジャンプすると、図21Bに示されるように、頭部
から順に消滅して行く。そして、移動終了位置におい
て、図21Cに示されるように、脚部から順に表示され
て、最終的には、図21Dに示されるように全身が表示
される。
【0142】エージェント72がデスクトップ上を上下
方向に移動するときには、例えば、図22A乃至図22
Gに示される画像が順次用いられる。すなわち、エージ
ェント72は、移動開始位置において、図22Aに示さ
れるように、自身の尻尾(先端がコンセントプラグの形
状をしている)を手で握り、図22Bに示されるよう
に、尻尾の先端を頭上付近に差し込む。
【0143】その後、エージェント72の表示は、図2
2C、図22Dに順次示されるように、体の下部から徐
々にロープに変身し、図22Eに示されるように、1本
のロープになってその状態で移動終了位置まで移動す
る。移動終了位置においては、図22F、図22Gに順
次示されるように、頭部から順に復元されて、最終的に
全身が表示される。
【0144】このように、エージェント72の移動を、
いわゆるワープによって表現したり、1本のロープに変
身させて表現したりすることにより、移動中を表現する
ために使われるリソース(メモリなど)の量を軽減させ
ることが可能となる。
【0145】図8の説明に戻る。ステップS62におい
て、イベント(メールの送受信、メールの編集、あるい
は関連情報の編集等を指示するコマンドの入力)が発生
したか否かが判定される。イベントが発生していないと
判定された場合、ステップS63に進む。
【0146】ステップS63において、エージェント7
2の表示が移動の状態に推移した後、所定の時間が経過
したか否かが判定され、所定の時間が経過したと判定さ
れるまで、ステップS62およびステップS63の処理
が繰り返し実行される。ステップS63において、所定
の時間が経過したと判定された場合、ステップS64に
進む。
【0147】ステップS64において、エージェント7
2の表示は、移動の状態から、例えば、図23に示され
る画像で表現される「遊び」の状態に推移する。図23
Aは、エージェント72が蛇と戯れている状態を示して
おり、図23Bは、エージェント72が尻尾の先端を上
方に差し込み、そこを支点としてぶら下がり揺れている
状態を示している。
【0148】ステップS65において、イベントが発生
したか否かが判定される。イベントが発生していないと
判定された場合、ステップS66に進む。ステップS6
6において、エージェント72の表示が遊びの状態に推
移した後、所定の時間が経過したか否かが判定され、所
定の時間が経過したと判定されるまで、ステップS65
およびステップS66の処理が繰り返し実行される。ス
テップS66において、所定の時間が経過したと判定さ
れた場合、ステップS67に進む。
【0149】ステップS67において、エージェント7
2の表示は、遊びの状態から、例えば、図24に示され
る画像で表現される「睡眠」の状態に推移する。ステッ
プS68において、イベントが発生したか否かが判定さ
れ、イベントが発生するまで判定処理が繰り返し実行さ
れる。ステップS68において、イベントが発生したと
判定された場合、図7のステップS35にリターンし、
それ以降の処理が実行される。
【0150】なお、ステップS62、またはステップS
65において、イベントが発生したと判定された場合も
同様に、図7のステップS35にリターンし、それ以降
の処理が実行される。
【0151】また、図8のフローチャートには図示して
いないが、待機中の処理が実行されている最中におい
て、メーラ2が終了されたと判定された場合、ステップ
S46にリターンする。同様に、図7のステップS33
において、メーラ2が終了されたと判定された場合、ス
テップS46に進む。
【0152】ステップS46において、エージェント制
御部13は、エージェント72の表示を、例えば、図2
5Aおよび図25Bに示される画像で表現される「消
失」の状態に推移させる。図25Aは、エージェント7
2が手を振りながら背を向けて遠方に立ち去る状態を示
しており、図25Bは、エージェント72が徐々に小さ
くなってやがて消失される状態を示している。
【0153】なお、エージェント72の消去とともに、
吹き出し73、スクラップ帳ウィンドウ74、および推
薦URL91等の表示も消去される。
【0154】以上のように、本発明によれば、電子メー
ル等の文書から重みの高い単語(重要語)を抽出し、関
連情報を推薦する一連の処理に対応して、エージェント
72が動作するので、エージェント72に対して信頼性
や親しみが感じられるようになる。
【0155】ところで、上述したエージェント72の動
作および吹き出し73の中の台詞の表示、並びに、表示
された台詞に対応する音声信号の出力については、本発
明のエージェントプログラム1だけでなく、他のアプリ
ケーション、例えば、ゲームやワードプロセッサのヘル
プ画面等に適用することが可能である。さらに、テレビ
ジョン受像機、ビデオカメラ、またはカーナビゲーショ
ン等のディスプレイに表示されるキャラクタに適用する
ことも勿論可能である。
【0156】また、同一のパーソナルコンピュータを複
数のユーザが操作する場合、エージェント72の種類を
複数用意して、ユーザ毎に表示されるエージェント72
(図26)の種類を変えるようにしてもよい。また、エ
ージェント72は、ユーザが好みのキャラクタを自由に
作成し、編集できるようにしてもよい。さらに、同一の
ユーザが複数のパーソナルコンピュータ上でエージェン
トプログラム1を利用する場合、異なるパソコン上にお
いても同じエージェント72が表示されるようにしても
よい。
【0157】なお、以上においては、エージェントプロ
グラム1が実行されている場合、エージェント72は、
常に登場しているものとして説明したが、推薦時にのみ
表示させたり、その設定を変更することができる。
【0158】例えば、ユーザは、エージェントプログラ
ム1が実行されている状態で、マウスを右クリックし、
図26に示されるようなメニューボックス101を表示
させて、その中から、「いろいろな設定をする」の項目
を選択することにより、図27に示されるような設定画
面を表示させる。
【0159】図27の例の設定画面には、複数のタブが
配置されており、「エージェント」と示されたタブがア
クティブとされているとき、ユーザが選択または入力可
能な、エージェントの名前、表示、効果音、推薦間隔、
推薦保存数、推薦するときのせりふ、および推薦データ
更新などの項目が表示される。
【0160】ユーザは、これらの項目に対して、それぞ
れ、所望の情報(エージェントの名前)を入力したり、
あるいは、所定の項目を選択することによって、自分好
みにエージェント72および吹き出し73の表示状態、
あるいは、推薦する関連情報の推薦間隔時間や保存数な
どを設定することができる。
【0161】次に、蓄積部11によるデータベースの更
新のタイミングについて説明する。データベースは、図
3のフローチャートを用いて上述したデータベース作成
処理によって作成されるが、次のような第1乃至第3の
状況になった場合、データベースの更新が必要である。
【0162】すなわち、第1の状況として、データベー
スが作成または更新されてから所定の期間が経過してい
る場合、データベース内の関連情報が古くなってしまう
ので更新が必要である。第2の状況として、データベー
スに蓄積されている関連情報のうちの所定の割合が提示
済みとなった場合、データベース内の関連情報を繰り返
し提示してしまったり、提示する関連情報が不足してし
まうので更新が必要である。第3の状況として、特徴抽
出に用いた文書が、例えば電子メールである場合、電子
メールの送受信を繰り返していると、その文書の内容が
変化するので更新が必要である。
【0163】なお、データベースの更新が必要である状
況になった場合(例えば、イベント管理部31がタイマ
31Aを監視し、所定の期間が経過したとき)、ユーザ
に対して更新を指示するように促すこともできるし、ユ
ーザに対する促しを実行せずに、自動的にデータベース
を実行するように設定することも可能である。また、ユ
ーザが指定する任意のタイミングで更新することも勿論
可能である。
【0164】前記第1乃至第3の状況を考慮したデータ
ベース更新処理について、図28のフローチャートを参
照して説明する。このデータベース更新処理は、エージ
ェントプログラム1が実行する処理のうちの1つであ
り、エージェントプログラム1の起動とともに開始さ
れ、エージェントプログラム1が終了されるまで繰り返
し実行される。なお、この処理を開始するにあたって、
図3を用いて説明したデータベース作成処理が実行され
ており、データベースが既に作成されているものとす
る。
【0165】ステップS81において、エージェントプ
ログラム1の蓄積部11は、作成済みのデータベースの
更新が必要であるか否かを判定し、更新が必要であると
判定されるまで待機する。この判断基準は、例えば、図
29に示すようなユーザインタフェースの画面を用いて
予めユーザが設定するものとする。図29の例では、4
つの条件が示されており、左端の□(チェックボック
ス)がユーザによってチェックされた場合、対応する条
件が有効となる。なお、1番目の条件では回数が設定可
能とされており、3番目の条件では日数が設定可能とさ
れている。
【0166】ステップS81において、更新が必要であ
ると判定された場合、ステップS82に進み、さらに蓄
積部11は、データベースを自動的に更新するように設
定されているか否かを判定し、自動的に更新するように
設定されていないと判定した場合、ステップS83に進
む。一方、ステップS82において、自動的に更新する
ように設定されていると判定された場合、ステップS8
3の処理はスキップされる。
【0167】ステップS83において、エージェントプ
ログラム1の提示部12は、データベースの更新が必要
である旨をユーザに通知するとともに、さらに、その通
知に対応して、ユーザから更新の指示がなされたか否か
を判定する。ユーザから更新の指示がなされたと判定さ
れた場合、ステップS84に進み、ユーザから更新の指
示がなされないと判定された場合、ステップS81に戻
り、上述した処理が繰り返し実行される。
【0168】ステップS84において、エージェントプ
ログラム1の蓄積部11は、データベースを更新する。
具体的には、文書取得部21乃至文書内容処理部23
が、電子メールのメールボックスファイル(例えば、mb
x等の拡張子が付加されていることが多い)を検出し、
その更新日時を取得して、以前に取得した更新日時と比
較して、異なる日付と異なるファイルサイズであれば、
ファイルが更新されていると判断し、追加または変更さ
れた部分を抽出する。この場合、メールのグループ化、
ヘッダの解析、形態素解析、特徴ベクトル算出等、一連
のファイル内の分析が行われ、得られる重要語が関連情
報検索部25に供給される。
【0169】ただし、メールグループ(話題)が変化せ
ず(所定の話題に追加されるメールがなく)、分析の結
果、更新以前の重要語(検索用キーワード)と更新後の
重要語が同じであれば、重み等の計算値だけを変更し、
関連情報検索部25による関連情報の検索を実行しない
ようにしてもよい。また、関連情報をインターネット等
のネットワーク上で検索する場合、ネットワークに接続
されているか否かが検出され、ネットワークに接続され
ていない場合、関連情報の検索を行わず、それ以後、ネ
ットワークに接続されたときに関連情報を検索するか否
かをユーザに問うようにしてもよい。
【0170】「同じ関連情報を何度も推薦(提示)しな
いようにするために、あるメールグループの関連情報
を、所定の回数以上推薦したら更新が必要と判断する」
との条件に関連して、取得したメールと類似性の高いメ
ールグループ(話題)を選択する際に、同じメールグル
ープから何度も推薦を行わないように、次のような処理
を行う。
【0171】メールグループ自体に推薦の優先度の順位
を付与し(例えば、メールグループ内での特徴語の重み
の最大値をそのメールグループの優先度の値とし、優先
度の値を降順に並べたものを優先度の順位として付与す
る)、一度推薦を行ったメールグループを優先順位の最
後尾に並び替えるようにする。このようにすることによ
って、類似度の範囲内にあるメールグループでも、同じ
メールグループから推薦する頻度が減少する。また、優
先順位の変更だけなので、関連情報を大量に検索して準
備しておけば、なるべく同じメールグループからの推薦
が減り、かつ、情報自体も不足することなく用いること
ができる。
【0172】これに関連して、特徴抽出に用いる話題内
の文書量に応じて、類似する話題を抽出する際の範囲を
変化させることができるようにする。具体的には、特徴
抽出する話題の文書量またはデータサイズに応じて何段
階かの類似度の範囲を設定する。例えば、ある話題に含
まれる文書量が10ファイル以内である場合は類似度を
0.01以上、11ファイル以上50ファイル未満の場
合は類似度を0.03以上、50ファイル以上である場
合は類似度を0.05以上とする。または、ある話題の
文書の容量が500kB未満である場合は類似度を0.0
1以上、500kB以上である場合は類似度を0.02以
上とする。
【0173】そして、予め設定された類似度の範囲のう
ち、優先度の高い話題から検索された関連情報を提示す
るようにする。このようにすると、文書量の減少によ
り、データベースの内容が更新されると、類似度の範囲
が変化し、類似度の範囲が狭すぎて関連情報が不足した
り、反対に、類似度の範囲が広すぎてユーザにとってあ
まり関連性が明確でない関連情報が提示されるような事
態の発生を抑止することが可能となる。
【0174】以上説明したように、データベース更新処
理においては、追加された文書や変更された文書だけを
処理の対象とするので、データベース作成処理を繰り返
し実行する場合に比べて、処理時間が短縮される。
【0175】また、データベース更新処理において、ユ
ーザの興味をより反映することができるようにするため
に、算出された単語の重みを修正することができる。次
に、単語の重みの修正処理について、いくつか例を挙げ
て説明するが、その前に、図30を参照して、データベ
ースに既に記録されている、各話題の特徴ベクトルの例
について説明する。
【0176】同図に示されるように、話題Aの特徴ベク
トル(単語aの重み,単語bの重み,単語cの重み,単
語dの重み,単語eの重み,単語fの重み,単語gの重
み)は、(0,0.54,0.02,0,0,0.01,0)であり、話
題Bの特徴ベクトルは、(0.01,0,0.41,0.33,0.1
6,0,0.64)であり、話題Cの特徴ベクトルは、(0.5
1,0.35,0,0,0.48,0.37,0)である。
【0177】以下、図30に示した各話題(話題A、話
題B、および話題C)に含まれる単語の重みを修正する
場合の処理について、第1乃至第3の例を挙げて順に説
明する。
【0178】まず、第1の例の重み修正処理について、
図31のフローチャートを参照して説明する。
【0179】ステップS101,S102において、文
書特徴データベース作成部24は、メールの相手毎に、
返信を含む送信した回数(やりとりした頻度)をカウン
トし、送信の頻度の多い順に相手をソートする。なお、
送信(返信)した回数をカウントするだけでなく、受信
した回数もカウントするようにしてもよい。
【0180】例えば、メールのやりとりをしている相手
が、Aさん、Bさん、Cさん、およびDさんであり、や
りとりの頻度が、Aさんとは35回、Bさんとは2回、
Cさんとは28回、Dさんとは4回であるとカウントさ
れた場合、図32に示されるように、やりとりした頻度
が多い順に、Aさん、Cさん、Dさん、Bさんにソート
される。
【0181】ステップS103において、文書特徴デー
タベース作成部24は、ステップS102の処理でソー
トされた、やりとりの頻度が上位のメールの相手を抽出
する。
【0182】具体的には、例えば、予め設定されている
上位n(例えば、n=2)番目までのメールの相手を抽
出するか、所定の頻度m(例えば、m=10)回以上の
メールの相手を抽出するか、上位n番目以上、かつ、所
定の頻度m回以上のメールの相手を抽出するか、あるい
は、その他の方法によってメールの相手を抽出する。こ
こでは、メールの相手の抽出方法は特に問わない。
【0183】例えば、上位2番目までのメールの相手を
抽出する場合、図32に示した4人のメールの相手の中
から、AさんとCさんが抽出される。
【0184】ステップS104において、文書特徴デー
タベース作成部24は、ステップS103の処理で抽出
された相手とのメール(話題)に含まれる単語の重みを
修正する。
【0185】具体的には、AさんとCさんとのメールの
やりとりが、例えば、話題Aであった場合、その話題A
に含まれる単語は、図30に示されるように、b,c,
fである(単語a,d,e,gの重みがそれぞれ0であ
るということは、それらの単語は、話題Aには含まれて
いない)。そして、話題Aに含まれる単語b,c,fの
重みがそれぞれ修正される。
【0186】より具体的には、単語b、c、fの重み
に、予め設定されている重み係数k(例えば、1.2)を
乗算して修正する(相対的に大きくする)。すなわち、
話題Aに含まれる、単語bの重み(=0.54)、単語cの
重み(=0.02)、単語fの重み(=0.01)をそれぞれ1.
2倍する。これにより、図33Aに示されるように、話
題Aの特徴ベクトルが、(0,0.65(≒0.54×1.2),0.
02(≒0.02×1.2),0,0,0.01(≒0.01×1.2),0)
に修正される。
【0187】以上のようにして、ユーザがより興味を感
じている話題に含まれる単語の重みを修正することがで
きる。
【0188】また例えば、AさんとCさんとの話題Aに
含まれる単語b、c、fが、AさんCさん以外の人(B
さんとDさん)との話題に含まれる場合にも、該当する
単語の重みに、同様の重み係数k(いまの場合、1.2)
を乗算して修正することもできる。すなわち、図30に
示した話題Bには単語cが含まれており、話題Cには単
語b,fが含まれており、それらの重みをそれぞれ1.2
倍する。これにより、図33Bに示されるように、話題
Bの特徴ベクトルが、(0.01,0,0.49(≒0.41×1.
2),0.33,0.16,0,0.64)に修正されるとともに、話
題Cの特徴ベクトルが、(0.51,0.42(=0.35×1.
2),0,0,0.48,0.44(≒0.37×1.2),0)に修正さ
れる。
【0189】以上のように、メールのやりとりの多い相
手との話題に含まれる単語が、他の話題にも含まれてい
る場合、その単語の重みも修正することによって、メー
ルのやりとりの少ない相手との話題の中から、ユーザが
より興味を持ちやすい単語を重要語として選択すること
ができる。
【0190】さらにまた、メールのやりとりの頻度また
は順位によって、重み係数kの値を変更するようにして
もよい。具体的には、Aさん(頻度1位)とのメールの
やりとりが、例えば、話題Bであり、その話題Bに含ま
れる単語a,c,d,e,gには、重み係数k1=1.5
を乗算し、Cさん(頻度2位)とのメールのやりとり
が、例えば、話題Cであり、その話題Cに含まれる単語
a,b,e,fには、重み係数k2=1.2を乗算する。
これにより、図33Cに示されるように、話題bの特徴
ベクトルが、(0.02(=0.01×1.5),0,0.62(≒0.41
×1.5),0.50(≒0.33×1.5),0.24(=0.16×1.
5),0,0.96(=0.64×1.5))に修正されるととも
に、話題Cの特徴ベクトルが、(0.61(≒0.51×1.
2),0.42(=0.35×1.2),0,0,0.58(≒0.48×1.
2),0.44(≒0.37×1.2),0)に修正される。
【0191】以上のようにして、ユーザがより興味を感
じている話題に含まれる単語の重みを、メールの相手と
のやりとりの頻度に応じて修正することができる。ま
た、重み係数kは、頻度に比例した値でも、任意に設定
した値でも、いずれでもよい。
【0192】次に、第2の例の重み修正処理について、
図34のフローチャートを参照して説明する。
【0193】ステップS111において、文書特徴デー
タベース作成部24は、話題毎にグループ化されている
複数のメールの中から、送信(返信を含む)メールを特
定し、その送信メールに含まれる単語を抽出する。ステ
ップS112において、文書特徴データベース作成部2
4は、ステップS111の処理で抽出された返信メール
に対応する元の受信メールを特定し、その受信メールに
含まれる単語を抽出する。
【0194】これにより、例えば、話題Aに対して送信
したメールに含まれる単語b,cが抽出され、話題Bに
対して返信したメールに含まれる単語e,gが抽出さ
れ、その返信メールに対応する元の受信メールに含まれ
る単語cが抽出される。
【0195】ステップS113において、文書特徴デー
タベース作成部24は、ステップS111およびS11
2の処理でそれぞれ抽出された単語の重みを修正する。
【0196】具体的には、送信(返信を含む)メールに
含まれる単語の重みに、予め設定されている重み係数k
1(例えば、1.5)を乗算して修正するとともに、返信
メールに対応する元の受信メールに含まれる単語の重み
に、重み係数k2(例えば、1.2)を乗算して修正す
る。これにより、図35に示されるように、話題Aの特
徴ベクトルが、(0,0.81(≒0.54×1.5),0.03(≒0.
02×1.5),0,0,0.01,0)に修正され、話題Bの特徴
ベクトルが、(0.01,0,0.49(≒0.41×1.2),0.33,
0.24(=0.16×1.5),0,0.96(=0.64×1.5))に修
正される。
【0197】以上のように、ユーザが送信または返信し
たメールに含まれる単語の重みを修正することによって
(ユーザが積極的に使用する単語の重みを修正すること
によって)、ユーザがより興味を感じている単語を重要
語として選択することができる。なお、受信のみのメー
ルについては、興味がないものとして重みを修正しない
ようにする。
【0198】また、送信、返信、または受信に応じて、
それぞれ重み係数を設定するようにしたり、あるいは、
特定の話題において、送信(返信を含む)メールに含ま
れる単語および返信メールに対応する元の受信メールに
含まれる単語が、他の話題にも含まれている場合、その
単語の重みも修正するようにしてもよい。
【0199】次に、第3の例の重み修正処理について、
図36のフローチャートを参照して説明する。
【0200】ステップS121において、文書特徴デー
タベース作成部24は、話題内の各単語のうち、特定の
地域や名称を示す固有名詞を抽出する。これにより、例
えば、単語b,fが固有名詞として抽出される。
【0201】ステップS122において、文書特徴デー
タベース作成部24は、ステップS121の処理で抽出
された単語の重みを修正する。
【0202】具体的には、話題に含まれる、固有名詞で
ある単語の重みに、予め設定されている重み係数k(例
えば、1.5)を乗算して修正する。すなわち、図30に
示した各話題に含まれる単語b,fの重みをそれぞれ1.
5倍する。これにより、図37に示されるように、話題
Aの特徴ベクトルが、(0,0.81(≒0.54×1.5),0.0
2,0,0,0.02(≒0.01×1.5),0)に修正され、話題
Cの特徴ベクトルが、(0.51,0.53(=0.35×1.5),
0,0,0.48,0.56(≒0.37×1.5),0)に修正される
(話題Bには、単語b,fは含まれていない)。
【0203】以上のようにして、ユーザがより興味を感
じている単語の重みを修正することができる。また、固
有名詞の種類(例えば、地名、組織名、商品名、または
人名など)に応じて、重み係数kの値を変更するように
してもよい。ただし、人名(単語)の重みを修正したと
しても、それを重要語として選択することはできないの
で、人名の重みは修正しないようにする。
【0204】また、メールのやりとり頻度、送受信の状
態、または品詞(固有名詞)によって、単語の重みを修
正する場合を説明したが、勿論、これらを組み合わせ
て、単語の重みを修正することもできる。さらに、ユー
ザの興味がより反映されるものであれば、単語の重みの
修正処理は、これに限られるものではない。
【0205】例えば、単語が属する分野ごとに単語をま
とめ分類した分野辞書を設け、この分野辞書に含まれる
か否かによって、文書特徴データベース作成部24が、
データベースに含まれる単語の重みを修正するようにし
てもよい。
【0206】図38は、本発明を適用したエージェント
プログラムの機能ブロックの、他の構成例を示す図であ
る。
【0207】図38において、分野辞書201は、例え
ば、人文、芸術、または科学等の領域、分野、またはカ
テゴリー毎に対応する単語をまとめたデータベースであ
る。分野辞書201には、ユーザが興味を示す分野を中
心とする複数の分野が形成されており、各分野には、対
応する単語がまとめられている。
【0208】文書特徴データベース作成部24は、この
分野辞書201を参照し、作成したデータベースに含ま
れる単語がこの分野辞書201に登録されているか否か
を判定し、目的の単語が分野辞書201に含まれている
場合、その単語の重みを修正する。
【0209】すなわち、データベースに含まれる単語が
分野辞書201に含まれている場合(ユーザの興味があ
る分野の単語である場合)、文書特徴データベース作成
部24は、その単語の重みを修正する。これにより、デ
ータベースの単語の重みづけにユーザの興味を反映する
ことができる。
【0210】次に、図39のフローチャートを参照し
て、文書特徴データベース作成部24による分野辞書を
用いた重み修正処理について説明する。
【0211】最初に、ステップS141において、文書
特徴データベース作成部24は、分野辞書201を参照
し、データベースに登録されている単語に対応する単語
を検索する。文書特徴データベース作成部24は、分野
辞書201より、データベースに登録されている単語と
同一の単語、同じ分野に属する単語等のように、対応す
る単語を検索する。
【0212】そして、ステップS142において、文書
特徴データベース作成部24は、検索結果に基づいて、
対応する単語が存在するか否かを判定し、存在すると判
定した場合、ステップS143に処理を進める。
【0213】ステップS143に処理を進めた文書特徴
データベース作成部24は、分野辞書201より検索さ
れた単語を抽出し、ステップS144において、データ
ベースを参照して、抽出した単語に対応する重みを修正
し、分野辞書201を用いた重み修正処理を終了する。
【0214】また、ステップS142において、検索結
果より、データベースに含まれる単語に対応する単語が
存在しないと判定した場合、文書特徴データベース作成
部24は、ステップS143および144の処理を省略
して、分野辞書201を用いた重み修正処理を終了す
る。
【0215】具体的には、例えば、ある話題の特徴ベク
トル(単語Aの重み,単語Bの重み,単語Cの重み,単
語Dの重み,単語Eの重み,単語Fの重み,単語Gの重
み)が(1.1,0.1,0,0,1.4,5.1,3.8)である場
合、データベース問い合わせ部32により2語が最重要
語として選択されるとすると、最重要語は、単語Fおよ
び単語Gとなる。
【0216】これに対して、分野辞書201に、単語
A,単語B,単語D,単語H,単語K,および単語Lが
含まれており、文書特徴データベース作成部24が、デ
ータベースに記録されているこれらの単語の重みを5倍
に修正したとすると、上述した特徴ベクトルは、(5.
5,0.5,0,0,1.4.5.1,3.8)に修正されており、デ
ータベース問い合わせ部32は、単語Aおよび単語Fを
最重要語として選択する。
【0217】なお、以上においては、分野辞書201に
対応する単語が含まれる、データベースの単語の重みを
全て一定の割合で修正するように説明したが、これに限
らず、分野辞書201に含まれる単語毎に修正する割合
を変化させるようにしてもよい。
【0218】以上のようにして、文書特徴データベース
作成部24は、分野辞書201を用いて重み修正処理を
行う。
【0219】以上においては、文書特徴データベース作
成部24が分野辞書201に含まれる単語に対応する、
データベースに含まれる単語の重みを修正するように説
明したが、これに限らず、分野辞書201に含まれる単
語に対応する、データベースの単語を、最重要語に指定
するようにしても良い。
【0220】次に、文書特徴データベース作成部24に
よる分野辞書を用いた重み修正処理の他の例について、
図40のフローチャートを参照して説明する。
【0221】文書特徴データベース作成部24は、最初
に、ステップS161において、分野辞書201を参照
し、データベースに登録されている単語に対応する単語
を検索する。文書特徴データベース作成部24は、分野
辞書201より、データベースに登録されている単語と
同一の単語、同じ分野に属する単語等のように、対応す
る単語を検索する。
【0222】そして、ステップS162において、文書
特徴データベース作成部24は、検索結果に基づいて、
対応する単語が存在するか否かを判定し、存在すると判
定した場合、ステップS163に処理を進める。
【0223】ステップS163に処理を進めた文書特徴
データベース作成部24は、分野辞書201より検索さ
れた単語を抽出し、ステップS164において、データ
ベースを参照して、抽出した単語を最重要語としてデー
タベースに登録し、分野辞書201を用いた重み修正処
理を終了する。
【0224】また、ステップS162において、検索結
果より、データベースに含まれる単語に対応する単語が
存在しないと判定した場合、文書特徴データベース作成
部24は、ステップS163および164の処理を省略
して、分野辞書201を用いた重み修正処理を終了す
る。
【0225】具体的には、例えば、ある話題の特徴ベク
トル(単語Aの重み,単語Bの重み,単語Cの重み,単
語Dの重み,単語Eの重み,単語Fの重み,単語Gの重
み)が(1.1,0.1,0,0,1.4,5.1,3.8)である場
合、データベース問い合わせ部32により2語が最重要
語として選択されるとすると、最重要語は、単語Fおよ
び単語Gとなる。
【0226】これに対して、分野辞書201に、単語
A,単語B,単語D,単語H,単語K,および単語Lが
含まれており、文書特徴データベース作成部24が、デ
ータベースに記録されているこれらの単語を最重要語と
してデータベースに登録したとすると、上述した特徴ベ
クトルは、(1.1,0.1,0,0,1.4,5.1,3.8)のまま
であるが、データベース問い合わせ部32は、最重要語
に指定された単語Aおよび単語Bを最重要語として選択
する。なお、単語Dも分野辞書201に含まれている
が、単語Dの重みの値が「0」であるため、指定されて
いない。
【0227】以上のようにして、文書特徴データベース
作成部24は、分野辞書201に含まれる単語に対応す
る、データベースに記録されている単語を最重要語とし
て指定しておき、データベース問い合わせ部32は、最
重要語に指定された単語を最重要語として選択する。
【0228】以上において、分野辞書201に含まれる
単語は6個として説明したが、これに限らず、いくつで
あってもよい。また、その分野辞書201の構造はどの
ような構造であってもよい。
【0229】次に、以上に説明したような分野辞書20
1の作成方法について説明する。
【0230】例えば、分野辞書201は、一般的に市販
または配布されているような、階層構造またはグループ
構造などで形成されたシソーラス辞書やオントロジー辞
書を用いて作成される。
【0231】これらの辞書は、例えば、予め本体アプリ
ケーションと同じ配布メディアに同梱され、CPU41に
より、ドライブ51に装着されたそのメディアから記憶
部49にインストールされる。そして、CPU41は、イ
ンストールされた辞書を参照し、分野辞書201を生成
する。
【0232】すなわち、CPU41は、インストールされ
た辞書の全部または一部より単語を抽出し、さらに、そ
の辞書の構造(階層、グループ等)を反映させながら、
分野辞書201を生成する。
【0233】分野辞書201の更新する場合、CPU41
は、生成する場合と同様に、ドライブ51に装着された
メディアから新たにインストールされた辞書を参照し
て、更新処理を行う。
【0234】また、参照される辞書は、メール等によ
り、インターネットに代表されるネットワークから取得
されるようにしてもよい。このとき、CPU41は、上述
した場合と同様に分野辞書201を生成する。また、こ
の場合、CPU41は、所定の間隔で定期的に、またはユ
ーザの指示に基づいて、ネットワークより新たな辞書を
取得し、分野辞書201の情報を更新する。
【0235】さらに、参照される辞書は、上述したシソ
ーラス辞書やオントロジー辞書以外にも、例えば、感度
良く頻繁に抽出する単語をリスト化したものであっても
よい。また、ユーザの入力により直接分野辞書201が
作成されるようにしてもよい。
【0236】また、以上に説明した分野辞書201は、
上述したような既存の辞書以外から作成されるようにし
てもよい。例えば、分野辞書201は、オンラインショ
ッピングのサイト、掲示板サイト、または、カテゴリー
別検索サイト等のようなインターネット上のWEBページ
を用いて作成される。
【0237】CPU41は、通信部50を介して、接続さ
れているインターネット上から上述したようなWEBペー
ジを取得する。そして、そのWEBページに基づいて、分
野辞書201を生成する。すなわち、CPU41は、取得
したWEBページに含まれる、例えば商品名等のような単
語を抽出し、さらにそのWEBページの構造(階層、グル
ープ等)を反映させながら、分野辞書201を生成す
る。
【0238】この場合、CPU41は、所定の間隔で定期
的に、またはユーザの指示に基づいて、ネットワークよ
り新たなWEBページを取得し、分野辞書201の情報を
更新する。
【0239】また、例えば、関連情報検索部25が図3
のステップS6において、文書特徴データベース作成部
24からの検索用キーワード(重要語)を検索条件とし
て、インターネット上の検索エンジンにアクセスして検
索結果を取得する際に、外部のサーバ(図示せず)が使
用された検索用キーワードを取得し、そのキーワードに
基づいて情報を作成するようにし、その作成された情報
に基づいて、分野辞書201が作成されるようにしても
よい。
【0240】外部に設けられたサーバ(図示せず)は、
関連情報検索部25が用いた検索用キーワードを取得し
て蓄積し、使用頻度に応じてランキングされた単語のリ
ストを生成する。
【0241】そして、CPU41は、所定のタイミングで
そのリストを取得し、そのリストに基づいて、分野辞書
201を生成する。
【0242】例えば、図41に示されるように、サーバ
は、取得した検索用キーワードより、ユーザ(Xさん,Y
さん,・・・)毎のリストを生成し、各単語が使用された
頻度に応じて、単語をグループ化する。
【0243】図41において、サーバは、検索される頻
度の高い単語を単純にリスト化しただけの辞書ではな
く、同じトピック(TopicX01乃至TopicX04、並びに、To
picY01乃至TopicY03)の中から用いられる検索用キーワ
ードの組み合わせに基づいて、検索用キーワードをグル
ープ化(Gp1,Gp2)したリストを生成している。
【0244】また、それ以外にも、例えば、同じような
検索用キーワードを用いているユーザを、検索用キーワ
ードを成分とするベクトル同士の内積をとり、一定範囲
内のユーザ同士をまとめるるなどして、グループ化し、
同じグループ内のユーザの用いる検索用キーワードだけ
を抽出するようにしてもよい。
【0245】さらに、上述した以外にも、例えば、CPU
41が、関連情報にアクセスする操作や関連情報を保存
するような操作についての操作情報を取得して、記憶部
49等に記録し、所定のタイミングでその捜査情報をサ
ーバに供給するようにし、サーバは、その操作情報に基
づいて、ユーザの評価が高い(ユーザが対応する関連情
報に興味があった)検索用キーワードを優先的にリスト
化するようにしてもよい。
【0246】これらの作成方法により作成された分野辞
書201を更新する場合、CPU41は、所定のタイミン
グでサーバにアクセスしてリストを取得し、そのリスト
に基づいて、分野辞書201の情報を更新する。
【0247】以上のように、分野辞書201は、様々な
情報に基づいて、作成することができる。
【0248】なお、分野辞書201は、上述したように
様々な方法で作成された複数の分野辞書で構成されるよ
うにしてもよい。
【0249】その場合、文書特徴データベース作成部2
4が参照する分野辞書を、分野辞書201に含まれる複
数の分野辞書の中から、ユーザが、自分が興味あるもの
をダウンロードするなどして、予め選択しておくように
してもよいし、分野辞書201が、全ての話題に含まれ
ている全単語の内、より多くの単語を含む分野辞書を予
め選択するようにしてもよいし、検索語に基づく分野辞
書を利用する場合、分野辞書201が、自分の検索語が
多く登録されているものを選択するようにしてもよい
し、外部のサーバにおいて、分野辞書を提供する場合、
契約内容、または、利用履歴等に応じて、サーバ側がユ
ーザをグループ化し、優先するサービス内容によって、
提供する辞書を選択するようにしてもよい。
【0250】また、以上においては、分野辞書に含まれ
るとして記録された単語については、文書特徴データベ
ース作成部24での重み計算時に、より重みを高く扱う
ように説明したが、これに限らず、例えば、文書内容処
理部23が単語の重みを算出する際に、分野辞書201
に含まれる単語の重みを上げるようにしてもよい。
【0251】例えば、文書内容処理部23が図3のステ
ップS3において行う形態素解析処理において使用され
る形態素解析辞書の変形が可能である場合、予め、形態
素解析辞書に含まれる品詞部分に新たな品詞(例えば、
「一般興味品詞」等)を追加し、その品詞(一般興味品
詞)を分野辞書201に含まれる単語に対応させてお
く。そして、文書内容処理部23が、図3のステップS
4において、tf・idf法を用いて単語に重み付けを行う
際に、その品詞の単語の重みを上げるようにする。この
ようにすることにより、文書内容処理部23が単語の重
みを算出する際に、分野辞書201に含まれる単語の重
みを上げることができる。
【0252】さらに、追加された新たな品詞(一般興味
品詞)が既に用意されている品詞よりも優先的に判定さ
れるように所定の値を振ることにより、分野辞書201
に含まれる単語が既に用意されている品詞である場合に
おいても、その単語は、追加された新たな品詞(一般興
味品詞)として判定されるので、その単語の重みを上げ
ることができる。
【0253】以上のように、分野辞書201を用いるこ
とにより、ユーザが興味を示す分野の関連情報が提示さ
れやすくなるように、データベースの単語の重みを修正
することができる。
【0254】なお、以上においては、ユーザが興味を示
す分野の関連情報が提示されやすくなるように、データ
ベースの単語の重みをあげるように、分野辞書201を
用いるように説明したが、これに限らず、重みを下げる
ために、分野辞書201を用いるようにしてもよい。
【0255】例えば、未成年のユーザで構成されるグル
ープに対してだけ、教育上好ましくない分野の単語の重
みが下がるようにするなど、特定のユーザグループに対
してだけ、特定の単語の重みが下がるようにする、また
は、その単語の重みに「0」を乗算し、重みを「0」に
するために、分野辞書201を用いるようにしてもよ
い。
【0256】以上においては、話題内に含まれる単語の
重みを修正する場合を例にして説明したが、これに限ら
ず、ワードプロセッサプログラム3によって作成された
文書に含まれる単語にも、同様にして重みを修正するこ
とができる。その場合、話題毎ではなく、フォルダ毎あ
るいは1つの作成文書毎に含まれる単語の重みを修正す
るようにしてもよい。
【0257】以上のように、従来、ユーザのメールのや
りとりにより抽出される単語に基づいて、一律にデータ
ベースを作成してしまうと、ユーザが興味を示している
話題、および興味を示していない話題が同等に扱われて
しまうが、図31、図34、および図36のフローチャ
ートを用いて説明した、単語の重みの修正処理を実行す
ることによって、ユーザがより興味を示している単語の
重みを修正することができ、意義のあるデータベースを
作成することができる。従って、図5の関連情報提示処
理のステップS15において、ユーザの興味がより高い
と思われる単語を重要語として選択しやすくなるととも
に、文書や話題の特徴ベクトルの内、ユーザの興味のあ
る分野に関連する要素を大きくすることにより、よりユ
ーザの興味を反映した精度の良い話題の抽出が可能とな
り、結果としてユーザの興味を精度良く反映した関連情
報を提示できる。
【0258】また、逆に、ユーザの興味の無い分野に関
連する要素を小さくすることにより、ユーザにとって有
用でない重要語を排除でき、無意味な特徴ベクトルの要
素に基づいた話題の抽出を抑制できるので、ユーザの所
望しない関連情報の提示を抑制できる。
【0259】ところで、エージェント制御部13は、図
5のステップS16の処理に対応して図7のステップS
39において、文書の属性情報を選択(推薦)した理由
としてデスクトップに表示させるように説明したが、そ
の際、表示する属性情報を一部に限定するようにし、同
じ属性情報より複数の表示パターンを生成することがで
きるようにしてもよい。
【0260】図42は、同じ属性情報から複数の表示パ
ターンを生成する例を示す図である。
【0261】例えば、図42Aに示すように、「200
1年8月21日」、「Aさん」、および「パーティ」等
の属性情報、並びに、「ワインとケーキ」というキーワ
ードより選択(推薦)理由を生成してデスクトップに表
示させる場合、エージェント制御部13は、図42Bに
示すように、これらの全ての単語を用いて、「2001
年8月21日にAさんとパーティについて話していたで
しょ。その話題に出てきたワインとケーキに関連する情
報があるよ。」のような文章の選択(推薦)理由を生成
し、エージェント72の吹き出し73に表示させるよう
にしてもよいし、図42C乃至図42Eに示すように、
上述した単語の一部を用いて、異なる文章を選択(推
薦)理由として生成し、エージェント72の吹き出し7
3に表示させるようにしてもよい。
【0262】すなわち、エージェント制御部13は、図
5のステップS16の処理に対応して図7のステップS
39において、図42Cに示すように「2001年8月
21日」および「Aさん」を用いて「2001年8月2
1日にAさんとメールで話していたでしょ。これに関す
る情報があるよ。」という文章、図42Dに示すように
「Aさん」および「パーティ」を用いて「Aさんとパー
ティについて話していたことがあったよね。これに関す
る情報があるよ。」という文章、または、図42Eに示
すように「Aさん」および「ワインとケーキ」を用いて
「Aさんとワインとケーキについて話していたことがあ
ったよね。関連情報があるよ。」という文章のいずれか
を生成し、エージェント72の吹き出し73に表示させ
る。
【0263】以上のようにして、エージェント制御部1
3は、同じ文書を選択(推薦)理由として何度も用いた
場合においても、毎回異なる文章を生成して表示させる
ので、ユーザの興味を低減することを抑制することがで
きる。
【0264】なお、以上において、一度使用された組み
合わせを記憶部49に記憶させておき、エージェント制
御部13が選択(推薦)理由の文章生成する際にそのデ
ータを参照し、同じ組み合わせの単語を用いないように
してもよい。
【0265】また、推薦理由の文書生成に際して、推薦
理由を構成する単語の類義語、上位概念語、または、関
連語等を、シソーラス辞書、オントロジー辞書(いずれ
も図示せず)等を用いて検索し、推薦理由を構成する単
語として利用してもよい。例えば、図42Aの「200
1年8月21日」に基づいて、「8月下旬」、「夏の終
わり」等を、推薦理由を構成する単語として適用しても
よいし、図42Aの「パーティ」に基づいて、「お祝
い」等を、推薦理由を構成する単語として適用してもよ
いし、図42Aの「ワインとケーキ」に基づいて、「洋
酒と洋菓子」等を、推薦理由を構成する単語として適用
してもよい。
【0266】本発明のエージェントプログラム1は、上
述したようにメーラ2によって送受信される文書やワー
ドプロセッサプログラム3で編集される文書の他、例え
ば、チャット、電子ニュース、電子掲示板等の文書や音
声信号をテキスト化した文書など、属性情報としてタイ
ムスタンプが付与されている文書に対応して動作するよ
うにさせることができる。
【0267】上述した一連の処理を実行するエージェン
トプログラム1は、パーソナルコンピュータに予め組み
込まれるか、あるいは、記録媒体からインストールされ
る。
【0268】上述した一連の処理は、ハードウェアに実
行させることもできるが、通常、ソフトウェアにより実
行させる。一連の処理をソフトウェアにより実行させる
場合には、そのソフトウェアを構成するエージェントプ
ログラム1が、専用のハードウェアに組み込まれている
コンピュータ、または、各種のプログラムをインストー
ルすることで、各種の機能を実行することが可能な、例
えば汎用のパーソナルコンピュータなどに、記録媒体か
らインストールされる。
【0269】コンピュータにインストールされ、コンピ
ュータによって実行可能な状態とされるプログラムを記
録する記録媒体は、図2に示されるように、プログラム
が記録されている磁気ディスク52(フレキシブルディ
スクを含む)、光ディスク53(CD-ROM(Compact Disk
-Read Only Memory),DVD(Digital Versatile Disk)
を含む)、光磁気ディスク54(MD(Mini-Disk)(商
標)を含む)、もしくは半導体メモリ55などよりなる
パッケージメディア、または、プログラムが一時的もし
くが永続的に記録されるROM42や記憶部49を構成す
るハードディスクなどにより構成される。記録媒体への
プログラムの記録は、必要に応じてルータ、モデムなど
のインタフェースを介して、公衆回線網、ローカルエリ
アネットワーク、インターネット、デジタル衛星放送と
いった、有線または無線の通信媒体を利用して行われ
る。
【0270】なお、本明細書において、記録媒体に記録
されるプログラムを記述するステップは、記載された順
序に沿って時系列的に行われる処理はもちろん、必ずし
も時系列的に処理されなくとも、並列的あるいは個別に
実行される処理をも含むものである。
【0271】
【発明の効果】本発明の情報処理装置および方法、並び
にプログラムによれば、既存の文書情報から第1の特徴
語が抽出するとともに、所定の文書情報から第2の特徴
語を抽出し、第1の特徴語の第1の重みおよび第2の特
徴語の第2の重みを算出し、所定の条件に基づいて算出
された第1の重みを修正し、第1の特徴語および第1の
重みに基づいて、既存の文書情報に対応付ける関連情報
を取得し、第2の特徴語に基づいて、所定の文書情報に
関連する既存の文書情報を検索し、検索された既存の文
書情報に対応付けられている関連情報を表示するように
したので、ユーザの興味の度合いに応じて関連情報を提
示することができる。
【図面の簡単な説明】
【図1】本発明を適用したエージェントプログラムの機
能ブロックの一構成例を示す図である。
【図2】エージェントプログラムをインストールして実
行させるパーソナルコンピュータの構成例を示すブロッ
ク図である。
【図3】エージェントプログラムのデータベース作成処
理を説明するフローチャートである。
【図4】図3のステップS5の処理を説明するための図
である。
【図5】エージェントプログラムの関連情報提示処理を
説明するフローチャートである。
【図6】図5のステップS15の処理を説明するための
図である。
【図7】エージェントの動作等を説明するフローチャー
トである。
【図8】図7のステップS51の待機中の処理の詳細を
説明するフローチャートである。
【図9】デスクトップ上に表示されたエージェントの表
示例を示す図である。
【図10】エージェントが登場するときの表示例を示す
図である。
【図11】エージェントの台詞である吹き出しの表示例
を示す図である。
【図12】エージェントが待機中であるときの表示例を
示す図である。
【図13】エージェントが作業中であるときの表示例を
示す図である。
【図14】デスクトップ上に表示された入力ウィンドウ
の表示例を示す図である。
【図15】入力ウィンドウの表示例を示す図である。
【図16】デスクトップ上に表示された推薦URLの表示
例を示す図である。
【図17】エージェンが指示中であるときの表示例を示
す図である。
【図18】デスクトップ上に表示されたスクラップ帳ウ
ィンドウの表示例を示す図である。
【図19】エージェントが喜びの状態であるときの表示
例を示す図である。
【図20】エージェントが悲しみの状態であるときの表
示例を示す図である。
【図21】エージェントが横方向に移動するときの表示
例を示す図である。
【図22】エージェントが縦方向に移動するときの表示
例を示す図である。
【図23】エージェントが遊びの状態であるときの表示
例を示す図である。
【図24】エージェントが睡眠の状態であるときの表示
例を示す図である。
【図25】エージェントが立ち去るときの表示例を示す
図である。
【図26】メニューボックスの表示例を示す図である。
【図27】設定画面の表示例を示す図である。
【図28】エージェントプログラムのデータベース更新
処理を説明するフローチャートである。
【図29】データベースを更新させる条件を入力するユ
ーザインタフェースの表示例を示す図である。
【図30】特徴ベクトルの例を示す図である。
【図31】第1の例の重み修正処理を説明するフローチ
ャートである。
【図32】メールの頻度の多い順にソートされたメール
の相手とその頻度を示す図である。
【図33】重みが修正された特徴ベクトルの例を示す図
である。
【図34】第2の例の重み修正処理を説明するフローチ
ャートである。
【図35】重みが修正された特徴ベクトルの例を示す図
である。
【図36】第3の例の重み修正処理を説明するフローチ
ャートである。
【図37】重みが修正された特徴ベクトルの例を示す図
である。
【図38】本発明を適用したエージェントプログラムの
機能ブロックの、他の構成例を示す図である。
【図39】図2の文書特徴データベース作成部による分
野辞書を用いた重み修正処理について説明するフローチ
ャートである。
【図40】図2の文書特徴データベース作成部による分
野辞書を用いた重み修正処理の他の例について説明する
フローチャートである。
【図41】サーバが取得した検索用キーワードに基づい
て、単語をグループ化する様子を示す図である。
【図42】同じ属性情報から複数の表示パターンを生成
する例を示す図である。
【符号の説明】 1 エージェントプログラム, 2 メーラ, 11
蓄積部, 12 提示部, 13 エージェント制御
部, 21 文書取得部, 22 文書属性処理部,
23 文書内容処理部, 24 文書特徴データベース
作成部, 25関連情報検索部, 31 イベント管理
部, 32 データベース問い合わせ部, 33 関連
情報提示部, 52 磁気ディスク, 53 光ディス
ク, 54 光磁気ディスク, 55 半導体メモリ,
72 エージェント, 73吹き出し, 74 スク
ラップ帳ウィンドウ, 81 入力ウィンドウ, 91
推薦URL, 201 分野辞書
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 ND03 NK02 NK32 NK44 NR05 PP12 PP22 PQ02 PQ32 PQ38 PQ46 PQ72 PQ74 PQ75 PR03 PR06 QM08

Claims (69)

    【特許請求の範囲】
  1. 【請求項1】 既存の文書情報および所定の文書情報に
    関連する関連情報を提示する情報処理装置において、 前記既存の文書情報から第1の特徴語を抽出するととも
    に、前記所定の文書情報から第2の特徴語を抽出する抽
    出手段と、 前記抽出手段により抽出された、前記第1の特徴語の第
    1の重みを算出するとともに、前記第2の特徴語の第2
    の重みを算出する重み算出手段と、 所定の条件に基づいて、前記重み算出手段により算出さ
    れた前記第1の重みを修正する重み修正手段と、 前記抽出手段により抽出された前記第1の特徴語、およ
    び前記重み修正手段により修正された前記第1の重みに
    基づいて、前記既存の文書情報に対応付ける前記関連情
    報を取得する取得手段と、 前記第2の特徴語に基づいて、前記所定の文書情報に関
    連する前記既存の文書情報を検索する検索手段と、 前記検索手段により検索された前記既存の文書情報に対
    応付けられている前記関連情報の表示を制御する表示制
    御手段とを備えることを特徴とする情報処理装置。
  2. 【請求項2】 前記取得手段は、前記既存の文書情報に
    おける、複数の前記第1の特徴語の中から、前記第1の
    重みに基づいて重要語を選択し、前記重要語に関連する
    前記関連情報を取得することを特徴とする請求項1に記
    載の情報処理装置。
  3. 【請求項3】 前記検索手段は、前記第1の重みと前記
    第2の重みから類似度を算出し、前記類似度に基づい
    て、前記所定の文書情報に対応する前記既存の文書情報
    を検索することを特徴とする請求項1に記載の情報処理
    装置。
  4. 【請求項4】 前記既存の文書情報および前記所定の文
    書情報から属性情報を抽出する属性情報抽出手段をさら
    に備えることを特徴とする請求項1に記載の情報処理装
    置。
  5. 【請求項5】 前記属性情報抽出手段により抽出された
    前記属性情報に基づいて、1または複数の前記既存の文
    書情報をグループ化して文書情報群を作成するグループ
    化手段をさらに備え、 前記抽出手段は、前記文書情報群から前記第1の特徴語
    を抽出し、 前記重み算出手段は、前記第1の特徴語の前記第1の重
    みを算出し、 前記取得手段は、前記第1の特徴語および前記第1の重
    みに基づいて、前記文書情報群に対応付ける前記関連情
    報を取得し、 前記検索手段は、前記第2の特徴語に基づいて、前記所
    定の文書情報に対応する前記文書情報群を検索すること
    を特徴とする請求項4に記載の情報処理装置。
  6. 【請求項6】 前記重み修正手段は、前記属性情報抽出
    手段により抽出された前記属性情報に基づいて、前記第
    1の重みを修正することを特徴とする請求項4に記載の
    情報処理装置。
  7. 【請求項7】 前記重み修正手段は、特定の宛先への送
    信または前記特定の宛先からの受信の頻度に応じて、前
    記第1の重みを修正することを特徴とする請求項1に記
    載の情報処理装置。
  8. 【請求項8】 前記重み修正手段は、前記情報処理装置
    の使用者が作成した前記既存の文書情報から抽出された
    前記第1の特徴語の前記第1の重みを修正することを特
    徴とする請求項1に記載の情報処理装置。
  9. 【請求項9】 前記重み修正手段は、他の前記既存の文
    書情報から抽出された、前記第1の特徴語と同じ特徴語
    の重みを、前記第1の重みと同様にさらに修正すること
    を特徴とする請求項1に記載の情報処理装置。
  10. 【請求項10】 前記重み修正手段は、前記第1の特徴
    語の種類に基づいて、前記第1の重みを修正することを
    特徴とする請求項1に記載の情報処理装置。
  11. 【請求項11】 前記既存の文書情報の前記第1の特徴
    語に関連付けて、前記取得手段により取得された前記関
    連情報を用いてデータベースを構築するデータベース構
    築手段をさらに備え、 前記検索手段は、前記第2の特徴語に基づいて、前記デ
    ータベース構築手段により構築された前記データベース
    から、前記所定の文書情報に関連する前記既存の文書情
    報を検索することを特徴とする請求項1に記載の情報処
    理装置。
  12. 【請求項12】 所定のイベントの発生を検知する検知
    手段をさらに備え、 前記所定の文書情報は、前記検知手段により検知された
    前記所定のイベントの発生に対応する文書であることを
    特徴とする請求項1に記載の情報処理装置。
  13. 【請求項13】 前記既存の文書情報および前記所定の
    文書情報は電子メールであることを特徴とする請求項1
    に記載の情報処理装置。
  14. 【請求項14】 所定のデータ構造で構成された単語群
    からなる、単語間の関係を示すデータベースである分野
    辞書を作成する分野辞書作成手段をさらに備え、 前記重み修正手段は、前記分野辞書作成手段により作成
    された前記分野辞書に基づいて、前記重み算出手段によ
    り算出された前記第1の重みを修正することを特徴とす
    る請求項1に記載の情報処理装置。
  15. 【請求項15】 前記分野辞書は、前記単語群が、各前
    記単語の属する分野によってグループ化され、記録され
    ているデータベースであることを特徴とする請求項1に
    記載の情報処理装置。
  16. 【請求項16】 前記分野辞書は、前記単語群が、前記
    単語間の関係に基づいて階層構造に配置され、記録され
    ているデータベースであることを特徴とする請求項1に
    記載の情報処理装置。
  17. 【請求項17】 前記分野辞書は、前記単語群が、各前
    記単語に割り当てられた重要度に基づいてリスト化され
    たデータベースであることを特徴とする請求項1に記載
    の情報処理装置。
  18. 【請求項18】 前記分野辞書は、既存の辞書データベ
    ースに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項1に記載の情
    報処理装置。
  19. 【請求項19】 前記分野辞書は、所定のWEBページデ
    ータに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項1に記載の情
    報処理装置。
  20. 【請求項20】 前記分野辞書は、以前に前記検索手段
    により用いられた前記第2の特徴語のリストに含まれる
    前記単語群および前記単語群が形成するデータ構造を含
    むことを特徴とする請求項1に記載の情報処理装置。
  21. 【請求項21】 前記重み修正手段は、前記分野辞書に
    含まれる前記単語に対応する前記第1の特徴語の前記第
    1の重みを修正することを特徴とする請求項1に記載の
    情報処理装置。
  22. 【請求項22】 既存の文書情報および所定の文書情報
    に関連する関連情報を提示する情報処理装置の情報処理
    方法において、 前記既存の文書情報から第1の特徴語を抽出するととも
    に、前記所定の文書情報から第2の特徴語を抽出する抽
    出ステップと、 前記抽出ステップの処理により抽出された、前記第1の
    特徴語の第1の重みを算出するとともに、前記第2の特
    徴語の第2の重みを算出する重み算出ステップと、 所定の条件に基づいて、前記重み算出ステップの処理に
    より算出された前記第1の重みを修正する重み修正ステ
    ップと、 前記抽出ステップの処理により抽出された前記第1の特
    徴語、および前記重み修正ステップの処理により修正さ
    れた前記第1の重みに基づいて、前記既存の文書情報に
    対応付ける前記関連情報の取得を制御する取得制御ステ
    ップと、 前記第2の特徴語に基づいて、前記所定の文書情報に関
    連する前記既存の文書情報を検索する検索ステップと、 前記検索ステップの処理により検索された前記既存の文
    書情報に対応付けられている前記関連情報の表示を制御
    する表示制御ステップとを含むことを特徴とする情報処
    理方法。
  23. 【請求項23】 前記取得制御ステップは、前記既存の
    文書情報における、複数の前記第1の特徴語の中から、
    前記第1の重みに基づいて重要語を選択し、前記重要語
    に関連する前記関連情報の取得を制御することを特徴と
    する請求項22に記載の情報処理方法。
  24. 【請求項24】 前記検索ステップは、前記第1の重み
    と前記第2の重みから類似度を算出し、前記類似度に基
    づいて、前記所定の文書情報に対応する前記既存の文書
    情報を検索することを特徴とする請求項22に記載の情
    報処理方法。
  25. 【請求項25】 前記既存の文書情報および前記所定の
    文書情報から属性情報を抽出する属性情報抽出ステップ
    をさらに含み、 前記重み修正ステップは、前記属性情報抽出ステップの
    処理により抽出された前記属性情報に基づいて、前記第
    1の重みを修正することを特徴とする請求項22に記載
    の情報処理方法。
  26. 【請求項26】 前記属性情報抽出ステップの処理によ
    り抽出された前記属性情報に基づいて、1または複数の
    前記既存の文書情報をグループ化して文書情報群を作成
    するグループ化ステップをさらに含むことを特徴とする
    請求項22に記載の情報処理方法。
  27. 【請求項27】 前記重み修正ステップは、特定の宛先
    への送信または前記特定の宛先からの受信の頻度に応じ
    て、前記第1の重みを修正することを特徴とする請求項
    22に記載の情報処理方法。
  28. 【請求項28】 前記重み修正ステップは、前記第1の
    特徴語の種類に基づいて、前記第1の重みを修正するこ
    とを特徴とする請求項22に記載の情報処理方法。
  29. 【請求項29】 前記既存の文書情報の前記第1の特徴
    語に関連付けて、前記取得制御ステップの処理により取
    得が制御された前記関連情報を用いてデータベースを構
    築するデータベース構築ステップをさらに含むことを特
    徴とする請求項22に記載の情報処理方法。
  30. 【請求項30】 所定のデータ構造で構成された単語群
    からなる、単語間の関係を示すデータベースである分野
    辞書を作成する分野辞書作成ステップをさらに含み、 前記重み修正ステップは、前記分野辞書作成ステップの
    処理により作成された前記分野辞書に基づいて、前記重
    み算出ステップの処理により算出された前記第1の重み
    を修正することを特徴とする請求項22に記載の情報処
    理方法。
  31. 【請求項31】 前記分野辞書は、前記単語群が、各前
    記単語の属する分野によってグループ化され、記録され
    ているデータベースであることを特徴とする請求項22
    に記載の情報処理方法。
  32. 【請求項32】 前記分野辞書は、前記単語群が、前記
    単語間の関係に基づいて階層構造に配置され、記録され
    ているデータベースであることを特徴とする請求項22
    に記載の情報処理方法。
  33. 【請求項33】 前記分野辞書は、前記単語群が、各前
    記単語に割り当てられた重要度に基づいてリスト化され
    たデータベースであることを特徴とする請求項22に記
    載の情報処理方法。
  34. 【請求項34】 前記分野辞書は、既存の辞書データベ
    ースに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項22に記載の
    情報処理方法。
  35. 【請求項35】 前記分野辞書は、所定のWEBページデ
    ータに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項22に記載の
    情報処理方法。
  36. 【請求項36】 前記分野辞書は、以前に前記検索ステ
    ップの処理により用いられた前記第2の特徴語のリスト
    に含まれる前記単語群および前記単語群が形成するデー
    タ構造を含むことを特徴とする請求項22に記載の情報
    処理方法。
  37. 【請求項37】 前記重み修正ステップは、前記分野辞
    書に含まれる前記単語に対応する前記第1の特徴語の前
    記第1の重みを修正することを特徴とする請求項22に
    記載の情報処理方法。
  38. 【請求項38】 既存の文書情報および所定の文書情報
    に関連する関連情報を提示する情報処理装置を制御する
    プログラムであって、 前記既存の文書情報から第1の特徴語を抽出するととも
    に、前記所定の文書情報から第2の特徴語を抽出する抽
    出ステップと、 前記抽出ステップの処理により抽出された、前記第1の
    特徴語の第1の重みを算出するとともに、前記第2の特
    徴語の第2の重みを算出する重み算出ステップと、 所定の条件に基づいて、前記重み算出ステップの処理に
    より算出された前記第1の重みを修正する重み修正ステ
    ップと、 前記抽出ステップの処理により抽出された前記第1の特
    徴語、および前記重み修正ステップの処理により修正さ
    れた前記第1の重みに基づいて、前記既存の文書情報に
    対応付ける前記関連情報の取得を制御する取得制御ステ
    ップと、 前記第2の特徴語に基づいて、前記所定の文書情報に関
    連する前記既存の文書情報を検索する検索ステップと、 前記検索ステップの処理により検索された前記既存の文
    書情報に対応付けられている前記関連情報の表示を制御
    する表示制御ステップとを含むことを特徴とするコンピ
    ュータが読み取り可能なプログラムが記録されている記
    録媒体。
  39. 【請求項39】 前記取得制御ステップは、前記既存の
    文書情報における、複数の前記第1の特徴語の中から、
    前記第1の重みに基づいて重要語を選択し、前記重要語
    に関連する前記関連情報の取得を制御することを特徴と
    する請求項38に記載の記録媒体。
  40. 【請求項40】 前記検索ステップは、前記第1の重み
    と前記第2の重みから類似度を算出し、前記類似度に基
    づいて、前記所定の文書情報に対応する前記既存の文書
    情報を検索することを特徴とする請求項38に記載の記
    録媒体。
  41. 【請求項41】 前記既存の文書情報および前記所定の
    文書情報から属性情報を抽出する属性情報抽出ステップ
    をさらに含み、 前記重み修正ステップは、前記属性情報抽出ステップの
    処理により抽出された前記属性情報に基づいて、前記第
    1の重みを修正することを特徴とする請求項38に記載
    の記録媒体。
  42. 【請求項42】 前記属性情報抽出ステップの処理によ
    り抽出された前記属性情報に基づいて、1または複数の
    前記既存の文書情報をグループ化して文書情報群を作成
    するグループ化ステップをさらに含むことを特徴とする
    請求項38に記載の記録媒体。
  43. 【請求項43】 前記重み修正ステップは、特定の宛先
    への送信または前記特定の宛先からの受信の頻度に応じ
    て、前記第1の重みを修正することを特徴とする請求項
    38に記載の記録媒体。
  44. 【請求項44】 前記重み修正ステップは、前記第1の
    特徴語の種類に基づいて、前記第1の重みを修正するこ
    とを特徴とする請求項38に記載の記録媒体。
  45. 【請求項45】 前記既存の文書情報の前記第1の特徴
    語に関連付けて、前記取得制御ステップの処理により取
    得が制御された前記関連情報を用いてデータベースを構
    築するデータベース構築ステップをさらに含むことを特
    徴とする請求項38に記載の記録媒体。
  46. 【請求項46】 所定のデータ構造で構成された単語群
    からなる、単語間の関係を示すデータベースである分野
    辞書を作成する分野辞書作成ステップをさらに含み、 前記重み修正ステップは、前記分野辞書作成ステップの
    処理により作成された前記分野辞書に基づいて、前記重
    み算出ステップの処理により算出された前記第1の重み
    を修正することを特徴とする請求項38に記載の記録媒
    体。
  47. 【請求項47】 前記分野辞書は、前記単語群が、各前
    記単語の属する分野によってグループ化され、記録され
    ているデータベースであることを特徴とする請求項38
    に記載の記録媒体。
  48. 【請求項48】 前記分野辞書は、前記単語群が、前記
    単語間の関係に基づいて階層構造に配置され、記録され
    ているデータベースであることを特徴とする請求項38
    に記載の記録媒体。
  49. 【請求項49】 前記分野辞書は、前記単語群が、各前
    記単語に割り当てられた重要度に基づいてリスト化され
    たデータベースであることを特徴とする請求項38に記
    載の記録媒体。
  50. 【請求項50】 前記分野辞書は、既存の辞書データベ
    ースに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項38に記載の
    記録媒体。
  51. 【請求項51】 前記分野辞書は、所定のWEBページデ
    ータに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項38に記載の
    記録媒体。
  52. 【請求項52】 前記分野辞書は、以前に前記検索ステ
    ップの処理により用いられた前記第2の特徴語のリスト
    に含まれる前記単語群および前記単語群が形成するデー
    タ構造を含むことを特徴とする請求項38に記載の記録
    媒体。
  53. 【請求項53】 前記重み修正ステップは、前記分野辞
    書に含まれる前記単語に対応する前記第1の特徴語の前
    記第1の重みを修正することを特徴とする請求項38に
    記載の記録媒体。
  54. 【請求項54】 既存の文書ファイルおよび所定の文書
    ファイルに関連する関連情報を提示する情報処理装置を
    制御するコンピュータに、 前記既存の文書情報から第1の特徴語を抽出するととも
    に、前記所定の文書情報から第2の特徴語を抽出する抽
    出ステップと、 前記抽出ステップの処理により抽出された、前記第1の
    特徴語の第1の重みを算出するとともに、前記第2の特
    徴語の第2の重みを算出する重み算出ステップと、 所定の条件に基づいて、前記重み算出ステップの処理に
    より算出された前記第1の重みを修正する重み修正ステ
    ップと、 前記抽出ステップの処理により抽出された前記第1の特
    徴語、および前記重み修正ステップの処理により修正さ
    れた前記第1の重みに基づいて、前記既存の文書情報に
    対応付ける前記関連情報の取得を制御する取得制御ステ
    ップと、 前記第2の特徴語に基づいて、前記所定の文書情報に関
    連する前記既存の文書情報を検索する検索ステップと、 前記検索ステップの処理により検索された前記既存の文
    書情報に対応付けられている前記関連情報の表示を制御
    する表示制御ステップとを実行させるプログラム。
  55. 【請求項55】 前記取得制御ステップは、前記既存の
    文書情報における、複数の前記第1の特徴語の中から、
    前記第1の重みに基づいて重要語を選択し、前記重要語
    に関連する前記関連情報の取得を制御することを特徴と
    する請求項54に記載のプログラム。
  56. 【請求項56】 前記検索ステップは、前記第1の重み
    と前記第2の重みから類似度を算出し、前記類似度に基
    づいて、前記所定の文書情報に対応する前記既存の文書
    情報を検索することを特徴とする請求項54に記載のプ
    ログラム。
  57. 【請求項57】 前記既存の文書情報および前記所定の
    文書情報から属性情報を抽出する属性情報抽出ステップ
    をさらに含み、 前記重み修正ステップは、前記属性情報抽出ステップの
    処理により抽出された前記属性情報に基づいて、前記第
    1の重みを修正することを特徴とする請求項54に記載
    のプログラム。
  58. 【請求項58】 前記属性情報抽出ステップの処理によ
    り抽出された前記属性情報に基づいて、1または複数の
    前記既存の文書情報をグループ化して文書情報群を作成
    するグループ化ステップをさらに含むことを特徴とする
    請求項54に記載のプログラム。
  59. 【請求項59】 前記重み修正ステップは、特定の宛先
    への送信または前記特定の宛先からの受信の頻度に応じ
    て、前記第1の重みを修正することを特徴とする請求項
    54に記載のプログラム。
  60. 【請求項60】 前記重み修正ステップは、前記第1の
    特徴語の種類に基づいて、前記第1の重みを修正するこ
    とを特徴とする請求項54に記載のプログラム。
  61. 【請求項61】 前記既存の文書情報の前記第1の特徴
    語に関連付けて、前記取得制御ステップの処理により取
    得が制御された前記関連情報を用いてデータベースを構
    築するデータベース構築ステップをさらに含むことを特
    徴とする請求項54に記載のプログラム。
  62. 【請求項62】 所定のデータ構造で構成された単語群
    からなる、単語間の関係を示すデータベースである分野
    辞書を作成する分野辞書作成ステップをさらに含み、 前記重み修正ステップは、前記分野辞書作成ステップの
    処理により作成された前記分野辞書に基づいて、前記重
    み算出ステップの処理により算出された前記第1の重み
    を修正することを特徴とする請求項54に記載のプログ
    ラム。
  63. 【請求項63】 前記分野辞書は、前記単語群が、各前
    記単語の属する分野によってグループ化され、記録され
    ているデータベースであることを特徴とする請求項54
    に記載のプログラム。
  64. 【請求項64】 前記分野辞書は、前記単語群が、前記
    単語間の関係に基づいて階層構造に配置され、記録され
    ているデータベースであることを特徴とする請求項54
    に記載のプログラム。
  65. 【請求項65】 前記分野辞書は、前記単語群が、各前
    記単語に割り当てられた重要度に基づいてリスト化され
    たデータベースであることを特徴とする請求項54に記
    載のプログラム。
  66. 【請求項66】 前記分野辞書は、既存の辞書データベ
    ースに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項54に記載の
    プログラム。
  67. 【請求項67】 前記分野辞書は、所定のWEBページデ
    ータに含まれる前記単語群および前記単語群が形成する
    データ構造を含むことを特徴とする請求項54に記載の
    プログラム。
  68. 【請求項68】 前記分野辞書は、以前に前記検索ステ
    ップの処理により用いられた前記第2の特徴語のリスト
    に含まれる前記単語群および前記単語群が形成するデー
    タ構造を含むことを特徴とする請求項54に記載のプロ
    グラム。
  69. 【請求項69】 前記重み修正ステップは、前記分野辞
    書に含まれる前記単語に対応する前記第1の特徴語の前
    記第1の重みを修正することを特徴とする請求項54に
    記載のプログラム。
JP2002147225A 2001-12-13 2002-05-22 情報処理装置および方法、記録媒体、並びにプログラム Pending JP2003242176A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002147225A JP2003242176A (ja) 2001-12-13 2002-05-22 情報処理装置および方法、記録媒体、並びにプログラム
US10/316,762 US7289982B2 (en) 2001-12-13 2002-12-12 System and method for classifying and searching existing document information to identify related information

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001379511 2001-12-13
JP2001-379511 2001-12-13
JP2002147225A JP2003242176A (ja) 2001-12-13 2002-05-22 情報処理装置および方法、記録媒体、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2003242176A true JP2003242176A (ja) 2003-08-29
JP2003242176A5 JP2003242176A5 (ja) 2005-03-17

Family

ID=26625034

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002147225A Pending JP2003242176A (ja) 2001-12-13 2002-05-22 情報処理装置および方法、記録媒体、並びにプログラム

Country Status (2)

Country Link
US (1) US7289982B2 (ja)
JP (1) JP2003242176A (ja)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006085374A (ja) * 2004-09-15 2006-03-30 Keio Gijuku 文書データベースにおける重要語抽出方法、重要語抽出装置、コンピュータプログラム、プログラム格納媒体
JP2006287380A (ja) * 2005-03-31 2006-10-19 Nec Corp メール添付型ウイルス検知方法およびメールサーバ
JP2007534057A (ja) * 2004-03-31 2007-11-22 グーグル インク. 情報を取り込み抽出する方法及びシステム
JP2008257414A (ja) * 2007-04-04 2008-10-23 Toyota Central R&D Labs Inc 情報選択支援システム、端末装置、情報選択支援装置、情報選択支援方法、プログラム
JP2008276737A (ja) * 2007-04-25 2008-11-13 Samsung Electronics Co Ltd ユーザーの潜在的な関心情報へのアクセスを提供する方法及びシステム
JP2008541267A (ja) * 2005-05-13 2008-11-20 マイクロソフト コーポレーション オンライン会話コンテンツを用いて表示のために広告コンテンツ及び/又は他の関連情報を選択するシステム及び方法
JP2010134848A (ja) * 2008-12-08 2010-06-17 Nomura Research Institute Ltd メール監査システム及び方法
WO2010098178A1 (ja) * 2009-02-27 2010-09-02 株式会社 東芝 情報推薦装置、情報推薦方法および情報推薦プログラム
JP2010211733A (ja) * 2009-03-12 2010-09-24 Nec Corp 検索装置および検索方法
JP2011503699A (ja) * 2007-11-07 2011-01-27 リアン ホールディングス,エルエルシー 右脳スマートネス条件を使用することによる人間中心のネットワークのデータの管理
US8099407B2 (en) 2004-03-31 2012-01-17 Google Inc. Methods and systems for processing media files
JP2012014349A (ja) * 2010-06-30 2012-01-19 Nec System Technologies Ltd 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法
US8161053B1 (en) 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US8161032B2 (en) 2006-10-18 2012-04-17 Kabushiki Kaisha Toshiba Thread ranking system and thread ranking method
US8209329B2 (en) 2007-04-09 2012-06-26 Sony Corporation Apparatus, method, and program for information processing
US8275839B2 (en) 2004-03-31 2012-09-25 Google Inc. Methods and systems for processing email messages
US8346777B1 (en) 2004-03-31 2013-01-01 Google Inc. Systems and methods for selectively storing event data
US8386728B1 (en) 2004-03-31 2013-02-26 Google Inc. Methods and systems for prioritizing a crawl
US8631076B1 (en) 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
US8782056B2 (en) 2007-01-29 2014-07-15 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US8812515B1 (en) 2004-03-31 2014-08-19 Google Inc. Processing contact information
KR101439841B1 (ko) 2007-05-23 2014-09-17 삼성전자주식회사 컨텐츠 데이터에 대한 부가 데이터의 검색 방법과 그 장치
US8954420B1 (en) 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user

Families Citing this family (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7302429B1 (en) * 1999-04-11 2007-11-27 William Paul Wanker Customizable electronic commerce comparison system and method
US8126779B2 (en) * 1999-04-11 2012-02-28 William Paul Wanker Machine implemented methods of ranking merchants
JP2002345800A (ja) * 2001-05-23 2002-12-03 Konica Corp 医用画像処理装置及び医用ネットワークシステム
KR100444995B1 (ko) * 2002-01-09 2004-08-21 삼성전자주식회사 방송 프로그램 정보 검색 방법 및 장치
JP2004062479A (ja) * 2002-07-29 2004-02-26 Fujitsu Ltd 情報収集装置、方法及びプログラム
KR100468171B1 (ko) 2002-12-13 2005-01-26 삼성전자주식회사 방송 프로그램 정보검색 시스템 및 방법
JP2004348241A (ja) * 2003-05-20 2004-12-09 Hitachi Ltd 情報提供方法、サーバ及びプログラム
JP2005043977A (ja) * 2003-07-23 2005-02-17 Hitachi Ltd 文書間の類似度算出方法および装置
JP2005196469A (ja) * 2004-01-07 2005-07-21 Sony Corp データ表示サーバ,データ表示方法,およびそのプログラム
US7254587B2 (en) * 2004-01-12 2007-08-07 International Business Machines Corporation Method and apparatus for determining relative relevance between portions of large electronic documents
JP4444677B2 (ja) * 2004-01-20 2010-03-31 クラリオン株式会社 検索データの更新方法および更新システム
JP4394517B2 (ja) * 2004-05-12 2010-01-06 富士通株式会社 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置
GB2419200A (en) * 2004-06-30 2006-04-19 Fujitsu Ltd Information search terminal
US7711679B2 (en) 2004-07-26 2010-05-04 Google Inc. Phrase-based detection of duplicate documents in an information retrieval system
US7567959B2 (en) 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US7702618B1 (en) 2004-07-26 2010-04-20 Google Inc. Information retrieval system for archiving multiple document versions
JP3993627B2 (ja) * 2004-11-02 2007-10-17 松下電器産業株式会社 表示装置およびその方法
JP4524640B2 (ja) * 2005-03-31 2010-08-18 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP2006309446A (ja) * 2005-04-27 2006-11-09 Toshiba Corp 分類辞書更新装置、分類辞書更新プログラムおよび分類辞書更新方法
JP4559295B2 (ja) * 2005-05-17 2010-10-06 株式会社エヌ・ティ・ティ・ドコモ データ通信システム及びデータ通信方法
US8826136B2 (en) * 2005-06-27 2014-09-02 Core Wireless Licensing S.A.R.L. System and method for enabling collaborative media stream editing
EP1746503A1 (en) * 2005-07-12 2007-01-24 Mitel Networks Corporation Dynamic mailbox size configuraration by self-modification based on historical behavior
JP5007510B2 (ja) * 2006-02-13 2012-08-22 コニカミノルタビジネステクノロジーズ株式会社 文書処理装置および文書処理システム
JP2007272463A (ja) * 2006-03-30 2007-10-18 Toshiba Corp 情報検索装置、情報検索方法および情報検索プログラム
US8200695B2 (en) * 2006-04-13 2012-06-12 Lg Electronics Inc. Database for uploading, storing, and retrieving similar documents
JP2008005175A (ja) * 2006-06-21 2008-01-10 Fuji Xerox Co Ltd 情報配信装置、情報配信方法およびプログラム
US8560956B2 (en) * 2006-07-07 2013-10-15 International Business Machines Corporation Processing model of an application wiki
US8196039B2 (en) * 2006-07-07 2012-06-05 International Business Machines Corporation Relevant term extraction and classification for Wiki content
US8775930B2 (en) * 2006-07-07 2014-07-08 International Business Machines Corporation Generic frequency weighted visualization component
US8219900B2 (en) * 2006-07-07 2012-07-10 International Business Machines Corporation Programmatically hiding and displaying Wiki page layout sections
JP4234740B2 (ja) * 2006-08-03 2009-03-04 株式会社東芝 キーワード提示装置、プログラムおよびキーワード提示方法
BRPI0715523A2 (pt) * 2006-08-30 2013-06-25 Thomson Reuters Glo Resources sistemas, mÉtodos e software de fluxo de trabalho centrados no documento, baseados no conteédo, metadados e contexto do documento
US8972839B2 (en) * 2006-10-02 2015-03-03 Adobe Systems Incorporated Media presentations including related content
US20080114750A1 (en) * 2006-11-14 2008-05-15 Microsoft Corporation Retrieval and ranking of items utilizing similarity
US20080154896A1 (en) * 2006-11-17 2008-06-26 Ebay Inc. Processing unstructured information
US8620658B2 (en) * 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
US8117223B2 (en) 2007-09-07 2012-02-14 Google Inc. Integrating external related phrase information into a phrase-based indexing information retrieval system
US20090138329A1 (en) * 2007-11-26 2009-05-28 William Paul Wanker Application of query weights input to an electronic commerce information system to target advertising
US7945571B2 (en) * 2007-11-26 2011-05-17 Legit Services Corporation Application of weights to online search request
US20100076964A1 (en) * 2007-12-18 2010-03-25 Daniel Joseph Parrell Instance-Class-Attribute Matching Web Page Ranking
US8176419B2 (en) * 2007-12-19 2012-05-08 Microsoft Corporation Self learning contextual spell corrector
JP4399514B2 (ja) * 2008-02-20 2010-01-20 パナソニック株式会社 対話型番組検索装置
TW201007486A (en) * 2008-08-06 2010-02-16 Otiga Technologies Ltd Document management system and method with identification, classification, search, and save functions
JP5370478B2 (ja) * 2009-03-31 2013-12-18 富士通株式会社 名寄せ装置、名寄せ方法および名寄せプログラム
US9646079B2 (en) 2012-05-04 2017-05-09 Pearl.com LLC Method and apparatus for identifiying similar questions in a consultation system
US9904436B2 (en) 2009-08-11 2018-02-27 Pearl.com LLC Method and apparatus for creating a personalized question feed platform
EP2478451A2 (en) * 2009-09-18 2012-07-25 Lexxe PTY Ltd Method and system for scoring texts
US20120303359A1 (en) * 2009-12-11 2012-11-29 Nec Corporation Dictionary creation device, word gathering method and recording medium
JP5761029B2 (ja) * 2009-12-11 2015-08-12 日本電気株式会社 辞書作成装置、単語収集方法、及び、プログラム
US20110214070A1 (en) * 2010-02-26 2011-09-01 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Providing access to one or more messages in response to detecting one or more patterns of usage of one or more non-communication productivity applications
US20110214069A1 (en) * 2010-02-26 2011-09-01 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Presenting messages through a channel of a non-communication productivity application interface
US20110211590A1 (en) * 2010-02-26 2011-09-01 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Presenting messages through a channel of a non-communication productivity application interface
US9626633B2 (en) * 2010-02-26 2017-04-18 Invention Science Fund I, Llc Providing access to one or more messages in response to detecting one or more patterns of usage of one or more non-communication productivity applications
JP5156047B2 (ja) * 2010-03-31 2013-03-06 株式会社東芝 キーワード提示装置、方法及びプログラム
TWI439960B (zh) 2010-04-07 2014-06-01 Apple Inc 虛擬使用者編輯環境
US8195458B2 (en) * 2010-08-17 2012-06-05 Xerox Corporation Open class noun classification
US20120185259A1 (en) * 2011-01-19 2012-07-19 International Business Machines Corporation Topic-based calendar availability
CN102651719B (zh) * 2011-02-28 2016-08-31 国际商业机器公司 用于在消息交互环境中跟踪消息话题的方法和设备
CN103621105A (zh) * 2011-06-30 2014-03-05 汤姆逊许可公司 根据用户喜好自动录制的方法和装置
US9275038B2 (en) * 2012-05-04 2016-03-01 Pearl.com LLC Method and apparatus for identifying customer service and duplicate questions in an online consultation system
US9501580B2 (en) 2012-05-04 2016-11-22 Pearl.com LLC Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website
US9459781B2 (en) 2012-05-09 2016-10-04 Apple Inc. Context-specific user interfaces for displaying animated sequences
JP5526199B2 (ja) * 2012-08-22 2014-06-18 株式会社東芝 文書分類装置および文書分類処理プログラム
CN103778169B (zh) * 2012-10-26 2017-02-08 北京雪球信息科技有限公司 信息排序方法
US9264505B2 (en) * 2013-01-31 2016-02-16 Hewlett Packard Enterprise Development Lp Building a semantics graph for an enterprise communication network
US9122681B2 (en) 2013-03-15 2015-09-01 Gordon Villy Cormack Systems and methods for classifying electronic information using advanced active learning techniques
WO2014166540A1 (en) * 2013-04-11 2014-10-16 Longsand Limited Sentiment feedback
US9396724B2 (en) * 2013-05-29 2016-07-19 Tencent Technology (Shenzhen) Company Limited Method and apparatus for building a language model
US20150058708A1 (en) * 2013-08-23 2015-02-26 Adobe Systems Incorporated Systems and methods of character dialog generation
US11003659B2 (en) * 2013-10-25 2021-05-11 Rakuten, Inc. Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium
JP2015090548A (ja) * 2013-11-05 2015-05-11 オムロン株式会社 制御装置
JP6165657B2 (ja) * 2014-03-20 2017-07-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム
KR20150144447A (ko) * 2014-06-16 2015-12-28 한국전자통신연구원 메시지 수정 방법 및 장치
US10592539B1 (en) * 2014-07-11 2020-03-17 Twitter, Inc. Trends in a messaging platform
US10601749B1 (en) 2014-07-11 2020-03-24 Twitter, Inc. Trends in a messaging platform
US10452253B2 (en) 2014-08-15 2019-10-22 Apple Inc. Weather user interface
WO2016163043A1 (ja) * 2015-04-10 2016-10-13 株式会社ソリトンシステムズ 電子メール誤送信判定装置、電子メール送信システム及び記録媒体
US10354010B2 (en) * 2015-04-24 2019-07-16 Nec Corporation Information processing system, an information processing method and a computer readable storage medium
US10242001B2 (en) 2015-06-19 2019-03-26 Gordon V. Cormack Systems and methods for conducting and terminating a technology-assisted review
KR102568097B1 (ko) * 2015-06-22 2023-08-18 삼성전자 주식회사 파싱 데이터의 관련 정보를 표시하는 방법 및 전자 장치
WO2017018012A1 (ja) * 2015-07-28 2017-02-02 ソニー株式会社 情報処理システム、情報処理方法、および記録媒体
EP4321088A3 (en) 2015-08-20 2024-04-24 Apple Inc. Exercise-based watch face
US9996533B2 (en) * 2015-09-30 2018-06-12 International Business Machines Corporation Question answering system using multilingual information sources
JP6565628B2 (ja) * 2015-11-19 2019-08-28 富士通株式会社 検索プログラム、検索装置および検索方法
US10521413B2 (en) * 2015-11-20 2019-12-31 Oath Inc. Location-based recommendations using nearest neighbors in a locality sensitive hashing (LSH) index
US10691893B2 (en) * 2016-02-29 2020-06-23 International Business Machines Corporation Interest highlight and recommendation based on interaction in long text reading
US10878190B2 (en) * 2016-04-26 2020-12-29 International Business Machines Corporation Structured dictionary population utilizing text analytics of unstructured language dictionary text
WO2018006254A1 (zh) * 2016-07-05 2018-01-11 马岩 基于局域网邮件数据的抓取方法及系统
DK179412B1 (en) 2017-05-12 2018-06-06 Apple Inc Context-Specific User Interfaces
US20190182197A1 (en) * 2017-10-10 2019-06-13 Soliton Systems K.K. Warning apparatus for preventing electronic mail wrong transmission, electronic mail transmission system, and program
CN108132930A (zh) * 2017-12-27 2018-06-08 曙光信息产业(北京)有限公司 特征词提取方法及装置
JP7031387B2 (ja) * 2018-03-12 2022-03-08 オムロン株式会社 情報処理装置、情報処理方法、および、情報処理プログラム
DK180078B1 (en) 2018-05-07 2020-03-31 Apple Inc. USER INTERFACE FOR AVATAR CREATION
US11722764B2 (en) 2018-05-07 2023-08-08 Apple Inc. Creative camera
US11960701B2 (en) 2019-05-06 2024-04-16 Apple Inc. Using an illustration to show the passing of time
US11874881B2 (en) 2019-05-15 2024-01-16 Nippon Telegraph And Telephone Corporation Business documents presentation device, business documents presentation method and business documents presentation program
US11921998B2 (en) 2020-05-11 2024-03-05 Apple Inc. Editing features of an avatar
DK202070625A1 (en) 2020-05-11 2022-01-04 Apple Inc User interfaces related to time
WO2021231345A1 (en) 2020-05-11 2021-11-18 Apple Inc. User interfaces for managing user interface sharing
CN111753540B (zh) * 2020-06-24 2023-04-07 云南电网有限责任公司信息中心 一种对于文本数据进行收集以进行自然语言处理nlp的方法及系统
US11694590B2 (en) 2020-12-21 2023-07-04 Apple Inc. Dynamic user interface with time indicator
US11720239B2 (en) 2021-01-07 2023-08-08 Apple Inc. Techniques for user interfaces related to an event
US11921992B2 (en) 2021-05-14 2024-03-05 Apple Inc. User interfaces related to time
US11776190B2 (en) 2021-06-04 2023-10-03 Apple Inc. Techniques for managing an avatar on a lock screen

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146405A (en) * 1988-02-05 1992-09-08 At&T Bell Laboratories Methods for part-of-speech determination and usage
US5442778A (en) * 1991-11-12 1995-08-15 Xerox Corporation Scatter-gather: a cluster-based method and apparatus for browsing large document collections
US5576954A (en) * 1993-11-05 1996-11-19 University Of Central Florida Process for determination of text relevancy
AU1258195A (en) * 1993-11-17 1995-06-06 Collegeview Method and apparatus for displaying three-dimensional animated characters upon a computer monitor's screen
US5715468A (en) * 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
JP3282937B2 (ja) * 1995-01-12 2002-05-20 日本アイ・ビー・エム株式会社 情報検索方法及びシステム
JPH09153050A (ja) * 1995-11-29 1997-06-10 Hitachi Ltd 文書情報収集方法および文書情報収集装置
JPH1145280A (ja) 1997-07-27 1999-02-16 Just Syst Corp 他言語文書検索システム、他言語文書検索プログラムが記憶された記憶媒体、及び他言語文書検索方法
US6038574A (en) * 1998-03-18 2000-03-14 Xerox Corporation Method and apparatus for clustering a collection of linked documents using co-citation analysis
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
US6493702B1 (en) * 1999-05-05 2002-12-10 Xerox Corporation System and method for searching and recommending documents in a collection using share bookmarks
JP2001155020A (ja) 1999-11-25 2001-06-08 Toshiba Corp 類似文書検索装置、類似文書検索方法及び記録媒体
US6571240B1 (en) * 2000-02-02 2003-05-27 Chi Fai Ho Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases
JP4608740B2 (ja) 2000-02-21 2011-01-12 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
CN1174332C (zh) * 2000-03-10 2004-11-03 松下电器产业株式会社 转换表达方式的方法和装置
US20020073079A1 (en) * 2000-04-04 2002-06-13 Merijn Terheggen Method and apparatus for searching a database and providing relevance feedback
KR100426382B1 (ko) * 2000-08-23 2004-04-08 학교법인 김포대학 엔트로피 정보와 베이지안 에스오엠을 이용한 문서군집기반의 순위조정 방법
US6845374B1 (en) * 2000-11-27 2005-01-18 Mailfrontier, Inc System and method for adaptive text recommendation
US6721728B2 (en) * 2001-03-02 2004-04-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration System, method and apparatus for discovering phrases in a database
US6754654B1 (en) * 2001-10-01 2004-06-22 Trilogy Development Group, Inc. System and method for extracting knowledge from documents
US6873985B2 (en) * 2001-12-06 2005-03-29 Xerox Corporation Lightweight subject indexing for e-mail collections

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8954420B1 (en) 2003-12-31 2015-02-10 Google Inc. Methods and systems for improving a search ranking using article information
US10423679B2 (en) 2003-12-31 2019-09-24 Google Llc Methods and systems for improving a search ranking using article information
US8812515B1 (en) 2004-03-31 2014-08-19 Google Inc. Processing contact information
JP2007534057A (ja) * 2004-03-31 2007-11-22 グーグル インク. 情報を取り込み抽出する方法及びシステム
US8161053B1 (en) 2004-03-31 2012-04-17 Google Inc. Methods and systems for eliminating duplicate events
US10180980B2 (en) 2004-03-31 2019-01-15 Google Llc Methods and systems for eliminating duplicate events
US9836544B2 (en) 2004-03-31 2017-12-05 Google Inc. Methods and systems for prioritizing a crawl
US9311408B2 (en) 2004-03-31 2016-04-12 Google, Inc. Methods and systems for processing media files
US9189553B2 (en) 2004-03-31 2015-11-17 Google Inc. Methods and systems for prioritizing a crawl
US8275839B2 (en) 2004-03-31 2012-09-25 Google Inc. Methods and systems for processing email messages
US8346777B1 (en) 2004-03-31 2013-01-01 Google Inc. Systems and methods for selectively storing event data
US8386728B1 (en) 2004-03-31 2013-02-26 Google Inc. Methods and systems for prioritizing a crawl
US8631076B1 (en) 2004-03-31 2014-01-14 Google Inc. Methods and systems for associating instant messenger events
JP4812747B2 (ja) * 2004-03-31 2011-11-09 グーグル インコーポレイテッド 情報を取り込み抽出する方法及びシステム
US8099407B2 (en) 2004-03-31 2012-01-17 Google Inc. Methods and systems for processing media files
JP4639388B2 (ja) * 2004-09-15 2011-02-23 学校法人慶應義塾 文書データベースにおける重要語抽出方法、重要語抽出装置、コンピュータプログラム、プログラム格納媒体
JP2006085374A (ja) * 2004-09-15 2006-03-30 Keio Gijuku 文書データベースにおける重要語抽出方法、重要語抽出装置、コンピュータプログラム、プログラム格納媒体
JP2006287380A (ja) * 2005-03-31 2006-10-19 Nec Corp メール添付型ウイルス検知方法およびメールサーバ
JP4720251B2 (ja) * 2005-03-31 2011-07-13 日本電気株式会社 メール添付型ウイルス検知方法およびメールサーバ
JP2008541267A (ja) * 2005-05-13 2008-11-20 マイクロソフト コーポレーション オンライン会話コンテンツを用いて表示のために広告コンテンツ及び/又は他の関連情報を選択するシステム及び方法
US8161032B2 (en) 2006-10-18 2012-04-17 Kabushiki Kaisha Toshiba Thread ranking system and thread ranking method
US8782056B2 (en) 2007-01-29 2014-07-15 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
JP2008257414A (ja) * 2007-04-04 2008-10-23 Toyota Central R&D Labs Inc 情報選択支援システム、端末装置、情報選択支援装置、情報選択支援方法、プログラム
US8209329B2 (en) 2007-04-09 2012-06-26 Sony Corporation Apparatus, method, and program for information processing
JP2008276737A (ja) * 2007-04-25 2008-11-13 Samsung Electronics Co Ltd ユーザーの潜在的な関心情報へのアクセスを提供する方法及びシステム
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
KR101439841B1 (ko) 2007-05-23 2014-09-17 삼성전자주식회사 컨텐츠 데이터에 대한 부가 데이터의 검색 방법과 그 장치
JP2011503699A (ja) * 2007-11-07 2011-01-27 リアン ホールディングス,エルエルシー 右脳スマートネス条件を使用することによる人間中心のネットワークのデータの管理
JP2010134848A (ja) * 2008-12-08 2010-06-17 Nomura Research Institute Ltd メール監査システム及び方法
JP2010204735A (ja) * 2009-02-27 2010-09-16 Toshiba Corp 情報推薦装置、情報推薦方法および情報推薦プログラム
WO2010098178A1 (ja) * 2009-02-27 2010-09-02 株式会社 東芝 情報推薦装置、情報推薦方法および情報推薦プログラム
JP2010211733A (ja) * 2009-03-12 2010-09-24 Nec Corp 検索装置および検索方法
JP2012014349A (ja) * 2010-06-30 2012-01-19 Nec System Technologies Ltd 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法

Also Published As

Publication number Publication date
US7289982B2 (en) 2007-10-30
US20030140309A1 (en) 2003-07-24

Similar Documents

Publication Publication Date Title
JP2003242176A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4082059B2 (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4608740B2 (ja) 情報処理装置および方法、並びにプログラム格納媒体
JP4810469B2 (ja) 検索支援装置、プログラム及び検索支援システム
JP3150209U (ja) Webコンテンツを管理するためのシステムおよび装置
US7577718B2 (en) Adaptive dissemination of personalized and contextually relevant information
US7685199B2 (en) Presenting information related to topics extracted from event classes
US8543572B2 (en) Systems and methods for analyzing boilerplate
US8631001B2 (en) Systems and methods for weighting a search query result
US7849079B2 (en) Temporal ranking of search results
US8918401B1 (en) Systems and methods for providing searchable prior history
JP4714156B2 (ja) 記事情報を用いて検索ランク付けを改良するための方法およびシステム
US20070276801A1 (en) Systems and methods for constructing and using a user profile
US20130173608A1 (en) Temporal search query personalization
JP2002082748A (ja) ユーザ支援装置
JP2009211697A (ja) 情報配信システムおよび情報配信方法
JP5013701B2 (ja) 検索装置及び検索方法
JP4088950B2 (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4375626B2 (ja) カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法
EP2017752A1 (en) Information processing apparatus, information processing method and program
JP4605415B2 (ja) 情報処理装置および方法、並びに記録媒体
JP4477931B2 (ja) 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003242173A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP2005353083A (ja) 情報共有装置および方法
AU2012251925A1 (en) Temporal ranking of search results

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070904