JP2003242176A - 情報処理装置および方法、記録媒体、並びにプログラム - Google Patents
情報処理装置および方法、記録媒体、並びにプログラムInfo
- Publication number
- JP2003242176A JP2003242176A JP2002147225A JP2002147225A JP2003242176A JP 2003242176 A JP2003242176 A JP 2003242176A JP 2002147225 A JP2002147225 A JP 2002147225A JP 2002147225 A JP2002147225 A JP 2002147225A JP 2003242176 A JP2003242176 A JP 2003242176A
- Authority
- JP
- Japan
- Prior art keywords
- weight
- word
- information
- document information
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99943—Generating database or data structure, e.g. via user interface
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
Abstract
示するようにする。 【構成】 ステップS101,102において、メール
の相手毎に、送信(返信)した回数(やりとりした頻
度)がカウントされ、送信の頻度の多い順にソートされ
る。ステップS103,S104において、やりとりの
頻度が上位のメールの相手が抽出され、抽出された相手
とのメールに含まれる単語の重みが修正される。例え
ば、やりとりの頻度が1位のAさんとのメールのやりと
りが話題Aであり、その話題に含まれる単語b,c,f
の重みに、予め設定されている重み係数kが乗算されて
修正される。これにより、ユーザがより興味を感じてい
る話題に含まれる単語の重みが修正される。本発明は、
パーソナルコンピュータに適用できる。
Description
び方法、記録媒体、並びにプログラムに関し、特に、例
えば、電子メールに含まれる情報の中から、ユーザの興
味があると思われる単語および関連情報を取得してデー
タベースに蓄積し、その関連情報を効果的に表示させる
ようにした情報処理装置および方法、記録媒体、並びに
プログラムに関する。
トップ(表示画面)に、いわゆるデスクトップマスコッ
トと呼ばれるキャラクタを表示させるアプリケーション
プログラムが存在する。
メールの着信等をユーザに通知する機能やデスクトップ
上を移動する機能などを有している。
として送信する文書等を入力している時や、受信した文
書を閲覧している時などに、対象としている文書に関連
する情報(以下、関連情報と記載する)を、デスクトッ
プマスコットが提示するようになれば、ユーザによって
利便性が向上するとともに、デスクトップマスコットに
対して一層愛着を感じるようになると考えられる。
15号公報には、電子メールなどの処理済みのテキスト
ファイルを用いて自動的にデータベースを構築し、送受
信などの対象とした文書に関連する関連情報をユーザに
提示する方法が提案されている。
報の発明においては、単に、対象となる文書に基づい
て、データベースから関連情報を抽出して提示するだけ
であり、ユーザの興味の度合いが反映されていなかっ
た。
ものであり、ユーザの興味の度合いに応じて関連情報を
提示することができるようにするものである。
は、既存の文書情報から第1の特徴語を抽出するととも
に、所定の文書情報から第2の特徴語を抽出する抽出手
段と、抽出手段により抽出された、第1の特徴語の第1
の重みを算出するとともに、第2の特徴語の第2の重み
を算出する重み算出手段と、所定の条件に基づいて、重
み算出手段により算出された第1の重みを修正する重み
修正手段と、抽出手段により抽出された第1の特徴語、
および重み修正手段により修正された第1の重みに基づ
いて、既存の文書情報に対応付ける関連情報を取得する
取得手段と、第2の特徴語に基づいて、所定の文書情報
に関連する既存の文書情報を検索する検索手段と、検索
手段により検索された既存の文書情報に対応付けられて
いる関連情報の表示を制御する表示制御手段とを備える
ことを特徴とする。
数の第1の特徴語の中から、第1の重みに基づいて重要
語を選択し、重要語に関連する関連情報を取得すること
ができる。
類似度を算出し、類似度に基づいて、所定の文書情報に
対応する既存の文書情報を検索することができる。
属性情報を抽出する属性情報抽出手段をさらに設けるこ
とができる。
報に基づいて、1または複数の既存の文書情報をグルー
プ化して文書情報群を作成するグループ化手段をさらに
設け、抽出手段は、文書情報群から第1の特徴語を抽出
し、重み算出手段は、第1の特徴語の第1の重みを算出
し、取得手段は、第1の特徴語および第1の重みに基づ
いて、文書情報群に対応付ける関連情報を取得し、検索
手段は、第2の特徴語に基づいて、所定の文書情報に対
応する文書情報群を検索することができる。
抽出された属性情報に基づいて、第1の重みを修正する
ことができる。
は特定の宛先からの受信の頻度に応じて、第1の重みを
修正することができる。
作成した既存の文書情報から抽出された第1の特徴語の
第1の重みを修正することができる。
抽出された、第1の特徴語と同じ特徴語の重みを、第1
の重みと同様にさらに修正することができる。
づいて、第1の重みを修正することができる。
て、取得手段により取得された関連情報を用いてデータ
ベースを構築するデータベース構築手段をさらに設け、
検索手段は、第2の特徴語に基づいて、データベース構
築手段により構築されたデータベースから、所定の文書
情報に関連する既存の文書情報を検索することができ
る。
をさらに設け、所定の文書情報は、検知手段により検知
された所定のイベントの発生に対応する文書であるもの
とすることができる。
子メールであるものとすることができる。
なる、単語間の関係を示すデータベースである分野辞書
を作成する分野辞書作成手段をさらに備え、重み修正手
段は、分野辞書作成手段により作成された分野辞書に基
づいて、重み算出手段により算出された第1の重みを修
正することができる。
る分野によってグループ化され、記録されているデータ
ベースであるようにすることができる。
に基づいて階層構造に配置され、記録されているデータ
ベースであるようにすることができる。
当てられた重要度に基づいてリスト化されたデータベー
スであるようにすることができる。
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
いられた第2の特徴語のリストに含まれる単語群および
単語群が形成するデータ構造を含むようにすることがで
きる。
単語に対応する第1の特徴語の第1の重みを修正するよ
うにすることができる。
から第1の特徴語を抽出するとともに、所定の文書情報
から第2の特徴語を抽出する抽出ステップと、抽出ステ
ップの処理により抽出された、第1の特徴語の第1の重
みを算出するとともに、第2の特徴語の第2の重みを算
出する重み算出ステップと、所定の条件に基づいて、重
み算出ステップの処理により算出された第1の重みを修
正する重み修正ステップと、抽出ステップの処理により
抽出された第1の特徴語、および重み修正ステップの処
理により修正された第1の重みに基づいて、既存の文書
情報に対応付ける関連情報の取得を制御する取得制御ス
テップと、第2の特徴語に基づいて、所定の文書情報に
関連する既存の文書情報を検索する検索ステップと、検
索ステップの処理により検索された既存の文書情報に対
応付けられている関連情報の表示を制御する表示制御ス
テップとを含むことを特徴とする。
ラムは、既存の文書情報から第1の特徴語を抽出すると
ともに、所定の文書情報から第2の特徴語を抽出する抽
出ステップと、抽出ステップの処理により抽出された、
第1の特徴語の第1の重みを算出するとともに、第2の
特徴語の第2の重みを算出する重み算出ステップと、所
定の条件に基づいて、重み算出ステップの処理により算
出された第1の重みを修正する重み修正ステップと、抽
出ステップの処理により抽出された第1の特徴語、およ
び重み修正ステップの処理により修正された第1の重み
に基づいて、既存の文書情報に対応付ける関連情報の取
得を制御する取得制御ステップと、第2の特徴語に基づ
いて、所定の文書情報に関連する既存の文書情報を検索
する検索ステップと、検索ステップの処理により検索さ
れた既存の文書情報に対応付けられている関連情報の表
示を制御する表示制御ステップとを含むことを特徴とす
る。
ら第1の特徴語を抽出するとともに、所定の文書情報か
ら第2の特徴語を抽出する抽出ステップと、抽出ステッ
プの処理により抽出された、第1の特徴語の第1の重み
を算出するとともに、第2の特徴語の第2の重みを算出
する重み算出ステップと、所定の条件に基づいて、重み
算出ステップの処理により算出された第1の重みを修正
する重み修正ステップと、抽出ステップの処理により抽
出された第1の特徴語、および重み修正ステップの処理
により修正された第1の重みに基づいて、既存の文書情
報に対応付ける関連情報の取得を制御する取得制御ステ
ップと、第2の特徴語に基づいて、所定の文書情報に関
連する既存の文書情報を検索する検索ステップと、検索
ステップの処理により検索された既存の文書情報に対応
付けられている関連情報の表示を制御する表示制御ステ
ップとをコンピュータに実行させる。
ける、複数の第1の特徴語の中から、第1の重みに基づ
いて重要語を選択し、重要語に関連する関連情報の取得
を制御することができる。
から類似度を算出し、類似度に基づいて、所定の文書情
報に対応する既存の文書情報を検索することができる。
属性情報を抽出する属性情報抽出ステップをさらに含
み、重み修正ステップは、属性情報抽出ステップの処理
により抽出された属性情報に基づいて、第1の重みを修
正することができる。
れた属性情報に基づいて、1または複数の既存の文書情
報をグループ化して文書情報群を作成するグループ化ス
テップをさらに含むことができる。
または特定の宛先からの受信の頻度に応じて、第1の重
みを修正することができる。
に基づいて、第1の重みを修正することができる。
て、取得制御ステップの処理により取得が制御された関
連情報を用いてデータベースを構築するデータベース構
築ステップをさらに含むことができる。
なる、単語間の関係を示すデータベースである分野辞書
を作成する分野辞書作成ステップをさらに含み、重み修
正ステップは、分野辞書作成ステップの処理により作成
された分野辞書に基づいて、重み算出ステップの処理に
より算出された第1の重みを修正することができる。
る分野によってグループ化され、記録されているデータ
ベースであるようにすることができる。
に基づいて階層構造に配置され、記録されているデータ
ベースであるようにすることができる。
当てられた重要度に基づいてリスト化されたデータベー
スであるようにすることができる。
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
に含まれる単語群および単語群が形成するデータ構造を
含むようにすることができる。
理により用いられた第2の特徴語のリストに含まれる単
語群および単語群が形成するデータ構造を含むようにす
ることができる。
れる単語に対応する第1の特徴語の第1の重みを修正す
るようにすることができる。
プログラムにおいては、既存の文書情報から第1の特徴
語が抽出されるとともに、所定の文書情報から第2の特
徴語が抽出され、第1の特徴語の第1の重みおよび第2
の特徴語の第2の重みが算出され、所定の条件に基づい
て算出された第1の重みが修正され、第1の特徴語およ
び第1の重みに基づいて、既存の文書情報に対応付ける
関連情報が取得され、第2の特徴語に基づいて、所定の
文書情報に関連する既存の文書情報が検索され、検索さ
れた既存の文書情報に対応付けられている関連情報が表
示される。
施の形態について説明する。
スコット(以下、エージェントと記載する)をデスクト
ップ上に表示するアプリケーションプログラム(以下、
エージェントプログラムと記載する)、電子メールを送
受信するアプリケーションプログラム(以下、メーラ
(mailer)2と記載する)、および、文書作成または編
集するワードプロセッサプログラム3の機能を説明する
図である。エージェントプログラム1乃至ワードプロセ
ッサ3は、例えば、パーソナルコンピュータ(詳細は、
図2を参照して後述する)にインストールされて実行さ
れるものである。
となる文書の関連情報(後述)を蓄積してデータベース
を構築する蓄積部11、処理の対象となる文書に対応す
る関連情報をユーザに提示する提示部12、および、エ
ージェント72(図9)の表示等を制御するエージェン
ト制御部13から構成される。
によって送受信した文書やワードプロセッサプログラム
3によって編集された文書などのうち、自己が未処理の
文書を取得して文書属性処理部22および文書内容処理
部23に供給する。なお、以下においては、主に、メー
ラ2により電子メールとして送受信した文書を例として
説明する。
ら供給される文書の属性情報を抽出し、属性情報に基づ
き、文書をグループ化して、文書内容処理部23および
文書特徴データベース作成部24に供給する。電子メー
ルである場合、文書の属性情報としてヘッダに記述され
ている情報(対象となっているメールを特定するメッセ
ージID、参照しているメールのメッセージID(Referenc
es,In-Reply-To)、宛先(To,Cc,Bcc)、送信元(Fro
m)、日付(Date)、あるいは標題(Subject))などが
抽出される。そして、抽出された属性情報に基づいて、
1または複数の文書がグループ化される。以下、属性情
報に基づいてグループ化された文書群(メールグルー
プ)を「話題」と称する。
2でグループ化された文書群(話題)の文面を抽出し、
形態素解析を施して、単語(特徴語)に分類する。単語
は、品詞(名詞、形容詞、動詞、副詞、接続詞、感動
詞、助詞、および助動詞)別に分類される。ただし、広
範囲に亘って分布している単語、すなわち、例えば、ほ
ぼ全ての文書に含まれている、「こんにちは」、「よろ
しく」あるいは「お願いします」等の名詞以外の品詞
は、後述する、関連情報を検索するためのキーワードに
は成り得ないので、不要語として除外される。
た各単語の出現頻度および複数の文書に亘る分布状況を
求め、グループ化された文書群(話題)毎に、各単語の
重み(文書の主旨に関係する程度を示す値)を演算す
る。これにより、話題毎に、各単語の重みを構成要素と
する特徴ベクトルが算出される。例えば、全話題の単語
(特徴語)数の総計がn個の場合、すべての話題の特徴
ベクトルは、n次元空間のベクトルとなり、次式(1)
で表わされる。 特徴ベクトル=(単語1の重みw1,単語2の重みw2,・・・単語nの重みwn) (1)
on,G.:Automatic Text Processing:The Transformatio
n,Analysis, and Retrieval of Information by Comput
er,Addison-Wesley,1989)等が用いられる。この方法を
用いると、例えば、話題Aに含まれる単語がn個あった
場合、話題Aの特徴ベクトルのうち、含まれる単語の該
当する構成要素には重みが与えられ、話題Aに含まれな
い単語の構成要素は、頻度が0であるため、重みの値は
0となる。
クトルを算出するものとして説明するが、これに限ら
ず、文書毎、または、その他の単位毎(例えば、所定期
間(1週間)に蓄積された文書群毎)に特徴ベクトルを
算出することも勿論可能である。
属性処理部22でグループ化された文書群(話題)毎の
各文書の属性情報と、文書内容処理部23で算出された
話題毎の特徴ベクトル(すなわち、話題内に含まれる全
ての単語の重み)を時系列順にデータベース化してハー
ドディスクドライブなどよりなる記憶部49(図2)に
記録する。文書特徴データベース作成部24はまた、単
語の重みに基づいて、所定の条件を満たす単語を選択
し、その単語を、関連情報を検索するための検索用キー
ワード(重要語)として記録する。文書特徴データベー
ス作成部24はさらに、検索用キーワードを関連情報検
索部25に供給し、それに対応して関連情報検索部25
から返される関連情報を、検索用キーワードに対応付け
て記録する。
ース作成部24が選択して記録した検索用キーワードに
対する関連情報を検索し、検索結果のインデックスを文
書特徴データベース作成部24に返す。キーワードの関
連情報を検索するには、例えば、インターネット上の検
索エンジンを用いる方法がある。この場合、Webページ
のURL(Uniform Resource Locator)やWebページのタイ
トルが、関連情報として文書特徴データベース作成部2
4に返される。
ラ2が電子メールの送信や受信を終えたことや、編集中
の文書のテキストデータ量が所定の閾値を超えたことを
検知して、データベース問い合わせ部32に通知する。
以下、メーラ2が電子メールの送信や受信を終えたこと
や、編集中の文書のテキストデータ量が所定の閾値を超
えたことをイベント発生と記載する。
Aを内蔵しており、所定時間が経過したか否かを監視
し、所定時間が経過した場合、その旨をデータベース問
い合わせ部32に通知する。
ト管理部31からのイベント発生の通知に対応して、イ
ベント発生に対応する文書(例えば、受信した電子メー
ル)を取得し、文書内容処理部23の処理と同様に、そ
の文書の形態素解析を施して、不要語を除外した単語を
抽出し、各単語の重みを演算する。これにより、イベン
ト発生に対応する文書の特徴ベクトルが算出される。
書特徴データベース作成部24が作成したデータベース
を検索し、算出したイベント発生に対応する文書の特徴
ベクトルと、データベースに記録されている話題毎の特
徴ベクトルとの内積から類似度をそれぞれ算出する。デ
ータベース問い合わせ部32は、類似度が最も高い話題
を抽出し、抽出した話題に含まれる各単語のうち、重み
が所定の条件(詳細については図6を参照して後述す
る)を満たすものを選択し、選択された単語(重要語)
に対応する関連情報を、イベント管理部31を介して、
あるいは、直接、関連情報提示部33に供給する。
1を介して、あるいは、直接、データベース問い合わせ
部32から供給される関連情報を表示部48(デスクト
ップ)上に表示させる。
新は、所定のタイミングにおいて実行される。データベ
ースの更新処理は、図28のフローチャートを参照して
後述する。また、蓄積部11によるデータベースの更新
時に、記憶部49に記録した特徴ベクトルが、例えば、
メールのやりとりの回数、送受信の状態、または、品詞
の種類(特定の地域や名称を示す固有名詞など)に応じ
て修正される。特徴ベクトルの修正処理は、図31、図
34、および図36のフローチャートを参照して後述す
る。さらに、提示部12による関連情報の提示処理は、
イベント管理部31がイベント発生を検知する毎に実行
される。
ストールされて実行されるパーソナルコンピュータの構
成例を示している。
Processing Unit)41を内蔵している。CPU41には
バス44を介して、入出力インタフェース45が接続さ
れている。入出力インタフェース45には、キーボー
ド、マウスなどの入力デバイスよりなる入力部46、処
理結果としての例えば音声信号を出力する出力部47、
処理結果としての画像を表示するディスプレイなどより
なる表示部48、プログラムや各種データを格納するハ
ードディスクドライブなどよりなる記憶部49、LAN(Lo
cal Area Network)やインターネットを介してデータを
通信するモデムなどよりなる通信部50、および、磁気
ディスク52、光ディスク53、光磁気ディスク54、
または半導体メモリ55などのプログラム格納媒体に対
してデータを読み書きするドライブ51が接続されてい
る。バス44には、ROM(Read OnlyMemory)42および
RAM(Random Access Memory)43が接続されている。
気ディスク52、光ディスク53、光磁気ディスク5
4、または半導体メモリ55に格納された状態でパーソ
ナルコンピュータに供給され、ドライブ51によって読
み出されて、記憶部49に内蔵されるハードディスクド
ライブにインストールされている。記憶部49にインス
トールされているエージェントプログラム1は、入力部
46に入力されるユーザからのコマンドに対応するCPU
41の指令によって、記憶部49からRAM43にロード
されて実行される。なお、パーソナルコンピュータの起
動時において自動的にエージェントプログラム1が実行
されるように設定しておくようにしてもよい。
クドライブには、エージェントプログラム1、メーラ
2、およびワードプロセッサ3の他、WWW(World Wide
Web)ブラウザなどのアプリケーションプログラムもイ
ンストールされており、エージェントプログラム1と同
様に、入力部46に入力されるユーザからの起動コマン
ドに対応するCPU41の指令によって、記憶部49からR
AM43にロードされて実行される。
エージェントプログラム1のデータベース作成処理につ
いて説明する。このデータベース作成処理は、エージェ
ントプログラム1が実行する処理のうちの1つであり、
エージェントプログラム1が実行された場合において、
データベースが未だ作成されていないときに開始され
る。
は、未処理の文書(例えば、エージェントプログラム1
が実行される以前に送受信された電子メール)を、記憶
部49に内蔵されるハードディスクドライブから取得し
て文書属性処理部22および文書内容処理部23に供給
する。
2は、ステップS1の処理で文書取得部21により取得
され供給された電子メールの文書から属性情報(メッセ
ージID等のヘッダ情報)を抽出し、その属性情報に基づ
き、文書をグループ化して(すなわち、話題毎にグルー
プ化して)、文書内容処理部23および文書特徴データ
ベース作成部24に供給する。
3は、ステップS2の処理で文書属性処理部22により
グループ化された文書群(話題)の本文のテキストデー
タを抽出し、さらにテキストデータの形態素解析を施
し、不要語を除く単語(特徴語)を抽出する。ステップ
S4において、文書内容処理部23は、ステップS3の
処理で抽出された各単語の出現頻度、複数の文書に亘る
分布状況を求め、話題毎に、各単語の重みを、例えば、
tf・idf法を用いて演算する。
ース作成部24は、ステップS2の処理で文書属性処理
部22によりグループ化された話題毎の各文書の属性情
報と、ステップS3の処理で文書内容処理部23により
算出されたその話題内に含まれる全ての単語の重み(特
徴ベクトル)をデータベース化する。
ープ化された各話題(話題A、話題B、話題C、・・
・)を時系列順にソートした後、各話題にそれぞれ含ま
れる全単語1乃至nの重みも時系列順にソートして記憶
部49に記録する。ここで、図4においては、例えば、
重みA1は、話題Aにおける単語1の重みの値を示し、
重みB2は、話題Bにおける単語2の重みの値を示して
いる。さらに例えば、話題Bに単語1が含まれていない
場合、重みB1は0となる。
て、文書特徴データベース作成部24は、単語の重みが
所定の閾値以上である単語を検索用キーワードに選択す
るか、あるいは、重みが大きい順にソートされ、予め指
定される個数の単語を選択して、関連情報検索部25に
供給する。関連情報検索部25は、文書特徴データベー
ス作成部24からの検索用キーワード(重要語)を検索
条件として、インターネット上の検索エンジンにアクセ
スして検索結果を取得し、得られたWebページのURLやタ
イトルを関連情報として文書特徴データベース作成部2
4に出力する。
ース作成部24は、関連情報検索部25からの関連情報
を検索用キーワードに対応付けて記憶部49に記録する
ことにより、データベースを作成する。なお、ステップ
S6の処理とステップS7の処理は、ステップS5まで
の一連の処理に継続して実行する場合と、一連の処理に
継続せず、所定のタイミングにおいて実行する場合があ
る。
ことにより、送受信した電子メールの文書に対応した関
連情報がデータベース内に蓄積されることになる。な
お、データベース作成処理は、エージェントプログラム
1が実行された場合に開始されるものとしたが、任意の
タイミングで開始させることも可能である。さらに、こ
のようにして作成されたデータベースは、所定の条件が
満たされたときに更新される(更新のタイミングについ
ては、図29を参照して後述する)。
制的に中断することができるようにするために、中断要
求があった場合、中断された時点で処理済みの文書を記
録し、再開要求があった場合、未処理の文書から処理を
再開するようにしてもよい。
エージェントプログラム1の関連情報提示処理について
説明する。この関連情報提示処理は、図3を用いて上述
したデータベース作成処理とは異なり、エージェントプ
ログラム1が実行されている間、繰り返して実行され
る。
ログラム1は、入力部46に入力されるユーザからのコ
マンドによって、エージェントプログラム1の終了が指
示されたか否かを判定し、エージェントプログラム1の
終了が指示されていないと判定した場合、ステップS1
2に進む。
31は、イベント発生(メーラ2の電子メールの送受信
の終了等)を監視し、イベント発生が検知されない場
合、ステップS11に戻り、上述した処理が繰り返し実
行される。
検知された場合、ステップS13に進み、イベント管理
部31は、イベント発生をデータベース問い合わせ部3
2に通知する。データベース問い合わせ部32は、イベ
ント管理部31からのイベント発生の通知に対応して、
イベント発生に対応する文書(送受信された電子メー
ル)を取得し、その文書の形態素解析を施して、不要語
を除外した単語(特徴語)を抽出し、各単語の重みを演
算する。これにより、イベント発生に対応する文書の特
徴ベクトルが算出される。
い合わせ部32は、文書特徴データベース作成部24が
作成したデータベースを検索し、ステップS13の処理
で算出された特徴ベクトルと、データベースに記録され
ている話題毎の特徴ベクトルとの内積から類似度をそれ
ぞれ算出し、類似度が所定の条件(例えば、類似度が最
大、もしくは類似度が所定の閾値以上)を満たすものを
抽出する。
ての条件として、過去一定期間に属する話題であって、
最近送受信したメールに多く含まれている、または、集
中して使われている単語を、特徴ベクトルの重みに関し
て上位後に持たない話題を選択するようにすると良い。
話題を確定する日時としては、話題を構成する電子メー
ルの初め、終わり、若しくは、平均の送信日時、また
は、話題を構成する電子メールの初め、終わり、若しく
は、平均の受信日時等、日時を特定できれば何れでもよ
い。これにより、最近忘れていたが過去にあった話題の
内、現在の興味に類似するものを抽出することができ、
ユーザに意外性を与えるとともに、ユーザの潜在的な興
味を喚起することができる。
い合わせ部32は、ステップS14の処理で抽出された
話題に含まれる各単語のうち、重みの時系列推移に着目
して、以下に示す条件1および条件2を満たす単語(重
要語)を選択する。
く、ステップS6で取得され、ステップS14で選択さ
れた話題に関連付けられた関連情報の内、ステップS6
での重みが一番大きなものから順に、または、今まで表
示していない関連情報から優先的に表示するようにして
も良い。また、表示する関連情報は1つに限られない。
について説明する。図6は、データベースに蓄積されて
いる単語の重みの時系列推移の例を示している。
点以前の所定の期間X(例えば、2週間)、所定の閾値
A以下であること」である。また例えば、条件2は、
「現時点以前の所定の期間Y(例えば、5週間)におい
て、異なる2以上の話題で、単語の重みが所定の閾値B
以上であること」である。なお、条件3「条件2におけ
る異なる2以上の話題のうち、最も古い話題と最も新し
い話題が所定の期間Z以上離れていること」を追加すれ
ばさらに好ましい。
ザの興味が高いと思われる単語(重要語)を選択するこ
とが可能となる。特に、条件1によって、現時点に近い
話題に含まれる単語は除外されるので、ユーザが現時点
で意識しており、意外性のないと思われる関連情報(新
しすぎる情報)を改めて選択することを避けることがで
き、かつ、かなり以前の話題に含まれる単語も除外され
るので、ユーザが現時点で思い出すことができないと思
われる関連情報(古すぎる情報)を改めて選択すること
も避けることができる。
うにして選択した単語(重要語)に対応する関連情報
を、イベント管理部31を介して、あるいは、直接、関
連情報提示部33に供給する。
て、エージェント制御部13は、ステップS15の処理
で選択した単語が含まれている文書の属性情報を、選択
(推薦)した理由として表示させるとともに、対応する
関連情報を表示するか否かをユーザに問う入力ウィンド
ウ81(図14)をデスクトップに表示させる。
書からなるため、重要語が含まれる文書も複数存在する
場合がある(すなわち、重要語が含まれている文書の属
性情報が複数存在する場合がある)。そこで、例えば、
重要語が含まれている文書のうち、最古または最新の文
書の属性情報を表示させるようにするか、あるいは、任
意に指定された文書の属性情報を表示させる。また、入
力ウィンドウ81を表示させずに、直接、デスクトップ
上に関連情報を表示させるようにしてもよい。
ログラム1は、入力部46に入力されるユーザからのコ
マンドによって、ステップS16の処理で表示された入
力ウィンドウ81に呼応して、ユーザが「見る」ボタン
を選択したか否かを判定する。ステップS17におい
て、ユーザが「見る」ボタンを選択したと判定された場
合、ステップS18に進む。なお、入力ウィンドウ81
には、「見る」ボタンおよび「見ない」ボタン以外にも
他の情報を表示したり、あるいは、表示しないようにす
ることもできる。
33は、イベント管理部31を介してデータベース問い
合わせ部32から供給された関連情報をデスクトップに
表示させる。この関連情報は、1または複数個を提示す
ることができる。
キーワードが付与された所定のデータベースに蓄積され
た情報であれば、Webページのタイトルでなくてもかま
わない。例えば、所定のデータベースに蓄積されている
情報のインデックスを表示するようにして、ユーザのア
クセス指令に対応して、そのインデックスのさらに詳細
な情報を表示させるようにしてもよい。
ログラム1は、入力部46に入力されるユーザからのコ
マンドによって、ステップS18の処理により関連情報
として表示されたWebページのタイトルに対して、ユー
ザがアクセスを指令したと判定した場合、ステップS2
0に進む。ステップS20において、WWWブラウザが起
動され、対応するWebページへのアクセスが行われる。
の処理により関連情報として表示されたWebページのタ
イトルに対して、ユーザが記録を指令したと判定された
場合、ステップS21に進む。ステップS21におい
て、エージェントプログラム1は、対応するWebページ
のタイトルおよびURLを、提示履歴を表示するスクラッ
プ帳ウィンドウ74(図9)に記録する。なお、ステッ
プS19において、ステップS18の処理により関連情
報として表示されたWebページのタイトルに対して、ユ
ーザから何の指令もなされずに所定の時間が経過したと
判定された場合、ステップS20またはステップS21
の処理はスキップされて、ステップS11に戻り、上述
した処理が繰り返し実行される。
「見る」ボタンを選択しないと判定された場合、ステッ
プS18乃至ステップS21の処理はスキップされて、
ステップS11に戻り、上述した処理が繰り返し実行さ
れる。さらに、ステップS11において、ユーザにより
エージェントプログラム1の終了が指示されたと判定さ
れた場合、処理は終了される。
ント発生に対応する電子メールを効率よく取得する手法
について説明する。
に関し、次のような4つの特徴を有していることに着目
する。第1に、メーラにおける1つのフォルダは、パー
ソナルコンピュータにおける1つのメールボックスファ
イルに対応していること。第2に、新たに受信したメー
ルは、特定のフォルダに格納されるようになっており、
パーソナルコンピュータでは当該フォルダに対応するフ
ァイルの末尾に追加され、このとき、1つのファイルに
は一般に複数のメールが含まれるので、メールとメール
との境界に、特定の文字列パターン(メーラによって異
なる)からなる行が挿入されていること。第3に、送信
したメールの記録も、同様の形式で特定のファイルに保
存されること。第4に、一般に、送受信したメールが含
まれるファイルはサイズが大きいこと(数百KB乃至1M
B)。
の手順によってイベント発生に対応するメールを取得す
る。始めに、メールボックスファイルの更新日時を検出
し、新たなメールが追加されたか否かを判断する。次
に、新たにメールが追加されたメールボックスファイル
を末尾から先頭方向に1行ずつ操作して、メールとメー
ルとの境界を示す特定の文字列を検出する。境界を示す
文字列を検出した場合、その位置からメールボックスフ
ァイルの末尾までデータを抽出する。
ント発生に対応する電子メールを効率的に取得すること
が可能となる。
メールに対して何度も関連情報を提示しないようにする
手法について説明する。まず、関連情報を提示したメー
ルのメッセージIDを記録するためのデータ構造を設定す
る。そして、イベントが発生した場合、そのイベントに
対応するメールのメッセージIDを取得して、設定したデ
ータ構造と比較する。データ構造の中に同じメッセージ
IDがある場合、そのメールに対しては既に関連情報を提
示しているので、関連情報を提示しない。一方、データ
構造の中に同じメッセージIDがない場合、そのメールに
対しては関連情報を提示していないので関連情報を提示
し、メッセージIDをデータ構造に記録する。
のメールに対して何度も関連情報を提示するような事態
の発生を抑止することが可能となる。
参照して、図5を用いて説明した関連情報提示処理のう
ち、主にエージェントの動作および台詞等について、詳
細に説明する。
されている状態においてメーラ2が起動された場合、ス
テップS31において、エージェント制御部13は、例
えば、図9に示されるように、メーラ2のウィンドウ
(以下、メーラウィンドウと記載する)71の表示と重
畳しない位置に、エージェント72を表示(登場)させ
る。
ば、図10A乃至図10Dに示す画像が順次表示される
ことによって、エージェント72が前転しながらデスク
トップ上に出現する動画が表現される。エージェント7
2の登場とともに、エージェント72の台詞として吹き
出し73と、保存されている関連情報が一覧表示されて
いるスクラップ帳ウィンドウ74(後述)が表示され
る。吹き出し73の中には、例えば、図11に示される
ように、登場の挨拶「おはよう、SAITOさん!」と、自
己紹介「ぼく、alfだよ。」の台詞が表示される。
き出し73に表示された台詞の音声信号が音声合成部
(図示せず)によって合成されて出力するようにするこ
とができる。なお、吹き出し73に表示された台詞の音
声信号は、吹き出し73に表示された言語(図16の例
の場合、日本語)、あるいは、吹き出し73に表示され
た言語と同じ意味を持つ他の言語(例えば、英語の場
合、”Good morning,SAITO"、”I'm Alf")の音声信号
が音声合成部によって合成されて出力されるようにして
もよい。そして、以降に表示される吹き出し73にも対
応する音声信号が同期して出力される。
力しなくてもよい。以降、いずれの処理においても、吹
き出し73および対応する音声は、エージェントプログ
ラム1の規定により出力するか否かを設定するようにす
るか、あるいは、ユーザにより、出力するか否かを任意
に設定できるようにする。
ップS32において、例えば、図12に示されるよう
に、待機中の様子(手を後に組み、つま先を上下させ
る)を示す動画に推移される。
ログラム1は、入力部46に入力されるユーザからのコ
マンドに応じて、メーラ2が終了されたか否かを判定
し、メーラ2が終了されていないと判定した場合、ステ
ップS34に進む。
ステップS12に対応する)、メーラ2は、ユーザから
何らかのコマンド(メールの送受信、メールの編集、あ
るいは関連情報の編集等)が入力されたか否かを判定
し、何らかのコマンドが入力されたと判定した場合、ス
テップS35に進み、コマンドに対応する処理を開始す
る。
ログラム1のイベント管理部31は、メールの送信、受
信、または編集のコマンドが入力されたか否かを判定さ
し、メールの送受信または編集のコマンドが入力された
と判定した場合、ステップS36に進む。
御部13は、エージェント72の表示を、図12に示し
た待機中の様子から、例えば、図13に示されるよう
に、作業中の様子(手足を激しく移動する)を示す動画
に推移させる。この間に、図5のステップS13乃至S
15の処理(ユーザに推薦する関連情報を選択する処
理)が実行される。
ログラム1は、コマンドに対応して開始されたメーラ2
の処理(例えば、メール送信など)が継続中であるか否
かを判定し、メーラ2の作業中の処理が終了するまで判
定処理を繰り返し実行する。すなわち、メーラ2の作業
中の処理が終了するまで、エージェント制御部13は、
エージェント72の表示を、図13に示した作業中の状
態のまま待機する。
が継続中ではない、すなわち、コマンドに対応して開始
されたメーラ2の作業中の処理が終了したと判定された
場合、ステップS38に進む。
ログラム1は、再度、入力部46に入力されるユーザか
らのコマンドに応じて、メーラ2が終了されたか否かを
判定し、メーラ2が終了されていないと判定した場合、
ステップS39に進む。
対応する)において、エージェント制御部13は、ステ
ップS37のメーラ2の処理がメール送信であった場
合、エージェント72の吹き出し73に、例えば、
「今、Aさんにメール送ったけど、某月某日にAさんと
(タイトル)について話していたよね。その中にでてき
た(キーワード)について、関連するページを見つけた
よ。見てみる?」と表示させる。
処理がメール受信であった場合、台詞の前半が「今、A
さんからメールがきたけど」となり、ステップS37の
メーラ2の処理がメールの編集であった場合、台詞の前
半が「今、Aさんにメールを書いているけど」となる。
について話していたよね。」の部分は、関連情報が選択
(推薦)された理由に相当するが、関連情報の選択理由
の表示を、ステップS39において実行せずに、後述す
るステップS42の処理(関連情報の表示)の後に表示
するようにしてもよい。また、関連情報の選択理由の表
示をユーザの指示により任意のタイミング(例えば、メ
ニューで理由をたずねるコマンドを用意するなど)で実
行するようにしてもよい。
の提示(定期的提示)に関しては、「今、Aさんからメ
ールがきたけど」など、特定のイベントを示すような表
現ではなく、例えば、「某月某日にAさんと(タイト
ル)について話していたよね。」の部分だけを表示する
ようにする。
報を提示する前に表示してもよいし、あるいは、関連情
報を提示した後に表示してもよい。
ば、図14に示されるように、入力ウィンドウ81が表
示される。入力ウィンドウ81には、図15に示される
ように、関連情報の表示を指示するときに選択する「見
る」と示されたボタン、関連情報を表示させない時に選
択する「見ない」と示されたボタン、関連情報が選択さ
れた背景(選択理由)の再表示を指示するときに選択す
る「背景をもう一度教えて」と示されたボタンが表示さ
れる。
ステップS40において、エージェント制御部13は、
エージェント72の表示を、図14に示した待機中の様
子を示す動画に推移させる。ステップS41(図5のス
テップS17に対応する)において、エージェントプロ
グラム1は、入力ウィンドウ81の中の「見る」と示さ
れたボタン、「見ない」と示されたボタン、または「背
景をもう一度教えて」と示されたボタンのいずれがユー
ザにより選択されたか否かを判定する。なお、この入力
ウィンドウ81は、表示しなくてもよい。
81の「見る」と示されたボタンが選択されたと判定さ
れた場合、ステップS42に進む。ステップS42(図
5のステップS18に対応する)において、エージェン
ト制御部13は、例えば、図16および図17に示され
るように、関連情報として推薦URL91を表示させ、エ
ージェント72の表示を、表示された推薦URL91を指
し示す動画に推移させるとともに、吹き出し73に、台
詞「どう?」を表示させる。推薦URL91には、通常、
推薦されるWebページのタイトルが表示され、推薦URL9
1の上にマウスカーソルが置かれたときだけURLも重畳
して表示される。推薦URL91は、マウスカーソルでド
ラッグすることにより移動可能である。
対応する)において、エージェントプログラム1は、表
示した推薦URL91に対するユーザのコマンドを検出す
る。表示される推薦URL91に対するユーザのコマンド
としては、記録、アクセス、または消去等がある。
えば、記録する推薦URL91をスクラップ帳ウィンドウ
74までドラッグアンドドロップする方法や、マウスで
右クリックし、表示されるメニューの中から記録を選択
する方法などが考えられる。あるいは、推薦URL91
は、すべて自動的に記録されるようにしてもよい。アク
セスコマンドや消去コマンドについても同様に、WWWブ
ラウザのアイコンやゴミ箱のアイコンにドラッグアンド
ドロップする方法や、マウスで右クリックし、表示され
るメニューの中から選択する方法、あるいはクリッカブ
ルにする方法などが考えられる。
対する記録コマンドが検出された場合、ステップS44
(図5のステップS21に対応する)において、エージ
ェント制御部13は、エージェント72の表示を、例え
ば、図18に示されるように、頷く動作に推移させる。
スクラップ帳ウィンドウ74の中に、記録が指示された
推薦URL91に対応するWebページのタイトルが追加され
る。
対するアクセスコマンドが検出された場合、ステップS
44(図5のステップS20に対応する)において、エ
ージェント制御部13は、エージェント72の表示を、
例えば、図19Aおよび図19Bに示されるように、笑
顔となって喜ぶ様子に推移させる。吹き出し73には、
「わーい」と表示され、対応する音声信号が出力され
る。
対する消去コマンドが検出された場合、ステップS44
において、エージェント制御部13は、エージェント7
2の表示を、例えば、図20Aおよび図20Bに示され
るように、泣き顔となって悲しみ失望した様子に推移さ
せる。吹き出し73には、「だめかぁ」と表示され、対
応する音声信号が出力される。
ップS32に戻り、それ以降の処理が繰り返し実行され
る。
ンドウ81の「見ない」と示されたボタンが選択された
と判定された場合、ステップS32に戻り、それ以降の
処理が繰り返し実行される。また、ステップS41にお
いて、入力ウィンドウ81の「背景をもう一度教えて」
と示されたボタンが選択されたと判定された場合、ステ
ップS39に戻り、ステップS39乃至S41の処理が
繰り返される。
されたと判定された場合、ステップS45に進み、エー
ジェント制御部13は、吹き出し73に、「え、そんな
ぁ」と表示させ、対応する音声信号を出力させた後、ス
テップS46において、エージェント72の表示を消失
させる(図25を参照して後述する)。
を指示するコマンドが入力されたと判定された場合、ス
テップS47に進み、関連情報提示部33は、関連情報
編集用ウィンドウ(図示せず)を表示させ、エージェン
ト制御部13は、エージェント72の表示を、図18に
示した待機中の様子から、図17と同様に、関連情報編
集用ウィンドウを指し示す様子に推移させる。その後、
ユーザが関連情報編集用ウィンドウに対して編集のため
の入力を開始すると、ステップS48において、エージ
ェント制御部13は、エージェント72の表示を、関連
情報編集用ウィンドウを指し示す様子から、図13に示
した作業中の様子を示す動画に推移させる。
ログラム1は、関連情報編集処理が継続中であるか否か
を判定し、関連情報編集処理が終了するまで判定処理を
繰り返し実行する。すなわち、関連情報編集処理が終了
するまで、エージェント制御部13は、エージェント7
2の表示を、図13に示した作業中の状態のまま待機す
る。
理が継続中ではない、すなわち、コマンドに対応して開
始された関連情報編集処理が終了したと判定された場
合、ステップS50に進む。
御部13は、エージェント72の表示を、図18と同様
に、頷く様子に推移させる。吹き出し73には、「変更
したよ」と表示され、対応する音声信号が出力される。
その後、処理は、ステップS32に戻り、それ以降の処
理が繰り返し実行される。
てユーザから何らかのコマンドが入力されない状態が所
定の時間以上継続した場合、ステップS51に進む。ス
テップS51において、エージェント制御部13は、エ
ージェント72の表示を、所定の時間が経過する毎に、
移動の状態、遊びの状態、または睡眠の状態に順次推移
させる。この待機中の処理の詳細について、図8のフロ
ーチャートを参照して説明する。なお、各処理は、エー
ジェント制御部13が実行する。
2の表示は、図12に示した待機中の状態から、例え
ば、図21または図22に示した画像を用いて表現され
る移動の状態に推移する。
るウィンドウと重畳しないようにデスクトップ上を横方
向あるいは縦方向に行われる。なお、アクティブである
ウィンドウ(いまの場合、メーラウィンドウ71)を検
出して、その周囲を横方向あるいは縦方向に行うように
してもよい。エージェント72がデスクトップ上を横方
向(例えば、右方向)に移動するときには、例えば、図
21A乃至図21Dに示される画像が順次用いられるこ
とにより、いわゆるワープしたかのような動画表現が実
現される。
移動開始位置において、図21Aに示されるように、体
の向きが移動する方向とされ、その後、指向している方
向にジャンプすると、図21Bに示されるように、頭部
から順に消滅して行く。そして、移動終了位置におい
て、図21Cに示されるように、脚部から順に表示され
て、最終的には、図21Dに示されるように全身が表示
される。
方向に移動するときには、例えば、図22A乃至図22
Gに示される画像が順次用いられる。すなわち、エージ
ェント72は、移動開始位置において、図22Aに示さ
れるように、自身の尻尾(先端がコンセントプラグの形
状をしている)を手で握り、図22Bに示されるよう
に、尻尾の先端を頭上付近に差し込む。
2C、図22Dに順次示されるように、体の下部から徐
々にロープに変身し、図22Eに示されるように、1本
のロープになってその状態で移動終了位置まで移動す
る。移動終了位置においては、図22F、図22Gに順
次示されるように、頭部から順に復元されて、最終的に
全身が表示される。
いわゆるワープによって表現したり、1本のロープに変
身させて表現したりすることにより、移動中を表現する
ために使われるリソース(メモリなど)の量を軽減させ
ることが可能となる。
て、イベント(メールの送受信、メールの編集、あるい
は関連情報の編集等を指示するコマンドの入力)が発生
したか否かが判定される。イベントが発生していないと
判定された場合、ステップS63に進む。
2の表示が移動の状態に推移した後、所定の時間が経過
したか否かが判定され、所定の時間が経過したと判定さ
れるまで、ステップS62およびステップS63の処理
が繰り返し実行される。ステップS63において、所定
の時間が経過したと判定された場合、ステップS64に
進む。
2の表示は、移動の状態から、例えば、図23に示され
る画像で表現される「遊び」の状態に推移する。図23
Aは、エージェント72が蛇と戯れている状態を示して
おり、図23Bは、エージェント72が尻尾の先端を上
方に差し込み、そこを支点としてぶら下がり揺れている
状態を示している。
したか否かが判定される。イベントが発生していないと
判定された場合、ステップS66に進む。ステップS6
6において、エージェント72の表示が遊びの状態に推
移した後、所定の時間が経過したか否かが判定され、所
定の時間が経過したと判定されるまで、ステップS65
およびステップS66の処理が繰り返し実行される。ス
テップS66において、所定の時間が経過したと判定さ
れた場合、ステップS67に進む。
2の表示は、遊びの状態から、例えば、図24に示され
る画像で表現される「睡眠」の状態に推移する。ステッ
プS68において、イベントが発生したか否かが判定さ
れ、イベントが発生するまで判定処理が繰り返し実行さ
れる。ステップS68において、イベントが発生したと
判定された場合、図7のステップS35にリターンし、
それ以降の処理が実行される。
65において、イベントが発生したと判定された場合も
同様に、図7のステップS35にリターンし、それ以降
の処理が実行される。
いないが、待機中の処理が実行されている最中におい
て、メーラ2が終了されたと判定された場合、ステップ
S46にリターンする。同様に、図7のステップS33
において、メーラ2が終了されたと判定された場合、ス
テップS46に進む。
御部13は、エージェント72の表示を、例えば、図2
5Aおよび図25Bに示される画像で表現される「消
失」の状態に推移させる。図25Aは、エージェント7
2が手を振りながら背を向けて遠方に立ち去る状態を示
しており、図25Bは、エージェント72が徐々に小さ
くなってやがて消失される状態を示している。
吹き出し73、スクラップ帳ウィンドウ74、および推
薦URL91等の表示も消去される。
ル等の文書から重みの高い単語(重要語)を抽出し、関
連情報を推薦する一連の処理に対応して、エージェント
72が動作するので、エージェント72に対して信頼性
や親しみが感じられるようになる。
作および吹き出し73の中の台詞の表示、並びに、表示
された台詞に対応する音声信号の出力については、本発
明のエージェントプログラム1だけでなく、他のアプリ
ケーション、例えば、ゲームやワードプロセッサのヘル
プ画面等に適用することが可能である。さらに、テレビ
ジョン受像機、ビデオカメラ、またはカーナビゲーショ
ン等のディスプレイに表示されるキャラクタに適用する
ことも勿論可能である。
数のユーザが操作する場合、エージェント72の種類を
複数用意して、ユーザ毎に表示されるエージェント72
(図26)の種類を変えるようにしてもよい。また、エ
ージェント72は、ユーザが好みのキャラクタを自由に
作成し、編集できるようにしてもよい。さらに、同一の
ユーザが複数のパーソナルコンピュータ上でエージェン
トプログラム1を利用する場合、異なるパソコン上にお
いても同じエージェント72が表示されるようにしても
よい。
グラム1が実行されている場合、エージェント72は、
常に登場しているものとして説明したが、推薦時にのみ
表示させたり、その設定を変更することができる。
ム1が実行されている状態で、マウスを右クリックし、
図26に示されるようなメニューボックス101を表示
させて、その中から、「いろいろな設定をする」の項目
を選択することにより、図27に示されるような設定画
面を表示させる。
配置されており、「エージェント」と示されたタブがア
クティブとされているとき、ユーザが選択または入力可
能な、エージェントの名前、表示、効果音、推薦間隔、
推薦保存数、推薦するときのせりふ、および推薦データ
更新などの項目が表示される。
れ、所望の情報(エージェントの名前)を入力したり、
あるいは、所定の項目を選択することによって、自分好
みにエージェント72および吹き出し73の表示状態、
あるいは、推薦する関連情報の推薦間隔時間や保存数な
どを設定することができる。
新のタイミングについて説明する。データベースは、図
3のフローチャートを用いて上述したデータベース作成
処理によって作成されるが、次のような第1乃至第3の
状況になった場合、データベースの更新が必要である。
スが作成または更新されてから所定の期間が経過してい
る場合、データベース内の関連情報が古くなってしまう
ので更新が必要である。第2の状況として、データベー
スに蓄積されている関連情報のうちの所定の割合が提示
済みとなった場合、データベース内の関連情報を繰り返
し提示してしまったり、提示する関連情報が不足してし
まうので更新が必要である。第3の状況として、特徴抽
出に用いた文書が、例えば電子メールである場合、電子
メールの送受信を繰り返していると、その文書の内容が
変化するので更新が必要である。
況になった場合(例えば、イベント管理部31がタイマ
31Aを監視し、所定の期間が経過したとき)、ユーザ
に対して更新を指示するように促すこともできるし、ユ
ーザに対する促しを実行せずに、自動的にデータベース
を実行するように設定することも可能である。また、ユ
ーザが指定する任意のタイミングで更新することも勿論
可能である。
ベース更新処理について、図28のフローチャートを参
照して説明する。このデータベース更新処理は、エージ
ェントプログラム1が実行する処理のうちの1つであ
り、エージェントプログラム1の起動とともに開始さ
れ、エージェントプログラム1が終了されるまで繰り返
し実行される。なお、この処理を開始するにあたって、
図3を用いて説明したデータベース作成処理が実行され
ており、データベースが既に作成されているものとす
る。
ログラム1の蓄積部11は、作成済みのデータベースの
更新が必要であるか否かを判定し、更新が必要であると
判定されるまで待機する。この判断基準は、例えば、図
29に示すようなユーザインタフェースの画面を用いて
予めユーザが設定するものとする。図29の例では、4
つの条件が示されており、左端の□(チェックボック
ス)がユーザによってチェックされた場合、対応する条
件が有効となる。なお、1番目の条件では回数が設定可
能とされており、3番目の条件では日数が設定可能とさ
れている。
ると判定された場合、ステップS82に進み、さらに蓄
積部11は、データベースを自動的に更新するように設
定されているか否かを判定し、自動的に更新するように
設定されていないと判定した場合、ステップS83に進
む。一方、ステップS82において、自動的に更新する
ように設定されていると判定された場合、ステップS8
3の処理はスキップされる。
ログラム1の提示部12は、データベースの更新が必要
である旨をユーザに通知するとともに、さらに、その通
知に対応して、ユーザから更新の指示がなされたか否か
を判定する。ユーザから更新の指示がなされたと判定さ
れた場合、ステップS84に進み、ユーザから更新の指
示がなされないと判定された場合、ステップS81に戻
り、上述した処理が繰り返し実行される。
ログラム1の蓄積部11は、データベースを更新する。
具体的には、文書取得部21乃至文書内容処理部23
が、電子メールのメールボックスファイル(例えば、mb
x等の拡張子が付加されていることが多い)を検出し、
その更新日時を取得して、以前に取得した更新日時と比
較して、異なる日付と異なるファイルサイズであれば、
ファイルが更新されていると判断し、追加または変更さ
れた部分を抽出する。この場合、メールのグループ化、
ヘッダの解析、形態素解析、特徴ベクトル算出等、一連
のファイル内の分析が行われ、得られる重要語が関連情
報検索部25に供給される。
ず(所定の話題に追加されるメールがなく)、分析の結
果、更新以前の重要語(検索用キーワード)と更新後の
重要語が同じであれば、重み等の計算値だけを変更し、
関連情報検索部25による関連情報の検索を実行しない
ようにしてもよい。また、関連情報をインターネット等
のネットワーク上で検索する場合、ネットワークに接続
されているか否かが検出され、ネットワークに接続され
ていない場合、関連情報の検索を行わず、それ以後、ネ
ットワークに接続されたときに関連情報を検索するか否
かをユーザに問うようにしてもよい。
いようにするために、あるメールグループの関連情報
を、所定の回数以上推薦したら更新が必要と判断する」
との条件に関連して、取得したメールと類似性の高いメ
ールグループ(話題)を選択する際に、同じメールグル
ープから何度も推薦を行わないように、次のような処理
を行う。
を付与し(例えば、メールグループ内での特徴語の重み
の最大値をそのメールグループの優先度の値とし、優先
度の値を降順に並べたものを優先度の順位として付与す
る)、一度推薦を行ったメールグループを優先順位の最
後尾に並び替えるようにする。このようにすることによ
って、類似度の範囲内にあるメールグループでも、同じ
メールグループから推薦する頻度が減少する。また、優
先順位の変更だけなので、関連情報を大量に検索して準
備しておけば、なるべく同じメールグループからの推薦
が減り、かつ、情報自体も不足することなく用いること
ができる。
の文書量に応じて、類似する話題を抽出する際の範囲を
変化させることができるようにする。具体的には、特徴
抽出する話題の文書量またはデータサイズに応じて何段
階かの類似度の範囲を設定する。例えば、ある話題に含
まれる文書量が10ファイル以内である場合は類似度を
0.01以上、11ファイル以上50ファイル未満の場
合は類似度を0.03以上、50ファイル以上である場
合は類似度を0.05以上とする。または、ある話題の
文書の容量が500kB未満である場合は類似度を0.0
1以上、500kB以上である場合は類似度を0.02以
上とする。
ち、優先度の高い話題から検索された関連情報を提示す
るようにする。このようにすると、文書量の減少によ
り、データベースの内容が更新されると、類似度の範囲
が変化し、類似度の範囲が狭すぎて関連情報が不足した
り、反対に、類似度の範囲が広すぎてユーザにとってあ
まり関連性が明確でない関連情報が提示されるような事
態の発生を抑止することが可能となる。
理においては、追加された文書や変更された文書だけを
処理の対象とするので、データベース作成処理を繰り返
し実行する場合に比べて、処理時間が短縮される。
ーザの興味をより反映することができるようにするため
に、算出された単語の重みを修正することができる。次
に、単語の重みの修正処理について、いくつか例を挙げ
て説明するが、その前に、図30を参照して、データベ
ースに既に記録されている、各話題の特徴ベクトルの例
について説明する。
トル(単語aの重み,単語bの重み,単語cの重み,単
語dの重み,単語eの重み,単語fの重み,単語gの重
み)は、(0,0.54,0.02,0,0,0.01,0)であり、話
題Bの特徴ベクトルは、(0.01,0,0.41,0.33,0.1
6,0,0.64)であり、話題Cの特徴ベクトルは、(0.5
1,0.35,0,0,0.48,0.37,0)である。
題B、および話題C)に含まれる単語の重みを修正する
場合の処理について、第1乃至第3の例を挙げて順に説
明する。
図31のフローチャートを参照して説明する。
書特徴データベース作成部24は、メールの相手毎に、
返信を含む送信した回数(やりとりした頻度)をカウン
トし、送信の頻度の多い順に相手をソートする。なお、
送信(返信)した回数をカウントするだけでなく、受信
した回数もカウントするようにしてもよい。
が、Aさん、Bさん、Cさん、およびDさんであり、や
りとりの頻度が、Aさんとは35回、Bさんとは2回、
Cさんとは28回、Dさんとは4回であるとカウントさ
れた場合、図32に示されるように、やりとりした頻度
が多い順に、Aさん、Cさん、Dさん、Bさんにソート
される。
タベース作成部24は、ステップS102の処理でソー
トされた、やりとりの頻度が上位のメールの相手を抽出
する。
上位n(例えば、n=2)番目までのメールの相手を抽
出するか、所定の頻度m(例えば、m=10)回以上の
メールの相手を抽出するか、上位n番目以上、かつ、所
定の頻度m回以上のメールの相手を抽出するか、あるい
は、その他の方法によってメールの相手を抽出する。こ
こでは、メールの相手の抽出方法は特に問わない。
抽出する場合、図32に示した4人のメールの相手の中
から、AさんとCさんが抽出される。
タベース作成部24は、ステップS103の処理で抽出
された相手とのメール(話題)に含まれる単語の重みを
修正する。
やりとりが、例えば、話題Aであった場合、その話題A
に含まれる単語は、図30に示されるように、b,c,
fである(単語a,d,e,gの重みがそれぞれ0であ
るということは、それらの単語は、話題Aには含まれて
いない)。そして、話題Aに含まれる単語b,c,fの
重みがそれぞれ修正される。
に、予め設定されている重み係数k(例えば、1.2)を
乗算して修正する(相対的に大きくする)。すなわち、
話題Aに含まれる、単語bの重み(=0.54)、単語cの
重み(=0.02)、単語fの重み(=0.01)をそれぞれ1.
2倍する。これにより、図33Aに示されるように、話
題Aの特徴ベクトルが、(0,0.65(≒0.54×1.2),0.
02(≒0.02×1.2),0,0,0.01(≒0.01×1.2),0)
に修正される。
じている話題に含まれる単語の重みを修正することがで
きる。
含まれる単語b、c、fが、AさんCさん以外の人(B
さんとDさん)との話題に含まれる場合にも、該当する
単語の重みに、同様の重み係数k(いまの場合、1.2)
を乗算して修正することもできる。すなわち、図30に
示した話題Bには単語cが含まれており、話題Cには単
語b,fが含まれており、それらの重みをそれぞれ1.2
倍する。これにより、図33Bに示されるように、話題
Bの特徴ベクトルが、(0.01,0,0.49(≒0.41×1.
2),0.33,0.16,0,0.64)に修正されるとともに、話
題Cの特徴ベクトルが、(0.51,0.42(=0.35×1.
2),0,0,0.48,0.44(≒0.37×1.2),0)に修正さ
れる。
手との話題に含まれる単語が、他の話題にも含まれてい
る場合、その単語の重みも修正することによって、メー
ルのやりとりの少ない相手との話題の中から、ユーザが
より興味を持ちやすい単語を重要語として選択すること
ができる。
は順位によって、重み係数kの値を変更するようにして
もよい。具体的には、Aさん(頻度1位)とのメールの
やりとりが、例えば、話題Bであり、その話題Bに含ま
れる単語a,c,d,e,gには、重み係数k1=1.5
を乗算し、Cさん(頻度2位)とのメールのやりとり
が、例えば、話題Cであり、その話題Cに含まれる単語
a,b,e,fには、重み係数k2=1.2を乗算する。
これにより、図33Cに示されるように、話題bの特徴
ベクトルが、(0.02(=0.01×1.5),0,0.62(≒0.41
×1.5),0.50(≒0.33×1.5),0.24(=0.16×1.
5),0,0.96(=0.64×1.5))に修正されるととも
に、話題Cの特徴ベクトルが、(0.61(≒0.51×1.
2),0.42(=0.35×1.2),0,0,0.58(≒0.48×1.
2),0.44(≒0.37×1.2),0)に修正される。
じている話題に含まれる単語の重みを、メールの相手と
のやりとりの頻度に応じて修正することができる。ま
た、重み係数kは、頻度に比例した値でも、任意に設定
した値でも、いずれでもよい。
図34のフローチャートを参照して説明する。
タベース作成部24は、話題毎にグループ化されている
複数のメールの中から、送信(返信を含む)メールを特
定し、その送信メールに含まれる単語を抽出する。ステ
ップS112において、文書特徴データベース作成部2
4は、ステップS111の処理で抽出された返信メール
に対応する元の受信メールを特定し、その受信メールに
含まれる単語を抽出する。
したメールに含まれる単語b,cが抽出され、話題Bに
対して返信したメールに含まれる単語e,gが抽出さ
れ、その返信メールに対応する元の受信メールに含まれ
る単語cが抽出される。
タベース作成部24は、ステップS111およびS11
2の処理でそれぞれ抽出された単語の重みを修正する。
含まれる単語の重みに、予め設定されている重み係数k
1(例えば、1.5)を乗算して修正するとともに、返信
メールに対応する元の受信メールに含まれる単語の重み
に、重み係数k2(例えば、1.2)を乗算して修正す
る。これにより、図35に示されるように、話題Aの特
徴ベクトルが、(0,0.81(≒0.54×1.5),0.03(≒0.
02×1.5),0,0,0.01,0)に修正され、話題Bの特徴
ベクトルが、(0.01,0,0.49(≒0.41×1.2),0.33,
0.24(=0.16×1.5),0,0.96(=0.64×1.5))に修
正される。
たメールに含まれる単語の重みを修正することによって
(ユーザが積極的に使用する単語の重みを修正すること
によって)、ユーザがより興味を感じている単語を重要
語として選択することができる。なお、受信のみのメー
ルについては、興味がないものとして重みを修正しない
ようにする。
それぞれ重み係数を設定するようにしたり、あるいは、
特定の話題において、送信(返信を含む)メールに含ま
れる単語および返信メールに対応する元の受信メールに
含まれる単語が、他の話題にも含まれている場合、その
単語の重みも修正するようにしてもよい。
図36のフローチャートを参照して説明する。
タベース作成部24は、話題内の各単語のうち、特定の
地域や名称を示す固有名詞を抽出する。これにより、例
えば、単語b,fが固有名詞として抽出される。
タベース作成部24は、ステップS121の処理で抽出
された単語の重みを修正する。
ある単語の重みに、予め設定されている重み係数k(例
えば、1.5)を乗算して修正する。すなわち、図30に
示した各話題に含まれる単語b,fの重みをそれぞれ1.
5倍する。これにより、図37に示されるように、話題
Aの特徴ベクトルが、(0,0.81(≒0.54×1.5),0.0
2,0,0,0.02(≒0.01×1.5),0)に修正され、話題
Cの特徴ベクトルが、(0.51,0.53(=0.35×1.5),
0,0,0.48,0.56(≒0.37×1.5),0)に修正される
(話題Bには、単語b,fは含まれていない)。
じている単語の重みを修正することができる。また、固
有名詞の種類(例えば、地名、組織名、商品名、または
人名など)に応じて、重み係数kの値を変更するように
してもよい。ただし、人名(単語)の重みを修正したと
しても、それを重要語として選択することはできないの
で、人名の重みは修正しないようにする。
態、または品詞(固有名詞)によって、単語の重みを修
正する場合を説明したが、勿論、これらを組み合わせ
て、単語の重みを修正することもできる。さらに、ユー
ザの興味がより反映されるものであれば、単語の重みの
修正処理は、これに限られるものではない。
とめ分類した分野辞書を設け、この分野辞書に含まれる
か否かによって、文書特徴データベース作成部24が、
データベースに含まれる単語の重みを修正するようにし
てもよい。
プログラムの機能ブロックの、他の構成例を示す図であ
る。
ば、人文、芸術、または科学等の領域、分野、またはカ
テゴリー毎に対応する単語をまとめたデータベースであ
る。分野辞書201には、ユーザが興味を示す分野を中
心とする複数の分野が形成されており、各分野には、対
応する単語がまとめられている。
分野辞書201を参照し、作成したデータベースに含ま
れる単語がこの分野辞書201に登録されているか否か
を判定し、目的の単語が分野辞書201に含まれている
場合、その単語の重みを修正する。
分野辞書201に含まれている場合(ユーザの興味があ
る分野の単語である場合)、文書特徴データベース作成
部24は、その単語の重みを修正する。これにより、デ
ータベースの単語の重みづけにユーザの興味を反映する
ことができる。
て、文書特徴データベース作成部24による分野辞書を
用いた重み修正処理について説明する。
特徴データベース作成部24は、分野辞書201を参照
し、データベースに登録されている単語に対応する単語
を検索する。文書特徴データベース作成部24は、分野
辞書201より、データベースに登録されている単語と
同一の単語、同じ分野に属する単語等のように、対応す
る単語を検索する。
特徴データベース作成部24は、検索結果に基づいて、
対応する単語が存在するか否かを判定し、存在すると判
定した場合、ステップS143に処理を進める。
データベース作成部24は、分野辞書201より検索さ
れた単語を抽出し、ステップS144において、データ
ベースを参照して、抽出した単語に対応する重みを修正
し、分野辞書201を用いた重み修正処理を終了する。
果より、データベースに含まれる単語に対応する単語が
存在しないと判定した場合、文書特徴データベース作成
部24は、ステップS143および144の処理を省略
して、分野辞書201を用いた重み修正処理を終了す
る。
トル(単語Aの重み,単語Bの重み,単語Cの重み,単
語Dの重み,単語Eの重み,単語Fの重み,単語Gの重
み)が(1.1,0.1,0,0,1.4,5.1,3.8)である場
合、データベース問い合わせ部32により2語が最重要
語として選択されるとすると、最重要語は、単語Fおよ
び単語Gとなる。
A,単語B,単語D,単語H,単語K,および単語Lが
含まれており、文書特徴データベース作成部24が、デ
ータベースに記録されているこれらの単語の重みを5倍
に修正したとすると、上述した特徴ベクトルは、(5.
5,0.5,0,0,1.4.5.1,3.8)に修正されており、デ
ータベース問い合わせ部32は、単語Aおよび単語Fを
最重要語として選択する。
対応する単語が含まれる、データベースの単語の重みを
全て一定の割合で修正するように説明したが、これに限
らず、分野辞書201に含まれる単語毎に修正する割合
を変化させるようにしてもよい。
作成部24は、分野辞書201を用いて重み修正処理を
行う。
成部24が分野辞書201に含まれる単語に対応する、
データベースに含まれる単語の重みを修正するように説
明したが、これに限らず、分野辞書201に含まれる単
語に対応する、データベースの単語を、最重要語に指定
するようにしても良い。
よる分野辞書を用いた重み修正処理の他の例について、
図40のフローチャートを参照して説明する。
に、ステップS161において、分野辞書201を参照
し、データベースに登録されている単語に対応する単語
を検索する。文書特徴データベース作成部24は、分野
辞書201より、データベースに登録されている単語と
同一の単語、同じ分野に属する単語等のように、対応す
る単語を検索する。
特徴データベース作成部24は、検索結果に基づいて、
対応する単語が存在するか否かを判定し、存在すると判
定した場合、ステップS163に処理を進める。
データベース作成部24は、分野辞書201より検索さ
れた単語を抽出し、ステップS164において、データ
ベースを参照して、抽出した単語を最重要語としてデー
タベースに登録し、分野辞書201を用いた重み修正処
理を終了する。
果より、データベースに含まれる単語に対応する単語が
存在しないと判定した場合、文書特徴データベース作成
部24は、ステップS163および164の処理を省略
して、分野辞書201を用いた重み修正処理を終了す
る。
トル(単語Aの重み,単語Bの重み,単語Cの重み,単
語Dの重み,単語Eの重み,単語Fの重み,単語Gの重
み)が(1.1,0.1,0,0,1.4,5.1,3.8)である場
合、データベース問い合わせ部32により2語が最重要
語として選択されるとすると、最重要語は、単語Fおよ
び単語Gとなる。
A,単語B,単語D,単語H,単語K,および単語Lが
含まれており、文書特徴データベース作成部24が、デ
ータベースに記録されているこれらの単語を最重要語と
してデータベースに登録したとすると、上述した特徴ベ
クトルは、(1.1,0.1,0,0,1.4,5.1,3.8)のまま
であるが、データベース問い合わせ部32は、最重要語
に指定された単語Aおよび単語Bを最重要語として選択
する。なお、単語Dも分野辞書201に含まれている
が、単語Dの重みの値が「0」であるため、指定されて
いない。
作成部24は、分野辞書201に含まれる単語に対応す
る、データベースに記録されている単語を最重要語とし
て指定しておき、データベース問い合わせ部32は、最
重要語に指定された単語を最重要語として選択する。
単語は6個として説明したが、これに限らず、いくつで
あってもよい。また、その分野辞書201の構造はどの
ような構造であってもよい。
1の作成方法について説明する。
または配布されているような、階層構造またはグループ
構造などで形成されたシソーラス辞書やオントロジー辞
書を用いて作成される。
ケーションと同じ配布メディアに同梱され、CPU41に
より、ドライブ51に装着されたそのメディアから記憶
部49にインストールされる。そして、CPU41は、イ
ンストールされた辞書を参照し、分野辞書201を生成
する。
た辞書の全部または一部より単語を抽出し、さらに、そ
の辞書の構造(階層、グループ等)を反映させながら、
分野辞書201を生成する。
は、生成する場合と同様に、ドライブ51に装着された
メディアから新たにインストールされた辞書を参照し
て、更新処理を行う。
り、インターネットに代表されるネットワークから取得
されるようにしてもよい。このとき、CPU41は、上述
した場合と同様に分野辞書201を生成する。また、こ
の場合、CPU41は、所定の間隔で定期的に、またはユ
ーザの指示に基づいて、ネットワークより新たな辞書を
取得し、分野辞書201の情報を更新する。
ーラス辞書やオントロジー辞書以外にも、例えば、感度
良く頻繁に抽出する単語をリスト化したものであっても
よい。また、ユーザの入力により直接分野辞書201が
作成されるようにしてもよい。
上述したような既存の辞書以外から作成されるようにし
てもよい。例えば、分野辞書201は、オンラインショ
ッピングのサイト、掲示板サイト、または、カテゴリー
別検索サイト等のようなインターネット上のWEBページ
を用いて作成される。
れているインターネット上から上述したようなWEBペー
ジを取得する。そして、そのWEBページに基づいて、分
野辞書201を生成する。すなわち、CPU41は、取得
したWEBページに含まれる、例えば商品名等のような単
語を抽出し、さらにそのWEBページの構造(階層、グル
ープ等)を反映させながら、分野辞書201を生成す
る。
的に、またはユーザの指示に基づいて、ネットワークよ
り新たなWEBページを取得し、分野辞書201の情報を
更新する。
のステップS6において、文書特徴データベース作成部
24からの検索用キーワード(重要語)を検索条件とし
て、インターネット上の検索エンジンにアクセスして検
索結果を取得する際に、外部のサーバ(図示せず)が使
用された検索用キーワードを取得し、そのキーワードに
基づいて情報を作成するようにし、その作成された情報
に基づいて、分野辞書201が作成されるようにしても
よい。
関連情報検索部25が用いた検索用キーワードを取得し
て蓄積し、使用頻度に応じてランキングされた単語のリ
ストを生成する。
そのリストを取得し、そのリストに基づいて、分野辞書
201を生成する。
は、取得した検索用キーワードより、ユーザ(Xさん,Y
さん,・・・)毎のリストを生成し、各単語が使用された
頻度に応じて、単語をグループ化する。
度の高い単語を単純にリスト化しただけの辞書ではな
く、同じトピック(TopicX01乃至TopicX04、並びに、To
picY01乃至TopicY03)の中から用いられる検索用キーワ
ードの組み合わせに基づいて、検索用キーワードをグル
ープ化(Gp1,Gp2)したリストを生成している。
検索用キーワードを用いているユーザを、検索用キーワ
ードを成分とするベクトル同士の内積をとり、一定範囲
内のユーザ同士をまとめるるなどして、グループ化し、
同じグループ内のユーザの用いる検索用キーワードだけ
を抽出するようにしてもよい。
41が、関連情報にアクセスする操作や関連情報を保存
するような操作についての操作情報を取得して、記憶部
49等に記録し、所定のタイミングでその捜査情報をサ
ーバに供給するようにし、サーバは、その操作情報に基
づいて、ユーザの評価が高い(ユーザが対応する関連情
報に興味があった)検索用キーワードを優先的にリスト
化するようにしてもよい。
書201を更新する場合、CPU41は、所定のタイミン
グでサーバにアクセスしてリストを取得し、そのリスト
に基づいて、分野辞書201の情報を更新する。
情報に基づいて、作成することができる。
様々な方法で作成された複数の分野辞書で構成されるよ
うにしてもよい。
4が参照する分野辞書を、分野辞書201に含まれる複
数の分野辞書の中から、ユーザが、自分が興味あるもの
をダウンロードするなどして、予め選択しておくように
してもよいし、分野辞書201が、全ての話題に含まれ
ている全単語の内、より多くの単語を含む分野辞書を予
め選択するようにしてもよいし、検索語に基づく分野辞
書を利用する場合、分野辞書201が、自分の検索語が
多く登録されているものを選択するようにしてもよい
し、外部のサーバにおいて、分野辞書を提供する場合、
契約内容、または、利用履歴等に応じて、サーバ側がユ
ーザをグループ化し、優先するサービス内容によって、
提供する辞書を選択するようにしてもよい。
るとして記録された単語については、文書特徴データベ
ース作成部24での重み計算時に、より重みを高く扱う
ように説明したが、これに限らず、例えば、文書内容処
理部23が単語の重みを算出する際に、分野辞書201
に含まれる単語の重みを上げるようにしてもよい。
ップS3において行う形態素解析処理において使用され
る形態素解析辞書の変形が可能である場合、予め、形態
素解析辞書に含まれる品詞部分に新たな品詞(例えば、
「一般興味品詞」等)を追加し、その品詞(一般興味品
詞)を分野辞書201に含まれる単語に対応させてお
く。そして、文書内容処理部23が、図3のステップS
4において、tf・idf法を用いて単語に重み付けを行う
際に、その品詞の単語の重みを上げるようにする。この
ようにすることにより、文書内容処理部23が単語の重
みを算出する際に、分野辞書201に含まれる単語の重
みを上げることができる。
品詞)が既に用意されている品詞よりも優先的に判定さ
れるように所定の値を振ることにより、分野辞書201
に含まれる単語が既に用意されている品詞である場合に
おいても、その単語は、追加された新たな品詞(一般興
味品詞)として判定されるので、その単語の重みを上げ
ることができる。
とにより、ユーザが興味を示す分野の関連情報が提示さ
れやすくなるように、データベースの単語の重みを修正
することができる。
す分野の関連情報が提示されやすくなるように、データ
ベースの単語の重みをあげるように、分野辞書201を
用いるように説明したが、これに限らず、重みを下げる
ために、分野辞書201を用いるようにしてもよい。
ープに対してだけ、教育上好ましくない分野の単語の重
みが下がるようにするなど、特定のユーザグループに対
してだけ、特定の単語の重みが下がるようにする、また
は、その単語の重みに「0」を乗算し、重みを「0」に
するために、分野辞書201を用いるようにしてもよ
い。
重みを修正する場合を例にして説明したが、これに限ら
ず、ワードプロセッサプログラム3によって作成された
文書に含まれる単語にも、同様にして重みを修正するこ
とができる。その場合、話題毎ではなく、フォルダ毎あ
るいは1つの作成文書毎に含まれる単語の重みを修正す
るようにしてもよい。
りとりにより抽出される単語に基づいて、一律にデータ
ベースを作成してしまうと、ユーザが興味を示している
話題、および興味を示していない話題が同等に扱われて
しまうが、図31、図34、および図36のフローチャ
ートを用いて説明した、単語の重みの修正処理を実行す
ることによって、ユーザがより興味を示している単語の
重みを修正することができ、意義のあるデータベースを
作成することができる。従って、図5の関連情報提示処
理のステップS15において、ユーザの興味がより高い
と思われる単語を重要語として選択しやすくなるととも
に、文書や話題の特徴ベクトルの内、ユーザの興味のあ
る分野に関連する要素を大きくすることにより、よりユ
ーザの興味を反映した精度の良い話題の抽出が可能とな
り、結果としてユーザの興味を精度良く反映した関連情
報を提示できる。
連する要素を小さくすることにより、ユーザにとって有
用でない重要語を排除でき、無意味な特徴ベクトルの要
素に基づいた話題の抽出を抑制できるので、ユーザの所
望しない関連情報の提示を抑制できる。
5のステップS16の処理に対応して図7のステップS
39において、文書の属性情報を選択(推薦)した理由
としてデスクトップに表示させるように説明したが、そ
の際、表示する属性情報を一部に限定するようにし、同
じ属性情報より複数の表示パターンを生成することがで
きるようにしてもよい。
ターンを生成する例を示す図である。
1年8月21日」、「Aさん」、および「パーティ」等
の属性情報、並びに、「ワインとケーキ」というキーワ
ードより選択(推薦)理由を生成してデスクトップに表
示させる場合、エージェント制御部13は、図42Bに
示すように、これらの全ての単語を用いて、「2001
年8月21日にAさんとパーティについて話していたで
しょ。その話題に出てきたワインとケーキに関連する情
報があるよ。」のような文章の選択(推薦)理由を生成
し、エージェント72の吹き出し73に表示させるよう
にしてもよいし、図42C乃至図42Eに示すように、
上述した単語の一部を用いて、異なる文章を選択(推
薦)理由として生成し、エージェント72の吹き出し7
3に表示させるようにしてもよい。
5のステップS16の処理に対応して図7のステップS
39において、図42Cに示すように「2001年8月
21日」および「Aさん」を用いて「2001年8月2
1日にAさんとメールで話していたでしょ。これに関す
る情報があるよ。」という文章、図42Dに示すように
「Aさん」および「パーティ」を用いて「Aさんとパー
ティについて話していたことがあったよね。これに関す
る情報があるよ。」という文章、または、図42Eに示
すように「Aさん」および「ワインとケーキ」を用いて
「Aさんとワインとケーキについて話していたことがあ
ったよね。関連情報があるよ。」という文章のいずれか
を生成し、エージェント72の吹き出し73に表示させ
る。
3は、同じ文書を選択(推薦)理由として何度も用いた
場合においても、毎回異なる文章を生成して表示させる
ので、ユーザの興味を低減することを抑制することがで
きる。
合わせを記憶部49に記憶させておき、エージェント制
御部13が選択(推薦)理由の文章生成する際にそのデ
ータを参照し、同じ組み合わせの単語を用いないように
してもよい。
理由を構成する単語の類義語、上位概念語、または、関
連語等を、シソーラス辞書、オントロジー辞書(いずれ
も図示せず)等を用いて検索し、推薦理由を構成する単
語として利用してもよい。例えば、図42Aの「200
1年8月21日」に基づいて、「8月下旬」、「夏の終
わり」等を、推薦理由を構成する単語として適用しても
よいし、図42Aの「パーティ」に基づいて、「お祝
い」等を、推薦理由を構成する単語として適用してもよ
いし、図42Aの「ワインとケーキ」に基づいて、「洋
酒と洋菓子」等を、推薦理由を構成する単語として適用
してもよい。
述したようにメーラ2によって送受信される文書やワー
ドプロセッサプログラム3で編集される文書の他、例え
ば、チャット、電子ニュース、電子掲示板等の文書や音
声信号をテキスト化した文書など、属性情報としてタイ
ムスタンプが付与されている文書に対応して動作するよ
うにさせることができる。
トプログラム1は、パーソナルコンピュータに予め組み
込まれるか、あるいは、記録媒体からインストールされ
る。
行させることもできるが、通常、ソフトウェアにより実
行させる。一連の処理をソフトウェアにより実行させる
場合には、そのソフトウェアを構成するエージェントプ
ログラム1が、専用のハードウェアに組み込まれている
コンピュータ、または、各種のプログラムをインストー
ルすることで、各種の機能を実行することが可能な、例
えば汎用のパーソナルコンピュータなどに、記録媒体か
らインストールされる。
ュータによって実行可能な状態とされるプログラムを記
録する記録媒体は、図2に示されるように、プログラム
が記録されている磁気ディスク52(フレキシブルディ
スクを含む)、光ディスク53(CD-ROM(Compact Disk
-Read Only Memory),DVD(Digital Versatile Disk)
を含む)、光磁気ディスク54(MD(Mini-Disk)(商
標)を含む)、もしくは半導体メモリ55などよりなる
パッケージメディア、または、プログラムが一時的もし
くが永続的に記録されるROM42や記憶部49を構成す
るハードディスクなどにより構成される。記録媒体への
プログラムの記録は、必要に応じてルータ、モデムなど
のインタフェースを介して、公衆回線網、ローカルエリ
アネットワーク、インターネット、デジタル衛星放送と
いった、有線または無線の通信媒体を利用して行われ
る。
されるプログラムを記述するステップは、記載された順
序に沿って時系列的に行われる処理はもちろん、必ずし
も時系列的に処理されなくとも、並列的あるいは個別に
実行される処理をも含むものである。
にプログラムによれば、既存の文書情報から第1の特徴
語が抽出するとともに、所定の文書情報から第2の特徴
語を抽出し、第1の特徴語の第1の重みおよび第2の特
徴語の第2の重みを算出し、所定の条件に基づいて算出
された第1の重みを修正し、第1の特徴語および第1の
重みに基づいて、既存の文書情報に対応付ける関連情報
を取得し、第2の特徴語に基づいて、所定の文書情報に
関連する既存の文書情報を検索し、検索された既存の文
書情報に対応付けられている関連情報を表示するように
したので、ユーザの興味の度合いに応じて関連情報を提
示することができる。
能ブロックの一構成例を示す図である。
行させるパーソナルコンピュータの構成例を示すブロッ
ク図である。
理を説明するフローチャートである。
である。
説明するフローチャートである。
図である。
トである。
説明するフローチャートである。
示例を示す図である。
図である。
を示す図である。
示す図である。
示す図である。
の表示例を示す図である。
例を示す図である。
す図である。
ィンドウの表示例を示す図である。
例を示す図である。
示例を示す図である。
例を示す図である。
例を示す図である。
例を示す図である。
例を示す図である。
図である。
処理を説明するフローチャートである。
ーザインタフェースの表示例を示す図である。
ャートである。
の相手とその頻度を示す図である。
である。
ャートである。
である。
ャートである。
である。
機能ブロックの、他の構成例を示す図である。
野辞書を用いた重み修正処理について説明するフローチ
ャートである。
野辞書を用いた重み修正処理の他の例について説明する
フローチャートである。
て、単語をグループ化する様子を示す図である。
する例を示す図である。
蓄積部, 12 提示部, 13 エージェント制御
部, 21 文書取得部, 22 文書属性処理部,
23 文書内容処理部, 24 文書特徴データベース
作成部, 25関連情報検索部, 31 イベント管理
部, 32 データベース問い合わせ部, 33 関連
情報提示部, 52 磁気ディスク, 53 光ディス
ク, 54 光磁気ディスク, 55 半導体メモリ,
72 エージェント, 73吹き出し, 74 スク
ラップ帳ウィンドウ, 81 入力ウィンドウ, 91
推薦URL, 201 分野辞書
Claims (69)
- 【請求項1】 既存の文書情報および所定の文書情報に
関連する関連情報を提示する情報処理装置において、 前記既存の文書情報から第1の特徴語を抽出するととも
に、前記所定の文書情報から第2の特徴語を抽出する抽
出手段と、 前記抽出手段により抽出された、前記第1の特徴語の第
1の重みを算出するとともに、前記第2の特徴語の第2
の重みを算出する重み算出手段と、 所定の条件に基づいて、前記重み算出手段により算出さ
れた前記第1の重みを修正する重み修正手段と、 前記抽出手段により抽出された前記第1の特徴語、およ
び前記重み修正手段により修正された前記第1の重みに
基づいて、前記既存の文書情報に対応付ける前記関連情
報を取得する取得手段と、 前記第2の特徴語に基づいて、前記所定の文書情報に関
連する前記既存の文書情報を検索する検索手段と、 前記検索手段により検索された前記既存の文書情報に対
応付けられている前記関連情報の表示を制御する表示制
御手段とを備えることを特徴とする情報処理装置。 - 【請求項2】 前記取得手段は、前記既存の文書情報に
おける、複数の前記第1の特徴語の中から、前記第1の
重みに基づいて重要語を選択し、前記重要語に関連する
前記関連情報を取得することを特徴とする請求項1に記
載の情報処理装置。 - 【請求項3】 前記検索手段は、前記第1の重みと前記
第2の重みから類似度を算出し、前記類似度に基づい
て、前記所定の文書情報に対応する前記既存の文書情報
を検索することを特徴とする請求項1に記載の情報処理
装置。 - 【請求項4】 前記既存の文書情報および前記所定の文
書情報から属性情報を抽出する属性情報抽出手段をさら
に備えることを特徴とする請求項1に記載の情報処理装
置。 - 【請求項5】 前記属性情報抽出手段により抽出された
前記属性情報に基づいて、1または複数の前記既存の文
書情報をグループ化して文書情報群を作成するグループ
化手段をさらに備え、 前記抽出手段は、前記文書情報群から前記第1の特徴語
を抽出し、 前記重み算出手段は、前記第1の特徴語の前記第1の重
みを算出し、 前記取得手段は、前記第1の特徴語および前記第1の重
みに基づいて、前記文書情報群に対応付ける前記関連情
報を取得し、 前記検索手段は、前記第2の特徴語に基づいて、前記所
定の文書情報に対応する前記文書情報群を検索すること
を特徴とする請求項4に記載の情報処理装置。 - 【請求項6】 前記重み修正手段は、前記属性情報抽出
手段により抽出された前記属性情報に基づいて、前記第
1の重みを修正することを特徴とする請求項4に記載の
情報処理装置。 - 【請求項7】 前記重み修正手段は、特定の宛先への送
信または前記特定の宛先からの受信の頻度に応じて、前
記第1の重みを修正することを特徴とする請求項1に記
載の情報処理装置。 - 【請求項8】 前記重み修正手段は、前記情報処理装置
の使用者が作成した前記既存の文書情報から抽出された
前記第1の特徴語の前記第1の重みを修正することを特
徴とする請求項1に記載の情報処理装置。 - 【請求項9】 前記重み修正手段は、他の前記既存の文
書情報から抽出された、前記第1の特徴語と同じ特徴語
の重みを、前記第1の重みと同様にさらに修正すること
を特徴とする請求項1に記載の情報処理装置。 - 【請求項10】 前記重み修正手段は、前記第1の特徴
語の種類に基づいて、前記第1の重みを修正することを
特徴とする請求項1に記載の情報処理装置。 - 【請求項11】 前記既存の文書情報の前記第1の特徴
語に関連付けて、前記取得手段により取得された前記関
連情報を用いてデータベースを構築するデータベース構
築手段をさらに備え、 前記検索手段は、前記第2の特徴語に基づいて、前記デ
ータベース構築手段により構築された前記データベース
から、前記所定の文書情報に関連する前記既存の文書情
報を検索することを特徴とする請求項1に記載の情報処
理装置。 - 【請求項12】 所定のイベントの発生を検知する検知
手段をさらに備え、 前記所定の文書情報は、前記検知手段により検知された
前記所定のイベントの発生に対応する文書であることを
特徴とする請求項1に記載の情報処理装置。 - 【請求項13】 前記既存の文書情報および前記所定の
文書情報は電子メールであることを特徴とする請求項1
に記載の情報処理装置。 - 【請求項14】 所定のデータ構造で構成された単語群
からなる、単語間の関係を示すデータベースである分野
辞書を作成する分野辞書作成手段をさらに備え、 前記重み修正手段は、前記分野辞書作成手段により作成
された前記分野辞書に基づいて、前記重み算出手段によ
り算出された前記第1の重みを修正することを特徴とす
る請求項1に記載の情報処理装置。 - 【請求項15】 前記分野辞書は、前記単語群が、各前
記単語の属する分野によってグループ化され、記録され
ているデータベースであることを特徴とする請求項1に
記載の情報処理装置。 - 【請求項16】 前記分野辞書は、前記単語群が、前記
単語間の関係に基づいて階層構造に配置され、記録され
ているデータベースであることを特徴とする請求項1に
記載の情報処理装置。 - 【請求項17】 前記分野辞書は、前記単語群が、各前
記単語に割り当てられた重要度に基づいてリスト化され
たデータベースであることを特徴とする請求項1に記載
の情報処理装置。 - 【請求項18】 前記分野辞書は、既存の辞書データベ
ースに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項1に記載の情
報処理装置。 - 【請求項19】 前記分野辞書は、所定のWEBページデ
ータに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項1に記載の情
報処理装置。 - 【請求項20】 前記分野辞書は、以前に前記検索手段
により用いられた前記第2の特徴語のリストに含まれる
前記単語群および前記単語群が形成するデータ構造を含
むことを特徴とする請求項1に記載の情報処理装置。 - 【請求項21】 前記重み修正手段は、前記分野辞書に
含まれる前記単語に対応する前記第1の特徴語の前記第
1の重みを修正することを特徴とする請求項1に記載の
情報処理装置。 - 【請求項22】 既存の文書情報および所定の文書情報
に関連する関連情報を提示する情報処理装置の情報処理
方法において、 前記既存の文書情報から第1の特徴語を抽出するととも
に、前記所定の文書情報から第2の特徴語を抽出する抽
出ステップと、 前記抽出ステップの処理により抽出された、前記第1の
特徴語の第1の重みを算出するとともに、前記第2の特
徴語の第2の重みを算出する重み算出ステップと、 所定の条件に基づいて、前記重み算出ステップの処理に
より算出された前記第1の重みを修正する重み修正ステ
ップと、 前記抽出ステップの処理により抽出された前記第1の特
徴語、および前記重み修正ステップの処理により修正さ
れた前記第1の重みに基づいて、前記既存の文書情報に
対応付ける前記関連情報の取得を制御する取得制御ステ
ップと、 前記第2の特徴語に基づいて、前記所定の文書情報に関
連する前記既存の文書情報を検索する検索ステップと、 前記検索ステップの処理により検索された前記既存の文
書情報に対応付けられている前記関連情報の表示を制御
する表示制御ステップとを含むことを特徴とする情報処
理方法。 - 【請求項23】 前記取得制御ステップは、前記既存の
文書情報における、複数の前記第1の特徴語の中から、
前記第1の重みに基づいて重要語を選択し、前記重要語
に関連する前記関連情報の取得を制御することを特徴と
する請求項22に記載の情報処理方法。 - 【請求項24】 前記検索ステップは、前記第1の重み
と前記第2の重みから類似度を算出し、前記類似度に基
づいて、前記所定の文書情報に対応する前記既存の文書
情報を検索することを特徴とする請求項22に記載の情
報処理方法。 - 【請求項25】 前記既存の文書情報および前記所定の
文書情報から属性情報を抽出する属性情報抽出ステップ
をさらに含み、 前記重み修正ステップは、前記属性情報抽出ステップの
処理により抽出された前記属性情報に基づいて、前記第
1の重みを修正することを特徴とする請求項22に記載
の情報処理方法。 - 【請求項26】 前記属性情報抽出ステップの処理によ
り抽出された前記属性情報に基づいて、1または複数の
前記既存の文書情報をグループ化して文書情報群を作成
するグループ化ステップをさらに含むことを特徴とする
請求項22に記載の情報処理方法。 - 【請求項27】 前記重み修正ステップは、特定の宛先
への送信または前記特定の宛先からの受信の頻度に応じ
て、前記第1の重みを修正することを特徴とする請求項
22に記載の情報処理方法。 - 【請求項28】 前記重み修正ステップは、前記第1の
特徴語の種類に基づいて、前記第1の重みを修正するこ
とを特徴とする請求項22に記載の情報処理方法。 - 【請求項29】 前記既存の文書情報の前記第1の特徴
語に関連付けて、前記取得制御ステップの処理により取
得が制御された前記関連情報を用いてデータベースを構
築するデータベース構築ステップをさらに含むことを特
徴とする請求項22に記載の情報処理方法。 - 【請求項30】 所定のデータ構造で構成された単語群
からなる、単語間の関係を示すデータベースである分野
辞書を作成する分野辞書作成ステップをさらに含み、 前記重み修正ステップは、前記分野辞書作成ステップの
処理により作成された前記分野辞書に基づいて、前記重
み算出ステップの処理により算出された前記第1の重み
を修正することを特徴とする請求項22に記載の情報処
理方法。 - 【請求項31】 前記分野辞書は、前記単語群が、各前
記単語の属する分野によってグループ化され、記録され
ているデータベースであることを特徴とする請求項22
に記載の情報処理方法。 - 【請求項32】 前記分野辞書は、前記単語群が、前記
単語間の関係に基づいて階層構造に配置され、記録され
ているデータベースであることを特徴とする請求項22
に記載の情報処理方法。 - 【請求項33】 前記分野辞書は、前記単語群が、各前
記単語に割り当てられた重要度に基づいてリスト化され
たデータベースであることを特徴とする請求項22に記
載の情報処理方法。 - 【請求項34】 前記分野辞書は、既存の辞書データベ
ースに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項22に記載の
情報処理方法。 - 【請求項35】 前記分野辞書は、所定のWEBページデ
ータに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項22に記載の
情報処理方法。 - 【請求項36】 前記分野辞書は、以前に前記検索ステ
ップの処理により用いられた前記第2の特徴語のリスト
に含まれる前記単語群および前記単語群が形成するデー
タ構造を含むことを特徴とする請求項22に記載の情報
処理方法。 - 【請求項37】 前記重み修正ステップは、前記分野辞
書に含まれる前記単語に対応する前記第1の特徴語の前
記第1の重みを修正することを特徴とする請求項22に
記載の情報処理方法。 - 【請求項38】 既存の文書情報および所定の文書情報
に関連する関連情報を提示する情報処理装置を制御する
プログラムであって、 前記既存の文書情報から第1の特徴語を抽出するととも
に、前記所定の文書情報から第2の特徴語を抽出する抽
出ステップと、 前記抽出ステップの処理により抽出された、前記第1の
特徴語の第1の重みを算出するとともに、前記第2の特
徴語の第2の重みを算出する重み算出ステップと、 所定の条件に基づいて、前記重み算出ステップの処理に
より算出された前記第1の重みを修正する重み修正ステ
ップと、 前記抽出ステップの処理により抽出された前記第1の特
徴語、および前記重み修正ステップの処理により修正さ
れた前記第1の重みに基づいて、前記既存の文書情報に
対応付ける前記関連情報の取得を制御する取得制御ステ
ップと、 前記第2の特徴語に基づいて、前記所定の文書情報に関
連する前記既存の文書情報を検索する検索ステップと、 前記検索ステップの処理により検索された前記既存の文
書情報に対応付けられている前記関連情報の表示を制御
する表示制御ステップとを含むことを特徴とするコンピ
ュータが読み取り可能なプログラムが記録されている記
録媒体。 - 【請求項39】 前記取得制御ステップは、前記既存の
文書情報における、複数の前記第1の特徴語の中から、
前記第1の重みに基づいて重要語を選択し、前記重要語
に関連する前記関連情報の取得を制御することを特徴と
する請求項38に記載の記録媒体。 - 【請求項40】 前記検索ステップは、前記第1の重み
と前記第2の重みから類似度を算出し、前記類似度に基
づいて、前記所定の文書情報に対応する前記既存の文書
情報を検索することを特徴とする請求項38に記載の記
録媒体。 - 【請求項41】 前記既存の文書情報および前記所定の
文書情報から属性情報を抽出する属性情報抽出ステップ
をさらに含み、 前記重み修正ステップは、前記属性情報抽出ステップの
処理により抽出された前記属性情報に基づいて、前記第
1の重みを修正することを特徴とする請求項38に記載
の記録媒体。 - 【請求項42】 前記属性情報抽出ステップの処理によ
り抽出された前記属性情報に基づいて、1または複数の
前記既存の文書情報をグループ化して文書情報群を作成
するグループ化ステップをさらに含むことを特徴とする
請求項38に記載の記録媒体。 - 【請求項43】 前記重み修正ステップは、特定の宛先
への送信または前記特定の宛先からの受信の頻度に応じ
て、前記第1の重みを修正することを特徴とする請求項
38に記載の記録媒体。 - 【請求項44】 前記重み修正ステップは、前記第1の
特徴語の種類に基づいて、前記第1の重みを修正するこ
とを特徴とする請求項38に記載の記録媒体。 - 【請求項45】 前記既存の文書情報の前記第1の特徴
語に関連付けて、前記取得制御ステップの処理により取
得が制御された前記関連情報を用いてデータベースを構
築するデータベース構築ステップをさらに含むことを特
徴とする請求項38に記載の記録媒体。 - 【請求項46】 所定のデータ構造で構成された単語群
からなる、単語間の関係を示すデータベースである分野
辞書を作成する分野辞書作成ステップをさらに含み、 前記重み修正ステップは、前記分野辞書作成ステップの
処理により作成された前記分野辞書に基づいて、前記重
み算出ステップの処理により算出された前記第1の重み
を修正することを特徴とする請求項38に記載の記録媒
体。 - 【請求項47】 前記分野辞書は、前記単語群が、各前
記単語の属する分野によってグループ化され、記録され
ているデータベースであることを特徴とする請求項38
に記載の記録媒体。 - 【請求項48】 前記分野辞書は、前記単語群が、前記
単語間の関係に基づいて階層構造に配置され、記録され
ているデータベースであることを特徴とする請求項38
に記載の記録媒体。 - 【請求項49】 前記分野辞書は、前記単語群が、各前
記単語に割り当てられた重要度に基づいてリスト化され
たデータベースであることを特徴とする請求項38に記
載の記録媒体。 - 【請求項50】 前記分野辞書は、既存の辞書データベ
ースに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項38に記載の
記録媒体。 - 【請求項51】 前記分野辞書は、所定のWEBページデ
ータに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項38に記載の
記録媒体。 - 【請求項52】 前記分野辞書は、以前に前記検索ステ
ップの処理により用いられた前記第2の特徴語のリスト
に含まれる前記単語群および前記単語群が形成するデー
タ構造を含むことを特徴とする請求項38に記載の記録
媒体。 - 【請求項53】 前記重み修正ステップは、前記分野辞
書に含まれる前記単語に対応する前記第1の特徴語の前
記第1の重みを修正することを特徴とする請求項38に
記載の記録媒体。 - 【請求項54】 既存の文書ファイルおよび所定の文書
ファイルに関連する関連情報を提示する情報処理装置を
制御するコンピュータに、 前記既存の文書情報から第1の特徴語を抽出するととも
に、前記所定の文書情報から第2の特徴語を抽出する抽
出ステップと、 前記抽出ステップの処理により抽出された、前記第1の
特徴語の第1の重みを算出するとともに、前記第2の特
徴語の第2の重みを算出する重み算出ステップと、 所定の条件に基づいて、前記重み算出ステップの処理に
より算出された前記第1の重みを修正する重み修正ステ
ップと、 前記抽出ステップの処理により抽出された前記第1の特
徴語、および前記重み修正ステップの処理により修正さ
れた前記第1の重みに基づいて、前記既存の文書情報に
対応付ける前記関連情報の取得を制御する取得制御ステ
ップと、 前記第2の特徴語に基づいて、前記所定の文書情報に関
連する前記既存の文書情報を検索する検索ステップと、 前記検索ステップの処理により検索された前記既存の文
書情報に対応付けられている前記関連情報の表示を制御
する表示制御ステップとを実行させるプログラム。 - 【請求項55】 前記取得制御ステップは、前記既存の
文書情報における、複数の前記第1の特徴語の中から、
前記第1の重みに基づいて重要語を選択し、前記重要語
に関連する前記関連情報の取得を制御することを特徴と
する請求項54に記載のプログラム。 - 【請求項56】 前記検索ステップは、前記第1の重み
と前記第2の重みから類似度を算出し、前記類似度に基
づいて、前記所定の文書情報に対応する前記既存の文書
情報を検索することを特徴とする請求項54に記載のプ
ログラム。 - 【請求項57】 前記既存の文書情報および前記所定の
文書情報から属性情報を抽出する属性情報抽出ステップ
をさらに含み、 前記重み修正ステップは、前記属性情報抽出ステップの
処理により抽出された前記属性情報に基づいて、前記第
1の重みを修正することを特徴とする請求項54に記載
のプログラム。 - 【請求項58】 前記属性情報抽出ステップの処理によ
り抽出された前記属性情報に基づいて、1または複数の
前記既存の文書情報をグループ化して文書情報群を作成
するグループ化ステップをさらに含むことを特徴とする
請求項54に記載のプログラム。 - 【請求項59】 前記重み修正ステップは、特定の宛先
への送信または前記特定の宛先からの受信の頻度に応じ
て、前記第1の重みを修正することを特徴とする請求項
54に記載のプログラム。 - 【請求項60】 前記重み修正ステップは、前記第1の
特徴語の種類に基づいて、前記第1の重みを修正するこ
とを特徴とする請求項54に記載のプログラム。 - 【請求項61】 前記既存の文書情報の前記第1の特徴
語に関連付けて、前記取得制御ステップの処理により取
得が制御された前記関連情報を用いてデータベースを構
築するデータベース構築ステップをさらに含むことを特
徴とする請求項54に記載のプログラム。 - 【請求項62】 所定のデータ構造で構成された単語群
からなる、単語間の関係を示すデータベースである分野
辞書を作成する分野辞書作成ステップをさらに含み、 前記重み修正ステップは、前記分野辞書作成ステップの
処理により作成された前記分野辞書に基づいて、前記重
み算出ステップの処理により算出された前記第1の重み
を修正することを特徴とする請求項54に記載のプログ
ラム。 - 【請求項63】 前記分野辞書は、前記単語群が、各前
記単語の属する分野によってグループ化され、記録され
ているデータベースであることを特徴とする請求項54
に記載のプログラム。 - 【請求項64】 前記分野辞書は、前記単語群が、前記
単語間の関係に基づいて階層構造に配置され、記録され
ているデータベースであることを特徴とする請求項54
に記載のプログラム。 - 【請求項65】 前記分野辞書は、前記単語群が、各前
記単語に割り当てられた重要度に基づいてリスト化され
たデータベースであることを特徴とする請求項54に記
載のプログラム。 - 【請求項66】 前記分野辞書は、既存の辞書データベ
ースに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項54に記載の
プログラム。 - 【請求項67】 前記分野辞書は、所定のWEBページデ
ータに含まれる前記単語群および前記単語群が形成する
データ構造を含むことを特徴とする請求項54に記載の
プログラム。 - 【請求項68】 前記分野辞書は、以前に前記検索ステ
ップの処理により用いられた前記第2の特徴語のリスト
に含まれる前記単語群および前記単語群が形成するデー
タ構造を含むことを特徴とする請求項54に記載のプロ
グラム。 - 【請求項69】 前記重み修正ステップは、前記分野辞
書に含まれる前記単語に対応する前記第1の特徴語の前
記第1の重みを修正することを特徴とする請求項54に
記載のプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002147225A JP2003242176A (ja) | 2001-12-13 | 2002-05-22 | 情報処理装置および方法、記録媒体、並びにプログラム |
US10/316,762 US7289982B2 (en) | 2001-12-13 | 2002-12-12 | System and method for classifying and searching existing document information to identify related information |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001379511 | 2001-12-13 | ||
JP2001-379511 | 2001-12-13 | ||
JP2002147225A JP2003242176A (ja) | 2001-12-13 | 2002-05-22 | 情報処理装置および方法、記録媒体、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003242176A true JP2003242176A (ja) | 2003-08-29 |
JP2003242176A5 JP2003242176A5 (ja) | 2005-03-17 |
Family
ID=26625034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002147225A Pending JP2003242176A (ja) | 2001-12-13 | 2002-05-22 | 情報処理装置および方法、記録媒体、並びにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US7289982B2 (ja) |
JP (1) | JP2003242176A (ja) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006085374A (ja) * | 2004-09-15 | 2006-03-30 | Keio Gijuku | 文書データベースにおける重要語抽出方法、重要語抽出装置、コンピュータプログラム、プログラム格納媒体 |
JP2006287380A (ja) * | 2005-03-31 | 2006-10-19 | Nec Corp | メール添付型ウイルス検知方法およびメールサーバ |
JP2007534057A (ja) * | 2004-03-31 | 2007-11-22 | グーグル インク. | 情報を取り込み抽出する方法及びシステム |
JP2008257414A (ja) * | 2007-04-04 | 2008-10-23 | Toyota Central R&D Labs Inc | 情報選択支援システム、端末装置、情報選択支援装置、情報選択支援方法、プログラム |
JP2008276737A (ja) * | 2007-04-25 | 2008-11-13 | Samsung Electronics Co Ltd | ユーザーの潜在的な関心情報へのアクセスを提供する方法及びシステム |
JP2008541267A (ja) * | 2005-05-13 | 2008-11-20 | マイクロソフト コーポレーション | オンライン会話コンテンツを用いて表示のために広告コンテンツ及び/又は他の関連情報を選択するシステム及び方法 |
JP2010134848A (ja) * | 2008-12-08 | 2010-06-17 | Nomura Research Institute Ltd | メール監査システム及び方法 |
WO2010098178A1 (ja) * | 2009-02-27 | 2010-09-02 | 株式会社 東芝 | 情報推薦装置、情報推薦方法および情報推薦プログラム |
JP2010211733A (ja) * | 2009-03-12 | 2010-09-24 | Nec Corp | 検索装置および検索方法 |
JP2011503699A (ja) * | 2007-11-07 | 2011-01-27 | リアン ホールディングス,エルエルシー | 右脳スマートネス条件を使用することによる人間中心のネットワークのデータの管理 |
US8099407B2 (en) | 2004-03-31 | 2012-01-17 | Google Inc. | Methods and systems for processing media files |
JP2012014349A (ja) * | 2010-06-30 | 2012-01-19 | Nec System Technologies Ltd | 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法 |
US8161053B1 (en) | 2004-03-31 | 2012-04-17 | Google Inc. | Methods and systems for eliminating duplicate events |
US8161032B2 (en) | 2006-10-18 | 2012-04-17 | Kabushiki Kaisha Toshiba | Thread ranking system and thread ranking method |
US8209329B2 (en) | 2007-04-09 | 2012-06-26 | Sony Corporation | Apparatus, method, and program for information processing |
US8275839B2 (en) | 2004-03-31 | 2012-09-25 | Google Inc. | Methods and systems for processing email messages |
US8346777B1 (en) | 2004-03-31 | 2013-01-01 | Google Inc. | Systems and methods for selectively storing event data |
US8386728B1 (en) | 2004-03-31 | 2013-02-26 | Google Inc. | Methods and systems for prioritizing a crawl |
US8631076B1 (en) | 2004-03-31 | 2014-01-14 | Google Inc. | Methods and systems for associating instant messenger events |
US8782056B2 (en) | 2007-01-29 | 2014-07-15 | Samsung Electronics Co., Ltd. | Method and system for facilitating information searching on electronic devices |
US8812515B1 (en) | 2004-03-31 | 2014-08-19 | Google Inc. | Processing contact information |
KR101439841B1 (ko) | 2007-05-23 | 2014-09-17 | 삼성전자주식회사 | 컨텐츠 데이터에 대한 부가 데이터의 검색 방법과 그 장치 |
US8954420B1 (en) | 2003-12-31 | 2015-02-10 | Google Inc. | Methods and systems for improving a search ranking using article information |
US9286385B2 (en) | 2007-04-25 | 2016-03-15 | Samsung Electronics Co., Ltd. | Method and system for providing access to information of potential interest to a user |
Families Citing this family (105)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7302429B1 (en) * | 1999-04-11 | 2007-11-27 | William Paul Wanker | Customizable electronic commerce comparison system and method |
US8126779B2 (en) * | 1999-04-11 | 2012-02-28 | William Paul Wanker | Machine implemented methods of ranking merchants |
JP2002345800A (ja) * | 2001-05-23 | 2002-12-03 | Konica Corp | 医用画像処理装置及び医用ネットワークシステム |
KR100444995B1 (ko) * | 2002-01-09 | 2004-08-21 | 삼성전자주식회사 | 방송 프로그램 정보 검색 방법 및 장치 |
JP2004062479A (ja) * | 2002-07-29 | 2004-02-26 | Fujitsu Ltd | 情報収集装置、方法及びプログラム |
KR100468171B1 (ko) | 2002-12-13 | 2005-01-26 | 삼성전자주식회사 | 방송 프로그램 정보검색 시스템 및 방법 |
JP2004348241A (ja) * | 2003-05-20 | 2004-12-09 | Hitachi Ltd | 情報提供方法、サーバ及びプログラム |
JP2005043977A (ja) * | 2003-07-23 | 2005-02-17 | Hitachi Ltd | 文書間の類似度算出方法および装置 |
JP2005196469A (ja) * | 2004-01-07 | 2005-07-21 | Sony Corp | データ表示サーバ,データ表示方法,およびそのプログラム |
US7254587B2 (en) * | 2004-01-12 | 2007-08-07 | International Business Machines Corporation | Method and apparatus for determining relative relevance between portions of large electronic documents |
JP4444677B2 (ja) * | 2004-01-20 | 2010-03-31 | クラリオン株式会社 | 検索データの更新方法および更新システム |
JP4394517B2 (ja) * | 2004-05-12 | 2010-01-06 | 富士通株式会社 | 特徴情報抽出方法、特徴情報抽出プログラム、および特徴情報抽出装置 |
GB2419200A (en) * | 2004-06-30 | 2006-04-19 | Fujitsu Ltd | Information search terminal |
US7711679B2 (en) | 2004-07-26 | 2010-05-04 | Google Inc. | Phrase-based detection of duplicate documents in an information retrieval system |
US7567959B2 (en) | 2004-07-26 | 2009-07-28 | Google Inc. | Multiple index based information retrieval system |
US7580921B2 (en) * | 2004-07-26 | 2009-08-25 | Google Inc. | Phrase identification in an information retrieval system |
US7702618B1 (en) | 2004-07-26 | 2010-04-20 | Google Inc. | Information retrieval system for archiving multiple document versions |
JP3993627B2 (ja) * | 2004-11-02 | 2007-10-17 | 松下電器産業株式会社 | 表示装置およびその方法 |
JP4524640B2 (ja) * | 2005-03-31 | 2010-08-18 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
JP2006309446A (ja) * | 2005-04-27 | 2006-11-09 | Toshiba Corp | 分類辞書更新装置、分類辞書更新プログラムおよび分類辞書更新方法 |
JP4559295B2 (ja) * | 2005-05-17 | 2010-10-06 | 株式会社エヌ・ティ・ティ・ドコモ | データ通信システム及びデータ通信方法 |
US8826136B2 (en) * | 2005-06-27 | 2014-09-02 | Core Wireless Licensing S.A.R.L. | System and method for enabling collaborative media stream editing |
EP1746503A1 (en) * | 2005-07-12 | 2007-01-24 | Mitel Networks Corporation | Dynamic mailbox size configuraration by self-modification based on historical behavior |
JP5007510B2 (ja) * | 2006-02-13 | 2012-08-22 | コニカミノルタビジネステクノロジーズ株式会社 | 文書処理装置および文書処理システム |
JP2007272463A (ja) * | 2006-03-30 | 2007-10-18 | Toshiba Corp | 情報検索装置、情報検索方法および情報検索プログラム |
US8200695B2 (en) * | 2006-04-13 | 2012-06-12 | Lg Electronics Inc. | Database for uploading, storing, and retrieving similar documents |
JP2008005175A (ja) * | 2006-06-21 | 2008-01-10 | Fuji Xerox Co Ltd | 情報配信装置、情報配信方法およびプログラム |
US8560956B2 (en) * | 2006-07-07 | 2013-10-15 | International Business Machines Corporation | Processing model of an application wiki |
US8196039B2 (en) * | 2006-07-07 | 2012-06-05 | International Business Machines Corporation | Relevant term extraction and classification for Wiki content |
US8775930B2 (en) * | 2006-07-07 | 2014-07-08 | International Business Machines Corporation | Generic frequency weighted visualization component |
US8219900B2 (en) * | 2006-07-07 | 2012-07-10 | International Business Machines Corporation | Programmatically hiding and displaying Wiki page layout sections |
JP4234740B2 (ja) * | 2006-08-03 | 2009-03-04 | 株式会社東芝 | キーワード提示装置、プログラムおよびキーワード提示方法 |
BRPI0715523A2 (pt) * | 2006-08-30 | 2013-06-25 | Thomson Reuters Glo Resources | sistemas, mÉtodos e software de fluxo de trabalho centrados no documento, baseados no conteédo, metadados e contexto do documento |
US8972839B2 (en) * | 2006-10-02 | 2015-03-03 | Adobe Systems Incorporated | Media presentations including related content |
US20080114750A1 (en) * | 2006-11-14 | 2008-05-15 | Microsoft Corporation | Retrieval and ranking of items utilizing similarity |
US20080154896A1 (en) * | 2006-11-17 | 2008-06-26 | Ebay Inc. | Processing unstructured information |
US8620658B2 (en) * | 2007-04-16 | 2013-12-31 | Sony Corporation | Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition |
US8117223B2 (en) | 2007-09-07 | 2012-02-14 | Google Inc. | Integrating external related phrase information into a phrase-based indexing information retrieval system |
US20090138329A1 (en) * | 2007-11-26 | 2009-05-28 | William Paul Wanker | Application of query weights input to an electronic commerce information system to target advertising |
US7945571B2 (en) * | 2007-11-26 | 2011-05-17 | Legit Services Corporation | Application of weights to online search request |
US20100076964A1 (en) * | 2007-12-18 | 2010-03-25 | Daniel Joseph Parrell | Instance-Class-Attribute Matching Web Page Ranking |
US8176419B2 (en) * | 2007-12-19 | 2012-05-08 | Microsoft Corporation | Self learning contextual spell corrector |
JP4399514B2 (ja) * | 2008-02-20 | 2010-01-20 | パナソニック株式会社 | 対話型番組検索装置 |
TW201007486A (en) * | 2008-08-06 | 2010-02-16 | Otiga Technologies Ltd | Document management system and method with identification, classification, search, and save functions |
JP5370478B2 (ja) * | 2009-03-31 | 2013-12-18 | 富士通株式会社 | 名寄せ装置、名寄せ方法および名寄せプログラム |
US9646079B2 (en) | 2012-05-04 | 2017-05-09 | Pearl.com LLC | Method and apparatus for identifiying similar questions in a consultation system |
US9904436B2 (en) | 2009-08-11 | 2018-02-27 | Pearl.com LLC | Method and apparatus for creating a personalized question feed platform |
EP2478451A2 (en) * | 2009-09-18 | 2012-07-25 | Lexxe PTY Ltd | Method and system for scoring texts |
US20120303359A1 (en) * | 2009-12-11 | 2012-11-29 | Nec Corporation | Dictionary creation device, word gathering method and recording medium |
JP5761029B2 (ja) * | 2009-12-11 | 2015-08-12 | 日本電気株式会社 | 辞書作成装置、単語収集方法、及び、プログラム |
US20110214070A1 (en) * | 2010-02-26 | 2011-09-01 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Providing access to one or more messages in response to detecting one or more patterns of usage of one or more non-communication productivity applications |
US20110214069A1 (en) * | 2010-02-26 | 2011-09-01 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Presenting messages through a channel of a non-communication productivity application interface |
US20110211590A1 (en) * | 2010-02-26 | 2011-09-01 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Presenting messages through a channel of a non-communication productivity application interface |
US9626633B2 (en) * | 2010-02-26 | 2017-04-18 | Invention Science Fund I, Llc | Providing access to one or more messages in response to detecting one or more patterns of usage of one or more non-communication productivity applications |
JP5156047B2 (ja) * | 2010-03-31 | 2013-03-06 | 株式会社東芝 | キーワード提示装置、方法及びプログラム |
TWI439960B (zh) | 2010-04-07 | 2014-06-01 | Apple Inc | 虛擬使用者編輯環境 |
US8195458B2 (en) * | 2010-08-17 | 2012-06-05 | Xerox Corporation | Open class noun classification |
US20120185259A1 (en) * | 2011-01-19 | 2012-07-19 | International Business Machines Corporation | Topic-based calendar availability |
CN102651719B (zh) * | 2011-02-28 | 2016-08-31 | 国际商业机器公司 | 用于在消息交互环境中跟踪消息话题的方法和设备 |
CN103621105A (zh) * | 2011-06-30 | 2014-03-05 | 汤姆逊许可公司 | 根据用户喜好自动录制的方法和装置 |
US9275038B2 (en) * | 2012-05-04 | 2016-03-01 | Pearl.com LLC | Method and apparatus for identifying customer service and duplicate questions in an online consultation system |
US9501580B2 (en) | 2012-05-04 | 2016-11-22 | Pearl.com LLC | Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website |
US9459781B2 (en) | 2012-05-09 | 2016-10-04 | Apple Inc. | Context-specific user interfaces for displaying animated sequences |
JP5526199B2 (ja) * | 2012-08-22 | 2014-06-18 | 株式会社東芝 | 文書分類装置および文書分類処理プログラム |
CN103778169B (zh) * | 2012-10-26 | 2017-02-08 | 北京雪球信息科技有限公司 | 信息排序方法 |
US9264505B2 (en) * | 2013-01-31 | 2016-02-16 | Hewlett Packard Enterprise Development Lp | Building a semantics graph for an enterprise communication network |
US9122681B2 (en) | 2013-03-15 | 2015-09-01 | Gordon Villy Cormack | Systems and methods for classifying electronic information using advanced active learning techniques |
WO2014166540A1 (en) * | 2013-04-11 | 2014-10-16 | Longsand Limited | Sentiment feedback |
US9396724B2 (en) * | 2013-05-29 | 2016-07-19 | Tencent Technology (Shenzhen) Company Limited | Method and apparatus for building a language model |
US20150058708A1 (en) * | 2013-08-23 | 2015-02-26 | Adobe Systems Incorporated | Systems and methods of character dialog generation |
US11003659B2 (en) * | 2013-10-25 | 2021-05-11 | Rakuten, Inc. | Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium |
JP2015090548A (ja) * | 2013-11-05 | 2015-05-11 | オムロン株式会社 | 制御装置 |
JP6165657B2 (ja) * | 2014-03-20 | 2017-07-19 | 株式会社東芝 | 情報処理装置、情報処理方法およびプログラム |
KR20150144447A (ko) * | 2014-06-16 | 2015-12-28 | 한국전자통신연구원 | 메시지 수정 방법 및 장치 |
US10592539B1 (en) * | 2014-07-11 | 2020-03-17 | Twitter, Inc. | Trends in a messaging platform |
US10601749B1 (en) | 2014-07-11 | 2020-03-24 | Twitter, Inc. | Trends in a messaging platform |
US10452253B2 (en) | 2014-08-15 | 2019-10-22 | Apple Inc. | Weather user interface |
WO2016163043A1 (ja) * | 2015-04-10 | 2016-10-13 | 株式会社ソリトンシステムズ | 電子メール誤送信判定装置、電子メール送信システム及び記録媒体 |
US10354010B2 (en) * | 2015-04-24 | 2019-07-16 | Nec Corporation | Information processing system, an information processing method and a computer readable storage medium |
US10242001B2 (en) | 2015-06-19 | 2019-03-26 | Gordon V. Cormack | Systems and methods for conducting and terminating a technology-assisted review |
KR102568097B1 (ko) * | 2015-06-22 | 2023-08-18 | 삼성전자 주식회사 | 파싱 데이터의 관련 정보를 표시하는 방법 및 전자 장치 |
WO2017018012A1 (ja) * | 2015-07-28 | 2017-02-02 | ソニー株式会社 | 情報処理システム、情報処理方法、および記録媒体 |
EP4321088A3 (en) | 2015-08-20 | 2024-04-24 | Apple Inc. | Exercise-based watch face |
US9996533B2 (en) * | 2015-09-30 | 2018-06-12 | International Business Machines Corporation | Question answering system using multilingual information sources |
JP6565628B2 (ja) * | 2015-11-19 | 2019-08-28 | 富士通株式会社 | 検索プログラム、検索装置および検索方法 |
US10521413B2 (en) * | 2015-11-20 | 2019-12-31 | Oath Inc. | Location-based recommendations using nearest neighbors in a locality sensitive hashing (LSH) index |
US10691893B2 (en) * | 2016-02-29 | 2020-06-23 | International Business Machines Corporation | Interest highlight and recommendation based on interaction in long text reading |
US10878190B2 (en) * | 2016-04-26 | 2020-12-29 | International Business Machines Corporation | Structured dictionary population utilizing text analytics of unstructured language dictionary text |
WO2018006254A1 (zh) * | 2016-07-05 | 2018-01-11 | 马岩 | 基于局域网邮件数据的抓取方法及系统 |
DK179412B1 (en) | 2017-05-12 | 2018-06-06 | Apple Inc | Context-Specific User Interfaces |
US20190182197A1 (en) * | 2017-10-10 | 2019-06-13 | Soliton Systems K.K. | Warning apparatus for preventing electronic mail wrong transmission, electronic mail transmission system, and program |
CN108132930A (zh) * | 2017-12-27 | 2018-06-08 | 曙光信息产业(北京)有限公司 | 特征词提取方法及装置 |
JP7031387B2 (ja) * | 2018-03-12 | 2022-03-08 | オムロン株式会社 | 情報処理装置、情報処理方法、および、情報処理プログラム |
DK180078B1 (en) | 2018-05-07 | 2020-03-31 | Apple Inc. | USER INTERFACE FOR AVATAR CREATION |
US11722764B2 (en) | 2018-05-07 | 2023-08-08 | Apple Inc. | Creative camera |
US11960701B2 (en) | 2019-05-06 | 2024-04-16 | Apple Inc. | Using an illustration to show the passing of time |
US11874881B2 (en) | 2019-05-15 | 2024-01-16 | Nippon Telegraph And Telephone Corporation | Business documents presentation device, business documents presentation method and business documents presentation program |
US11921998B2 (en) | 2020-05-11 | 2024-03-05 | Apple Inc. | Editing features of an avatar |
DK202070625A1 (en) | 2020-05-11 | 2022-01-04 | Apple Inc | User interfaces related to time |
WO2021231345A1 (en) | 2020-05-11 | 2021-11-18 | Apple Inc. | User interfaces for managing user interface sharing |
CN111753540B (zh) * | 2020-06-24 | 2023-04-07 | 云南电网有限责任公司信息中心 | 一种对于文本数据进行收集以进行自然语言处理nlp的方法及系统 |
US11694590B2 (en) | 2020-12-21 | 2023-07-04 | Apple Inc. | Dynamic user interface with time indicator |
US11720239B2 (en) | 2021-01-07 | 2023-08-08 | Apple Inc. | Techniques for user interfaces related to an event |
US11921992B2 (en) | 2021-05-14 | 2024-03-05 | Apple Inc. | User interfaces related to time |
US11776190B2 (en) | 2021-06-04 | 2023-10-03 | Apple Inc. | Techniques for managing an avatar on a lock screen |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5146405A (en) * | 1988-02-05 | 1992-09-08 | At&T Bell Laboratories | Methods for part-of-speech determination and usage |
US5442778A (en) * | 1991-11-12 | 1995-08-15 | Xerox Corporation | Scatter-gather: a cluster-based method and apparatus for browsing large document collections |
US5576954A (en) * | 1993-11-05 | 1996-11-19 | University Of Central Florida | Process for determination of text relevancy |
AU1258195A (en) * | 1993-11-17 | 1995-06-06 | Collegeview | Method and apparatus for displaying three-dimensional animated characters upon a computer monitor's screen |
US5715468A (en) * | 1994-09-30 | 1998-02-03 | Budzinski; Robert Lucius | Memory system for storing and retrieving experience and knowledge with natural language |
JP3282937B2 (ja) * | 1995-01-12 | 2002-05-20 | 日本アイ・ビー・エム株式会社 | 情報検索方法及びシステム |
JPH09153050A (ja) * | 1995-11-29 | 1997-06-10 | Hitachi Ltd | 文書情報収集方法および文書情報収集装置 |
JPH1145280A (ja) | 1997-07-27 | 1999-02-16 | Just Syst Corp | 他言語文書検索システム、他言語文書検索プログラムが記憶された記憶媒体、及び他言語文書検索方法 |
US6038574A (en) * | 1998-03-18 | 2000-03-14 | Xerox Corporation | Method and apparatus for clustering a collection of linked documents using co-citation analysis |
US6006225A (en) * | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6493702B1 (en) * | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks |
JP2001155020A (ja) | 1999-11-25 | 2001-06-08 | Toshiba Corp | 類似文書検索装置、類似文書検索方法及び記録媒体 |
US6571240B1 (en) * | 2000-02-02 | 2003-05-27 | Chi Fai Ho | Information processing for searching categorizing information in a document based on a categorization hierarchy and extracted phrases |
JP4608740B2 (ja) | 2000-02-21 | 2011-01-12 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム格納媒体 |
CN1174332C (zh) * | 2000-03-10 | 2004-11-03 | 松下电器产业株式会社 | 转换表达方式的方法和装置 |
US20020073079A1 (en) * | 2000-04-04 | 2002-06-13 | Merijn Terheggen | Method and apparatus for searching a database and providing relevance feedback |
KR100426382B1 (ko) * | 2000-08-23 | 2004-04-08 | 학교법인 김포대학 | 엔트로피 정보와 베이지안 에스오엠을 이용한 문서군집기반의 순위조정 방법 |
US6845374B1 (en) * | 2000-11-27 | 2005-01-18 | Mailfrontier, Inc | System and method for adaptive text recommendation |
US6721728B2 (en) * | 2001-03-02 | 2004-04-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | System, method and apparatus for discovering phrases in a database |
US6754654B1 (en) * | 2001-10-01 | 2004-06-22 | Trilogy Development Group, Inc. | System and method for extracting knowledge from documents |
US6873985B2 (en) * | 2001-12-06 | 2005-03-29 | Xerox Corporation | Lightweight subject indexing for e-mail collections |
-
2002
- 2002-05-22 JP JP2002147225A patent/JP2003242176A/ja active Pending
- 2002-12-12 US US10/316,762 patent/US7289982B2/en not_active Expired - Fee Related
Cited By (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8954420B1 (en) | 2003-12-31 | 2015-02-10 | Google Inc. | Methods and systems for improving a search ranking using article information |
US10423679B2 (en) | 2003-12-31 | 2019-09-24 | Google Llc | Methods and systems for improving a search ranking using article information |
US8812515B1 (en) | 2004-03-31 | 2014-08-19 | Google Inc. | Processing contact information |
JP2007534057A (ja) * | 2004-03-31 | 2007-11-22 | グーグル インク. | 情報を取り込み抽出する方法及びシステム |
US8161053B1 (en) | 2004-03-31 | 2012-04-17 | Google Inc. | Methods and systems for eliminating duplicate events |
US10180980B2 (en) | 2004-03-31 | 2019-01-15 | Google Llc | Methods and systems for eliminating duplicate events |
US9836544B2 (en) | 2004-03-31 | 2017-12-05 | Google Inc. | Methods and systems for prioritizing a crawl |
US9311408B2 (en) | 2004-03-31 | 2016-04-12 | Google, Inc. | Methods and systems for processing media files |
US9189553B2 (en) | 2004-03-31 | 2015-11-17 | Google Inc. | Methods and systems for prioritizing a crawl |
US8275839B2 (en) | 2004-03-31 | 2012-09-25 | Google Inc. | Methods and systems for processing email messages |
US8346777B1 (en) | 2004-03-31 | 2013-01-01 | Google Inc. | Systems and methods for selectively storing event data |
US8386728B1 (en) | 2004-03-31 | 2013-02-26 | Google Inc. | Methods and systems for prioritizing a crawl |
US8631076B1 (en) | 2004-03-31 | 2014-01-14 | Google Inc. | Methods and systems for associating instant messenger events |
JP4812747B2 (ja) * | 2004-03-31 | 2011-11-09 | グーグル インコーポレイテッド | 情報を取り込み抽出する方法及びシステム |
US8099407B2 (en) | 2004-03-31 | 2012-01-17 | Google Inc. | Methods and systems for processing media files |
JP4639388B2 (ja) * | 2004-09-15 | 2011-02-23 | 学校法人慶應義塾 | 文書データベースにおける重要語抽出方法、重要語抽出装置、コンピュータプログラム、プログラム格納媒体 |
JP2006085374A (ja) * | 2004-09-15 | 2006-03-30 | Keio Gijuku | 文書データベースにおける重要語抽出方法、重要語抽出装置、コンピュータプログラム、プログラム格納媒体 |
JP2006287380A (ja) * | 2005-03-31 | 2006-10-19 | Nec Corp | メール添付型ウイルス検知方法およびメールサーバ |
JP4720251B2 (ja) * | 2005-03-31 | 2011-07-13 | 日本電気株式会社 | メール添付型ウイルス検知方法およびメールサーバ |
JP2008541267A (ja) * | 2005-05-13 | 2008-11-20 | マイクロソフト コーポレーション | オンライン会話コンテンツを用いて表示のために広告コンテンツ及び/又は他の関連情報を選択するシステム及び方法 |
US8161032B2 (en) | 2006-10-18 | 2012-04-17 | Kabushiki Kaisha Toshiba | Thread ranking system and thread ranking method |
US8782056B2 (en) | 2007-01-29 | 2014-07-15 | Samsung Electronics Co., Ltd. | Method and system for facilitating information searching on electronic devices |
JP2008257414A (ja) * | 2007-04-04 | 2008-10-23 | Toyota Central R&D Labs Inc | 情報選択支援システム、端末装置、情報選択支援装置、情報選択支援方法、プログラム |
US8209329B2 (en) | 2007-04-09 | 2012-06-26 | Sony Corporation | Apparatus, method, and program for information processing |
JP2008276737A (ja) * | 2007-04-25 | 2008-11-13 | Samsung Electronics Co Ltd | ユーザーの潜在的な関心情報へのアクセスを提供する方法及びシステム |
US9286385B2 (en) | 2007-04-25 | 2016-03-15 | Samsung Electronics Co., Ltd. | Method and system for providing access to information of potential interest to a user |
KR101439841B1 (ko) | 2007-05-23 | 2014-09-17 | 삼성전자주식회사 | 컨텐츠 데이터에 대한 부가 데이터의 검색 방법과 그 장치 |
JP2011503699A (ja) * | 2007-11-07 | 2011-01-27 | リアン ホールディングス,エルエルシー | 右脳スマートネス条件を使用することによる人間中心のネットワークのデータの管理 |
JP2010134848A (ja) * | 2008-12-08 | 2010-06-17 | Nomura Research Institute Ltd | メール監査システム及び方法 |
JP2010204735A (ja) * | 2009-02-27 | 2010-09-16 | Toshiba Corp | 情報推薦装置、情報推薦方法および情報推薦プログラム |
WO2010098178A1 (ja) * | 2009-02-27 | 2010-09-02 | 株式会社 東芝 | 情報推薦装置、情報推薦方法および情報推薦プログラム |
JP2010211733A (ja) * | 2009-03-12 | 2010-09-24 | Nec Corp | 検索装置および検索方法 |
JP2012014349A (ja) * | 2010-06-30 | 2012-01-19 | Nec System Technologies Ltd | 電子メールシステム、サーバ、及び電子メールシステムのキーワード強調表示方法 |
Also Published As
Publication number | Publication date |
---|---|
US7289982B2 (en) | 2007-10-30 |
US20030140309A1 (en) | 2003-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003242176A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JP4082059B2 (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JP4608740B2 (ja) | 情報処理装置および方法、並びにプログラム格納媒体 | |
JP4810469B2 (ja) | 検索支援装置、プログラム及び検索支援システム | |
JP3150209U (ja) | Webコンテンツを管理するためのシステムおよび装置 | |
US7577718B2 (en) | Adaptive dissemination of personalized and contextually relevant information | |
US7685199B2 (en) | Presenting information related to topics extracted from event classes | |
US8543572B2 (en) | Systems and methods for analyzing boilerplate | |
US8631001B2 (en) | Systems and methods for weighting a search query result | |
US7849079B2 (en) | Temporal ranking of search results | |
US8918401B1 (en) | Systems and methods for providing searchable prior history | |
JP4714156B2 (ja) | 記事情報を用いて検索ランク付けを改良するための方法およびシステム | |
US20070276801A1 (en) | Systems and methods for constructing and using a user profile | |
US20130173608A1 (en) | Temporal search query personalization | |
JP2002082748A (ja) | ユーザ支援装置 | |
JP2009211697A (ja) | 情報配信システムおよび情報配信方法 | |
JP5013701B2 (ja) | 検索装置及び検索方法 | |
JP4088950B2 (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JP4375626B2 (ja) | カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法 | |
EP2017752A1 (en) | Information processing apparatus, information processing method and program | |
JP4605415B2 (ja) | 情報処理装置および方法、並びに記録媒体 | |
JP4477931B2 (ja) | 検索リクエスト装置、検索リクエスト方法、検索リクエストプログラムおよび検索リクエストプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP2003242173A (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
JP2005353083A (ja) | 情報共有装置および方法 | |
AU2012251925A1 (en) | Temporal ranking of search results |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040423 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040423 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070201 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070402 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070904 |