JP2003085204A - 文書処理管理装置 - Google Patents
文書処理管理装置Info
- Publication number
- JP2003085204A JP2003085204A JP2001274960A JP2001274960A JP2003085204A JP 2003085204 A JP2003085204 A JP 2003085204A JP 2001274960 A JP2001274960 A JP 2001274960A JP 2001274960 A JP2001274960 A JP 2001274960A JP 2003085204 A JP2003085204 A JP 2003085204A
- Authority
- JP
- Japan
- Prior art keywords
- document
- document data
- browsing
- information
- instruction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99941—Database schema or data structure
- Y10S707/99944—Object-oriented database structure
- Y10S707/99945—Object-oriented database structure processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99951—File or database maintenance
- Y10S707/99952—Coherency, e.g. same view to multiple users
- Y10S707/99954—Version management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【課題】 あらかじめ文書の分類整理や関連付け、キー
ワード入力などの作業を行う必要なく、閲覧中の文書と
関連している可能性の高い文書を保存文書群から自動的
に抽出することができる文書処理管理装置を提供するこ
と。 【解決手段】 ユーザによって指定された文書の保存場
所と文書名をメインウィンドウ画面に表示する。閲覧履
歴管理部114は、表示中の文書情報が、過去に閲覧さ
れたことがあるか否かを文書管理情報保存部113の内
容を参照し判定する。過去に閲覧されたことがある場
合、表示中の文書情報に対応するID番号を取得し、閲
覧されたことがない場合、新たに文書管理情報保存部1
13に新規にIDを発行し登録する。関連文書群リスト
生成処理では、日々蓄積された閲覧履歴情報を解析し、
現在閲覧中の文書の関連文書群を決定し、リストとして
生成する。
ワード入力などの作業を行う必要なく、閲覧中の文書と
関連している可能性の高い文書を保存文書群から自動的
に抽出することができる文書処理管理装置を提供するこ
と。 【解決手段】 ユーザによって指定された文書の保存場
所と文書名をメインウィンドウ画面に表示する。閲覧履
歴管理部114は、表示中の文書情報が、過去に閲覧さ
れたことがあるか否かを文書管理情報保存部113の内
容を参照し判定する。過去に閲覧されたことがある場
合、表示中の文書情報に対応するID番号を取得し、閲
覧されたことがない場合、新たに文書管理情報保存部1
13に新規にIDを発行し登録する。関連文書群リスト
生成処理では、日々蓄積された閲覧履歴情報を解析し、
現在閲覧中の文書の関連文書群を決定し、リストとして
生成する。
Description
【0001】
【発明の属する技術分野】本発明は、大量の文書データ
を扱う装置やシステム、特に保存文書群を管理する文書
処理管理装置に係り、より詳細には、大量の保存文書群
から閲覧中の文書に関連した文書を抽出する文書処理管
理装置に関する。
を扱う装置やシステム、特に保存文書群を管理する文書
処理管理装置に係り、より詳細には、大量の保存文書群
から閲覧中の文書に関連した文書を抽出する文書処理管
理装置に関する。
【0002】
【従来の技術】近年、通信技術の普及に伴い、誰でも様
々な情報を取得することができ、扱われる情報量も膨大
なものとなってきている。膨大な情報の中から所望の情
報や文書を効率良く見つけ出すことが求められている。
一般的に、コンピュータのファイルシステムでは階層デ
ィレクトリを用いて文書を管理し、階層ディレクトリ上
で文書の分類整理を徹底することにより、関連のある文
書を見つけやすくしている。また、キーワード検索によ
って、特定の語句を含む文書を検索するための各種の検
索ツールが知られている。このキーワード検索では、特
定の語句を含む関連文書を見つけ出すことができるま
た、インターネット上のワールド・ワイド・ウェブ(W
WW)では、関連する文書をリンクによって結びつける
ことができ、関連文書の参照が容易になっている。さら
に、WWWブラウザなどでは、一定期間あるいは一定数
までの文書の閲覧履歴を表示したり、閲覧頻度によって
文書を順位付けする技術が知られている。このような情
報や文書の検索技術について、特開2000−2020
2号公報には、ユーザによる情報の閲覧履歴をユーザの
指定した重要度判断基準に従って分析し、この分析の結
果に従って、重要度の高い情報をユーザによって関連付
けされたシンボルで表示する情報参照支援装置が記載さ
れている。
々な情報を取得することができ、扱われる情報量も膨大
なものとなってきている。膨大な情報の中から所望の情
報や文書を効率良く見つけ出すことが求められている。
一般的に、コンピュータのファイルシステムでは階層デ
ィレクトリを用いて文書を管理し、階層ディレクトリ上
で文書の分類整理を徹底することにより、関連のある文
書を見つけやすくしている。また、キーワード検索によ
って、特定の語句を含む文書を検索するための各種の検
索ツールが知られている。このキーワード検索では、特
定の語句を含む関連文書を見つけ出すことができるま
た、インターネット上のワールド・ワイド・ウェブ(W
WW)では、関連する文書をリンクによって結びつける
ことができ、関連文書の参照が容易になっている。さら
に、WWWブラウザなどでは、一定期間あるいは一定数
までの文書の閲覧履歴を表示したり、閲覧頻度によって
文書を順位付けする技術が知られている。このような情
報や文書の検索技術について、特開2000−2020
2号公報には、ユーザによる情報の閲覧履歴をユーザの
指定した重要度判断基準に従って分析し、この分析の結
果に従って、重要度の高い情報をユーザによって関連付
けされたシンボルで表示する情報参照支援装置が記載さ
れている。
【0003】
【発明が解決しようとする課題】しかしながら、文書を
閲覧する場合、その文書の関連文書を参照したいだけの
場合が少なくない。階層ディレクトリで文書が管理され
ている場合、関連文書を見つけやすくなってはいるが、
文書の保存時にあらかじめ文書を分類する作業が必要と
なる。また、文書の増加に伴い、分類体系の変更もしば
しば必要となり、その変更には多くの作業と時間を要す
ることととなる。また、キーワード検索の技術によれ
ば、特定の語句を含む関連文書を見つけ出すことができ
るが、キーワード入力を必須とし、また関連文書を検索
するための適切なキーワードの選定が必ずしも容易なも
のとは限らない。WWWブラウザなどでは、関連文書の
参照を容易にするために、あらかじめ文書の関連を調
べ、関連した文書間にリンクを構築する作業が必要とな
る。
閲覧する場合、その文書の関連文書を参照したいだけの
場合が少なくない。階層ディレクトリで文書が管理され
ている場合、関連文書を見つけやすくなってはいるが、
文書の保存時にあらかじめ文書を分類する作業が必要と
なる。また、文書の増加に伴い、分類体系の変更もしば
しば必要となり、その変更には多くの作業と時間を要す
ることととなる。また、キーワード検索の技術によれ
ば、特定の語句を含む関連文書を見つけ出すことができ
るが、キーワード入力を必須とし、また関連文書を検索
するための適切なキーワードの選定が必ずしも容易なも
のとは限らない。WWWブラウザなどでは、関連文書の
参照を容易にするために、あらかじめ文書の関連を調
べ、関連した文書間にリンクを構築する作業が必要とな
る。
【0004】また、一定期間あるいは一定数までの文書
の閲覧履歴を表示したり、閲覧頻度によって文書を順位
付けする方法や、特開2000−20202号公報に記
載されているような情報参照支援装置では、ある文書と
関連した文書を効率良く見つけ出すことが必ずできるわ
けではなく、また、事前にシンボルと重要度判断基準と
の関係などを定義する作業も必要となる。通常、文書の
利用状況を観察すると、どの文書も均一に閲覧されるわ
けではなく、個々の人によって閲覧する文書には偏りが
ある。関心があり閲覧頻度の多い文書群は、共出現情報
として繰り返し参照されるという統計的性質がある。こ
こで、共出現情報とは、まとまった一連の作業中に参照
した文書をいうものとする。図9は、文書の閲覧履歴情
報を説明する模式図である。図9では閲覧した文書
「A」、「B」、「C」、、、を時系列に並べ、共出現
情報である一連の作業を単位に丸(○)で括っている。
図9を一例として時系列を観察すると、「B」を閲覧し
ているときは同時に「C」を閲覧する傾向が最も強く、
次いで「A」、「D」となり、「E」は同時に閲覧して
いないことがわかる。
の閲覧履歴を表示したり、閲覧頻度によって文書を順位
付けする方法や、特開2000−20202号公報に記
載されているような情報参照支援装置では、ある文書と
関連した文書を効率良く見つけ出すことが必ずできるわ
けではなく、また、事前にシンボルと重要度判断基準と
の関係などを定義する作業も必要となる。通常、文書の
利用状況を観察すると、どの文書も均一に閲覧されるわ
けではなく、個々の人によって閲覧する文書には偏りが
ある。関心があり閲覧頻度の多い文書群は、共出現情報
として繰り返し参照されるという統計的性質がある。こ
こで、共出現情報とは、まとまった一連の作業中に参照
した文書をいうものとする。図9は、文書の閲覧履歴情
報を説明する模式図である。図9では閲覧した文書
「A」、「B」、「C」、、、を時系列に並べ、共出現
情報である一連の作業を単位に丸(○)で括っている。
図9を一例として時系列を観察すると、「B」を閲覧し
ているときは同時に「C」を閲覧する傾向が最も強く、
次いで「A」、「D」となり、「E」は同時に閲覧して
いないことがわかる。
【0005】そこで、本発明の第1の目的は、ユーザに
よって閲覧や参照する文書に偏りが発生するという統計
的性質に着目することにより、あらかじめ文書の分類整
理や関連付け、キーワード入力などの作業を行う必要な
く、閲覧中の文書と関連している可能性の高い文書を保
存文書群から自動的に抽出することができる文書処理管
理装置を提供することである。本発明の第2の目的は、
文書の閲覧作業を支援するための文書の分類整理や関連
付け、キーワード入力などの事前作業を行うことなく、
閲覧中の文書に関連した文書を容易に参照することがで
きる文書処理管理装置を提供することである。
よって閲覧や参照する文書に偏りが発生するという統計
的性質に着目することにより、あらかじめ文書の分類整
理や関連付け、キーワード入力などの作業を行う必要な
く、閲覧中の文書と関連している可能性の高い文書を保
存文書群から自動的に抽出することができる文書処理管
理装置を提供することである。本発明の第2の目的は、
文書の閲覧作業を支援するための文書の分類整理や関連
付け、キーワード入力などの事前作業を行うことなく、
閲覧中の文書に関連した文書を容易に参照することがで
きる文書処理管理装置を提供することである。
【0006】
【課題を解決するための手段】請求項1記載の発明で
は、受領した文書データを格納する文書データ格納手段
と、前記文書データ格納手段に格納されている文書デー
タに対する閲覧指示または閲覧文書データの変更指示の
指示入力を促す指示入力手段と、前記指示入力手段によ
って文書データの閲覧指示が入力された場合、当該閲覧
指示された文書データを前記文書データ格納手段から抽
出し、閲覧指示回数、閲覧時間などの統計的数字と関連
付けした閲覧文書履歴情報として記憶する閲覧履歴記憶
手段と、前記閲覧履歴記憶手段に記憶された閲覧文書履
歴情報に関連付けされた統計的数字を解析することによ
り、前記指示入力手段によって閲覧指示された文書デー
タと統計的数字が近似する閲覧文書履歴情報の文書デー
タを関連文書データとして前記文書データ格納手段から
抽出する文書データ抽出手段と、を備えたことにより、
前記第1および第2の目的を達成する。
は、受領した文書データを格納する文書データ格納手段
と、前記文書データ格納手段に格納されている文書デー
タに対する閲覧指示または閲覧文書データの変更指示の
指示入力を促す指示入力手段と、前記指示入力手段によ
って文書データの閲覧指示が入力された場合、当該閲覧
指示された文書データを前記文書データ格納手段から抽
出し、閲覧指示回数、閲覧時間などの統計的数字と関連
付けした閲覧文書履歴情報として記憶する閲覧履歴記憶
手段と、前記閲覧履歴記憶手段に記憶された閲覧文書履
歴情報に関連付けされた統計的数字を解析することによ
り、前記指示入力手段によって閲覧指示された文書デー
タと統計的数字が近似する閲覧文書履歴情報の文書デー
タを関連文書データとして前記文書データ格納手段から
抽出する文書データ抽出手段と、を備えたことにより、
前記第1および第2の目的を達成する。
【0007】請求項2記載の発明では、請求項1記載の
発明において、前記閲覧履歴記憶手段は、前記閲覧履歴
情報を時系列に並べた閲覧履歴一覧として記憶し、前記
文書データ抽出手段は、前記閲覧履歴記憶手段に記憶さ
れた閲覧履歴一覧の時系列の統計的数字を解析して前記
関連文書データを抽出することにより、前記第1および
第2の目的を達成する。請求項3記載の発明では、請求
項1または請求項2記載の発明において、前記指示入力
手段による指示入力が行われる時間間隔を計測する指示
計測手段をさらに備え、前記指示計測手段によって所定
時間が計測された場合、または、前記指示入力手段によ
って閲覧文書データの変更指示が入力された場合、前記
文書データ抽出手段は、前記文書データ格納手段から前
記閲覧指示された文書データ以外の文書データに関連付
けされた閲覧履歴情報を解析して前記文書データ格納手
段から前記関連文書データを抽出することにより、前記
第1および第2の目的を達成する。
発明において、前記閲覧履歴記憶手段は、前記閲覧履歴
情報を時系列に並べた閲覧履歴一覧として記憶し、前記
文書データ抽出手段は、前記閲覧履歴記憶手段に記憶さ
れた閲覧履歴一覧の時系列の統計的数字を解析して前記
関連文書データを抽出することにより、前記第1および
第2の目的を達成する。請求項3記載の発明では、請求
項1または請求項2記載の発明において、前記指示入力
手段による指示入力が行われる時間間隔を計測する指示
計測手段をさらに備え、前記指示計測手段によって所定
時間が計測された場合、または、前記指示入力手段によ
って閲覧文書データの変更指示が入力された場合、前記
文書データ抽出手段は、前記文書データ格納手段から前
記閲覧指示された文書データ以外の文書データに関連付
けされた閲覧履歴情報を解析して前記文書データ格納手
段から前記関連文書データを抽出することにより、前記
第1および第2の目的を達成する。
【0008】請求項4記載の発明では、請求項1、請求
項2、請求項3のうちいずれか1に記載の発明におい
て、前記文書データ抽出手段は、前記閲覧履歴記憶手段
に記憶された時系列の閲覧履歴一覧のうち、前記指示入
力手段によって閲覧指示された文書データの閲覧時間が
時系列において近似する閲覧文書履歴情報の文書データ
を前記関連文書データとして前記文書データ格納手段か
ら抽出することにより、前記第1および第2の目的を達
成する。
項2、請求項3のうちいずれか1に記載の発明におい
て、前記文書データ抽出手段は、前記閲覧履歴記憶手段
に記憶された時系列の閲覧履歴一覧のうち、前記指示入
力手段によって閲覧指示された文書データの閲覧時間が
時系列において近似する閲覧文書履歴情報の文書データ
を前記関連文書データとして前記文書データ格納手段か
ら抽出することにより、前記第1および第2の目的を達
成する。
【0009】請求項5記載の発明では、請求項1、請求
項2、請求項3、請求項4のうちいずれか1に記載の発
明において、前記文書データ抽出手段によって関連文書
データとして前記文書データ格納手段から抽出される文
書データの抽出確率を算出する抽出確率算出手段をさら
に備えたことにより、前記第1および第2の目的を達成
する。請求項6記載の発明では、請求項5記載の発明に
おいて、前記抽出確率算出手段によって算出された抽出
確率に基づいて、前記文書データ格納手段に格納されて
いる文書データを関連文書データ一覧として提示する文
書データ提示手段をさらに備え、前記文書データ提示手
段は、前記抽出確率算出手段によって算出された抽出確
率が高い順に提示することにより、前記第1および第2
の目的を達成する。
項2、請求項3、請求項4のうちいずれか1に記載の発
明において、前記文書データ抽出手段によって関連文書
データとして前記文書データ格納手段から抽出される文
書データの抽出確率を算出する抽出確率算出手段をさら
に備えたことにより、前記第1および第2の目的を達成
する。請求項6記載の発明では、請求項5記載の発明に
おいて、前記抽出確率算出手段によって算出された抽出
確率に基づいて、前記文書データ格納手段に格納されて
いる文書データを関連文書データ一覧として提示する文
書データ提示手段をさらに備え、前記文書データ提示手
段は、前記抽出確率算出手段によって算出された抽出確
率が高い順に提示することにより、前記第1および第2
の目的を達成する。
【0010】
【発明の実施の形態】以下、本発明の好適な実施の形態
について図1ないし図9を参照して詳細に説明する。図
1は、本実施の形態に係る文書処理管理システム100
の概略構成を示したブロック図である。この文書処理管
理システム100は、文書管理装置110と、文書管理
装置110により管理されている文書を閲覧するための
文書閲覧装置130から構成されている。文書閲覧装置
130は、ユーザが各種指示やデータを入力するための
キーボードやマウスなどの入力装置131、文書を表示
し操作するために利用される表示装置132やハードデ
ィスク装置などの補助記憶装置133を備えている。本
実施の形態では、一例として文書閲覧装置130は一台
として説明するが、同様の構成の文書閲覧装置130を
複数台、文書管理装置110に接続するようにしてもよ
い。
について図1ないし図9を参照して詳細に説明する。図
1は、本実施の形態に係る文書処理管理システム100
の概略構成を示したブロック図である。この文書処理管
理システム100は、文書管理装置110と、文書管理
装置110により管理されている文書を閲覧するための
文書閲覧装置130から構成されている。文書閲覧装置
130は、ユーザが各種指示やデータを入力するための
キーボードやマウスなどの入力装置131、文書を表示
し操作するために利用される表示装置132やハードデ
ィスク装置などの補助記憶装置133を備えている。本
実施の形態では、一例として文書閲覧装置130は一台
として説明するが、同様の構成の文書閲覧装置130を
複数台、文書管理装置110に接続するようにしてもよ
い。
【0011】文書管理装置110は、多数の文書の実体
が保存される文書保存部111、この文書保存部111
に保存されている文書群を管理する文書管理部112、
この文書管理部112による文書管理のための文書管理
情報が保存される文書管理情報保存部113、文書保存
部111に保存されている文書に関する閲覧履歴を管理
するための閲覧履歴管理部114、この閲覧履歴管理部
114により生成される閲覧履歴情報が保存される閲覧
履歴情報保存部115、閲覧履歴情報保存部115に保
存されている閲覧履歴情報に基づいて、文書閲覧装置1
30の閲覧対象となっている文書に関連する文書を文書
保存部111に保存されている文書の中から抽出する関
連文書推定処理部116、各部の動作や文書管理装置1
10の全体的な動作の制御、文書閲覧装置130との情
報交換の制御などを司る制御部120を備えている。な
お、文書処理管理システム100は、全体を単一の装置
(文書処理管理装置)として実現される形態、ネットワ
ークで接続された複数の装置の集合体として実現される
形態のいずれでも適用することができるものとする。
が保存される文書保存部111、この文書保存部111
に保存されている文書群を管理する文書管理部112、
この文書管理部112による文書管理のための文書管理
情報が保存される文書管理情報保存部113、文書保存
部111に保存されている文書に関する閲覧履歴を管理
するための閲覧履歴管理部114、この閲覧履歴管理部
114により生成される閲覧履歴情報が保存される閲覧
履歴情報保存部115、閲覧履歴情報保存部115に保
存されている閲覧履歴情報に基づいて、文書閲覧装置1
30の閲覧対象となっている文書に関連する文書を文書
保存部111に保存されている文書の中から抽出する関
連文書推定処理部116、各部の動作や文書管理装置1
10の全体的な動作の制御、文書閲覧装置130との情
報交換の制御などを司る制御部120を備えている。な
お、文書処理管理システム100は、全体を単一の装置
(文書処理管理装置)として実現される形態、ネットワ
ークで接続された複数の装置の集合体として実現される
形態のいずれでも適用することができるものとする。
【0012】次に、図2および図3を参照して他の実施
形態について説明する。文書処理管理システム100が
全体を単一の装置(文書処理管理装置)として実現され
る形態の場合、またはネットワークで接続された複数の
装置の集合体として実現する形態の場合について説明す
る。図2は、文書処理管理システム100を1つの文書
処理管理装置として実現する実施形態を示した図であ
る。すなわち、文書処理管理システム100を集中シス
テムとして実現する実施形態とする。図2において、ワ
ークステーションなどの汎用のコンピュータ200は、
表示装置201、キーボードやマウスなどの入力装置2
02、ハードディスク装置203、印刷装置204など
の周辺機器を備えている。このコンピュータ200のハ
ードウェア資源を利用し、ソフトウェアにより文書処理
管理システム100の文書管理装置110および文書閲
覧装置130を実現することができる。この場合、情報
保存部(図1での文書保存部111、文書管理情報保存
部113および閲覧履歴情報保存部115に相当する)
として利用されるハードウェア資源については幾つか挙
げることができる。例えば、文書保存部111、文書管
理情報保存部113および閲覧履歴情報保存部115と
して、共通のハードディスク装置203を利用すること
ができる。
形態について説明する。文書処理管理システム100が
全体を単一の装置(文書処理管理装置)として実現され
る形態の場合、またはネットワークで接続された複数の
装置の集合体として実現する形態の場合について説明す
る。図2は、文書処理管理システム100を1つの文書
処理管理装置として実現する実施形態を示した図であ
る。すなわち、文書処理管理システム100を集中シス
テムとして実現する実施形態とする。図2において、ワ
ークステーションなどの汎用のコンピュータ200は、
表示装置201、キーボードやマウスなどの入力装置2
02、ハードディスク装置203、印刷装置204など
の周辺機器を備えている。このコンピュータ200のハ
ードウェア資源を利用し、ソフトウェアにより文書処理
管理システム100の文書管理装置110および文書閲
覧装置130を実現することができる。この場合、情報
保存部(図1での文書保存部111、文書管理情報保存
部113および閲覧履歴情報保存部115に相当する)
として利用されるハードウェア資源については幾つか挙
げることができる。例えば、文書保存部111、文書管
理情報保存部113および閲覧履歴情報保存部115と
して、共通のハードディスク装置203を利用すること
ができる。
【0013】また、コンピュータ200とLAN(ロー
カルエリアネットワーク)210により接続された大容
量記憶装置211を文書保存部111として利用し、ハ
ードディスク装置203を文書管理情報保存部113お
よび閲覧履歴情報保存部115として利用するこように
してもよい。さらに、ルータ、ゲートウェイなどのネッ
トワーク間インターフェイス手段212を介してコンピ
ュータ200と接続されたインターネットや他のLAN
などのネットワーク213上のコンピュータ214など
が所有する大容量記憶装置も文書保存部111もしくは
その一部として利用することができる。このような文書
処理管理システムの実施形態を文書管理装置110およ
び文書閲覧装置130を実現するためのプログラムが記
録された磁気ディスク、光ディスク、光磁気ディスク、
半導体記憶素子などの各種記録媒体として利用するよう
にしてもよい。
カルエリアネットワーク)210により接続された大容
量記憶装置211を文書保存部111として利用し、ハ
ードディスク装置203を文書管理情報保存部113お
よび閲覧履歴情報保存部115として利用するこように
してもよい。さらに、ルータ、ゲートウェイなどのネッ
トワーク間インターフェイス手段212を介してコンピ
ュータ200と接続されたインターネットや他のLAN
などのネットワーク213上のコンピュータ214など
が所有する大容量記憶装置も文書保存部111もしくは
その一部として利用することができる。このような文書
処理管理システムの実施形態を文書管理装置110およ
び文書閲覧装置130を実現するためのプログラムが記
録された磁気ディスク、光ディスク、光磁気ディスク、
半導体記憶素子などの各種記録媒体として利用するよう
にしてもよい。
【0014】図3は、文書処理管理システム100をネ
ットワークで接続された複数の装置の集合体として実現
する実施形態を示した図である。図3において、サーバ
ーマシンとして働くワークステーションなどのコンピュ
ータ300は、大容量記憶装置301を備えている。文
書処理管理システム100の文書管理装置110を、こ
のコンピュータ300のハードウェア資源を利用し、ソ
フトウェアにより実現することができる。コンピュータ
300は、LAN302を介して、クライアントマシン
として働くパソコンなどのコンピュータ303と接続さ
れ、ネットワーク間インターフェイス手段304を介し
て、例えばインターネットなどの他のネットワーク30
5と接続される。1台または複数台のコンピュータ30
3のハードウェア資源をそれぞれ利用し、文書処理管理
システム100の文書閲覧装置130をソフトウェアに
より実現することができる。
ットワークで接続された複数の装置の集合体として実現
する実施形態を示した図である。図3において、サーバ
ーマシンとして働くワークステーションなどのコンピュ
ータ300は、大容量記憶装置301を備えている。文
書処理管理システム100の文書管理装置110を、こ
のコンピュータ300のハードウェア資源を利用し、ソ
フトウェアにより実現することができる。コンピュータ
300は、LAN302を介して、クライアントマシン
として働くパソコンなどのコンピュータ303と接続さ
れ、ネットワーク間インターフェイス手段304を介し
て、例えばインターネットなどの他のネットワーク30
5と接続される。1台または複数台のコンピュータ30
3のハードウェア資源をそれぞれ利用し、文書処理管理
システム100の文書閲覧装置130をソフトウェアに
より実現することができる。
【0015】ネットワーク305に接続されたコンピュ
ータ306などのハードウェア資源を利用し、ソフトウ
ェアにより1つまたは複数の文書閲覧装置130を実現
するようにしてもよい。文書保存部111、文書管理情
報保存部113および閲覧履歴情報保存部115として
は、共通の大容量記憶装置301を利用することができ
る。文書保存部111として、またはその一部として、
LAN302に接続された他のハードディスク装置や、
ネットワーク305に接続されたコンピュータ306な
どの大容量記憶装置を利用するようにしてもよい。この
ような文書処理管理システムの実施形態を文書管理装置
110を実現するためのプログラムが記録された磁気デ
ィスク、光ディスク、光磁気ディスク、半導体記憶素子
などの各種記録媒体として利用するようにしてもよい。
以上のように、本実施の形態に係る文書処理管理システ
ム100は、様々な実現形態として適用することができ
る。
ータ306などのハードウェア資源を利用し、ソフトウ
ェアにより1つまたは複数の文書閲覧装置130を実現
するようにしてもよい。文書保存部111、文書管理情
報保存部113および閲覧履歴情報保存部115として
は、共通の大容量記憶装置301を利用することができ
る。文書保存部111として、またはその一部として、
LAN302に接続された他のハードディスク装置や、
ネットワーク305に接続されたコンピュータ306な
どの大容量記憶装置を利用するようにしてもよい。この
ような文書処理管理システムの実施形態を文書管理装置
110を実現するためのプログラムが記録された磁気デ
ィスク、光ディスク、光磁気ディスク、半導体記憶素子
などの各種記録媒体として利用するようにしてもよい。
以上のように、本実施の形態に係る文書処理管理システ
ム100は、様々な実現形態として適用することができ
る。
【0016】次に、本実施の形態に係る文書処理管理シ
ステム100の動作について説明する。文書管理装置1
10の文書管理部112は、文書保存部111内の文書
群をリレーショナル型データベースとして管理する。こ
のような文書管理部112は、例えば、リレーショナル
型のデータベース・マネージメント・システム(DBM
S)と呼ばれる一般的なソフトウェアによって実現する
ことができる。このような文書管理のために文書管理部
112により生成されて文書管理情報保存部113に保
存される文書管理情報は、例えば、図4に示すような構
造とすることができる。文書管理情報の各レコード(図
中の各行)は、保存文書と1対1に対応している。各レ
コードは、文書の属性である「ID(識別番号)」「文
書名」「保存場所」の値が記録される3つのフィールド
から構成される。「ID」フィールドには、文書を識別
するためのIDを表す値が記録される。「文書名」フィ
ールドには、ユーザが文書に付与した文書名が記録され
る。「文書保存場所」フィールドには、文書の実体が保
存されている場所を特定するための情報が記録される。
インターネット上のWWWサーバーに保存されている文
書の場合、その保存場所を特定するための情報としてU
RL(Uniform Resource Locat
or)が用いられる。
ステム100の動作について説明する。文書管理装置1
10の文書管理部112は、文書保存部111内の文書
群をリレーショナル型データベースとして管理する。こ
のような文書管理部112は、例えば、リレーショナル
型のデータベース・マネージメント・システム(DBM
S)と呼ばれる一般的なソフトウェアによって実現する
ことができる。このような文書管理のために文書管理部
112により生成されて文書管理情報保存部113に保
存される文書管理情報は、例えば、図4に示すような構
造とすることができる。文書管理情報の各レコード(図
中の各行)は、保存文書と1対1に対応している。各レ
コードは、文書の属性である「ID(識別番号)」「文
書名」「保存場所」の値が記録される3つのフィールド
から構成される。「ID」フィールドには、文書を識別
するためのIDを表す値が記録される。「文書名」フィ
ールドには、ユーザが文書に付与した文書名が記録され
る。「文書保存場所」フィールドには、文書の実体が保
存されている場所を特定するための情報が記録される。
インターネット上のWWWサーバーに保存されている文
書の場合、その保存場所を特定するための情報としてU
RL(Uniform Resource Locat
or)が用いられる。
【0017】閲覧履歴管理部114は、文書保存部11
1内の文書群に対する閲覧履歴情報を管理する。閲覧履
歴情報保存部115に保存される閲覧履歴情報は、例え
ば、図5に示すような構造とすることができる。閲覧履
歴情報の各行は、一連の作業において閲覧した文書のI
Dであり、例えば1行目の「1,2,3,」は、IDが
「1」、「2」、「3」の文書、すなわち、文書名が
「××××ファイナンス」、「マネー&マーケット」、
「ABCMail Media」の文書を同一の時期に
閲覧していたという閲覧履歴が記録されている。同様に
4行目の「4,5」は、IDが「4」、「5」、すなわ
ち、文書名が「DEFマリナーズ」、「GHIメッツ」
の文書を同一の時期に閲覧していたという閲覧履歴が記
録されている。これらの記録は日々、蓄積されていくも
のであり、作業を終了した後はファイルとして保存され
る。
1内の文書群に対する閲覧履歴情報を管理する。閲覧履
歴情報保存部115に保存される閲覧履歴情報は、例え
ば、図5に示すような構造とすることができる。閲覧履
歴情報の各行は、一連の作業において閲覧した文書のI
Dであり、例えば1行目の「1,2,3,」は、IDが
「1」、「2」、「3」の文書、すなわち、文書名が
「××××ファイナンス」、「マネー&マーケット」、
「ABCMail Media」の文書を同一の時期に
閲覧していたという閲覧履歴が記録されている。同様に
4行目の「4,5」は、IDが「4」、「5」、すなわ
ち、文書名が「DEFマリナーズ」、「GHIメッツ」
の文書を同一の時期に閲覧していたという閲覧履歴が記
録されている。これらの記録は日々、蓄積されていくも
のであり、作業を終了した後はファイルとして保存され
る。
【0018】関連文書推定処理部116は、文書閲覧装
置130において閲覧中の文書について、その関連文書
を推定する。図6は、ユーザインターフェイスを示した
図である。ユーザインターフェイスはメインウィンドウ
とサブウィンドウの2つの画面で構成されている。メイ
ンウィンドウは、文書名を指定入力する欄、指定された
文書情報を閲覧するために表示する欄、および閲覧中の
文書に対する関連文書群を表示する欄から構成される。
関連文書群として3つの文書名「マネー&マーケッ
ト」、「ABCMail Media」、「Analy
st山田太郎」が列挙されているが、これは閲覧履歴情
報を解析した結果に基づいて決定された文書群であり、
その決定方法については後述の図8のフローチャートを
参照して説明する。これらの関連文書を推定するのが関
連文書推定処理部116である。
置130において閲覧中の文書について、その関連文書
を推定する。図6は、ユーザインターフェイスを示した
図である。ユーザインターフェイスはメインウィンドウ
とサブウィンドウの2つの画面で構成されている。メイ
ンウィンドウは、文書名を指定入力する欄、指定された
文書情報を閲覧するために表示する欄、および閲覧中の
文書に対する関連文書群を表示する欄から構成される。
関連文書群として3つの文書名「マネー&マーケッ
ト」、「ABCMail Media」、「Analy
st山田太郎」が列挙されているが、これは閲覧履歴情
報を解析した結果に基づいて決定された文書群であり、
その決定方法については後述の図8のフローチャートを
参照して説明する。これらの関連文書を推定するのが関
連文書推定処理部116である。
【0019】サブウィンドウでは、閲覧した文書の履歴
が時系列に表示されている。太線で区切りが挿入されて
いるのは、作業の区切りである。作業の区切りは「作業
区分指定」ボタンをユーザが押すことによって挿入され
る。例えば、ユーザが野球に関連する一連の情報(「D
EFマリナーズ」、「GHIメッツ」)を閲覧した後
に、金融経済に関連する情報の閲覧を開始するタイミン
グにおいて作業区分指定ボタンを押す。このボタンはユ
ーザが押すだけではなく、ある一定期間操作が行われな
かったとき、例えば、1時間放置されていたときに自動
的に作業区分指定が入力されたとみなすようにしてもよ
い。
が時系列に表示されている。太線で区切りが挿入されて
いるのは、作業の区切りである。作業の区切りは「作業
区分指定」ボタンをユーザが押すことによって挿入され
る。例えば、ユーザが野球に関連する一連の情報(「D
EFマリナーズ」、「GHIメッツ」)を閲覧した後
に、金融経済に関連する情報の閲覧を開始するタイミン
グにおいて作業区分指定ボタンを押す。このボタンはユ
ーザが押すだけではなく、ある一定期間操作が行われな
かったとき、例えば、1時間放置されていたときに自動
的に作業区分指定が入力されたとみなすようにしてもよ
い。
【0020】図7は、利用時の動作イメージを理解しや
すいようにメインウィンドウの表示画面を時系列に示し
た図である。一番上の表示画面は初期状態であり、関連
文書群は表示されていないものとする。2番目の表示画
面では、ユーザがスポーツ関連の文書情報を閲覧してい
る状態であり、関連文書群として3つの文書名「野
球」、「サッカー」、「テニス」が列挙されている。こ
こでユーザが次に閲覧する文書情報として文書名「サッ
カー」を指定した場合、3番目の表示画面では、指定さ
れた「サッカー」の文書情報が表示され、その隣の関連
文書群を表示する欄には、文書「サッカー」に関連する
情報が表示される。
すいようにメインウィンドウの表示画面を時系列に示し
た図である。一番上の表示画面は初期状態であり、関連
文書群は表示されていないものとする。2番目の表示画
面では、ユーザがスポーツ関連の文書情報を閲覧してい
る状態であり、関連文書群として3つの文書名「野
球」、「サッカー」、「テニス」が列挙されている。こ
こでユーザが次に閲覧する文書情報として文書名「サッ
カー」を指定した場合、3番目の表示画面では、指定さ
れた「サッカー」の文書情報が表示され、その隣の関連
文書群を表示する欄には、文書「サッカー」に関連する
情報が表示される。
【0021】次に、以上のような一連の動作を図8のフ
ローチャートを参照して説明する。文書処理管理システ
ム100の利用を開始すると、まず、文書指定処理にお
いてユーザからの文書指定処理を受け付ける(ステップ
600)。ユーザは、文書の保存場所と文書名を指定
し、次の文書表示処理によって、指定された文書の内容
を図7のメインウィンドウ画面に示すように表示する
(ステップ601)。次に、履歴リスト追加処理におい
て閲覧履歴管理部114は、表示中の文書情報が、過去
に閲覧されたことがあるか否かを文書管理情報保存部1
13の内容を参照し判定する(ステップ602)。過去
に閲覧されたことがある場合は、表示中の文書情報に対
応するID番号を取得し、閲覧されたことがない場合
は、新たに文書管理情報保存部113に新規にIDを発
行し登録する。このIDを閲覧履歴情報として図5に示
すファイルの一番最後に追加する。そして、関連文書群
リスト生成処理(ステップ603)に移行する。
ローチャートを参照して説明する。文書処理管理システ
ム100の利用を開始すると、まず、文書指定処理にお
いてユーザからの文書指定処理を受け付ける(ステップ
600)。ユーザは、文書の保存場所と文書名を指定
し、次の文書表示処理によって、指定された文書の内容
を図7のメインウィンドウ画面に示すように表示する
(ステップ601)。次に、履歴リスト追加処理におい
て閲覧履歴管理部114は、表示中の文書情報が、過去
に閲覧されたことがあるか否かを文書管理情報保存部1
13の内容を参照し判定する(ステップ602)。過去
に閲覧されたことがある場合は、表示中の文書情報に対
応するID番号を取得し、閲覧されたことがない場合
は、新たに文書管理情報保存部113に新規にIDを発
行し登録する。このIDを閲覧履歴情報として図5に示
すファイルの一番最後に追加する。そして、関連文書群
リスト生成処理(ステップ603)に移行する。
【0022】ここで、関連文書推定処理部116におい
て実施される関連文書群リスト生成処理(ステップ60
3)について説明する。関連文書群リスト生成処理で
は、日々蓄積された閲覧履歴情報を解析し、現在閲覧中
の文書の関連文書群を決定し、リストとして生成する。
そのアルゴリズムを図9を用いて説明する。次のような
3つの閲覧履歴情報(共出現情報1、2、3の閲覧履
歴)が蓄積され、現在「B」の情報を閲覧中の場合を想
定すると、情報「B」と連接特徴を持つ情報は、共出現
情報1および共出現情報2において出現した「A」、
「C」、「D」の情報であることになる。すなわち、
「B」を閲覧しているときは「A」、「C」、「D」の
3種類のいずれかを閲覧する可能性が高いということで
ある。ユーザにとって理想的な関連情報群としては、
「B」閲覧時の事後確率分布(C:50%,A:25
%,D:25%)を求めることにより推定することがで
きる。
て実施される関連文書群リスト生成処理(ステップ60
3)について説明する。関連文書群リスト生成処理で
は、日々蓄積された閲覧履歴情報を解析し、現在閲覧中
の文書の関連文書群を決定し、リストとして生成する。
そのアルゴリズムを図9を用いて説明する。次のような
3つの閲覧履歴情報(共出現情報1、2、3の閲覧履
歴)が蓄積され、現在「B」の情報を閲覧中の場合を想
定すると、情報「B」と連接特徴を持つ情報は、共出現
情報1および共出現情報2において出現した「A」、
「C」、「D」の情報であることになる。すなわち、
「B」を閲覧しているときは「A」、「C」、「D」の
3種類のいずれかを閲覧する可能性が高いということで
ある。ユーザにとって理想的な関連情報群としては、
「B」閲覧時の事後確率分布(C:50%,A:25
%,D:25%)を求めることにより推定することがで
きる。
【0023】事後確率分布の算出方法は、閲覧中の文書
(図9では「B」)について過去に共出現情報として用
いられた文書(図9では、共出現情報1における
「A」、「C」、および共出現情報2における「C」、
「D」を合わせた「A」、「C」、「C」、「D」)を
列挙し、文書毎に出現した確率を求める。この結果、
「C」は、のべ4文書中2回出現しているので50%、
「A」は、のべ4文書中1回出現しているので25%、
同様に「D」は25%となる。この場合、「B」を閲覧
しているときは、「C」が最も必要な情報(共出現情報
1および共出現情報2の両方で利用されている)であ
り、「A」、「D」がそれに次ぐ情報ということにな
る。なお、一例として「B」を閲覧中の場合について述
べたが、「B」以外の情報に関しても同様の手法で関連
文書群を生成することができ、閲覧中の情報の変化に合
わせて算出し関連文書群を生成し続けることができる。
このように関連文書群のリストが生成され、図7に示す
ような結果が表示される。
(図9では「B」)について過去に共出現情報として用
いられた文書(図9では、共出現情報1における
「A」、「C」、および共出現情報2における「C」、
「D」を合わせた「A」、「C」、「C」、「D」)を
列挙し、文書毎に出現した確率を求める。この結果、
「C」は、のべ4文書中2回出現しているので50%、
「A」は、のべ4文書中1回出現しているので25%、
同様に「D」は25%となる。この場合、「B」を閲覧
しているときは、「C」が最も必要な情報(共出現情報
1および共出現情報2の両方で利用されている)であ
り、「A」、「D」がそれに次ぐ情報ということにな
る。なお、一例として「B」を閲覧中の場合について述
べたが、「B」以外の情報に関しても同様の手法で関連
文書群を生成することができ、閲覧中の情報の変化に合
わせて算出し関連文書群を生成し続けることができる。
このように関連文書群のリストが生成され、図7に示す
ような結果が表示される。
【0024】次に、作業区分指定処理に移行し、ユーザ
が作業の区切りかどうかの入力を受け付ける(ステップ
604)。ユーザからの指定がなければ、作業終了か否
かの入力を受け付け(ステップ605)、終了しない場
合(ステップ605;N)、最初の文書指定処理へと戻
る(ステップ600)。2回目以降の文書指定処理は、
1回目と同様にユーザが文書の保存場所と文書名を指定
してもよいし、ユーザは関連文書群リストとして表示さ
れたリストの中から選択するようにしてもよい。
が作業の区切りかどうかの入力を受け付ける(ステップ
604)。ユーザからの指定がなければ、作業終了か否
かの入力を受け付け(ステップ605)、終了しない場
合(ステップ605;N)、最初の文書指定処理へと戻
る(ステップ600)。2回目以降の文書指定処理は、
1回目と同様にユーザが文書の保存場所と文書名を指定
してもよいし、ユーザは関連文書群リストとして表示さ
れたリストの中から選択するようにしてもよい。
【0025】以上のように、本実施の形態の文書処理管
理システムでは、文書群を過去にどのように閲覧してい
るかについての統計的性質を活用するので、分類整理や
キーワード検索などの手間をかけることなく閲覧中の文
書の関連文書を抽出することができる。また、本実施の
形態の文書処理管理システムでは、文書を閲覧した時系
列を解析することにより、ユーザのニーズを考慮した関
連文書を抽出することができる。本実施の形態の文書処
理管理システムでは、閲覧作業単位別に文書を閲覧した
時系列を解析することにより、ユーザの作業単位別のニ
ーズを考慮した関連文書を抽出することができる。ま
た、本実施の形態の文書処理管理システムでは、閲覧中
の文書と時系列において近傍に位置する文書に関する統
計的性質を解析することにより、閲覧中の文書との関連
を高い精度で解析することができる。さらに、本実施の
形態の文書処理管理システムでは、閲覧中の文書との関
連の強さを閲覧履歴における確率として求めることによ
り、関連の強さをユーザが把握することができる。ま
た、本実施の形態の文書処理管理システムでは、閲覧す
る確率の高い順に関連文書のリストを表示することによ
って、ユーザが関連の強さを容易に把握することができ
る。
理システムでは、文書群を過去にどのように閲覧してい
るかについての統計的性質を活用するので、分類整理や
キーワード検索などの手間をかけることなく閲覧中の文
書の関連文書を抽出することができる。また、本実施の
形態の文書処理管理システムでは、文書を閲覧した時系
列を解析することにより、ユーザのニーズを考慮した関
連文書を抽出することができる。本実施の形態の文書処
理管理システムでは、閲覧作業単位別に文書を閲覧した
時系列を解析することにより、ユーザの作業単位別のニ
ーズを考慮した関連文書を抽出することができる。ま
た、本実施の形態の文書処理管理システムでは、閲覧中
の文書と時系列において近傍に位置する文書に関する統
計的性質を解析することにより、閲覧中の文書との関連
を高い精度で解析することができる。さらに、本実施の
形態の文書処理管理システムでは、閲覧中の文書との関
連の強さを閲覧履歴における確率として求めることによ
り、関連の強さをユーザが把握することができる。ま
た、本実施の形態の文書処理管理システムでは、閲覧す
る確率の高い順に関連文書のリストを表示することによ
って、ユーザが関連の強さを容易に把握することができ
る。
【0026】
【発明の効果】請求項1記載の発明では、指示入力手段
によって文書データの閲覧指示が入力された場合、当該
閲覧指示された文書データを文書データ格納手段から抽
出し、閲覧指示回数、閲覧時間などの統計的数字と関連
付けした閲覧文書履歴情報として記憶する閲覧履歴記憶
手段と、閲覧履歴記憶手段に記憶された閲覧文書履歴情
報に関連付けされた統計的数字を解析することにより、
指示入力手段によって閲覧指示された文書データと統計
的数字が近似する閲覧文書履歴情報の文書データを関連
文書データとして前記文書データ格納手段から抽出する
文書データ抽出手段と、を備えるので、文書群を過去に
どのように閲覧しているかについての統計的性質を活用
することができ、分類整理やキーワード検索などの手間
をかけることなく閲覧中の文書の関連文書抽出すること
ができる。
によって文書データの閲覧指示が入力された場合、当該
閲覧指示された文書データを文書データ格納手段から抽
出し、閲覧指示回数、閲覧時間などの統計的数字と関連
付けした閲覧文書履歴情報として記憶する閲覧履歴記憶
手段と、閲覧履歴記憶手段に記憶された閲覧文書履歴情
報に関連付けされた統計的数字を解析することにより、
指示入力手段によって閲覧指示された文書データと統計
的数字が近似する閲覧文書履歴情報の文書データを関連
文書データとして前記文書データ格納手段から抽出する
文書データ抽出手段と、を備えるので、文書群を過去に
どのように閲覧しているかについての統計的性質を活用
することができ、分類整理やキーワード検索などの手間
をかけることなく閲覧中の文書の関連文書抽出すること
ができる。
【0027】請求項2記載の発明では、閲覧履歴記憶手
段は、閲覧履歴情報を時系列に並べた閲覧履歴一覧とし
て記憶し、文書データ抽出手段は、閲覧履歴記憶手段に
記憶された閲覧履歴一覧の時系列の統計的数字を解析す
ることにより、関連文書データを抽出するので、文書を
閲覧した時系列を解析することにより、ユーザのニーズ
を考慮した関連文書を抽出することができる。
段は、閲覧履歴情報を時系列に並べた閲覧履歴一覧とし
て記憶し、文書データ抽出手段は、閲覧履歴記憶手段に
記憶された閲覧履歴一覧の時系列の統計的数字を解析す
ることにより、関連文書データを抽出するので、文書を
閲覧した時系列を解析することにより、ユーザのニーズ
を考慮した関連文書を抽出することができる。
【0028】請求項3記載の発明では、指示計測手段に
よって所定時間が計測された場合、または、指示入力手
段によって閲覧文書データの変更指示が入力された場
合、文書データ抽出手段は、文書データ格納手段から閲
覧指示された文書データ以外の文書データに関連付けさ
れた閲覧履歴情報を解析することにより、文書データ格
納手段から関連文書データを抽出するので、閲覧作業単
位別に文書を閲覧した時系列を解析することにより、ユ
ーザの作業単位別のニーズを考慮した関連文書を抽出す
ることができる。
よって所定時間が計測された場合、または、指示入力手
段によって閲覧文書データの変更指示が入力された場
合、文書データ抽出手段は、文書データ格納手段から閲
覧指示された文書データ以外の文書データに関連付けさ
れた閲覧履歴情報を解析することにより、文書データ格
納手段から関連文書データを抽出するので、閲覧作業単
位別に文書を閲覧した時系列を解析することにより、ユ
ーザの作業単位別のニーズを考慮した関連文書を抽出す
ることができる。
【0029】請求項4記載の発明では、文書データ抽出
手段は、閲覧履歴記憶手段に記憶された時系列の閲覧履
歴一覧のうち、指示入力手段によって閲覧指示された文
書データの閲覧時間が時系列において近似する閲覧文書
履歴情報の文書データを関連文書データとして文書デー
タ格納手段から抽出するので、閲覧中の文書と時系列に
おいて近傍に位置する文書に関する統計的性質を解析し
て閲覧中の文書との関連を高い精度で解析することがで
きる。
手段は、閲覧履歴記憶手段に記憶された時系列の閲覧履
歴一覧のうち、指示入力手段によって閲覧指示された文
書データの閲覧時間が時系列において近似する閲覧文書
履歴情報の文書データを関連文書データとして文書デー
タ格納手段から抽出するので、閲覧中の文書と時系列に
おいて近傍に位置する文書に関する統計的性質を解析し
て閲覧中の文書との関連を高い精度で解析することがで
きる。
【0030】請求項5記載の発明では、文書データ抽出
手段によって関連文書データとして文書データ格納手段
から抽出される文書データの抽出確率を算出する抽出確
率算出手段をさらに備えるので、閲覧中の文書との関連
の強さを閲覧履歴における確率として求めることがで
き、関連の強さをユーザが把握することができる。
手段によって関連文書データとして文書データ格納手段
から抽出される文書データの抽出確率を算出する抽出確
率算出手段をさらに備えるので、閲覧中の文書との関連
の強さを閲覧履歴における確率として求めることがで
き、関連の強さをユーザが把握することができる。
【0031】請求項6記載の発明では、抽出確率算出手
段によって算出された抽出確率に基づいて、文書データ
格納手段に格納されている文書データを関連文書データ
一覧として提示する文書データ提示手段をさらに備え、
文書データ提示手段は、抽出確率算出手段によって算出
された抽出確率が高い順に提示するので、閲覧する確率
の高い順に関連文書のリストを表示することによって、
ユーザが関連の強さを容易に把握することができる。
段によって算出された抽出確率に基づいて、文書データ
格納手段に格納されている文書データを関連文書データ
一覧として提示する文書データ提示手段をさらに備え、
文書データ提示手段は、抽出確率算出手段によって算出
された抽出確率が高い順に提示するので、閲覧する確率
の高い順に関連文書のリストを表示することによって、
ユーザが関連の強さを容易に把握することができる。
【図1】本実施の形態に係る文書処理管理システムの概
略構成を示したブロック図である。
略構成を示したブロック図である。
【図2】文書処理管理システムを1つの文書処理管理装
置として実現する実施形態を示した図である。
置として実現する実施形態を示した図である。
【図3】文書処理管理システムをネットワークで接続さ
れた複数の装置の集合体として実現する実施形態を示し
た図である。
れた複数の装置の集合体として実現する実施形態を示し
た図である。
【図4】文書管理情報の一例を示した図である。
【図5】閲覧履歴情報の一例を示す図である。
【図6】ユーザインターフェイスを示した図である。
【図7】メインウィンドウの表示画面の時系列変換を示
した図である。
した図である。
【図8】文書処理管理システムの全体的動作手順を示し
たフローチャートである。
たフローチャートである。
【図9】文書の閲覧履歴情報を説明する模式図である。
【符号の説明】
100 文書処理管理システム
110 文書管理装置
111 文書保存部
112 文書管理部
113 文書管理情報保存部
114 閲覧履歴管理部
115 閲覧履歴情報保存部
116 関連文書推定処理部
120 制御部
130 文書閲覧装置
131 入力装置
132 表示装置
133 補助記憶装置
200 コンピュータ
201 表示装置
202 入力装置
203 ハードディスク装置
204 印刷装置
210 LAN(ローカルエリアネットワーク)
211 大容量記憶装置
212 ネットワーク間インターフェイス手段
213 ネットワーク
214 コンピュータ
300 コンピュータ
302 LAN
303 コンピュータ
304 ネットワーク間インターフェイス手段
305 ネットワーク
306 コンピュータ
Claims (6)
- 【請求項1】 受領した文書データを格納する文書デー
タ格納手段と、 前記文書データ格納手段に格納されている文書データに
対する閲覧指示または閲覧文書データの変更指示の指示
入力を促す指示入力手段と、 前記指示入力手段によって文書データの閲覧指示が入力
された場合、当該閲覧指示された文書データを前記文書
データ格納手段から抽出し、閲覧指示回数、閲覧時間な
どの統計的数字と関連付けした閲覧文書履歴情報として
記憶する閲覧履歴記憶手段と、 前記閲覧履歴記憶手段に記憶された閲覧文書履歴情報に
関連付けされた統計的数字を解析することにより、前記
指示入力手段によって閲覧指示された文書データと統計
的数字が近似する閲覧文書履歴情報の文書データを関連
文書データとして前記文書データ格納手段から抽出する
文書データ抽出手段と、を備えたことを特徴とする文書
処理管理装置。 - 【請求項2】 前記閲覧履歴記憶手段は、前記閲覧履歴
情報を時系列に並べた閲覧履歴一覧として記憶し、前記
文書データ抽出手段は、前記閲覧履歴記憶手段に記憶さ
れた閲覧履歴一覧の時系列の統計的数字を解析すること
により、前記関連文書データを抽出することを特徴とす
る請求項1記載の文書処理管理装置。 - 【請求項3】 前記指示入力手段による指示入力が行わ
れる時間間隔を計測する指示計測手段をさらに備え、 前記指示計測手段によって所定時間が計測された場合、
または、前記指示入力手段によって閲覧文書データの変
更指示が入力された場合、前記文書データ抽出手段は、
前記文書データ格納手段から前記閲覧指示された文書デ
ータ以外の文書データに関連付けされた閲覧履歴情報を
解析することにより、前記文書データ格納手段から前記
関連文書データを抽出することを特徴とする請求項1ま
たは請求項2記載の文書処理管理装置。 - 【請求項4】 前記文書データ抽出手段は、前記閲覧履
歴記憶手段に記憶された時系列の閲覧履歴一覧のうち、
前記指示入力手段によって閲覧指示された文書データの
閲覧時間が時系列において近似する閲覧文書履歴情報の
文書データを前記関連文書データとして前記文書データ
格納手段から抽出することを特徴とする請求項1、請求
項2、請求項3のうちいずれか1に記載の文書処理管理
装置。 - 【請求項5】 前記文書データ抽出手段によって関連文
書データとして前記文書データ格納手段から抽出される
文書データの抽出確率を算出する抽出確率算出手段をさ
らに備えたことを特徴とする請求項1、請求項2、請求
項3、請求項4のうちいずれか1に記載の文書処理管理
装置。 - 【請求項6】 前記抽出確率算出手段によって算出され
た抽出確率に基づいて、前記文書データ格納手段に格納
されている文書データを関連文書データ一覧として提示
する文書データ提示手段をさらに備え、 前記文書データ提示手段は、前記抽出確率算出手段によ
って算出された抽出確率が高い順に提示することを特徴
とする請求項5記載の文書処理管理装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001274960A JP2003085204A (ja) | 2001-09-11 | 2001-09-11 | 文書処理管理装置 |
US10/230,192 US7127476B2 (en) | 2001-09-11 | 2002-08-29 | Apparatus and method for document processing and management |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001274960A JP2003085204A (ja) | 2001-09-11 | 2001-09-11 | 文書処理管理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003085204A true JP2003085204A (ja) | 2003-03-20 |
Family
ID=19099906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001274960A Pending JP2003085204A (ja) | 2001-09-11 | 2001-09-11 | 文書処理管理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7127476B2 (ja) |
JP (1) | JP2003085204A (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025209A1 (ja) * | 2004-08-30 | 2006-03-09 | Pioneer Corporation | 画像表示制御装置及び画像表示方法 |
JP2008059099A (ja) * | 2006-08-29 | 2008-03-13 | Access Co Ltd | 情報表示装置、情報表示プログラム、および情報表示システム |
JP2010140257A (ja) * | 2008-12-11 | 2010-06-24 | Canon It Solutions Inc | 情報処理装置及び情報処理方法 |
JP2011128908A (ja) * | 2009-12-17 | 2011-06-30 | Canon Software Inc | 情報処理装置及び情報処理方法 |
JP2012118624A (ja) * | 2010-11-29 | 2012-06-21 | Sharp Corp | コンテンツ提示装置、外部推薦装置およびコンテンツ提示システム |
WO2014083928A1 (ja) * | 2012-11-28 | 2014-06-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理装置、プログラム及び情報処理方法 |
US9170725B2 (en) | 2012-03-15 | 2015-10-27 | Fuji Xerox Co., Ltd. | Information processing apparatus, non-transitory computer readable medium, and information processing method that detect associated documents based on distance between documents |
US9338313B2 (en) | 2011-02-18 | 2016-05-10 | Ricoh Company, Limited | Document management apparatus and document management system |
JP2018037121A (ja) * | 2017-12-12 | 2018-03-08 | シャープ株式会社 | 端末装置、提示方法、及び提示プログラム |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6981040B1 (en) * | 1999-12-28 | 2005-12-27 | Utopy, Inc. | Automatic, personalized online information and product services |
US20050138049A1 (en) * | 2003-12-22 | 2005-06-23 | Greg Linden | Method for personalized news |
US7496385B2 (en) | 2003-12-29 | 2009-02-24 | International Business Machines Corporation | Method for viewing information underlying lists and other contexts |
US8151214B2 (en) | 2003-12-29 | 2012-04-03 | International Business Machines Corporation | System and method for color coding list items |
US7908566B2 (en) | 2003-12-29 | 2011-03-15 | International Business Machines Corporation | System and method for scrolling among categories in a list of documents |
US7421664B2 (en) * | 2003-12-29 | 2008-09-02 | International Business Machines Corporation | System and method for providing a category separator in a list of documents |
US7895537B2 (en) * | 2003-12-29 | 2011-02-22 | International Business Machines Corporation | Method and apparatus for setting attributes and initiating actions through gestures |
US8171426B2 (en) * | 2003-12-29 | 2012-05-01 | International Business Machines Corporation | Method for secondary selection highlighting |
US7631276B2 (en) * | 2003-12-29 | 2009-12-08 | International Business Machines Corporation | Method for indication and navigating related items |
JP2006344118A (ja) * | 2005-06-10 | 2006-12-21 | Fuji Xerox Co Ltd | 利用状況通知システム |
US20080072225A1 (en) * | 2006-09-19 | 2008-03-20 | Tetsuro Nagatsuka | Information processing apparatus, information processing method, program, and recording medium |
US9870554B1 (en) | 2012-10-23 | 2018-01-16 | Google Inc. | Managing documents based on a user's calendar |
US10140198B1 (en) | 2012-10-30 | 2018-11-27 | Google Llc | Networked desktop environment |
US20140195904A1 (en) * | 2013-01-06 | 2014-07-10 | Chao-Chin Chang | Technical documents capturing and patents analysis system and method |
US9842113B1 (en) | 2013-08-27 | 2017-12-12 | Google Inc. | Context-based file selection |
US9973462B1 (en) | 2013-10-21 | 2018-05-15 | Google Llc | Methods for generating message notifications |
CN107766527A (zh) * | 2017-10-26 | 2018-03-06 | 努比亚技术有限公司 | 一种快速查找文件方法、移动终端及计算机可读存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5850298A (en) * | 1994-03-22 | 1998-12-15 | Ricoh Company, Ltd. | Image processing device eliminating background noise |
JP3600372B2 (ja) * | 1995-06-27 | 2004-12-15 | 株式会社リコー | 色再現域補正装置および方法 |
JP2000020202A (ja) | 1998-06-30 | 2000-01-21 | Fujitsu Ltd | 情報参照支援装置 |
JP2001318939A (ja) * | 2000-05-09 | 2001-11-16 | Hitachi Ltd | 文書処理方法及び装置並びにその処理プログラムを記憶した媒体 |
JP2002032364A (ja) * | 2000-07-14 | 2002-01-31 | Ricoh Co Ltd | 文書情報処理方法、文書情報処理装置及び記録媒体 |
US6990631B2 (en) * | 2000-07-14 | 2006-01-24 | Ricoh Company, Ltd. | Document management apparatus, related document extracting method, and document processing assist method |
JP3916124B2 (ja) * | 2001-02-15 | 2007-05-16 | インターナショナル・ビジネス・マシーンズ・コーポレーション | デジタル文書閲覧システム、ブラウザ、デジタル文書表示方法、プログラム及び記憶媒体 |
JP2003067306A (ja) * | 2001-08-24 | 2003-03-07 | Hitachi Ltd | 電子メールの蓄積管理方法 |
WO2003040963A1 (en) * | 2001-11-02 | 2003-05-15 | Medical Research Consultants L.P. | Knowledge management system |
-
2001
- 2001-09-11 JP JP2001274960A patent/JP2003085204A/ja active Pending
-
2002
- 2002-08-29 US US10/230,192 patent/US7127476B2/en not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006025209A1 (ja) * | 2004-08-30 | 2006-03-09 | Pioneer Corporation | 画像表示制御装置及び画像表示方法 |
JP2008059099A (ja) * | 2006-08-29 | 2008-03-13 | Access Co Ltd | 情報表示装置、情報表示プログラム、および情報表示システム |
JP2010140257A (ja) * | 2008-12-11 | 2010-06-24 | Canon It Solutions Inc | 情報処理装置及び情報処理方法 |
JP2011128908A (ja) * | 2009-12-17 | 2011-06-30 | Canon Software Inc | 情報処理装置及び情報処理方法 |
JP2012118624A (ja) * | 2010-11-29 | 2012-06-21 | Sharp Corp | コンテンツ提示装置、外部推薦装置およびコンテンツ提示システム |
US9338313B2 (en) | 2011-02-18 | 2016-05-10 | Ricoh Company, Limited | Document management apparatus and document management system |
US9170725B2 (en) | 2012-03-15 | 2015-10-27 | Fuji Xerox Co., Ltd. | Information processing apparatus, non-transitory computer readable medium, and information processing method that detect associated documents based on distance between documents |
WO2014083928A1 (ja) * | 2012-11-28 | 2014-06-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 情報処理装置、プログラム及び情報処理方法 |
US9292596B2 (en) | 2012-11-28 | 2016-03-22 | International Business Machines Corporation | Relevance-based information processing |
JP2018037121A (ja) * | 2017-12-12 | 2018-03-08 | シャープ株式会社 | 端末装置、提示方法、及び提示プログラム |
Also Published As
Publication number | Publication date |
---|---|
US20030051212A1 (en) | 2003-03-13 |
US7127476B2 (en) | 2006-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003085204A (ja) | 文書処理管理装置 | |
US11657065B2 (en) | Clustering events while excluding extracted values | |
Trippe | Patinformatics: Tasks to tools | |
JP4772378B2 (ja) | Webページから時系列データを生成する方法及び装置 | |
US9015194B2 (en) | Root cause analysis using interactive data categorization | |
US6336112B2 (en) | Method for interactively creating an information database including preferred information elements, such as, preferred-authority, world wide web pages | |
USRE41899E1 (en) | System for ranking the relevance of information objects accessed by computer users | |
US20050203888A1 (en) | Method and apparatus for improved relevance of search results | |
EP2840515A1 (en) | Method, device and computer storage media for user preferences information collection | |
US20090204588A1 (en) | Method and apparatus for determining key attribute items | |
US20090248678A1 (en) | Information recommendation device and information recommendation method | |
US20020143797A1 (en) | File classification management system and method used in operating systems | |
US20070174254A1 (en) | Systems and methods for organizing data | |
JP2012517046A (ja) | 文献分析システム | |
US8560518B2 (en) | Method and apparatus for building sales tools by mining data from websites | |
JP2007193685A (ja) | 人脈情報表示プログラム、該プログラムを記録した記録媒体、人脈情報表示装置、および人脈情報表示方法 | |
TWI284818B (en) | Database searching engine system | |
JP2003173280A (ja) | データベース生成装置、データベース生成方法及びデータベース生成プログラム | |
JP2000181759A (ja) | 時系列データ検索システムと検索方法およびそのプログラムを記録した記録媒体 | |
Bakariya et al. | An efficient algorithm for extracting infrequent itemsets from weblog. | |
KR100557874B1 (ko) | 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체 | |
JP3746233B2 (ja) | 知識分析システムおよび知識分析方法 | |
WO2001027712A2 (en) | A method and system for automatically structuring content from universal marked-up documents | |
US20010051942A1 (en) | Information retrieval user interface method | |
JP4309497B2 (ja) | 情報検索装置および情報検索方法 |