JP2003085204A - 文書処理管理装置 - Google Patents

文書処理管理装置

Info

Publication number
JP2003085204A
JP2003085204A JP2001274960A JP2001274960A JP2003085204A JP 2003085204 A JP2003085204 A JP 2003085204A JP 2001274960 A JP2001274960 A JP 2001274960A JP 2001274960 A JP2001274960 A JP 2001274960A JP 2003085204 A JP2003085204 A JP 2003085204A
Authority
JP
Japan
Prior art keywords
document
document data
browsing
information
instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001274960A
Other languages
English (en)
Inventor
Koichi Narahara
孝一 楢原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001274960A priority Critical patent/JP2003085204A/ja
Priority to US10/230,192 priority patent/US7127476B2/en
Publication of JP2003085204A publication Critical patent/JP2003085204A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99954Version management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 あらかじめ文書の分類整理や関連付け、キー
ワード入力などの作業を行う必要なく、閲覧中の文書と
関連している可能性の高い文書を保存文書群から自動的
に抽出することができる文書処理管理装置を提供するこ
と。 【解決手段】 ユーザによって指定された文書の保存場
所と文書名をメインウィンドウ画面に表示する。閲覧履
歴管理部114は、表示中の文書情報が、過去に閲覧さ
れたことがあるか否かを文書管理情報保存部113の内
容を参照し判定する。過去に閲覧されたことがある場
合、表示中の文書情報に対応するID番号を取得し、閲
覧されたことがない場合、新たに文書管理情報保存部1
13に新規にIDを発行し登録する。関連文書群リスト
生成処理では、日々蓄積された閲覧履歴情報を解析し、
現在閲覧中の文書の関連文書群を決定し、リストとして
生成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、大量の文書データ
を扱う装置やシステム、特に保存文書群を管理する文書
処理管理装置に係り、より詳細には、大量の保存文書群
から閲覧中の文書に関連した文書を抽出する文書処理管
理装置に関する。
【0002】
【従来の技術】近年、通信技術の普及に伴い、誰でも様
々な情報を取得することができ、扱われる情報量も膨大
なものとなってきている。膨大な情報の中から所望の情
報や文書を効率良く見つけ出すことが求められている。
一般的に、コンピュータのファイルシステムでは階層デ
ィレクトリを用いて文書を管理し、階層ディレクトリ上
で文書の分類整理を徹底することにより、関連のある文
書を見つけやすくしている。また、キーワード検索によ
って、特定の語句を含む文書を検索するための各種の検
索ツールが知られている。このキーワード検索では、特
定の語句を含む関連文書を見つけ出すことができるま
た、インターネット上のワールド・ワイド・ウェブ(W
WW)では、関連する文書をリンクによって結びつける
ことができ、関連文書の参照が容易になっている。さら
に、WWWブラウザなどでは、一定期間あるいは一定数
までの文書の閲覧履歴を表示したり、閲覧頻度によって
文書を順位付けする技術が知られている。このような情
報や文書の検索技術について、特開2000−2020
2号公報には、ユーザによる情報の閲覧履歴をユーザの
指定した重要度判断基準に従って分析し、この分析の結
果に従って、重要度の高い情報をユーザによって関連付
けされたシンボルで表示する情報参照支援装置が記載さ
れている。
【0003】
【発明が解決しようとする課題】しかしながら、文書を
閲覧する場合、その文書の関連文書を参照したいだけの
場合が少なくない。階層ディレクトリで文書が管理され
ている場合、関連文書を見つけやすくなってはいるが、
文書の保存時にあらかじめ文書を分類する作業が必要と
なる。また、文書の増加に伴い、分類体系の変更もしば
しば必要となり、その変更には多くの作業と時間を要す
ることととなる。また、キーワード検索の技術によれ
ば、特定の語句を含む関連文書を見つけ出すことができ
るが、キーワード入力を必須とし、また関連文書を検索
するための適切なキーワードの選定が必ずしも容易なも
のとは限らない。WWWブラウザなどでは、関連文書の
参照を容易にするために、あらかじめ文書の関連を調
べ、関連した文書間にリンクを構築する作業が必要とな
る。
【0004】また、一定期間あるいは一定数までの文書
の閲覧履歴を表示したり、閲覧頻度によって文書を順位
付けする方法や、特開2000−20202号公報に記
載されているような情報参照支援装置では、ある文書と
関連した文書を効率良く見つけ出すことが必ずできるわ
けではなく、また、事前にシンボルと重要度判断基準と
の関係などを定義する作業も必要となる。通常、文書の
利用状況を観察すると、どの文書も均一に閲覧されるわ
けではなく、個々の人によって閲覧する文書には偏りが
ある。関心があり閲覧頻度の多い文書群は、共出現情報
として繰り返し参照されるという統計的性質がある。こ
こで、共出現情報とは、まとまった一連の作業中に参照
した文書をいうものとする。図9は、文書の閲覧履歴情
報を説明する模式図である。図9では閲覧した文書
「A」、「B」、「C」、、、を時系列に並べ、共出現
情報である一連の作業を単位に丸(○)で括っている。
図9を一例として時系列を観察すると、「B」を閲覧し
ているときは同時に「C」を閲覧する傾向が最も強く、
次いで「A」、「D」となり、「E」は同時に閲覧して
いないことがわかる。
【0005】そこで、本発明の第1の目的は、ユーザに
よって閲覧や参照する文書に偏りが発生するという統計
的性質に着目することにより、あらかじめ文書の分類整
理や関連付け、キーワード入力などの作業を行う必要な
く、閲覧中の文書と関連している可能性の高い文書を保
存文書群から自動的に抽出することができる文書処理管
理装置を提供することである。本発明の第2の目的は、
文書の閲覧作業を支援するための文書の分類整理や関連
付け、キーワード入力などの事前作業を行うことなく、
閲覧中の文書に関連した文書を容易に参照することがで
きる文書処理管理装置を提供することである。
【0006】
【課題を解決するための手段】請求項1記載の発明で
は、受領した文書データを格納する文書データ格納手段
と、前記文書データ格納手段に格納されている文書デー
タに対する閲覧指示または閲覧文書データの変更指示の
指示入力を促す指示入力手段と、前記指示入力手段によ
って文書データの閲覧指示が入力された場合、当該閲覧
指示された文書データを前記文書データ格納手段から抽
出し、閲覧指示回数、閲覧時間などの統計的数字と関連
付けした閲覧文書履歴情報として記憶する閲覧履歴記憶
手段と、前記閲覧履歴記憶手段に記憶された閲覧文書履
歴情報に関連付けされた統計的数字を解析することによ
り、前記指示入力手段によって閲覧指示された文書デー
タと統計的数字が近似する閲覧文書履歴情報の文書デー
タを関連文書データとして前記文書データ格納手段から
抽出する文書データ抽出手段と、を備えたことにより、
前記第1および第2の目的を達成する。
【0007】請求項2記載の発明では、請求項1記載の
発明において、前記閲覧履歴記憶手段は、前記閲覧履歴
情報を時系列に並べた閲覧履歴一覧として記憶し、前記
文書データ抽出手段は、前記閲覧履歴記憶手段に記憶さ
れた閲覧履歴一覧の時系列の統計的数字を解析して前記
関連文書データを抽出することにより、前記第1および
第2の目的を達成する。請求項3記載の発明では、請求
項1または請求項2記載の発明において、前記指示入力
手段による指示入力が行われる時間間隔を計測する指示
計測手段をさらに備え、前記指示計測手段によって所定
時間が計測された場合、または、前記指示入力手段によ
って閲覧文書データの変更指示が入力された場合、前記
文書データ抽出手段は、前記文書データ格納手段から前
記閲覧指示された文書データ以外の文書データに関連付
けされた閲覧履歴情報を解析して前記文書データ格納手
段から前記関連文書データを抽出することにより、前記
第1および第2の目的を達成する。
【0008】請求項4記載の発明では、請求項1、請求
項2、請求項3のうちいずれか1に記載の発明におい
て、前記文書データ抽出手段は、前記閲覧履歴記憶手段
に記憶された時系列の閲覧履歴一覧のうち、前記指示入
力手段によって閲覧指示された文書データの閲覧時間が
時系列において近似する閲覧文書履歴情報の文書データ
を前記関連文書データとして前記文書データ格納手段か
ら抽出することにより、前記第1および第2の目的を達
成する。
【0009】請求項5記載の発明では、請求項1、請求
項2、請求項3、請求項4のうちいずれか1に記載の発
明において、前記文書データ抽出手段によって関連文書
データとして前記文書データ格納手段から抽出される文
書データの抽出確率を算出する抽出確率算出手段をさら
に備えたことにより、前記第1および第2の目的を達成
する。請求項6記載の発明では、請求項5記載の発明に
おいて、前記抽出確率算出手段によって算出された抽出
確率に基づいて、前記文書データ格納手段に格納されて
いる文書データを関連文書データ一覧として提示する文
書データ提示手段をさらに備え、前記文書データ提示手
段は、前記抽出確率算出手段によって算出された抽出確
率が高い順に提示することにより、前記第1および第2
の目的を達成する。
【0010】
【発明の実施の形態】以下、本発明の好適な実施の形態
について図1ないし図9を参照して詳細に説明する。図
1は、本実施の形態に係る文書処理管理システム100
の概略構成を示したブロック図である。この文書処理管
理システム100は、文書管理装置110と、文書管理
装置110により管理されている文書を閲覧するための
文書閲覧装置130から構成されている。文書閲覧装置
130は、ユーザが各種指示やデータを入力するための
キーボードやマウスなどの入力装置131、文書を表示
し操作するために利用される表示装置132やハードデ
ィスク装置などの補助記憶装置133を備えている。本
実施の形態では、一例として文書閲覧装置130は一台
として説明するが、同様の構成の文書閲覧装置130を
複数台、文書管理装置110に接続するようにしてもよ
い。
【0011】文書管理装置110は、多数の文書の実体
が保存される文書保存部111、この文書保存部111
に保存されている文書群を管理する文書管理部112、
この文書管理部112による文書管理のための文書管理
情報が保存される文書管理情報保存部113、文書保存
部111に保存されている文書に関する閲覧履歴を管理
するための閲覧履歴管理部114、この閲覧履歴管理部
114により生成される閲覧履歴情報が保存される閲覧
履歴情報保存部115、閲覧履歴情報保存部115に保
存されている閲覧履歴情報に基づいて、文書閲覧装置1
30の閲覧対象となっている文書に関連する文書を文書
保存部111に保存されている文書の中から抽出する関
連文書推定処理部116、各部の動作や文書管理装置1
10の全体的な動作の制御、文書閲覧装置130との情
報交換の制御などを司る制御部120を備えている。な
お、文書処理管理システム100は、全体を単一の装置
(文書処理管理装置)として実現される形態、ネットワ
ークで接続された複数の装置の集合体として実現される
形態のいずれでも適用することができるものとする。
【0012】次に、図2および図3を参照して他の実施
形態について説明する。文書処理管理システム100が
全体を単一の装置(文書処理管理装置)として実現され
る形態の場合、またはネットワークで接続された複数の
装置の集合体として実現する形態の場合について説明す
る。図2は、文書処理管理システム100を1つの文書
処理管理装置として実現する実施形態を示した図であ
る。すなわち、文書処理管理システム100を集中シス
テムとして実現する実施形態とする。図2において、ワ
ークステーションなどの汎用のコンピュータ200は、
表示装置201、キーボードやマウスなどの入力装置2
02、ハードディスク装置203、印刷装置204など
の周辺機器を備えている。このコンピュータ200のハ
ードウェア資源を利用し、ソフトウェアにより文書処理
管理システム100の文書管理装置110および文書閲
覧装置130を実現することができる。この場合、情報
保存部(図1での文書保存部111、文書管理情報保存
部113および閲覧履歴情報保存部115に相当する)
として利用されるハードウェア資源については幾つか挙
げることができる。例えば、文書保存部111、文書管
理情報保存部113および閲覧履歴情報保存部115と
して、共通のハードディスク装置203を利用すること
ができる。
【0013】また、コンピュータ200とLAN(ロー
カルエリアネットワーク)210により接続された大容
量記憶装置211を文書保存部111として利用し、ハ
ードディスク装置203を文書管理情報保存部113お
よび閲覧履歴情報保存部115として利用するこように
してもよい。さらに、ルータ、ゲートウェイなどのネッ
トワーク間インターフェイス手段212を介してコンピ
ュータ200と接続されたインターネットや他のLAN
などのネットワーク213上のコンピュータ214など
が所有する大容量記憶装置も文書保存部111もしくは
その一部として利用することができる。このような文書
処理管理システムの実施形態を文書管理装置110およ
び文書閲覧装置130を実現するためのプログラムが記
録された磁気ディスク、光ディスク、光磁気ディスク、
半導体記憶素子などの各種記録媒体として利用するよう
にしてもよい。
【0014】図3は、文書処理管理システム100をネ
ットワークで接続された複数の装置の集合体として実現
する実施形態を示した図である。図3において、サーバ
ーマシンとして働くワークステーションなどのコンピュ
ータ300は、大容量記憶装置301を備えている。文
書処理管理システム100の文書管理装置110を、こ
のコンピュータ300のハードウェア資源を利用し、ソ
フトウェアにより実現することができる。コンピュータ
300は、LAN302を介して、クライアントマシン
として働くパソコンなどのコンピュータ303と接続さ
れ、ネットワーク間インターフェイス手段304を介し
て、例えばインターネットなどの他のネットワーク30
5と接続される。1台または複数台のコンピュータ30
3のハードウェア資源をそれぞれ利用し、文書処理管理
システム100の文書閲覧装置130をソフトウェアに
より実現することができる。
【0015】ネットワーク305に接続されたコンピュ
ータ306などのハードウェア資源を利用し、ソフトウ
ェアにより1つまたは複数の文書閲覧装置130を実現
するようにしてもよい。文書保存部111、文書管理情
報保存部113および閲覧履歴情報保存部115として
は、共通の大容量記憶装置301を利用することができ
る。文書保存部111として、またはその一部として、
LAN302に接続された他のハードディスク装置や、
ネットワーク305に接続されたコンピュータ306な
どの大容量記憶装置を利用するようにしてもよい。この
ような文書処理管理システムの実施形態を文書管理装置
110を実現するためのプログラムが記録された磁気デ
ィスク、光ディスク、光磁気ディスク、半導体記憶素子
などの各種記録媒体として利用するようにしてもよい。
以上のように、本実施の形態に係る文書処理管理システ
ム100は、様々な実現形態として適用することができ
る。
【0016】次に、本実施の形態に係る文書処理管理シ
ステム100の動作について説明する。文書管理装置1
10の文書管理部112は、文書保存部111内の文書
群をリレーショナル型データベースとして管理する。こ
のような文書管理部112は、例えば、リレーショナル
型のデータベース・マネージメント・システム(DBM
S)と呼ばれる一般的なソフトウェアによって実現する
ことができる。このような文書管理のために文書管理部
112により生成されて文書管理情報保存部113に保
存される文書管理情報は、例えば、図4に示すような構
造とすることができる。文書管理情報の各レコード(図
中の各行)は、保存文書と1対1に対応している。各レ
コードは、文書の属性である「ID(識別番号)」「文
書名」「保存場所」の値が記録される3つのフィールド
から構成される。「ID」フィールドには、文書を識別
するためのIDを表す値が記録される。「文書名」フィ
ールドには、ユーザが文書に付与した文書名が記録され
る。「文書保存場所」フィールドには、文書の実体が保
存されている場所を特定するための情報が記録される。
インターネット上のWWWサーバーに保存されている文
書の場合、その保存場所を特定するための情報としてU
RL(Uniform Resource Locat
or)が用いられる。
【0017】閲覧履歴管理部114は、文書保存部11
1内の文書群に対する閲覧履歴情報を管理する。閲覧履
歴情報保存部115に保存される閲覧履歴情報は、例え
ば、図5に示すような構造とすることができる。閲覧履
歴情報の各行は、一連の作業において閲覧した文書のI
Dであり、例えば1行目の「1,2,3,」は、IDが
「1」、「2」、「3」の文書、すなわち、文書名が
「××××ファイナンス」、「マネー&マーケット」、
「ABCMail Media」の文書を同一の時期に
閲覧していたという閲覧履歴が記録されている。同様に
4行目の「4,5」は、IDが「4」、「5」、すなわ
ち、文書名が「DEFマリナーズ」、「GHIメッツ」
の文書を同一の時期に閲覧していたという閲覧履歴が記
録されている。これらの記録は日々、蓄積されていくも
のであり、作業を終了した後はファイルとして保存され
る。
【0018】関連文書推定処理部116は、文書閲覧装
置130において閲覧中の文書について、その関連文書
を推定する。図6は、ユーザインターフェイスを示した
図である。ユーザインターフェイスはメインウィンドウ
とサブウィンドウの2つの画面で構成されている。メイ
ンウィンドウは、文書名を指定入力する欄、指定された
文書情報を閲覧するために表示する欄、および閲覧中の
文書に対する関連文書群を表示する欄から構成される。
関連文書群として3つの文書名「マネー&マーケッ
ト」、「ABCMail Media」、「Analy
st山田太郎」が列挙されているが、これは閲覧履歴情
報を解析した結果に基づいて決定された文書群であり、
その決定方法については後述の図8のフローチャートを
参照して説明する。これらの関連文書を推定するのが関
連文書推定処理部116である。
【0019】サブウィンドウでは、閲覧した文書の履歴
が時系列に表示されている。太線で区切りが挿入されて
いるのは、作業の区切りである。作業の区切りは「作業
区分指定」ボタンをユーザが押すことによって挿入され
る。例えば、ユーザが野球に関連する一連の情報(「D
EFマリナーズ」、「GHIメッツ」)を閲覧した後
に、金融経済に関連する情報の閲覧を開始するタイミン
グにおいて作業区分指定ボタンを押す。このボタンはユ
ーザが押すだけではなく、ある一定期間操作が行われな
かったとき、例えば、1時間放置されていたときに自動
的に作業区分指定が入力されたとみなすようにしてもよ
い。
【0020】図7は、利用時の動作イメージを理解しや
すいようにメインウィンドウの表示画面を時系列に示し
た図である。一番上の表示画面は初期状態であり、関連
文書群は表示されていないものとする。2番目の表示画
面では、ユーザがスポーツ関連の文書情報を閲覧してい
る状態であり、関連文書群として3つの文書名「野
球」、「サッカー」、「テニス」が列挙されている。こ
こでユーザが次に閲覧する文書情報として文書名「サッ
カー」を指定した場合、3番目の表示画面では、指定さ
れた「サッカー」の文書情報が表示され、その隣の関連
文書群を表示する欄には、文書「サッカー」に関連する
情報が表示される。
【0021】次に、以上のような一連の動作を図8のフ
ローチャートを参照して説明する。文書処理管理システ
ム100の利用を開始すると、まず、文書指定処理にお
いてユーザからの文書指定処理を受け付ける(ステップ
600)。ユーザは、文書の保存場所と文書名を指定
し、次の文書表示処理によって、指定された文書の内容
を図7のメインウィンドウ画面に示すように表示する
(ステップ601)。次に、履歴リスト追加処理におい
て閲覧履歴管理部114は、表示中の文書情報が、過去
に閲覧されたことがあるか否かを文書管理情報保存部1
13の内容を参照し判定する(ステップ602)。過去
に閲覧されたことがある場合は、表示中の文書情報に対
応するID番号を取得し、閲覧されたことがない場合
は、新たに文書管理情報保存部113に新規にIDを発
行し登録する。このIDを閲覧履歴情報として図5に示
すファイルの一番最後に追加する。そして、関連文書群
リスト生成処理(ステップ603)に移行する。
【0022】ここで、関連文書推定処理部116におい
て実施される関連文書群リスト生成処理(ステップ60
3)について説明する。関連文書群リスト生成処理で
は、日々蓄積された閲覧履歴情報を解析し、現在閲覧中
の文書の関連文書群を決定し、リストとして生成する。
そのアルゴリズムを図9を用いて説明する。次のような
3つの閲覧履歴情報(共出現情報1、2、3の閲覧履
歴)が蓄積され、現在「B」の情報を閲覧中の場合を想
定すると、情報「B」と連接特徴を持つ情報は、共出現
情報1および共出現情報2において出現した「A」、
「C」、「D」の情報であることになる。すなわち、
「B」を閲覧しているときは「A」、「C」、「D」の
3種類のいずれかを閲覧する可能性が高いということで
ある。ユーザにとって理想的な関連情報群としては、
「B」閲覧時の事後確率分布(C:50%,A:25
%,D:25%)を求めることにより推定することがで
きる。
【0023】事後確率分布の算出方法は、閲覧中の文書
(図9では「B」)について過去に共出現情報として用
いられた文書(図9では、共出現情報1における
「A」、「C」、および共出現情報2における「C」、
「D」を合わせた「A」、「C」、「C」、「D」)を
列挙し、文書毎に出現した確率を求める。この結果、
「C」は、のべ4文書中2回出現しているので50%、
「A」は、のべ4文書中1回出現しているので25%、
同様に「D」は25%となる。この場合、「B」を閲覧
しているときは、「C」が最も必要な情報(共出現情報
1および共出現情報2の両方で利用されている)であ
り、「A」、「D」がそれに次ぐ情報ということにな
る。なお、一例として「B」を閲覧中の場合について述
べたが、「B」以外の情報に関しても同様の手法で関連
文書群を生成することができ、閲覧中の情報の変化に合
わせて算出し関連文書群を生成し続けることができる。
このように関連文書群のリストが生成され、図7に示す
ような結果が表示される。
【0024】次に、作業区分指定処理に移行し、ユーザ
が作業の区切りかどうかの入力を受け付ける(ステップ
604)。ユーザからの指定がなければ、作業終了か否
かの入力を受け付け(ステップ605)、終了しない場
合(ステップ605;N)、最初の文書指定処理へと戻
る(ステップ600)。2回目以降の文書指定処理は、
1回目と同様にユーザが文書の保存場所と文書名を指定
してもよいし、ユーザは関連文書群リストとして表示さ
れたリストの中から選択するようにしてもよい。
【0025】以上のように、本実施の形態の文書処理管
理システムでは、文書群を過去にどのように閲覧してい
るかについての統計的性質を活用するので、分類整理や
キーワード検索などの手間をかけることなく閲覧中の文
書の関連文書を抽出することができる。また、本実施の
形態の文書処理管理システムでは、文書を閲覧した時系
列を解析することにより、ユーザのニーズを考慮した関
連文書を抽出することができる。本実施の形態の文書処
理管理システムでは、閲覧作業単位別に文書を閲覧した
時系列を解析することにより、ユーザの作業単位別のニ
ーズを考慮した関連文書を抽出することができる。ま
た、本実施の形態の文書処理管理システムでは、閲覧中
の文書と時系列において近傍に位置する文書に関する統
計的性質を解析することにより、閲覧中の文書との関連
を高い精度で解析することができる。さらに、本実施の
形態の文書処理管理システムでは、閲覧中の文書との関
連の強さを閲覧履歴における確率として求めることによ
り、関連の強さをユーザが把握することができる。ま
た、本実施の形態の文書処理管理システムでは、閲覧す
る確率の高い順に関連文書のリストを表示することによ
って、ユーザが関連の強さを容易に把握することができ
る。
【0026】
【発明の効果】請求項1記載の発明では、指示入力手段
によって文書データの閲覧指示が入力された場合、当該
閲覧指示された文書データを文書データ格納手段から抽
出し、閲覧指示回数、閲覧時間などの統計的数字と関連
付けした閲覧文書履歴情報として記憶する閲覧履歴記憶
手段と、閲覧履歴記憶手段に記憶された閲覧文書履歴情
報に関連付けされた統計的数字を解析することにより、
指示入力手段によって閲覧指示された文書データと統計
的数字が近似する閲覧文書履歴情報の文書データを関連
文書データとして前記文書データ格納手段から抽出する
文書データ抽出手段と、を備えるので、文書群を過去に
どのように閲覧しているかについての統計的性質を活用
することができ、分類整理やキーワード検索などの手間
をかけることなく閲覧中の文書の関連文書抽出すること
ができる。
【0027】請求項2記載の発明では、閲覧履歴記憶手
段は、閲覧履歴情報を時系列に並べた閲覧履歴一覧とし
て記憶し、文書データ抽出手段は、閲覧履歴記憶手段に
記憶された閲覧履歴一覧の時系列の統計的数字を解析す
ることにより、関連文書データを抽出するので、文書を
閲覧した時系列を解析することにより、ユーザのニーズ
を考慮した関連文書を抽出することができる。
【0028】請求項3記載の発明では、指示計測手段に
よって所定時間が計測された場合、または、指示入力手
段によって閲覧文書データの変更指示が入力された場
合、文書データ抽出手段は、文書データ格納手段から閲
覧指示された文書データ以外の文書データに関連付けさ
れた閲覧履歴情報を解析することにより、文書データ格
納手段から関連文書データを抽出するので、閲覧作業単
位別に文書を閲覧した時系列を解析することにより、ユ
ーザの作業単位別のニーズを考慮した関連文書を抽出す
ることができる。
【0029】請求項4記載の発明では、文書データ抽出
手段は、閲覧履歴記憶手段に記憶された時系列の閲覧履
歴一覧のうち、指示入力手段によって閲覧指示された文
書データの閲覧時間が時系列において近似する閲覧文書
履歴情報の文書データを関連文書データとして文書デー
タ格納手段から抽出するので、閲覧中の文書と時系列に
おいて近傍に位置する文書に関する統計的性質を解析し
て閲覧中の文書との関連を高い精度で解析することがで
きる。
【0030】請求項5記載の発明では、文書データ抽出
手段によって関連文書データとして文書データ格納手段
から抽出される文書データの抽出確率を算出する抽出確
率算出手段をさらに備えるので、閲覧中の文書との関連
の強さを閲覧履歴における確率として求めることがで
き、関連の強さをユーザが把握することができる。
【0031】請求項6記載の発明では、抽出確率算出手
段によって算出された抽出確率に基づいて、文書データ
格納手段に格納されている文書データを関連文書データ
一覧として提示する文書データ提示手段をさらに備え、
文書データ提示手段は、抽出確率算出手段によって算出
された抽出確率が高い順に提示するので、閲覧する確率
の高い順に関連文書のリストを表示することによって、
ユーザが関連の強さを容易に把握することができる。
【図面の簡単な説明】
【図1】本実施の形態に係る文書処理管理システムの概
略構成を示したブロック図である。
【図2】文書処理管理システムを1つの文書処理管理装
置として実現する実施形態を示した図である。
【図3】文書処理管理システムをネットワークで接続さ
れた複数の装置の集合体として実現する実施形態を示し
た図である。
【図4】文書管理情報の一例を示した図である。
【図5】閲覧履歴情報の一例を示す図である。
【図6】ユーザインターフェイスを示した図である。
【図7】メインウィンドウの表示画面の時系列変換を示
した図である。
【図8】文書処理管理システムの全体的動作手順を示し
たフローチャートである。
【図9】文書の閲覧履歴情報を説明する模式図である。
【符号の説明】 100 文書処理管理システム 110 文書管理装置 111 文書保存部 112 文書管理部 113 文書管理情報保存部 114 閲覧履歴管理部 115 閲覧履歴情報保存部 116 関連文書推定処理部 120 制御部 130 文書閲覧装置 131 入力装置 132 表示装置 133 補助記憶装置 200 コンピュータ 201 表示装置 202 入力装置 203 ハードディスク装置 204 印刷装置 210 LAN(ローカルエリアネットワーク) 211 大容量記憶装置 212 ネットワーク間インターフェイス手段 213 ネットワーク 214 コンピュータ 300 コンピュータ 302 LAN 303 コンピュータ 304 ネットワーク間インターフェイス手段 305 ネットワーク 306 コンピュータ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 受領した文書データを格納する文書デー
    タ格納手段と、 前記文書データ格納手段に格納されている文書データに
    対する閲覧指示または閲覧文書データの変更指示の指示
    入力を促す指示入力手段と、 前記指示入力手段によって文書データの閲覧指示が入力
    された場合、当該閲覧指示された文書データを前記文書
    データ格納手段から抽出し、閲覧指示回数、閲覧時間な
    どの統計的数字と関連付けした閲覧文書履歴情報として
    記憶する閲覧履歴記憶手段と、 前記閲覧履歴記憶手段に記憶された閲覧文書履歴情報に
    関連付けされた統計的数字を解析することにより、前記
    指示入力手段によって閲覧指示された文書データと統計
    的数字が近似する閲覧文書履歴情報の文書データを関連
    文書データとして前記文書データ格納手段から抽出する
    文書データ抽出手段と、を備えたことを特徴とする文書
    処理管理装置。
  2. 【請求項2】 前記閲覧履歴記憶手段は、前記閲覧履歴
    情報を時系列に並べた閲覧履歴一覧として記憶し、前記
    文書データ抽出手段は、前記閲覧履歴記憶手段に記憶さ
    れた閲覧履歴一覧の時系列の統計的数字を解析すること
    により、前記関連文書データを抽出することを特徴とす
    る請求項1記載の文書処理管理装置。
  3. 【請求項3】 前記指示入力手段による指示入力が行わ
    れる時間間隔を計測する指示計測手段をさらに備え、 前記指示計測手段によって所定時間が計測された場合、
    または、前記指示入力手段によって閲覧文書データの変
    更指示が入力された場合、前記文書データ抽出手段は、
    前記文書データ格納手段から前記閲覧指示された文書デ
    ータ以外の文書データに関連付けされた閲覧履歴情報を
    解析することにより、前記文書データ格納手段から前記
    関連文書データを抽出することを特徴とする請求項1ま
    たは請求項2記載の文書処理管理装置。
  4. 【請求項4】 前記文書データ抽出手段は、前記閲覧履
    歴記憶手段に記憶された時系列の閲覧履歴一覧のうち、
    前記指示入力手段によって閲覧指示された文書データの
    閲覧時間が時系列において近似する閲覧文書履歴情報の
    文書データを前記関連文書データとして前記文書データ
    格納手段から抽出することを特徴とする請求項1、請求
    項2、請求項3のうちいずれか1に記載の文書処理管理
    装置。
  5. 【請求項5】 前記文書データ抽出手段によって関連文
    書データとして前記文書データ格納手段から抽出される
    文書データの抽出確率を算出する抽出確率算出手段をさ
    らに備えたことを特徴とする請求項1、請求項2、請求
    項3、請求項4のうちいずれか1に記載の文書処理管理
    装置。
  6. 【請求項6】 前記抽出確率算出手段によって算出され
    た抽出確率に基づいて、前記文書データ格納手段に格納
    されている文書データを関連文書データ一覧として提示
    する文書データ提示手段をさらに備え、 前記文書データ提示手段は、前記抽出確率算出手段によ
    って算出された抽出確率が高い順に提示することを特徴
    とする請求項5記載の文書処理管理装置。
JP2001274960A 2001-09-11 2001-09-11 文書処理管理装置 Pending JP2003085204A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001274960A JP2003085204A (ja) 2001-09-11 2001-09-11 文書処理管理装置
US10/230,192 US7127476B2 (en) 2001-09-11 2002-08-29 Apparatus and method for document processing and management

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001274960A JP2003085204A (ja) 2001-09-11 2001-09-11 文書処理管理装置

Publications (1)

Publication Number Publication Date
JP2003085204A true JP2003085204A (ja) 2003-03-20

Family

ID=19099906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001274960A Pending JP2003085204A (ja) 2001-09-11 2001-09-11 文書処理管理装置

Country Status (2)

Country Link
US (1) US7127476B2 (ja)
JP (1) JP2003085204A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006025209A1 (ja) * 2004-08-30 2006-03-09 Pioneer Corporation 画像表示制御装置及び画像表示方法
JP2008059099A (ja) * 2006-08-29 2008-03-13 Access Co Ltd 情報表示装置、情報表示プログラム、および情報表示システム
JP2010140257A (ja) * 2008-12-11 2010-06-24 Canon It Solutions Inc 情報処理装置及び情報処理方法
JP2011128908A (ja) * 2009-12-17 2011-06-30 Canon Software Inc 情報処理装置及び情報処理方法
JP2012118624A (ja) * 2010-11-29 2012-06-21 Sharp Corp コンテンツ提示装置、外部推薦装置およびコンテンツ提示システム
WO2014083928A1 (ja) * 2012-11-28 2014-06-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、プログラム及び情報処理方法
US9170725B2 (en) 2012-03-15 2015-10-27 Fuji Xerox Co., Ltd. Information processing apparatus, non-transitory computer readable medium, and information processing method that detect associated documents based on distance between documents
US9338313B2 (en) 2011-02-18 2016-05-10 Ricoh Company, Limited Document management apparatus and document management system
JP2018037121A (ja) * 2017-12-12 2018-03-08 シャープ株式会社 端末装置、提示方法、及び提示プログラム

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6981040B1 (en) * 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
US20050138049A1 (en) * 2003-12-22 2005-06-23 Greg Linden Method for personalized news
US7496385B2 (en) 2003-12-29 2009-02-24 International Business Machines Corporation Method for viewing information underlying lists and other contexts
US8151214B2 (en) 2003-12-29 2012-04-03 International Business Machines Corporation System and method for color coding list items
US7908566B2 (en) 2003-12-29 2011-03-15 International Business Machines Corporation System and method for scrolling among categories in a list of documents
US7421664B2 (en) * 2003-12-29 2008-09-02 International Business Machines Corporation System and method for providing a category separator in a list of documents
US7895537B2 (en) * 2003-12-29 2011-02-22 International Business Machines Corporation Method and apparatus for setting attributes and initiating actions through gestures
US8171426B2 (en) * 2003-12-29 2012-05-01 International Business Machines Corporation Method for secondary selection highlighting
US7631276B2 (en) * 2003-12-29 2009-12-08 International Business Machines Corporation Method for indication and navigating related items
JP2006344118A (ja) * 2005-06-10 2006-12-21 Fuji Xerox Co Ltd 利用状況通知システム
US20080072225A1 (en) * 2006-09-19 2008-03-20 Tetsuro Nagatsuka Information processing apparatus, information processing method, program, and recording medium
US9870554B1 (en) 2012-10-23 2018-01-16 Google Inc. Managing documents based on a user's calendar
US10140198B1 (en) 2012-10-30 2018-11-27 Google Llc Networked desktop environment
US20140195904A1 (en) * 2013-01-06 2014-07-10 Chao-Chin Chang Technical documents capturing and patents analysis system and method
US9842113B1 (en) 2013-08-27 2017-12-12 Google Inc. Context-based file selection
US9973462B1 (en) 2013-10-21 2018-05-15 Google Llc Methods for generating message notifications
CN107766527A (zh) * 2017-10-26 2018-03-06 努比亚技术有限公司 一种快速查找文件方法、移动终端及计算机可读存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5850298A (en) * 1994-03-22 1998-12-15 Ricoh Company, Ltd. Image processing device eliminating background noise
JP3600372B2 (ja) * 1995-06-27 2004-12-15 株式会社リコー 色再現域補正装置および方法
JP2000020202A (ja) 1998-06-30 2000-01-21 Fujitsu Ltd 情報参照支援装置
JP2001318939A (ja) * 2000-05-09 2001-11-16 Hitachi Ltd 文書処理方法及び装置並びにその処理プログラムを記憶した媒体
JP2002032364A (ja) * 2000-07-14 2002-01-31 Ricoh Co Ltd 文書情報処理方法、文書情報処理装置及び記録媒体
US6990631B2 (en) * 2000-07-14 2006-01-24 Ricoh Company, Ltd. Document management apparatus, related document extracting method, and document processing assist method
JP3916124B2 (ja) * 2001-02-15 2007-05-16 インターナショナル・ビジネス・マシーンズ・コーポレーション デジタル文書閲覧システム、ブラウザ、デジタル文書表示方法、プログラム及び記憶媒体
JP2003067306A (ja) * 2001-08-24 2003-03-07 Hitachi Ltd 電子メールの蓄積管理方法
WO2003040963A1 (en) * 2001-11-02 2003-05-15 Medical Research Consultants L.P. Knowledge management system

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006025209A1 (ja) * 2004-08-30 2006-03-09 Pioneer Corporation 画像表示制御装置及び画像表示方法
JP2008059099A (ja) * 2006-08-29 2008-03-13 Access Co Ltd 情報表示装置、情報表示プログラム、および情報表示システム
JP2010140257A (ja) * 2008-12-11 2010-06-24 Canon It Solutions Inc 情報処理装置及び情報処理方法
JP2011128908A (ja) * 2009-12-17 2011-06-30 Canon Software Inc 情報処理装置及び情報処理方法
JP2012118624A (ja) * 2010-11-29 2012-06-21 Sharp Corp コンテンツ提示装置、外部推薦装置およびコンテンツ提示システム
US9338313B2 (en) 2011-02-18 2016-05-10 Ricoh Company, Limited Document management apparatus and document management system
US9170725B2 (en) 2012-03-15 2015-10-27 Fuji Xerox Co., Ltd. Information processing apparatus, non-transitory computer readable medium, and information processing method that detect associated documents based on distance between documents
WO2014083928A1 (ja) * 2012-11-28 2014-06-05 インターナショナル・ビジネス・マシーンズ・コーポレーション 情報処理装置、プログラム及び情報処理方法
US9292596B2 (en) 2012-11-28 2016-03-22 International Business Machines Corporation Relevance-based information processing
JP2018037121A (ja) * 2017-12-12 2018-03-08 シャープ株式会社 端末装置、提示方法、及び提示プログラム

Also Published As

Publication number Publication date
US20030051212A1 (en) 2003-03-13
US7127476B2 (en) 2006-10-24

Similar Documents

Publication Publication Date Title
JP2003085204A (ja) 文書処理管理装置
US11657065B2 (en) Clustering events while excluding extracted values
Trippe Patinformatics: Tasks to tools
JP4772378B2 (ja) Webページから時系列データを生成する方法及び装置
US9015194B2 (en) Root cause analysis using interactive data categorization
US6336112B2 (en) Method for interactively creating an information database including preferred information elements, such as, preferred-authority, world wide web pages
USRE41899E1 (en) System for ranking the relevance of information objects accessed by computer users
US20050203888A1 (en) Method and apparatus for improved relevance of search results
EP2840515A1 (en) Method, device and computer storage media for user preferences information collection
US20090204588A1 (en) Method and apparatus for determining key attribute items
US20090248678A1 (en) Information recommendation device and information recommendation method
US20020143797A1 (en) File classification management system and method used in operating systems
US20070174254A1 (en) Systems and methods for organizing data
JP2012517046A (ja) 文献分析システム
US8560518B2 (en) Method and apparatus for building sales tools by mining data from websites
JP2007193685A (ja) 人脈情報表示プログラム、該プログラムを記録した記録媒体、人脈情報表示装置、および人脈情報表示方法
TWI284818B (en) Database searching engine system
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
JP2000181759A (ja) 時系列データ検索システムと検索方法およびそのプログラムを記録した記録媒体
Bakariya et al. An efficient algorithm for extracting infrequent itemsets from weblog.
KR100557874B1 (ko) 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
JP3746233B2 (ja) 知識分析システムおよび知識分析方法
WO2001027712A2 (en) A method and system for automatically structuring content from universal marked-up documents
US20010051942A1 (en) Information retrieval user interface method
JP4309497B2 (ja) 情報検索装置および情報検索方法