JP4518168B2 - 関連文書提示システム及びプログラム - Google Patents

関連文書提示システム及びプログラム Download PDF

Info

Publication number
JP4518168B2
JP4518168B2 JP2008072841A JP2008072841A JP4518168B2 JP 4518168 B2 JP4518168 B2 JP 4518168B2 JP 2008072841 A JP2008072841 A JP 2008072841A JP 2008072841 A JP2008072841 A JP 2008072841A JP 4518168 B2 JP4518168 B2 JP 4518168B2
Authority
JP
Japan
Prior art keywords
document
electronic document
electronic
target
workspace
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008072841A
Other languages
English (en)
Other versions
JP2009230299A (ja
Inventor
康洋 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2008072841A priority Critical patent/JP4518168B2/ja
Priority to US12/209,877 priority patent/US8099413B2/en
Priority to CN200810172465XA priority patent/CN101539926B/zh
Publication of JP2009230299A publication Critical patent/JP2009230299A/ja
Application granted granted Critical
Publication of JP4518168B2 publication Critical patent/JP4518168B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、関連文書提示システム及びプログラムに関する。
従来、ある電子文書に関連のある電子文書を検索して提示するシステムとして、様々なものが提案されている。また、電子文書同士の関連度合いを画面上での距離で表現した表示を提供するシステムも知られている。
例えば特許文献1には、画像データの特徴量に基づき画像の類似検索を行う装置が開示されている。
特許文献2には、キーワードに基づきコンテンツ同士の関連度合いを求め、各コンテンツを各々の間の関連度合いに応じた距離だけ離して配置して表示する装置が開示されている。
特許文献3には、文書同士の類似度を共通キーワード及び共通引用文献に基づき計算し、それら文書が計算された類似度に対応した距離となるように配置して表示する装置が開示されている。
特開2005−010931号公報 特開2005−332080号公報 特開2007−133516号公報
本発明は、対象の電子文書と他の電子文書との位置関係のみに基づく場合よりも、対象の電子文書に関連する電子文書の候補を増やすことを目的とする。
請求項1に係る発明は、1以上の作業空間のそれぞれについて、当該作業空間に配置される各電子文書の配置位置を記憶する第1の記憶手段と、前記各電子文書が属するグループを記憶する第2の記憶手段と、前記1以上の作業空間のそれぞれについて、前記第1の記憶手段に記憶された当該作業空間における各電子文書の配置位置に基づきそれら電子文書間の関連度を計算する関連度計算手段と、ユーザから対象の電子文書の指定を受け付ける受付手段と、指定された前記対象の電子文書と同じグループに属する電子文書を前記第2の記憶手段に基づき特定する特定手段と、前記1以上の各作業空間での、各電子文書と前記対象の電子文書との関連度、及びそれら各電子文書と前記特定手段が特定した電子文書との関連度を、それら各電子文書についてそれぞれ集計する集計手段と、前記集計手段の集計結果に基づき、それら各電子文書のうち前記対象の電子文書に関連する電子文書を提示する提示手段と、を備える関連文書提示システムである。
請求項2に係る発明は、請求項1に係る発明において、前記対象の電子文書と前記特定手段が特定した電子文書とが同じ作業空間に配置される場合、当該作業空間内の各電子文書と前記特定手段が特定した電子文書との関連度を、当該作業空間における前記対象の電子文書の配置位置と前記特定手段が特定した電子文書の配置位置との位置関係に基づき補正する補正手段、を更に備え、前記集計手段は、前記補正手段により補正された関連度を集計することを特徴とする。
請求項に係る発明は、請求項1〜に係る発明において、前記集計手段は、前記作業空間内の電子文書群が所定の整列処理が施された状態にあることを検知した場合に、当該作業空間内の電子文書同士の関連度は集計の対象から除く、ことを特徴とする。
請求項に係る発明は、コンピュータを、1以上の作業空間のそれぞれについて、当該作業空間に配置される各電子文書の配置位置を記憶する第1の記憶手段、前記各電子文書が属するグループを記憶する第2の記憶手段、前記1以上の作業空間のそれぞれについて、前記第1の記憶手段に記憶された当該作業空間における各電子文書の配置位置に基づきそれら電子文書間の関連度を計算する関連度計算手段、ユーザから対象の電子文書の指定を受け付ける受付手段と、指定された前記対象の電子文書と同じグループに属する電子文書を前記第2の記憶手段に基づき特定する特定手段、前記1以上の各作業空間での、各電子文書と前記対象の電子文書との関連度、及びそれら各電子文書と前記特定手段が特定した電子文書との関連度を、それら各電子文書についてそれぞれ集計する集計手段、前記集計手段の集計結果に基づき、それら各電子文書のうち前記対象の電子文書に関連する電子文書を提示する提示手段、として機能させるためのプログラムである。
請求項1又はに係る発明によれば、対象の電子文書と他の電子文書との位置関係のみに基づく場合よりも、対象の電子文書に関連する電子文書の候補を増やすことができる。
請求項2に係る発明によれば、対象の電子文書と同じグループに属すると特定された電子文書が、対象の電子文書に関連する電子文書の判定に与える影響を、作業空間内での対象文書との位置関係に応じて補正することができる。
請求項に係る発明によれば、電子文書の配置位置にユーザの意図が反映されていない作業空間の情報を用いずに、関連する電子文書を求めることができる。
図1を参照して、実施形態に係る文書管理システムの一例を説明する。このシステムは、ユーザに対してワークスペース(作業空間)と呼ぶ仮想的な空間を提供する。ワークスペースは、典型的には2次元空間であるが、これに限定されるものではない。ユーザは、その空間に対して1以上の電子文書を配置する。
この実施形態における「電子文書」の概念には、文書データ、スプレッドシートデータ、図面データ、画像データ、音声データ、及びマルティメディアデータなどのデータが含まれる。また、「電子文書」の概念には、プログラムも含まれる。また、それらデータやプログラムを指し示す参照データ(例えば、いわゆる「ショートカット」)も「電子文書」の中に含まれる。
ワークスペース内に配置された電子文書には、そのワークスペース内での位置座標が対応づけられる。電子文書は、ワークスペース内では、当該電子文書を表すシンボル画像として表示される。シンボル画像は、例えば、アイコン又は当該電子文書の縮小画像などである。アイコンは、例えば、電子文書に対応づけられたアプリケーションに対応づけられた図形である。電子文書のシンボル画像は、当該電子文書のファイル名などの識別情報を含んでいてもよい。ワークスペースは、例えば、各電子文書の位置座標の情報を含んだ、(実体的又は仮想的な)ディレクトリ又はフォルダの一種ととらえることができる。例えばワークスペースが2次元である場合、電子文書の位置座標は、ワークスペースの画面での画素を単位としたXY座標系で表すことができる。
文書管理システムは、個々のユーザに対して、それぞれ1以上のワークスペースを提供する。ユーザは、自分のワークスペース内の希望の位置座標に、電子文書を配置することができる。ユーザは、例えば業務ごと期間ごとなどのように自ら定めた区分ごとにワークスペースを作成し、そのワークスペースに対して当該区分に関連する電子文書を格納することができる。
文書管理システムは、ワークスペースを表す画面の情報を生成し、ユーザ端末に提供する。ワークスペースの画面の一例を図2に示す。図2は、あるユーザについてのワークスペース画面20を表している。図に例示するように、ワークスペース画面20上には、当該ワークスペースに含まれる各電子文書のシンボル画像22a〜hが、それぞれ当該電子文書に対応する位置座標に配置される。オペレーティングシステムが提供するデスクトップ画面は、ワークスペース画面の一例である。ワークスペース画面はグラフィカルユーザインタフェース(GUI)技術に基づいており、ユーザはワークスペース画面に示される電子文書を、マウス等のポインティングデバイスを用いて操作することができる。例えば、ワークスペース画面上の電子文書のシンボル画像を、いわゆるドラッグ&ドロップ操作により移動させることができる。この移動に応じて、電子文書の位置座標が変化する。ユーザがワークスペース内で互いに関連のある電子文書同士を近くに配置することで、図2に例示するように、ワークスペース内にいくつかの電子文書の集まりができることもある。また、電子文書のシンボル画像をポインティングデバイス等の入力装置を用いて選択し、その電子文書のファイルに対し、オープンその他の操作を行うこともできる。
ワークスペース自体の広さが、表示装置で実際に表示可能な広さより大きい場合、ユーザは、ワークスペース全体を一度に見ることができない。例えば、ワークスペース内の表示装置に表示されていない部分に電子文書がある場合、その電子文書は例えば画面をスクロールさせないとみることができない。
本実施形態では、このような文書管理システムが持っているワークスペースの情報に基づき、ユーザが指定した対象の電子文書(「対象文書」と呼ぶ)に関連する電子文書(「関連文書」と呼ぶ)を判定する。文書管理システムは、ワークスペース内での電子文書同士の距離に基づき、対象文書に関連する関連文書を判定する。この判定の際、本実施形態ではユーザたちが文書管理その他の目的で作成した文書グループの情報を利用する。すなわち、文書管理システムは、対象文書に対する他の各電子文書の距離だけでなく、対象文書と同一の文書グループに属する電子文書(「同グループ文書」と呼ぶ)と他の各電子文書との距離も計算に入れる。
図1に例示する文書管理システムは、機能モジュールとして、ワークスペースDB(データベース)10,文書グループDB11,ワークスペース処理部12,同グループ文書特定部13,距離(関連度)計算部14,距離(関連度)集計部16,対象文書受付部18及び関連文書提示部19を備える。
ワークスペースDB10は、各ユーザのワークスペースを管理するための情報を記憶したデータベースである。図3にワークスペースDB10のデータ内容の一例を示す。この例では、1つのワークスペースに対応するワークスペースレコード30は、ワークスペースID32及び文書情報34を含む。ワークスペースIDは、当該ワークスペースを一意に特定する識別情報である。文書情報34は、当該ワークスペースに格納された各電子文書の「文書ID」と「位置」を含む。「文書ID」は、当該電子文書の識別情報である。「位置」は、当該ワークスペース内での当該電子文書の位置座標である。ワークスペースレコード30には、この他の情報(例えば当該ワークスペースに対応するユーザを示す情報)を含んでいてもよい。ワークスペースDB10には、ワークスペースごとに1つずつ、このようなワークスペースレコード30が格納されている。
なお、電子文書の実体データは、文書IDに対応づけて文書DB(図示省略)に保存されている。
文書グループDB11には、各文書グループの情報が登録されている。文書グループは、1以上の電子文書からなるグループである。文書グループDB11が保持するデータ内容の例を図4に示す。この例では、文書グループDB11には、文書グループのID(「グループID」と呼ぶ)に対応づけて、その文書グループに属する電子文書の文書IDが登録されている。また、文書グループDB11は、個々の文書グループについての付随情報を含んでいてもよい。付随情報には、例えば、当該文書グループの変更履歴(当該グループに対する電子文書の登録や削除の履歴など)、ユーザが当該文書グループに対して登録したメッセージ、等が含まれてもよい。文書グループは、例えば、各ユーザが文書グループDB11に登録する。文書グループを登録できるユーザを限定してもよい。また、各ユーザは、文書グループDB11に登録された文書グループに対し、電子文書を登録することができる。アクセス権管理により、各文書グループにアクセスできるユーザ、又は各文書グループに電子文書を提供できるユーザを制限してもよい。
ワークスペース処理部12は、ユーザの操作に応じて、ワークスペースに関する処理を行う。この処理には、例えば当該ユーザのワークスペースの画面を提供する処理、その画面上に示された電子文書に対する各種の処理が含まれる。電子文書に対する各種の処理には、電子文書をユーザの指示に応じてオープンしたり、移動したり、削除したり、コピーしたりする処理が含まれる。
また、ワークスペース処理部12は、ユーザがワークスペース上のある電子文書に対して文書オープンなどの操作を行った際に、文書グループDB11を参照して、その電子文書が属する文書グループについての更新情報を提供してもよい。例えば、そのユーザが前回その文書グループにアクセス(例えばそのグループ内の電子文書を操作)した時刻以降にその文書グループに対して登録された電子文書やメッセージなどを、更新情報として提供することができる。文書グループにユーザがアクセスした時刻は、文書グループDB11が記録しておけばよい。
同グループ文書特定部13は、対象文書受付部18(詳細は後述)が受け付けた対象文書と同じグループに属する同グループ文書を、文書グループDB11を参照して特定する。
距離(関連度)計算部14は、ワークスペースDB10が保持するワークスペースレコード30、特に各電子文書の位置座標を参照して、ワークスペース内の電子文書同士の距離を計算する。距離(関連度)計算部14は、計算した距離を、所定の換算関数又は換算テーブルなどの換算情報に基づき関連度に変換してもよい。例えば、電子文書同士の関連性が強いほど関連度の数値が高くなるようにした場合、換算情報は、距離が小さいほど関連度が高くなるように規定される。
距離(関連度)集計部16は、距離(関連度)計算部14が計算した電子文書間の距離又は関連度を、電子文書ごとに集計する。すなわち、ユーザからある対象文書Aに対する関連文書の提示が要求された場合、対象文書Aと各電子文書Xとの距離又は関連度、及び各同グループ文書と各電子文書Xとの距離又は関連度を、電子文書Xごとに集計する。なお、同グループ文書は集計の対象から外してもよい。
距離(関連度)集計部16は、対象文書Aからの距離が所定のしきい値を超える電子文書X(すなわち対象文書Aから遠すぎる電子文書)を、距離又は関連度の集計の対象から外してもよい。同様に、同グループ文書から遠すぎる電子文書を集計の対象から外してもよい。
具体例を用いて、距離(関連度)集計部16の処理を説明する。ワークスペースDB10内に、図2に例示したようなワークスペースが1つだけ登録されており、文書A(22a)が対象文書に指定されたとする。そして、文書H及びIが、文書Aに対応する同グループ文書であったとする。この場合、例えば、文書B〜Gの対象文書Aに対する距離又は関連度、同グループ文書Hに対する距離又は関連度、及び同グループ文書Iに対する距離又は関連度を、文書B〜Gについてそれぞれ集計する。
また、例えば、ワークスペースDB10内には複数のワークスペースのレコード30が存在しており、それらワークスペースの中には対象文書A又は対象文書Aに対する同グループ文書を含むものもあれば含まないものもある。対象文書A又は同グループ文書を含むワークスペースについては、距離(関連度)計算部14が、そのワークスペース内の他の電子文書Xと対象文書A又は同グループとの距離又は関連度を求めることができる。距離(関連度)集計部16は、そのように求められた各ワークスペースにおける各電子文書Xと対象文書A又は同グループ文書との距離又は関連度を、各電子文書Xについてそれぞれ集計してもよい。
集計では、例えば、各ワークスペースにおける電子文書Xと対象文書A又は同グループ文書との距離又は関連度を、それら全部のワークスペースに渡って加算した結果を集計値とすればよい。また、別の例として、その加算の結果を、対象文書A又は同グループ文書を含むワークスペースの数で正規化したものを集計値としてもよい。正規化は、例えば、加算結果をそのワークスペースの数で割り算することにより実現すればよい。
対象文書受付部18は、ユーザから対象文書(すなわち関連文書抽出の対象となる電子文書)の指定を受け付ける。1つの例では、ワークスペース処理部12が当該ユーザに提供したワークスペース画面において、ユーザに対象文書を指定させればよい。ただし、これはあくまで一例に過ぎない。この他にも、例えば、電子文書の検索結果の中からユーザに対象文書を指定させる構成を採用してもよい。
対象文書受付部18が対象文書の指定を受けると、距離(関連度)集計部16が、その対象文書に対する各電子文書の距離又は関連度の集計結果を関連文書提示部19に提供する。この集計結果には、電子文書ごとに、その電子文書と対象文書との距離又は関連度の集計値が含まれる。そして、関連文書提示部19は、距離(関連度)集計部16から取得した集計結果に基づき、ユーザに対して関連文書を提示する。関連文書の提示は、従来の一般的な検索ツールにおける検索結果の提示と同様に行えばよい。例えば、電子文書へのリンクを集計値が高い(すなわち対象文書に対する関連が強い)順に配列した抽出結果画面をユーザに提供してもよい。また、抽出結果画面に表示する電子文書を、関連の強さが所定の程度以上である電子文書のみに限定してもよい。関連の強さが所定の程度以上である電子文書は、例えば距離(関連度)集計部16が距離の集計値を算出する場合は、集計値がしきい値以下である電子文書である。また、距離(関連度)集計部16が関連度の集計値を算出する場合は、集計値がしきい値以上である電子文書である。距離の集計値についてのしきい値と関連度の集計値についてのしきい値とは異なる値であり、あらかじめ定めておけばよい。また、集計値に基づき最も関連が強い電子文書を特定し、その電子文書を抽出結果としてユーザに提供してもよい。また、「関連が強い」、「(関連が強いとは言えないが)関連がある可能性がある」などというように集計値にいくつかの段階を設け、抽出結果画面では各電子文書をそれら段階ごとに区別して表示してもよい。この場合の表示上での区別は、例えば段階ごとに欄を分けて表示したり、段階ごとに異なる表示形態で表示したりすることにより実現すればよい。ユーザは、そのような抽出結果画面の中で、電子文書へのリンクを選択してその電子文書をオープンするなどの各種操作を指示することができる。
次に、図5を参照して、図1のシステムにおける関連文書の提示処理の流れの一例を説明する。この処理では、まず対象文書受付部18がユーザの端末から対象文書の指定を受けると(S10)、同グループ文書特定部13が、文書グループDB11を参照して、その対象文書と同じグループに属する文書(同グループ文書)を特定する(S11)。同グループ文書特定部13は、距離(関連度)集計部16に対し、対象文書及び特定した同グループ文書に対する各電子文書の距離又は関連度の集計結果を要求する。この要求に応じ、距離(関連度)集計部16は、距離(関連度)計算部14に対し、各ワークスペースでの各電子文書と対象文書又は各同グループ文書との距離又は関連度の計算を要求する。距離(関連度)計算部14は、その要求に応じ、ワークスペースDB10を参照して、各ワークスペースにおける各電子文書と対象文書又は各同グループ文書との距離をそれぞれ計算する(S12,S13)。距離(関連度)集計部16は、距離(関連度)計算部14が計算した距離又は関連度を電子文書ごとに集計し(S14)、その集計結果を関連文書提示部19に渡す。関連文書提示部19は、その集計結果に基づき、関連文書の抽出結果を示す画面を生成し、その画面を要求元のユーザの端末に提供する(S16,S18)。図示例では、集計結果に基づき、関連の強さが所定の程度以上の電子文書を関連文書として抽出し(S16)、その抽出結果をユーザに提示している(S18)。
図5の処理手順はあくまで一例に過ぎない。この手順の代わりに、例えば、電子文書間の距離又は関連度の集計値をあらかじめ計算してデータベースを作成しておき、ユーザから関連文書抽出の指示を受けたときに関連文書提示部19がそのデータベースを参照して関連文書を抽出してもよい。このデータベースは、例えば定期的、又はユーザがワークスペース内の電子文書を操作したとき、などの所定のタイミングごとに、更新すればよい。この更新処理の際に、距離(関連度)計算部14及び距離(関連度)集計部16が、各電子文書間の距離又は関連度を計算し、電子文書ごとに集計すればよい。
また集計値のデータベースの代わりに、電子文書間の距離又は関連度のデータベースをあらかじめ作成しておく構成もあり得る。この場合、所定のタイミングごとに距離(関連度)計算部14により各電子文書間の距離を計算し、その計算結果に基づきデータベースを更新する。そして、ユーザから関連文書抽出の指示があると、距離(関連度)集計部16が、そのデータベースを参照して、各電子文書について、それぞれ、当該電子文書の対象文書に対する距離又は関連度をワークスペース群にわたって集計し、関連文書提示部19がその集計結果に基づき関連文書を抽出する。
次に、図6〜図15を参照して、別の例を説明する。図6に例示する文書管理サーバ100は、インターネットやLAN(ローカルエリアネットワーク)などのネットワーク300を介して、ユーザPC(パーソナルコンピュータ)200に接続されている。ユーザは、自分のユーザPC200を操作して文書管理サーバ100にアクセスし、ワークスペースに関するサービスを受ける。
文書管理サーバ100中のワークスペースDB110は、図1の例のワークスペースDB10と同様、各ワークスペースを規定するワークスペースレコードを記憶している。ワークスペースDB110には、更にユーザとそのユーザに割り当てられたワークスペースとの対応関係を示す情報を登録してもよい。図7に、この対応関係の情報の一例を概念的に示す。この例では、対応関係の情報には、ユーザごとに、そのユーザのID(識別情報)42と、そのユーザに割り当てられた1以上のワークスペースのID44が含まれている。ここで言う「ユーザ」の概念には、1人の人間だけでなく、複数の人間からなるユーザグループも含まれる。あるユーザグループに属するユーザは、そのグループに対応するワークスペースにアクセスできる。また、図7の例では、ユーザに割り当てられたワークスペースがツリー構造を成している。この例によれば、各ユーザは、自分の分類の仕方に応じてワークスペースのツリー構造を構築することができる。
文書グループDB111には、図1の文書グループDB11と同様のデータが登録される。
ワークスペース処理部112は、図1の例のワークスペース処理部12と同様の処理を行う。また、ユーザ認証部114は、ユーザPC200を介してワークスペースへのアクセス要求を送ってきたユーザの認証処理を行う。ユーザの認証処理には、パスワード認証や生体認証、デジタル証明書を用いた認証など、既存の技術を用いればよい。ユーザ認証部114は、そのユーザ認証処理の際にユーザ情報DB116を参照する。ユーザ情報DB116には、各ユーザの認証情報、例えばユーザIDとパスワード、生体情報(指紋の特徴など)、又はデジタル証明書とのペアが登録されている。なお、ユーザ情報DB116には、認証情報以外のユーザの属性情報が登録されていてもよい。このような属性情報には、例えば、企業等の組織におけるユーザの役職、ユーザの所属グループなどがある。ユーザ認証部114によるユーザ認証が成功した場合にのみ、ユーザはワークスペースへのアクセスが許可される。
同グループ文書特定部113は、図1の同グループ文書特定部13と同様、対象文書受付部122が指定を受け付けた対象文書と同じ文書グループに属する同グループ文書を、文書グループDB111を参照して特定する。
関連情報管理DB120は、電子文書ごとに、その電子文書が属する各ワークスペース内の他の電子文書との距離又は関連度が登録される。図8に関連情報管理DB120のデータ内容の一例を示す。この例では、関連情報管理DB120には、電子文書(図では「対象文書」と表示)ごとに、その対象文書の文書IDと対応づけられた1つのレコードが登録されている。また、1つの対象文書のレコードには、その対象文書が含まれるワークスペースのIDと対応づけて、当該ワークスペースのレコードが登録されている。ワークスペースのレコードには、そのワークスペースに存在する他の各電子文書(図では「周辺文書」と表示)についてのエントリが含まれる。1つの周辺文書のエントリには、その文書のIDと、その文書から対象文書までの距離とが登録されている。図8では、距離の値は1を単位として丸められているがこれは一例に過ぎない。また、図8では、対象文書との距離があるしきい値(例えば5)より小さい(すなわち近い)電子文書のみを「周辺文書」として取り上げているが、これも一例に過ぎない。図6の文書管理サーバ100は、ユーザから関連文書の抽出指示を受けると、この関連情報管理DB120を参照して関連文書を抽出する。
関連情報更新部118は、定期的に、又は電子文書に対してユーザが操作を行ったタイミングなどの所定の更新タイミングで、関連情報管理DB120の更新のための処理を行う。この更新処理では、更新タイミングにおけるワークスペースDB110内の情報から各ワークスペースにおける各電子文書間の距離を計算し、その計算結果に基づき関連情報管理DB120内の周辺文書や距離の情報を更新する。この更新処理については後で詳しく説明する。
対象文書受付部122は、図1の例における対象文書受付部18と同様、ユーザPC200から、関連文書抽出の対象である対象文書の指定を受け付ける。対象レコード取得部124は、関連情報管理DB120の中から、対象文書受付部122が受け付けた対象文書のレコード、及び同グループ文書特定部113が特定した各同グループ文書のレコードを、それぞれ取得する。
関連度集計部126は、対象レコード取得部124が取得した対象文書及び各同グループ文書のレコードに含まれる各周辺文書の距離を換算情報128に基づき関連度に換算し、換算結果の関連度を周辺文書ごとに集計する。換算情報128は、図9に例示するようなテーブル形式のものでもよいし、換算のための関数でもよい。図9の例では、距離ごとに、その距離に対応する関連度の値が登録されている。集計の仕方は、図1の例における距離(関連度)集計部16と同様でよい。
関連文書提示部130は、図1の例における関連文書提示部19と同様、関連度集計部126の集計結果に基づき関連文書の抽出結果の画面情報を生成し、要求元のユーザPC200に返す。
次に、図10を参照して、図6のシステムにおける関連情報更新部118の処理手順の一例を説明する。この手順では、ワークスペース画面(図2参照)上での電子文書のオープン指示に連動して、関連情報管理DB120内のその電子文書を対象文書とするレコードのうち、当該ワークスペースについてのレコードを更新する。
この手順は、ワークスペース処理部112が、あるワークスペース内の電子文書をオープンする指示をユーザPC200から受け取ったときに開始する(S100)。このとき、関連情報更新部118は、そのワークスペースにおいて、オープン指示の対象となった電子文書(対象文書と呼ぶ)と他の各電子文書との距離を計算し、その距離が所定のしきい値以下の周辺文書を特定する(S101)。距離の計算は、ワークスペースDB110内の当該ワークスペースのレコードにおける各電子文書の位置座標から計算する。周辺文書を判別するための距離のしきい値は、あらかじめ文書管理サーバ100に設定しておく。
また、関連情報更新部118は、関連情報管理DB120内の対象文書のレコードを参照し(S102)、当該ワークスペースのレコードがあるか否かを調べる(S103)。対象文書のレコード内に当該ワークスペースのレコードがなければ、生成し(S104)、ステップS105に進む。この生成の時点では、そのワークスペースのレコードには、周辺文書のエントリは含まれない。
ステップS105では、関連情報更新部118は、ステップS101で特定した各周辺文書とその距離の情報により、関連情報管理DB120内の対象文書のレコードのうちの当該ワークスペースのレコードを更新する。この更新の後、ワークスペース処理部112が対象文書をオープンする(S106)。
例えば、図2に例示したワークスペース20でユーザが対象文書Aのオープンを指示した場合、ステップS101では、図11に例示するように、電子文書B,F,Gがその対象文書Aの周辺文書として特定される。この例では、対象文書Aから遠すぎる文書は周辺文書として採用していない。各々の対象文書Aとの距離は1,2,3とそれぞれ求められる。この周辺文書と距離の情報により、図8に例示した関連情報管理DB120内のデータ内容のうち、対象文書Aのレコード内のワークスペース20のレコードにおける各周辺文書の距離が更新される。
図10の例では、オープン指示の対象の電子文書についてのレコードのみ更新したが、オープン指示が行われたワークスペースにある他の各電子文書についても同様にレコードを更新してもよい。
また図10の例では、電子文書のオープンをトリガとしてレコードを更新していたが、これに限らず、電子文書に対する他の操作をトリガとしてレコードを更新してもよい。
次に、図12及び図13を参照して、文書管理サーバ100が関連文書の抽出を行う処理手順の一例を説明する。
この手順では、ユーザPC200を操作するユーザが、ワークスペース処理部112が提供するワークスペース画面上で対象文書を選択し、その対象文書についての関連文書の抽出を指示すると、対象文書受付部122がその指示を受け付ける(S200)。すると、同グループ文書特定部113が、文書グループDB111を参照して、その対象文書に対応する同グループ文書を特定する(S201)。次に、対象レコード取得部124が、関連情報管理DB120を参照し(S202)、対象文書受付部122が受け付けた対象文書に対応するレコード、又は同グループ文書特定部113が特定した同グループ文書に対応するレコードがあるかどうかを判定する(S203)。ここで、対象文書に対応するレコードも同グループ文書に対応するレコードもなければ、関連文書提示部130は関連文書がないと判定し(S210)、その旨を示す抽出結果をユーザPC200に返す(S209)。
ステップS203で、対象文書又は同グループ文書のレコードが関連情報管理DB120内にあると判定されると、対象レコード取得部124がその対象文書及び各同グループ文書のレコードを取得し、関連度集計部126は、それらレコードに含まれる先頭の周辺文書エントリの取得を試みる(S204)。この試みより周辺文書エントリ(すなわち文書IDと距離)が取得できれば(S205の判定結果が肯定(Yes)。すなわち取得したレコード群の中の最後の周辺文書エントリまで処理が終了していなければ)、その距離を換算情報128により関連度に換算し(S206)、その関連度により集計テーブルにおける当該周辺文書に対応する集計値を更新する(S207)。ここで、集計テーブルは、図13に例示するように、各周辺文書の文書IDに対応づけて、その周辺文書の関連度の集計値が登録されたテーブルである。集計値が関連度を加算したものである場合は、ステップS207では、当該周辺文書に対応する集計値に対し、ステップS206で求めた関連度を加算すればよい。なお加算結果を当該対象文書が含まれるワークスペースの数で正規化した値を関連度の集計値とする場合は、関連度集計部126は、当該対象文書のレコード中の最後の周辺文書エントリまで集計を行い、その結果得られた各周辺文書についての最終的な加算結果を当該対象文書が含まれるワークスペースの数で正規化すればよい。
そして、ステップS204に戻り、関連情報管理DB120から取得した対象文書又は同グループ文書のレコードから、次の周辺文書のIDと距離の取得を行い、ステップS205以下の処理を繰り返す。
例えば、関連情報管理DB120が図8に示すようなものであり、ステップS200でユーザから指定された対象文書が文書Aであるとする。また、ステップS201で、対象文書Aの同グループ文書として文書H及びIが特定されたとする。この場合、関連度集計部126は、まずステップS204で、文書Aのレコード中のワークスペースID「1」のレコードから、先頭の周辺文書エントリから、周辺文書Bの距離「1」を取得する。そして、ステップS206でその距離「1」を図9のテーブルに基づき関連度「3」に変換し、ステップS207でこの関連度「3」を集計テーブルにおける周辺文書Bの集計値(この時点では0)に加算する。次に、関連度集計部126は、再びステップS204で、ワークスペースID「1」のレコード中の2番目の周辺文書エントリから周辺文書Fの距離「2」を取得し、これをステップS206で関連度「2」に変換し、ステップS207でこの関連度を集計テーブルの当該周辺文書Fの集計値に加算する。次に、次の周辺文書Gの距離「3」が関連度「1」に変換され、周辺文書Gの集計値に加算される。以上の処理が、対象文書Aのレコード中の全てのワークスペースのレコードの最後の周辺文書エントリまで繰り返されたのち、同グループ文書H及びIについても、同様に関連情報管理DB120から当該文書H,Iのレコードから各周辺文書の距離が読み出され、関連度に換算され、得られた関連度が各周辺文書の集計値に加算される。
当該対象文書及び各同グループ文書のレコード内の最後の周辺文書エントリまで集計が終わると、ステップS205の判定結果がNoとなる。この場合、関連文書提示部130は、集計テーブルを参照して関連文書を抽出する(S208)。例えば、最終的な集計結果が図13に示す集計テーブルのようなものであり、関連文書と判定するための関連度のしきい値が7である場合、文書B及びCが関連文書として抽出される。関連文書提示部130は、この抽出結果を示す画面を生成し、その画面の情報をユーザPC200に提供する(S208)。
図14に抽出結果の画面50の表示例を示す。この例では、関連文書の候補として抽出された文書B及びCの文書名52がリスト表示される。またこの例では、ユーザが各関連文書を判別するための情報として、各関連文書のファイル形式を表示しているが、これは一例に過ぎない。文書名だけでもよいし、関連文書の他の属性情報、或いは関連文書の縮小画像等を表示してもよい。また、ユーザが各関連文書の文書名52などをクリック操作することで、それら関連文書をオープンしてユーザに中身が確認できるようにしてもよい。
また、図14の例では、関連文書ごとにチェックボックス54が表示されており、ユーザは、ユーザPC200に付属するポインティングデバイス等の入力装置によりこのチェックボックス54を選択することができる。グループ登録ボタン56をポインティングデバイス等の入力装置で押下すると、チェックボックス54が選択状態となっている関連文書が、文書グループDB11内の当該対象文書の属する文書グループに登録される。すなわち、ワークスペース内の対象文書及び同グループ文書との距離に基づき文書管理サーバ100が推定した関連文書を、ユーザは文書グループDB11に対し、対象文書と同一グループの文書として明示的に登録することができる。
次に、図15を参照して、関連情報管理DB120の更新処理の別の例を説明する。図10の処理例では、ワークスペース中の電子文書のオープン操作に応じて、関連情報管理DB120を部分的に更新した。これに対して図15の手順では、定期的に、或いは管理者が指示したタイミングなどの所定の更新タイミングごとに、関連情報管理DB120全体を更新する。
この手順では、所定の更新タイミングが到来すると、まずステップS111では、ワークスペースDB110内に登録された1つのワークスペースのレコードを取り出し、当該ワークスペース内の各電子文書間の距離を各電子文書の位置座標から計算する。そして、そのワークスペース内の電子文書ごとに、ステップS112〜S116の処理を実行する。
すなわち、ステップS112では、関連情報管理DB120内に当該電子文書を「対象文書」とするレコードがあるか否かを調べ、なければステップS113でそのレコードを生成する(この時点ではそのレコードの内容は空)。次にステップS114で、当該対象文書のレコード内に当該ワークスペースのレコードがあるか否かを調べ、なければステップS115でそのレコードを生成する(この時点ではそのレコードの内容は空)。そして、ステップS111で求められた当該対象文書と他の各電子文書(周辺文書)との距離を、当該ワークスペースのレコード内にそれら各電子文書(周辺文書)の距離の値として書き込む、或いは上書きする(S116)。
以上のステップS111〜S116の処理を、ワークスペースDB110内のワークスペースごとに実行することにより、関連文書管理DB120が更新される。
なお、以上に説明した例では、関連情報管理DB120に各周辺文書の距離を登録していたが、この代わりに関連度を登録してもよい。この場合、関連度集計部126が距離を関連度に換算する必要はなくなる。
また、関連度に換算する代わりに、距離のままで集計を行い、その集計値の小さい周辺文書ほど関連が強いとする考え方に従って、関連文書の抽出を行ってもよい。例えば、距離の集計値が所定のしきい値以下の周辺文書を関連文書として抽出するなどである。
次に、図16を参照して、実施形態の第1の変形例を説明する。図16のうち、図12に示したステップと同様のステップには同一の符号を付して説明を省略する。
この変形例では、ステップS206で計算した周辺文書と同グループ文書との関連度を、同グループ文書と対象文書との距離に応じて補正する(S215)。同グループ文書と対象文書との距離が近いほど、関連度を高い値(すなわちより強い関連性を示す値)に補正する。例えば、ステップS204で、関連情報管理DB120内のある同グループ文書のレコード中の、あるワークスペースのレコード内の周辺文書エントリの距離の値を取得した場合を考える。この場合、ステップS215では、そのワークスペース内でのその同グループ文書と対象文書(これはS200で指定されている)との距離を求め、その距離に応じて、ステップS206で計算した関連度を補正する。この補正は、例えば、距離の範囲と補正係数との対応関係を示すテーブルを用いて行えばよい。すなわち、そのテーブルから同グループ文書と対象文書との距離に応じた補正係数を読み出し、関連度にその補正係数を乗じることで補正を行えばよい。もちろんこれは一例にすぎない。例えばこの代わりに、関連度に補正係数を加算することにより補正を行ってもよい。また、テーブルを用いる代わりに、関数を用いてもよい。例えば、同グループ文書と対象文書との距離と関連度とを入力すると補正された関連度を出力する関数、などを用いることができる。なお、ステップS204で取得された周辺文書エントリが属するワークスペース中に対象文書が存在しない場合については、例えば存在する場合よりも関連度が低い値となるように補正のための規則(テーブル或いは関数など)を定めておいてもよい。
次に、図17を参照して、実施形態の第2の変形例を説明する。図17のうち、図12に示したステップと同様のステップには同一の符号を付して説明を省略する。
この例では、関連文書提示部130が提示する関連文書の抽出結果に対し、信頼度の情報を付加する。信頼度は、関連文書抽出指示の対象文書に対応する同グループ文書がワークスペース群の中に現れる回数に基づき計算する。このシステムでは、1つのワークスペース内に同じ電子文書のシンボル画像が複数配置されてもかまわない。例えば、対象文書に対応する同じ同グループ文書が、あるワークスペースに1つ配置されており、別のワークスペースに2つ配置されている場合には、ワークスペースDB110内にはその同グループ文書が合計3個あるとカウントする。概略的には、同グループ文書の出現回数が多いほど、関連文書の抽出結果が多くのサンプルから裏付けられているということなので、その抽出結果の信頼度は高いと言える。
そこで、この変形例では、ステップS203で関連情報管理DB120内に対象文書のレコードがあると判定された場合に、文書管理サーバ100は、ステップS220にて、対象文書に対応する同グループ文書がワークスペース群の中に出現する回数を、ワークスペースDB110を参照して求め、そのワークスペースの数を所定の関数を用いて信頼度に変換する。そして、ステップS209aにて、関連文書提示部130は、関連文書の抽出結果をその信頼度と共に提示した抽出結果画面をユーザに提示する。
なお、同グループ文書の出現回数だけでなく、対象文書の出現回数も考慮して、信頼度を求めてもよい。
次に、図18及び図19を参照して、第3の変形例を説明する。この変形例では、対象文書についての関連文書の抽出を指示したユーザ(「ユーザU」と呼ぶ)と、個々のワークスペースSに対応するユーザ(「ユーザV」と呼ぶ)との関係に基づき、それら各ワークスペースSにある当該対象文書A又はその同グループ文書と、他の電子文書Xと、の関連度を補正する。すなわち、ユーザUとユーザVとの関係が強いほど、対象文書A又は同グループ文書とワークスペースS中の電子文書Xとの関連度を、大きい値になるように補正する。
この第3の変形例のために、文書管理サーバ100は、例えば、図18に例示するユーザ関係テーブルを記憶している。図18のユーザ関係テーブルには、ユーザ同士の関係の強さ(重み)の値が含まれている。このユーザ関係テーブルは、対角線(同一ユーザ同士の関係を示す)を挟んで対称となっている。例えば、縦軸上のユーザを、対象文書を指定したユーザUとみると、そのユーザに対応するテーブルの行内の各セルは、ユーザUに対する各ワークスペースのユーザVの重みを示す。重みは、値が大きいほどユーザ間の関係が強いことを示す。
この第3変形例の処理は、例えば、図12又は図17に例示した関連文書抽出の手順のうちのステップS206を図19に例示するように変更することで実現できる。すなわち、図19の手順では、関連度集計部126は、ステップS204(図12,図16又は図17参照)で対象文書又は同グループ文書のレコードから取得した周辺文書の距離を、換算情報128に基づき、関連度に換算する(S2060)。この換算処理は、ステップS206と同様でよい。また、関連度集計部126は、ステップS200(図12等参照)で対象文書を指定したユーザUと、ステップS204で取得した周辺文書を含むワークスペースのユーザVとの関係の強さを示す重み値を、図18に例示したユーザ関係テーブルから取得する(S2061)。ここでは、例えば、テーブルの縦軸からユーザUの行を、横軸からユーザVの列をそれぞれ選び、その行と列の交わるセルの重み値を取得する。なお、ステップS2061の処理では、例えば、ステップS204で関連情報管理DB120のワークスペースID「1」のレコードから先頭の周辺文書Bの情報を取得した場合、そのワークスペースID「1」に対応するユーザをワークスペースDB110から求め、前述のユーザVとすればよい。
そして、関連度集計部126は、ステップS2060で求めた関連度をその重み値により補正する(S2062)。この補正では、例えば関連度に重み値を加えたり、関連度に重み値を乗じたりするなど、あらかじめ定められた演算により行えばよい。逆に言えば、重み値はその演算に応じた値にあらかじめ定めておけばよい。そして、ステップS2062で補正された関連度により、ステップS207(図12等参照)で集計テーブルを更新すればよい。
図19の例では、関連文書の抽出指示を受けた後の関連度を集計する段階で、その関連度をユーザ同士の関係の強さに応じて補正したが、これは一例に過ぎない。この代わりに、例えば、関連情報管理DB120の各周辺文書エントリに距離又は関連度を登録する段階で、その距離又は関連度をユーザ同士の関係の強さに応じた重み値により補正しておいてもよい。
また、図18のようなユーザ関係テーブルを用いることも必須ではない。この代わりに、例えば、ユーザUとユーザVとが組織内の同じグループに属している場合に、そうでない場合より大きい重みとするようなルールに従い、関係の重みを求めてもよい。
次に、図20及び図21を参照して、第4の変形例を説明する。この変形例では、ワークスペース内での電子文書群の自動整列を考慮する。例えば、オペレーティングシステムの中には、デスクトップ画面上のオブジェクト群を、名前や更新日時などといった属性の値の順に自動整列する機能を備えているものもある。ワークスペース処理部12又は112(図1及び図6参照)も、同様にワークスペース内の各電子文書を、指定された属性値の順に自動的に整列し直す機能を持ってもよい。この機能によりワークスペース内の電子文書が自動的に整列された場合、そのワークスペース内の電子文書同士の距離はユーザの意志を反映したものではないので、電子文書同士の関連の強さを推測するのに用いるには適さない。そこで、この第4変形例では、ワークスペースが自動整列された場合には、そのワークスペース内の電子文書間の距離が関連度集計値に反映されないようにする。
このために、一例として、ワークスペースDB110に、図20に例示するような整列フラグ情報を持たせる。図20の例では、整列フラグ情報には、ワークスペースごとに整列フラグが含まれる。ワークスペース内の電子文書群が自動整列された場合、そのワークスペースの整列フラグが“1”にセットされる。また、例えば、ワークスペース内のいずれかの電子文書がドラッグアンドドロップ操作などにより移動された場合、そのワークスペースの整列フラグは“0”にリセットされる。
例えば、関連度集計部126は、図21に示すように、ステップS2060で周辺文書の距離を関連度に換算した後、この整列フラグ情報を参照して、その周辺文書が属するワークスペースの整列フラグの値を判定する(S2265)。この判定の結果、整列フラグが“1”であれば、ステップS2060で求めた関連度を0(この0という値は一例に過ぎない。0以外の所定の値でもよい)に変更し(S2066)、ステップS207でその関連度0を集計テーブルに反映する。一方、整列フラグが“0”であれば、ステップS2060で求めた関連度をそのままステップS206で集計テーブルに反映させる。
なお、図21の例では、関連度の集計の段階で整列フラグが“1”の場合は関連度を0等の所定の値に変更したが、これは一例に過ぎない。関連情報管理DB120を更新する際に整列フラグ情報を参照し、整列フラグが“1”であるワークスペースのレコード内の各周辺文書の距離又は関連度の値を所定の値に変更してもよい。
以上の実施形態及びその変形例では、各ワークスペースにおける同一の対象文書と他の各周辺文書との距離(又は関連度)の集計結果から、各周辺文書の対象文書に対する関連度の集計値を求めた。すなわち、実施形態・変形例の方式では、各ワークスペースにおける電子文書同士の同一性の判定が必要になる。最も単純には、電子文書を一意に識別する文書IDを各電子文書に持たせておき、この文書IDが同一である電子文書同士が同一であると判定すればよい。しかし、上述の実施形態及び変形例での同一性判定の仕方は、そのような単純な方式に限られない。
例えば、各電子文書の他の1以上の属性(例えば文書ID、文書名、作成日時、更新日時、作成者、ファイルの形式、データサイズ)に基づき電子文書同士の同一性を判定してもよい。例えば、判定に使用する1以上の属性の値の組を1つのベクトルと見なし、2つの電子文書の間でそのベクトル同士の距離が所定にしきい値以下である場合に、それら電子文書が同一であると見なす、などである。
また、ワークスペースには、電子文書そのもののシンボル画像だけでなく、電子文書を指し示す参照情報ファイル(いわゆる「ショートカット」)のシンボル画像が配置される場合がある。この場合、ワークスペース内の電子文書と、別のワークスペース内のその電子文書を指す参照情報ファイルとは、同一であると判定してもよい。
また、ユーザが明示的に同一と見なす電子文書群を登録するデータベースを設け、文書IDが一致しなくても、そのデータベースに同一であるとして登録されている電子文書同士は同一と判定することも考えられる。
上記実施形態及び変形例では、ワークスペースDB10又は110に登録されたすべてのワークスペースにわたって距離又は関連度の集計を行ったが、これは一例に過ぎない。この代わりに、例えば、関連文書の抽出を指示したユーザのワークスペースは、集計の範囲から削除してもよい。ユーザは、自分のワークスペースの中にある電子文書同士の関連性はよく知っているので、自分が把握していない関連文書を知りたいなどという目的のためには、集計の範囲から自分のワークスペースを除くことが考えられる。ワークスペースDB10に登録された各ワークスペースのユーザIDを参照することで、関連文書の抽出を指示したユーザのワークスペースを集計の範囲から除くことができる。
以上の各例では、文書グループの情報を文書グループDB11又は125で一元管理していたが、これは一例に過ぎない。この代わりに、各電子文書に対して、その電子文書が属する文書グループを示すグループ属性情報を持たせておいてもよい。この場合、各電子文書のグループ属性を調べることで対象文書と同じグループに属する電子文書を特定すればよい。
また、電子文書が複数の文書グループに所属可能とする場合には、対象文書に対応する同グループ文書の条件にはいくつか考えられる。例えば、1つの条件では対象文書が所属するすべての文書グループに属している電子文書のみを同グループ文書とする。別の条件では、対象文書が所属する文書グループのうちのいずれか1以上に属している電子文書はすべて同グループ文書とする。どの条件を適用するかは、例えば管理者が同グループ文書特定部13又は113に登録するようにしてもよいし、個々のユーザが選択できるようにしてもよい。また、対象文書が属する文書グループの一覧を示す画面を、対象文書を指定したユーザに提供し、ユーザから、関連文書抽出の際に考慮する文書グループの指定を受けてもよい。この場合、指定された各文書グループに属する電子文書を、同グループ文書とすればよい。
以上では、ワークスペース上での電子文書同士の距離に基づきそれら電子文書同士の関連度を求めていたが、これは一例に過ぎない。一般的にいえば、電子文書同士の関連度は、ワークスペース上でのそれら各電子文書の配置位置同士の関係に基づき求めてもよい。距離はそのような関係の一種である。また、別の例として、文書情報の位置座標がXY座標系で表される場合において、X座標値,Y座標値のうち、一方の座標値のみを利用して、電子文書同士の関連度を求めてもよい。具体的には、X座標値の等しい位置座標をもつ2つの電子文書は(両者のY座標が異なっていようとも)関連度が高いと判定するが、X座標値が所定の値以上異なる2つの電子文書は(Y座標が等しくとも)関連度が低いと判定することなどが考えられる。こうした構成を取ることで、例えば、同じ「行」にある電子文書同士は関連度が高いと判定するようになる。もちろん、一方の座標値を全く考慮しないのではなく、関連度を判定する際に2つの座標値の重み付けを変える構成としてもよい。さらに、ワークスペースやワークスペースのユーザ毎に、各文書同士の関連度の判定方法を変えてもよい。
以上に例示した実施形態及び各変形例のシステムは、例えば、汎用のコンピュータに上述の各機能モジュールの処理を表すプログラムを実行させることにより実現される。ここで、コンピュータは、例えば、ハードウエアとして、図22に示すように、CPU1000等のマイクロプロセッサ、ランダムアクセスメモリ(RAM)1002およびリードオンリメモリ(ROM)1004等のメモリ(一次記憶)、HDD(ハードディスクドライブ)1006を制御するHDDコントローラ1008、各種I/O(入出力)インタフェース1010、ローカルエリアネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース1012等が、たとえばバス1014を介して接続された回路構成を有する。また、そのバス1014に対し、例えばI/Oインタフェース1010経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ1016、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ1018、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAM1002に読み出されCPU1000等のマイクロプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。なお、それら機能モジュール群のうちの一部又は全部を、専用LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit、特定用途向け集積回路)又はFPGA(Field Programmable Gate Array)等のハードウエア回路として構成してもよい。
なお、図1に例示したシステムの各機能モジュール、又は図6に例示した文書管理サーバ100内の各機能モジュールが、ネットワーク上の複数の装置に分散配置され、相互に通信を行いながら上記システム又は文書管理サーバ100の機能を実現してもよい。
[補遺]
実施形態に関連する第1の態様は、特許請求の範囲の請求項1〜2のいずれか1項に係る発明において、前記特定手段が特定した電子文書の数を前記第1の記憶手段に基づき求め、求めた数を所定の換算情報に基づき信頼度に換算する手段、を更に備え、前記提示手段は、前記対象の電子文書に関連する電子文書を示す情報を、前記信頼度と対応づけて提示する、ことを特徴とする。
この態様によれば、関連する電子文書を示す情報の信頼度をユーザに提示することができる。
第2の態様は、特許請求の範囲の請求項1〜2のいずれか1項に係る発明又は上記第1の態様において、前記複数の作業空間のそれぞれについて、当該作業空間に対応するユーザを記憶するとともに、各ユーザ同士の関係の強さの判定のための判定情報を記憶する第2の記憶手段と、前記受付手段に対して前記指定を行ったユーザと、前記各電子文書が配置された作業空間に対応するユーザと、の関係の強さを前記判定情報に基づき判定する判定手段と、を更に備え、前記集計手段は、前記各作業空間での各電子文書と前記対象の電子文書との関連度、及びそれら各電子文書と前記特定手段が特定した電子文書との関連度を、前記判定手段が判定した前記関係の強さに応じて補正し、補正後の関連度をそれぞれ集計する、ことを特徴とする。
この態様によれば、対象の電子文書を指定したユーザと各作業空間に対応するユーザとの関係の強さも考慮して、対象の電子文書に関連する電子文書を求めることができる。
実施形態のシステム構成の一例を示す図である。 ワークスペース画面の一例を示す図である。 ワークスペースDBのデータ内容の一例を示す図である。 文書グループDBのデータ内容の一例を示す図である。 図1のシステムにおける関連文書抽出の処理手順の一例を示すフローチャートである。 実施形態のシステム構成の別の例を示す図である。 ユーザとワークスペースとの対応関係の情報の一例を概念的に示す図である。 関連情報管理DBのデータ内容の一例を示す図である。 換算情報の一例を示す図である。 関連情報更新部の処理手順の一例を示すフローチャートである。 ワークスペース上で指定された電子文書に対する周辺文書の情報の一例を示す図である。 関連文書抽出が指示されたときの文書管理サーバの処理手順の一例を示すフローチャートである。 集計テーブルのデータ内容の一例である。 関連文書抽出結果の表示画面の一例を示す図である。 関連情報更新部の処理手順の別の例を示すフローチャートである。 第1の変形例の処理手順の一例を示すフローチャートである。 第2の変形例の処理手順の一例を示すフローチャートである。 第3の変形例におけるユーザ関係テーブルの一例を示す図である。 第3の変形例の処理手順の一例を示すフローチャートである。 第4の変形例における整列フラグ情報の一例を示す図である。 第4の変形例における処理手順の一例を示すフローチャートである。 コンピュータのハードウエア構成の一例を示す図である。
符号の説明
10 ワークスペースDB、11 文書グループDB、12 ワークスペース処理部、13 同グループ文書特定部、14 距離(関連度)計算部、16 距離(関連度)集計部、18 対象文書受付部、19 関連文書提示部。

Claims (4)

  1. 1以上の作業空間のそれぞれについて、当該作業空間に配置される各電子文書の配置位置を記憶する第1の記憶手段と、
    前記各電子文書が属するグループを記憶する第2の記憶手段と、
    前記1以上の作業空間のそれぞれについて、前記第1の記憶手段に記憶された当該作業空間における各電子文書の配置位置に基づきそれら電子文書間の関連度を計算する関連度計算手段と、
    ユーザから対象の電子文書の指定を受け付ける受付手段と、
    指定された前記対象の電子文書と同じグループに属する電子文書を前記第2の記憶手段に基づき特定する特定手段と、
    前記1以上の各作業空間での、各電子文書と前記対象の電子文書との関連度、及びそれら各電子文書と前記特定手段が特定した電子文書との関連度を、それら各電子文書についてそれぞれ集計する集計手段と、
    前記集計手段の集計結果に基づき、それら各電子文書のうち前記対象の電子文書に関連する電子文書を提示する提示手段と、
    を備える関連文書提示システム。
  2. 前記対象の電子文書と前記特定手段が特定した電子文書とが同じ作業空間に配置される場合、当該作業空間内の各電子文書と前記特定手段が特定した電子文書との関連度を、当該作業空間における前記対象の電子文書の配置位置と前記特定手段が特定した電子文書の配置位置との位置関係に基づき補正する補正手段、
    を更に備え、
    前記集計手段は、前記補正手段により補正された関連度を集計する、
    ことを特徴とする請求項1記載の関連文書提示システム。
  3. 前記集計手段は、前記作業空間内の電子文書群が所定の整列処理が施された状態にあることを検知した場合に、当該作業空間内の電子文書同士の関連度は集計の対象から除く、ことを特徴とする請求項1〜のいずれか1項に記載の関連文書提示システム。
  4. コンピュータを、
    1以上の作業空間のそれぞれについて、当該作業空間に配置される各電子文書の配置位置を記憶する第1の記憶手段、
    前記各電子文書が属するグループを記憶する第2の記憶手段、
    前記1以上の作業空間のそれぞれについて、前記第1の記憶手段に記憶された当該作業空間における各電子文書の配置位置に基づきそれら電子文書間の関連度を計算する関連度計算手段、
    ユーザから対象の電子文書の指定を受け付ける受付手段と、
    指定された前記対象の電子文書と同じグループに属する電子文書を前記第2の記憶手段に基づき特定する特定手段、
    前記1以上の各作業空間での、各電子文書と前記対象の電子文書との関連度、及びそれら各電子文書と前記特定手段が特定した電子文書との関連度を、それら各電子文書についてそれぞれ集計する集計手段、
    前記集計手段の集計結果に基づき、それら各電子文書のうち前記対象の電子文書に関連する電子文書を提示する提示手段、
    として機能させるためのプログラム。
JP2008072841A 2008-03-21 2008-03-21 関連文書提示システム及びプログラム Expired - Fee Related JP4518168B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008072841A JP4518168B2 (ja) 2008-03-21 2008-03-21 関連文書提示システム及びプログラム
US12/209,877 US8099413B2 (en) 2008-03-21 2008-09-12 Relative document presenting system, relative document presenting method, and computer readable medium
CN200810172465XA CN101539926B (zh) 2008-03-21 2008-11-10 相关文档呈现系统和相关文档呈现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008072841A JP4518168B2 (ja) 2008-03-21 2008-03-21 関連文書提示システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2009230299A JP2009230299A (ja) 2009-10-08
JP4518168B2 true JP4518168B2 (ja) 2010-08-04

Family

ID=41089904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008072841A Expired - Fee Related JP4518168B2 (ja) 2008-03-21 2008-03-21 関連文書提示システム及びプログラム

Country Status (3)

Country Link
US (1) US8099413B2 (ja)
JP (1) JP4518168B2 (ja)
CN (1) CN101539926B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5471065B2 (ja) * 2009-06-24 2014-04-16 富士ゼロックス株式会社 文書情報生成装置、文書登録システム、及びプログラム
WO2013005266A1 (ja) * 2011-07-05 2013-01-10 パナソニック株式会社 プレゼンテーションコンテンツ生成装置、プレゼンテーションコンテンツ生成方法、プレゼンテーションコンテンツ生成プログラム、及び集積回路
CN108995219B (zh) * 2018-05-31 2021-04-20 共享智能铸造产业创新中心有限公司 一种层厚可变的切片方法、3d打印方法及3d打印的产品
JP7322438B2 (ja) * 2019-03-14 2023-08-08 富士フイルムビジネスイノベーション株式会社 情報処理装置および情報処理プログラム
US11557136B1 (en) * 2022-02-23 2023-01-17 Scandit Ag Identity document verification based on barcode structure

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000067006A (ja) * 1998-08-17 2000-03-03 Fuji Xerox Co Ltd ワークスペース管理装置
JP2000076367A (ja) * 1998-08-27 2000-03-14 Fuji Xerox Co Ltd ワークプロセス管理装置
JP2006350659A (ja) * 2005-06-15 2006-12-28 Ricoh Co Ltd 人材検索システム、人材検索装置、人材検索端末、プログラムおよび記録媒体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5790853A (en) * 1994-12-22 1998-08-04 Fuji Xerox Co., Ltd. Workspace management apparatus
US5625767A (en) * 1995-03-13 1997-04-29 Bartell; Brian Method and system for two-dimensional visualization of an information taxonomy and of text documents based on topical content of the documents
US6131096A (en) * 1998-10-05 2000-10-10 Visto Corporation System and method for updating a remote database in a network
US6671855B1 (en) * 1999-12-07 2003-12-30 Fuji Xerox Co., Ltd. Outline information generating apparatus and computer-readable recording medium recording thereon outline information generating program
US7249314B2 (en) * 2000-08-21 2007-07-24 Thoughtslinger Corporation Simultaneous multi-user document editing system
JP2005010931A (ja) 2003-06-17 2005-01-13 Fujitsu Ltd 画像データの類似検索装置および該類似検索装置における類似判定方法
JP4453440B2 (ja) 2004-05-18 2010-04-21 日本電信電話株式会社 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体
KR100586982B1 (ko) * 2004-05-20 2006-06-08 삼성전자주식회사 디스플레이 시스템 및 그 가상 작업공간 관리방법
CN100573514C (zh) * 2004-12-01 2009-12-23 皇家飞利浦电子股份有限公司 相关内容检索中的位置相似度阈值的调整
US20060149800A1 (en) * 2004-12-30 2006-07-06 Daniel Egnor Authoritative document identification
JP2009509259A (ja) * 2005-09-20 2009-03-05 フランス テレコム 一組の電子文書を並べ替える方法
JP2007133516A (ja) 2005-11-08 2007-05-31 Shin Etsu Polymer Co Ltd 文書分類方法、文書分類プログラム及び文書分類装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000067006A (ja) * 1998-08-17 2000-03-03 Fuji Xerox Co Ltd ワークスペース管理装置
JP2000076367A (ja) * 1998-08-27 2000-03-14 Fuji Xerox Co Ltd ワークプロセス管理装置
JP2006350659A (ja) * 2005-06-15 2006-12-28 Ricoh Co Ltd 人材検索システム、人材検索装置、人材検索端末、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP2009230299A (ja) 2009-10-08
US20090240715A1 (en) 2009-09-24
CN101539926B (zh) 2012-09-05
US8099413B2 (en) 2012-01-17
CN101539926A (zh) 2009-09-23

Similar Documents

Publication Publication Date Title
JP4518165B2 (ja) 関連文書提示システム及びプログラム
US7739304B2 (en) Context-based community-driven suggestions for media annotation
CN111506498A (zh) 测试用例的自动生成方法、装置、计算机设备及存储介质
JP6635624B2 (ja) 情報処理装置、情報処理システム、情報処理方法およびプログラム
US8959079B2 (en) Method and system for providing relationships in search results
CN108011928A (zh) 一种信息推送方法、终端设备及计算机可读介质
US11263219B2 (en) Error identification, indexing and linking construction documents
US20130265334A1 (en) System and method for organizing documents
JP4518168B2 (ja) 関連文書提示システム及びプログラム
US9087053B2 (en) Computer-implemented document manager application enabler system and method
JP3872689B2 (ja) セキュリティポリシーの作成支援システムおよびセキュリティ対策決定支援システム
US20180330206A1 (en) Machine-based learning systems, methods, and apparatus for interactively mapping raw data objects to recognized data objects
JP6146209B2 (ja) 情報処理装置、文字認識方法、及びプログラム
CN109727056B (zh) 金融机构推荐方法、设备、存储介质及装置
KR100469825B1 (ko) 지역의 인기 정보를 제공하는 방법 및 지역 인기 정보제공 시스템
CN111611251B (zh) 一种数据处理系统
JP6790886B2 (ja) 情報処理プログラム、情報処理方法および情報処理装置
WO2012099163A1 (ja) 細胞情報データの作成方法
JP7312646B2 (ja) 情報処理装置、文書識別方法、及び情報処理システム
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
JP5837447B2 (ja) メタデータ候補生成装置及びメタデータ候補生成方法
US9311392B2 (en) Document analysis apparatus, document analysis method, and computer-readable recording medium
JP6958952B2 (ja) マスター顔画像の登録装置、登録方法、プログラム、および記録媒体
KR20050104713A (ko) 지역의 인기 정보를 제공하는 방법 및 지역 인기 정보제공 시스템
GB2604092A (en) Method and apparatus for determining a folder path for a scanned image file

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100324

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100427

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100510

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130528

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4518168

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140528

Year of fee payment: 4

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees