JP2015102971A - 文書管理システム、文書管理システムにおける情報処理装置、文書管理方法及びプログラム - Google Patents

文書管理システム、文書管理システムにおける情報処理装置、文書管理方法及びプログラム Download PDF

Info

Publication number
JP2015102971A
JP2015102971A JP2013242149A JP2013242149A JP2015102971A JP 2015102971 A JP2015102971 A JP 2015102971A JP 2013242149 A JP2013242149 A JP 2013242149A JP 2013242149 A JP2013242149 A JP 2013242149A JP 2015102971 A JP2015102971 A JP 2015102971A
Authority
JP
Japan
Prior art keywords
file entity
server
file
attribute information
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013242149A
Other languages
English (en)
Inventor
鎌田 環己
Tamaki Kamata
環己 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2013242149A priority Critical patent/JP2015102971A/ja
Publication of JP2015102971A publication Critical patent/JP2015102971A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書管理システムにおいて、データベースの使用量を削減して、低コストかつ効果的にファイル実体を管理する。【解決手段】文書のファイル実体とその属性情報とを管理する第1のサーバと、文書のファイル実体は管理するがその属性情報は管理しない第2のサーバと、通信可能な情報処理装置であって、受信した文書のファイル実体の管理を前記第1のサーバ及び前記第2のサーバに指示するファイル実体処理手段と、受信した文書の属性情報の管理を前記第1のサーバに指示する属性情報処理手段と、を備え、前記ファイル実体処理手段は、前記第1のサーバに格納されているファイル実体に対するアクセスが一定期間ない場合に、当該ファイル実体の削除を前記第1のサーバに対し指示する、ことを特徴とする。【選択図】図5

Description

本発明は、文書管理システム上で管理する文書のファイル実体及び属性情報を管理する技術に関する。
一般的な文書管理システムでは、クライアントPCから登録されるファイルに紐付いた属性(例えばファイル名、サイズ等)の情報をキーにして、目的とするファイルを検索する検索機能を、データベースを用いて提供することが多い。その際、ファイル実体はファイルサーバで管理し、属性情報はデータベースサーバで管理するといった手法が採られたり、もしくは、ファイル実体と属性情報の両方ともデータベースサーバで管理するといった手法が採られる。また、特許文献1のようにファイル実体を登録時用と長期保存用とで別々の保管場所を用意し、どちらか一方で管理するということも提案されている。
特開2006−268701号公報
ここで、ファイル実体のみをファイルサーバ上で管理する手法の場合は、ファイルサーバは安価でかつ大容量であるため有効的な管理方法と言える。しかし、文書管理をする上で必要な属性情報がデータベースサーバ上にあるため、データベースサーバ内の属性情報を取得した上でファイルサーバへのアクセスが行なわれるのでパフォーマンスが低下してしまうという難点がある。
また、ファイル実体と属性情報の両方をデータベースサーバで管理する手法の場合は、データベースサーバへのアクセスだけで完結するため、パフォーマンスは良い。しかし、データベースサーバはファイルサーバとは違って比較的高価であり、かつ容量も大きくはないためコストが高くなってしまう。
本発明に係る情報処理装置は、文書のファイル実体とその属性情報とを管理する第1のサーバと、文書のファイル実体は管理するがその属性情報は管理しない第2のサーバと、通信可能な情報処理装置であって、受信した文書のファイル実体の管理を前記第1のサーバ及び前記第2のサーバに指示するファイル実体処理手段と、受信した文書の属性情報の管理を前記第1のサーバに指示する属性情報処理手段と、を備え、前記ファイル実体処理手段は、前記第1のサーバに格納されているファイル実体に対するアクセスが一定期間ない場合に、当該ファイル実体の削除を前記第1のサーバに対し指示する、ことを特徴とする。
本発明によれば、文書管理システムにおいて、データベースの使用量を削減して、低コストかつ効果的にファイル実体を管理することが可能となる。
文書管理システムの構成の一例を示す図である。 文書管理システムを構成するサーバ群内の各種サーバ及びクライアントPCのハードウェア構成を示す図である。 文書管理システムのソフトウェア構成を示す図である。 ユーザ情報管理テーブルの一例を示す図である。 実施例1に係る、ファイル実体及び属性情報の登録処理の流れを示すフローチャートである。 実施例1に係る、属性情報管理テーブルの一例を示す図である。 ファイル実体管理テーブルの一例を示す図である。 実施例1に係る、WebサーバからクライアントPCへファイル実体を送信する処理の流れを示すフローチャートである。 実施例1に係る、ファイル実体をDBのファイル実体管理テーブルから削除する処理の流れを示すフローチャートである。 実施例2に係る、属性情報管理テーブルの一例を示す図である。 実施例2に係る、ファイル実体管理テーブルにファイル実体を格納しておく期間をアクセス可能なユーザ数に応じて設定・管理するためのテーブルの一例を示す図である。
以下、本発明を実施するための形態について図面を用いて説明する。
なお、以下に述べる実施例は説明の便宜上、本発明に関連する最低限のハードウェア構成、ソフトウェア構成、データ構成、及び処理フローを記載しているが、本発明の範囲は以下の説明において特に記載がない限り、これらの態様に限られるものではない。
(システム構成)
図1は、本実施例に係る文書管理システムの構成の一例を示す図である。本実施例に係る文書管理システム100は、ネットワーク110上にクライアントPC101(1)、101(2)、・・・、101(N:自然数)が接続されており、さらにサーバ群102が接続されている。そして、クライアントPC101とサーバ群102とは、ネットワーク110を介して相互に通信可能となっている。なお、ネットワーク110は、例えばインターネットまたはイントラネット回線を表す。
サーバ群102は、Webサーバ103、データベースサーバ(以下、DB)104、ファイルサーバ(以下、FS)105で構成される。
Webサーバ103は、クライアントPC101からのリクエストを受け付け、レスポンスを返却するサーバである。本明細書では、Webサーバ103を、クライアントPC101からのHTTPリクエストに対するレスポンスを処理するHTTPサーバと、DB104やFS105への橋渡しを担い、データの加工等を行なうアプリケーションサーバをまとめたものとして扱う。実際のWebサーバの構成が、HTTPサーバとアプリケーションサーバのように別々の構成であっても構わないが、本実施例では説明の簡略化のため1つのサーバとして記載する。
DB104は、ファイル実体及びファイルの属性情報を管理するサーバであり、ファイルの検索や抽出を行なうサーバである。本実施例においては、OSが提供するファイルシステム上に直接構築するものを指すのではなく、データベース管理プログラムを用いて構築した高速かつ安定したデータ管理を行なうサーバを指す。
FS105は、ファイル実体を管理するサーバである。FS105は、ファイル実体を管理するための記憶装置としての役割を有するため、一般的には高度な演算能力や描画能力は求められない。そのため、同じ容量のデータを扱う場合は、DB104と比べて入出力の処理能力が低い。
(クライアントPC及び各種サーバのハードウェア構成)
図2は、文書管理システム100を構成するサーバ群102内の各種サーバ(103〜105)、及びクライアントPC101のハードウェア構成を示す図である。
サーバ群102内の各種サーバ(103〜105)及びクライアントPC101は、一般的な情報処理装置のハードウェア構成を有するものとし、まとめて情報処理装置200と記すこととする。
CPU201は、情報処理装置200の演算/制御を司る。
RAM202は、CPU201の主メモリとして実行プログラムの領域や該プログラムの実行エリア並びにデータエリアとして機能する。実行プログラムは、後述する外部メモリ213からRAM202に読み出されて実行される。
プログラムROM203は、情報処理装置200の機器制御を行なうシステムプログラムの基本ソフト(OS)を格納する。Webサーバ103におけるプログラムROM203には、クライアントPC101から送信されたリクエストを受信してリクエストに応じた処理を行なうプログラムや、DB104又はFS105に処理を指示するためのプログラムが格納される。DB104におけるプログラムROM203には、Webサーバ103からの依頼に応じた処理を行なうためのデータベース管理プログラムが格納される。
データROM204は、情報処理装置200の機能を提供するために必要な情報等を格納する。情報処理装置200の機能を提供するために必要な情報としては、例えばDB104においては、クライアントPC101から登録されるファイル実体や属性情報、またクライアントPC101の認証情報等が考えられる。なお、データROM204の代わりに後述する外部メモリ213を用いる場合もある。
ネットワークコントローラ(NC)205は、ネットワーク110に接続され、ネットワーク110上の他の機器との通信制御処理を実行する。
キーボードコントローラ206は、後述するキーボード211からのキー入力を制御する。
ディスプレイコントローラ207は、情報処理装置200内の情報を後述のディスプレイ212の画面に表示するために画像データを展開し、その表示の制御を行なう。
ディスクコントローラ208は、外部メモリ213への読み書きを制御するコントローラであり、例えばDB104においては、管理するファイル実体やその属性に関する情報(以下、属性情報)、クライアントPC101の認証情報等の入出力を制御する。
キーボード211は、情報処理装置200を操作するユーザが入力操作を行なう。例えば、本実施例においてサーバ群102のメンテナンス作業をする場合は、後述するディスプレイ212に表示される情報を見ながらキーボード211を操作することが考えられる。
ディスプレイ212は、例えばLCDなどの表示装置である。
外部メモリ213は、アプリケーションプログラムや各種データ保存用に用いるHDDなどの外部記憶装置である。本実施例におけるアプリケーションプログラムとは、例えばWebサーバ103における各処理部、またDB104におけるデータベース管理プログラムのようなソフトウェアプログラムを表す。
(文書管理システムのソフトウェア構成)
図3は、本実施例に係る文書管理システムのソフトウェア構成を示す図である。
Webサーバ103における各処理部は、プログラムROM203等より読み込まれてRAM202に展開されるWebアプリケーションプログラム、または該プログラムの一部として動作する。すなわち、Webアプリケーションプログラムは、Webサーバ103のCPU201を各処理部305〜307として機能させるためのものである。同様にDB104、及びFS105においても、CPU201が各プログラムによって各管理部308〜310、及び311として機能する。
ただし、図3に示されているのは、本発明の説明に必要な機能のみであって、ここに記されている以外の一般的な文書管理機能を、クライアントPC101やサーバ群102は備えているものとする。以下、各処理部について説明する。
クライアントPC101には、リクエスト送信部301とレスポンス受信部302が存在する。
リクエスト送信部301は、ネットワーク110上のサーバ群102に処理のリクエストを送信する通信モジュールである。
レスポンス受信部302は、リクエスト送信部301によって依頼した処理に対するサーバ群102からのレスポンスを受信する通信モジュールである。
Webサーバ103には、リクエスト受信部303、レスポンス送信部304、ファイル実体処理部305、属性情報処理部306、認証情報処理部307が存在する。
リクエスト受信部303は、ネットワーク110上のクライアントPC101から送信されたリクエストを受信する通信モジュールである。
レスポンス送信部304は、リクエスト受信部303によって受信したリクエストに対して処理を行なった結果をレスポンスとしてクライアントPC101に送信する通信モジュールである。
ファイル実体処理部305は、後述するファイル実体管理テーブル、又はFS105のファイルシステム上に記録されるファイル実体を、クライアントPC101からの要求に従って処理するモジュールである。
属性情報処理部306は、後述する属性情報管理テーブル上に記録されるファイルの属性情報をクライアントPC101からの指示に従って処理するモジュールである。
認証情報処理部307は、クライアントPC101からリクエストを受けた時に、当該クライアントPC101が文書管理システム100に登録されたユーザであることを判定するための認証処理を行なうモジュールである。
DB104には、認証情報管理部308、属性情報管理部309、ファイル実体管理部310が存在する。
認証情報管理部308は、ユーザID、ユーザ名、メールアドレス、パスワードといったユーザ認証に必要な情報をユーザ情報管理テーブルによって管理するモジュールである。図4は、ユーザ情報管理テーブルの一例を示す図である。「ユーザID」は、ユーザ毎に発行される内部IDであり、文書管理システム100上で一意となるユーザ識別子である。「ユーザ名」は、ユーザを識別するために付けられる名前であり、主に画面表示時に使用される。「メールアドレス」は、文書管理システム100からクライアントPC101への通知の送信等で使用される。「パスワード」は、クライアントPC101が文書管理システム100にログインする際に必要となるパスワードであり、認証情報処理部307によって自動発行してもよいしクライアントPC101で任意に設定してもよい。クライアントPC101が文書管理システム100のユーザが利用する端末として登録されていれば、上述のようなユーザ情報管理テーブルにおいて対応するユーザ情報が管理されていることになる。
属性情報管理部309は、文書ID、文書名、ファイル実体格納場所フラグ、FS上のファイル実体パスといったデータを、後述する属性情報管理テーブルによって管理するモジュールである。
ファイル実体管理部310は、文書ID、ファイル実体、最終アクセス日時といったデータを、後述するファイル実体管理テーブルによって管理するモジュールである。
また、FS105にもファイル実体管理部311が存在し、一般的にはOSが提供するファイルシステム上に直接構築される。
(ファイル実体及び属性情報の文書管理システム100への登録処理)
次に、クライアントPC101からの文書(文書ファイル)の登録要求に従って行なわれる、ファイル実体及び属性情報の文書管理システム100への登録処理について説明する。
図5は、本実施例に係る、ファイル実体及び属性情報の登録処理の流れを示すフローチャートである。
ステップ501において、Webサーバ103のリクエスト受信部303は、クライアントPC101のリクエスト送信部301によって送信された、登録要求に係る文書のファイル実体及び属性情報を受信する。
ステップ502において、属性情報処理部306は、受信した属性情報をDB104に登録する。具体的には、属性情報管理部309に対し受信した属性情報の登録を指示し、指示を受けて属性情報管理部309は属性情報管理テーブルに属性情報を登録する。図6は、本実施例に係る、属性情報管理テーブルの一例を示す図である。テーブルの各行が1レコードであり、文書ID、文書名、ファイル実体格納場所フラグ、FS上のファイル実体パス、といった情報が含まれる。
「文書ID」は、Webサーバ103がクライアントPC101からファイルを受信し属性情報管理テーブルに新規文書として登録される時に属性情報処理部306によって自動的に割り振られるIDであり、これにより文書管理システム上で一意に識別される。各文書IDが単独で一意に識別可能でなくても、別のIDとの組み合わせ等により文書管理システム上で一意なIDとなっていれば構わない。
「文書名」は、クライアントPC101から新規文書を登録する際(Webサーバ103にファイルを送信する際)に、ユーザが任意に設定することができる。
「ファイル実体格納場所フラグ」は、ファイル実体の格納場所を示すフラグであり、本実施例では、値「1」がFS105のみに格納されていることを表し、値「2」がDB104とFS105の両方に格納されていることを表す。これにより、登録されているファイル実体が、FS105のファイル実体管理部311のみで格納・管理されているのか、FS105内のファイル実体管理部311に加え、DB104内のファイル実体管理部310でも格納・管理されているのかが把握される。
「FS上のファイル実体パス」は、FS105上のファイル実体管理部311でファイル実体が管理されている場合の、格納場所としてのフルパスを示す。本実施例に係る文書管理システム100では、登録される文書のファイル実体は常にFS105に格納されているので、この「FS上のファイル実体パス」には必ず格納先を表すパスの情報が入ることになる。FS105内のファイル実体管理部311のみでファイル実体を管理している場合においてファイル実体を取得するときは、この「FS上のファイル実体パス」が参照されて、パスの示す先に置かれるファイルが取得される。一方、DB104内のファイル実体管理部310でもファイル実体が管理されている場合においてファイル実体を取得するときは、上述の文書IDをキーとして、後述するファイル実体管理テーブルの該当レコードを検索することでファイル実体が取得される。つまり、DB104にもファイル実体がある文書の場合、パスの情報は使われない。
このような属性情報管理テーブルによって、DB104に登録される文書の属性情報が管理される。
図5のフローチャートの説明に戻る。
ステップ503において、ファイル実体処理部305は、受信したファイル実体をDB104に登録する。具体的には、ファイル実体管理部310に対し受信したファイル実体の登録を指示し、指示を受けてファイル実体管理部310は、ファイル実体管理テーブルにファイル実体を登録する。図7は、ファイル実体管理テーブルの一例を示す図である。テーブルの各行が1レコードであり、文書ID、ファイル実体、最終アクセス日時、といった情報が含まれる。
「文書ID」は、上述の属性情報管理テーブルにおける文書IDと同じである。この文書IDをキーに属性情報管理テーブルとファイル実体管理テーブルのデータが紐付けられる。
「ファイル実体」は、クライアントPC101から受信した文書ファイルの実体データである。一般的なデータベース管理システム(DBMS)においてファイル実体をデータベースサーバに格納する場合は、ラージ・オブジェクト(LOB)と呼ばれるバイナリやキャラクターを格納するデータ型が使用される。
「最終アクセス日時」は、ファイル実体管理テーブルで管理されるファイル実体に対してクライアントPC101からのアクセス要求があった最後の日時の情報である。この「最終アクセス日時」で示される日時が現在から一定以上の期間が経過した場合(日時が古くなった場合)、常駐プロセスやバッチファイル等による定期的なファイル実体削除処理によって、該当レコードが削除される。
このようなファイル実体管理テーブルによって、DB104に登録される文書ファイルの実体が管理される。
図5のフローチャートの説明に戻る。
ステップ504において、ファイル実体処理部305は、DB104に登録したファイル実体をFS105にも登録する。具体的には、ファイル実体管理部311に対し受信したファイル実体の複製の登録を指示し、指示を受けてファイル実体管理部311は、FS105内のファイルシステム上にファイル実体(複製)を格納する。この時点で一時的に、DB104とFS105の両方にファイル実体が存在することになる。
ステップ505において、属性情報処理部306は、ステップ404でFS105のファイルシステム上に格納されたファイル実体のパスをDB105に登録する。具体的には、属性情報管理部309に対しファイル実体のパスの登録を指示し、指示を受けて属性情報管理部309は上述の属性情報テーブルにおける「FS上のファイル実体パス」に当該ファイル実体のパスを登録する。
ステップ506において、属性情報処理部306及びファイル実体処理部305は、ステップ502〜505までの処理によって、DB104とFS105に登録(格納)すべきデータが正しく登録(格納)されたかどうかをそれぞれ判定する。いずれも正しく登録されていればステップ507に進む。一方、いずれかが正しく登録されていなければステップ509に進む。
ステップ507において、属性情報処理部306及びファイル実体処理部305は、登録確定処理を行なう。これにより、属性情報管理テーブル及びファイル実体管理テーブルの該当レコードにおける登録がそれぞれ確定される。
ステップ508において、レスポンス送信部304は、登録要求に係る文書のファイル実体とその属性情報が文書管理システム100(DB104及びFS105)に問題なく登録されたことを、クライアントPC101に通知する。
ステップ509において、属性情報処理部306及びファイル実体処理部305は、それぞれ属性情報及びファイル実体の登録取り消し処理を行なう。具体的には、属性情報管理部309に対し属性情報の取り消しが、ファイル実体管理部310に対しファイル実体の登録取り消しがそれぞれ指示される。指示を受けて属性情報管理部309は属性情報管理テーブルの該当レコードから当該属性情報を削除し、ファイル実体管理部310はファイル実体管理テーブルの該当レコードから当該ファイル実体を削除する。
ステップ510において、ファイル実体処理部305は、FS105のファイルシステム上に格納されたファイル実体(ステップ509で登録取り消し処理がなされた属性情報に紐付くファイル実体(複製))を削除する。
ステップ511において、レスポンス送信部304は、登録要求に係る文書のファイル実体とその属性情報が文書管理システム100(DB104及びFS105)に正しく登録されなかったこと(登録の失敗)を、クライアントPC101に通知する。
以上が、文書のファイル実体及び属性情報の登録処理(エラー処理を含む)の内容である。
(ファイル実体のクライアントPCへの送信処理)
次に、クライアントPC101から文書管理システムへのファイル実体の取得要求に従って行なわれる、Webサーバ103からクライアントPC101へのファイル実体の送信処理について説明する。
図8は、本実施例に係る、Webサーバ103からクライアントPC101へファイル実体を送信する処理の流れを示すフローチャートである。
ステップ801において、Webサーバ103のリクエスト受信部303は、クライアントPC101のリクエスト送信部301によって送信された、文書管理システム100に登録されているファイル実体の取得要求を受信する。この取得要求には、文書IDなど、当該取得要求に係る文書を特定するための情報が含まれる。
ステップ802において、ファイル実体処理部305は、受信した取得要求に従い、DB104のファイル実体管理部310に対し、当該取得要求に係る文書のファイル実体を要求する。
ステップ803において、属性情報処理部306は、当該取得要求に係る文書のファイル実体の格納場所を示す情報(以下、格納場所情報)を取得する。具体的には、DB104内の属性情報管理テーブルにアクセスし、上述の「ファイル実体格納場所フラグ」を参照して、当該取得要求に係る文書のファイル実体がどこで管理されているのかを示す上述のフラグ値(1or2)を取得する。
ステップ804において、属性情報処理部306は、取得した「ファイル実体格納フラグ」の値をチェックし、ファイル実体の格納先がFS105のみであるのかDB104にも格納されているのかを判定する。当該取得要求に係る文書のファイル実体の格納先がFS105のみであればステップ805に進む。一方、DB104にもファイル実体が格納されていればステップ812に進む。前述のとおり、DB104にファイル実体が格納されているということは、一定期間内に対象文書のファイル実体へのアクセス要求があったことを示している。これに対し、ファイル実体の格納先がFS105のみであれば、一定期間内に対象文書のファイル実体へのアクセス要求がなかったことを示している。
ステップ805において、属性情報処理部306は、当該取得要求に係る文書の、属性情報管理テーブルにおける該当レコードの「FS上のファイル実体パス」を取得する。
ステップ806において、ファイル実体処理部305は、ステップ805で取得した「FS上のファイル実体パス」を用いて、FS105に対してファイル実体の取得を要求する。
ステップ807において、ファイル実体処理部305は、当該取得要求に係るファイル実体をFS105から受け取る。
ステップ808において、レスポンス送信部304は、FS105から取得したファイル実体をクライアントPC101に送信する。送信されたファイル実体は、クライアントPC101のレスポンス受信部302によって受信される。
ステップ809において、ファイル実体処理部305は、これまで一定期間アクセスがなかった為にFS105にしか格納されていなかった、当該取得要求に係る文書のファイル実体をDB104に再登録する。具体的には、ファイル実体管理部310に対し対象文書のファイル実体の再登録を指示し、指示を受けてファイル実体管理部310は、ファイル実体格納テーブルに当該文書のファイル実体を再び登録する。
ステップ810において、属性情報管理部309は、属性情報管理テーブルにおける該当するレコードの「ファイル実体格納場所フラグ」の値を更新(本実施例では「1」から「2」に変更)する。この更新処理により、以後はDB104にもファイル実体が格納されている文書として、文書管理システム100上扱われることになる。
ステップ811において、属性情報処理部306及びファイル実体処理部305は、再登録の確定処理を行なう。これにより、属性情報管理テーブル及びファイル実体管理テーブルの該当レコードにおける再登録がそれぞれ確定される。
ステップ812において、ファイル実体処理部305は、当該取得要求に係る文書のファイル実体をDB104から取得する。
ステップ813において、レスポンス送信部304は、DB104から取得したファイル実体をクライアントPC101に送信する。送信されたファイル実体は、クライアントPC101のレスポンス受信部302によって受信される。
以上が、ファイル実体のクライアントPCへの送信処理(エラー処理を含む)の内容である。
(ファイル実体の削除処理)
次に、DB104に格納・管理されているファイル実体に対して一定期間アクセスがない場合に、当該ファイル実体をDB104から削除する処理について説明する。図9は、本実施例に係る、ファイル実体をDB104のファイル実体管理テーブルから削除する処理の流れを示すフローチャートである。この削除処理は、常駐プロセスやバッチファイル等による定期的なチェックによって実施されることを想定している。
まず、ステップ901において、ファイル実体処理部305は、DB104内のファイル実体管理テーブルから全レコードの文書IDをリストアップし、ファイル実体管理テーブルにおいてファイル実体が格納されている文書の一覧を抽出する。
ステップ902において、ファイル実体処理部305は、リストアップされた全文書の最終アクセス日時をチェックし、一定期間ファイル実体に対するアクセスがなされていない文書の文書IDをリストアップする。なお、一定期間は、例えば文書管理システム100内で設定された固定の期間としてもよいし、利用契約単位で設定できるようにしてもよい。
ステップ903において、ファイル実体処理部305は、一定期間アクセスがないとして抽出された文書のファイル実体を、ファイル実体管理テーブルから削除する。具体的には、ファイル実体管理部310に対し該当する文書のファイル実体の削除を指示し、指示を受けてファイル実体管理部310は、ファイル実体管理テーブルの該当するレコードからファイル実体を削除する。
ステップ904において、属性情報処理部306は、ファイル実体が削除された文書について、属性情報管理テーブルの該当するレコードにおける「ファイル実体格納場所フラグ」の値を更新する。すなわち、本実施例では「2」から「1」にフラグ値が変更される。この処理によって、以降にこの文書のファイル実体にアクセスがされた時は、ファイル実体がFS105でのみ管理されていることがわかる。
ステップ905において、ファイル実体処理部305及び属性情報処理部306は、ファイル実体管理テーブル及び属性情報管理テーブルの更新確定処理を行なう。
ステップ906において、ファイル実体処理部305は、ステップ902で一定期間アクセスなしの文書としてリストアップされた文書IDについて、ファイル実体の削除処理がすべて完了したかどうかを判定する。未処理の文書IDがあればステップ903に戻り、削除処理を続行する。一方、すべてのリストアップされた文書IDについてファイル実体の削除処理が完了していれば、本処理を終える。
以上がファイル実体の削除処理の内容である。この処理によって、ファイル実体に対して一定期間アクセスがない文書のファイル実体が定期的にDB104から削除される。
本実施例によれば、文書管理システムにおいて、データベースの使用量を削減でき、低コストかつ効果的にファイル実体を管理することが可能となる。
実施例1では、ファイル実体に対し一定期間アクセスがない文書については、データベースサーバ内のファイル実体管理テーブルから該当するファイル実体が自動で削除されるようにしていた。しかしながら、ファイル実体へのアクセス数はその文書にアクセス可能なユーザ数に比例する可能性が高く、そしてアクセス可能なユーザ数は文書毎に異なることも少なくない。そこで、文書にアクセス可能なユーザ数に応じて、ファイル実体管理テーブルに登録しておく期間を文書毎に変更可能にする態様について、実施例2として説明する。なお、実施例1と共通する点については省略ないしは簡略化し、以下では差異点を中心に説明するものとする。
図10は、本実施例に係る、属性情報管理テーブルの一例を示す図である。図6のテーブルにおける項目(文書ID、文書名、ファイル実体格納場所フラグ、FS上のファイル実体パス)に加え、「アクセス可能ユーザ数」の項目が追加されている。この「アクセス可能ユーザ数」は、該当レコードにおける文書のファイル実体へのアクセスが可能なユーザの数を表している。
なお、ファイル実体へのアクセスレベルを別テーブルで管理するなど、アクセス可能なユーザ数を複数のテーブルで分けて管理するようにしてもよい。
図11は、本実施例に係る、ファイル実体管理テーブルにファイル実体を格納しておく期間をアクセス可能なユーザ数に応じて設定・管理するためのテーブル(以下、DB格納期間管理テーブル)の一例を示す図である。
「アクセス可能ユーザ数」は、上述の属性情報管理テーブルにおけるアクセス可能ユーザ数と同じである。
「DB格納期間」は、ファイル実体管理テーブルにおいてファイル実体を、アクセスのない状態でどのくらいの期間格納しておくのかを示す情報であり、アクセス可能ユーザ数に対応付けて規定されている。図11に示す例では、ファイル実体へのアクセス可能ユーザ数が0〜10人の場合は3日間、11〜20人の場合は5日間、21〜30人の場合は10日間といった具合に、アクセスのないファイル実体をDB104で管理されることになる。
上述した図10に示す属性情報管理テーブルと図11に示すDB格納期間管理テーブルを用いて前述したファイル実体の削除処理(図9を参照)を行なうことにより、文書毎にDBからファイル実体を削除するまでの期間を柔軟に変えることが可能となる。
本実施例によれば、ファイル実体管理がより柔軟に行なえるようになり、効率的な文書の管理が可能となる。
(その他の実施例)
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施例の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (9)

  1. 文書のファイル実体とその属性情報とを管理する第1のサーバと、文書のファイル実体は管理するがその属性情報は管理しない第2のサーバと、通信可能な情報処理装置であって、
    受信した文書のファイル実体の管理を前記第1のサーバ及び前記第2のサーバに指示するファイル実体処理手段と、
    受信した文書の属性情報の管理を前記第1のサーバに指示する属性情報処理手段と、
    を備え、
    前記ファイル実体処理手段は、前記第1のサーバに格納されているファイル実体に対するアクセスが一定期間ない場合に、当該ファイル実体の削除を前記第1のサーバに対し指示する、
    ことを特徴とする情報処理装置。
  2. 前記属性情報には、前記第1のサーバと前記第2のサーバの両方にファイル実体が格納されているのか、前記第2のサーバのみにファイル実体が格納されているのかを示す格納場所情報が含まれ、
    前記属性情報処理手段は、前記ファイル実体処理手段からの指示に従って前記第1のサーバからファイル実体が削除されると、前記格納場所情報の更新を前記第1のサーバに指示する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記ファイル実体処理手段は、ファイル実体へのアクセス要求を受信した時に、
    要求に係るファイル実体が前記第1のサーバに格納されていれば前記第1のサーバから当該要求に係るファイル実体を取得してレスポンスし、
    要求に係るファイル実体が前記第1のサーバに格納されていなければ前記第2のサーバから当該要求に係るファイル実体を取得してレスポンスする、
    ことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 前記ファイル実体処理手段は、ファイル実体へのアクセス要求を受信した時に、要求に係るファイル実体が前記第1のサーバに格納されていなかった場合、前記第2のサーバから当該要求に係るファイル実体を取得して、前記第1のサーバに対し当該ファイル実体の再登録を指示する、
    ことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記属性情報処理手段は、前記ファイル実体処理手段からの指示に従って前記第1のサーバにファイル実体が再登録されると、前記格納場所情報の更新を前記第1のサーバに指示することを特徴とする請求項4に記載の情報処理装置。
  6. ファイル実体へのアクセスが可能なユーザの数を管理する手段をさらに備え、
    前記ファイル実体処理手段は、ファイル実体に対するアクセス可能ユーザ数に応じて前記第1のサーバにおいてファイル実体を格納する期間をファイル実体毎に設定する、
    ことを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
  7. 請求項1乃至6のいずれか1項に記載の情報処理装置、前記第1のサーバ、及び前記第2のサーバを少なくとも含む文書管理システム。
  8. 文書のファイル実体とその属性情報とを管理する第1のサーバと、ファイル実体は管理するが属性情報は管理しない第2のサーバと、通信可能な情報処理装置が実行する方法であって、
    受信した文書のファイル実体の管理を前記第1のサーバ及び前記第2のサーバに指示するファイル実体処理ステップと、
    受信した文書の属性情報の管理を前記第1のサーバに指示する属性情報処理ステップと、
    を含み、
    前記ファイル実体処理ステップには、前記第1のサーバに格納されているファイル実体に対するアクセスが一定期間ない場合に、当該ファイル実体の削除を前記第1のサーバに対し指示するステップを含む、
    ことを特徴とする方法。
  9. コンピュータを、請求項1乃至6のいずれか1項に記載の情報処理装置として機能させるためのプログラム。
JP2013242149A 2013-11-22 2013-11-22 文書管理システム、文書管理システムにおける情報処理装置、文書管理方法及びプログラム Pending JP2015102971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013242149A JP2015102971A (ja) 2013-11-22 2013-11-22 文書管理システム、文書管理システムにおける情報処理装置、文書管理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013242149A JP2015102971A (ja) 2013-11-22 2013-11-22 文書管理システム、文書管理システムにおける情報処理装置、文書管理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2015102971A true JP2015102971A (ja) 2015-06-04

Family

ID=53378634

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013242149A Pending JP2015102971A (ja) 2013-11-22 2013-11-22 文書管理システム、文書管理システムにおける情報処理装置、文書管理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP2015102971A (ja)

Similar Documents

Publication Publication Date Title
US11379428B2 (en) Synchronization of client machines with a content management system repository
US10691719B2 (en) Cursor with last observed access state
CN108053863B (zh) 适合大小文件的海量医疗数据存储系统及数据存储方法
US9292575B2 (en) Dynamic data aggregation from a plurality of data sources
US7921189B2 (en) Single virtual client for multiple client access and equivalency
US9483473B2 (en) High availability architecture for a cloud-based concurrent-access collaboration platform
US20140244580A1 (en) Predictive storage service
JP2009518757A (ja) 無線装置の最新データを維持するための方法及びシステム
JP2006252085A (ja) ユーザ識別情報を変換するファイルサーバ
JP5077430B2 (ja) 管理装置および管理装置のプログラム
JP2010271963A (ja) ファイル変更通知インタフェースを持ったストレージシステム
JP7374232B2 (ja) コンテキスト付きのコンテンツ・アイテム共有
US20100115061A1 (en) Server system, server apparatus, program and method
JP5271925B2 (ja) キャッシュ情報の更新方法、コンピュータ、プログラムおよび記憶媒体
JP5911378B2 (ja) 文書管理サーバ、コンピュータプログラム、文書管理方法
JP6242087B2 (ja) 文書管理サーバ、文書管理方法、コンピュータプログラム
JP2009211403A (ja) ファイル検索プログラム
JP2015041335A (ja) 更新情報管理システム、タイムライン管理サーバ、タイムライン管理方法及びそのプログラム
KR20210082481A (ko) 데이터베이스 관리 서비스 제공 시스템
JP2007293433A (ja) 文書管理システム
JP6398368B2 (ja) 情報処理装置、情報処理システム及びプログラム
JP2015102971A (ja) 文書管理システム、文書管理システムにおける情報処理装置、文書管理方法及びプログラム
JP6782219B2 (ja) データ活用支援装置、データ活用支援システム、及びデータ活用支援方法
JP6323109B2 (ja) 文書管理システム、キーバリューストア装置、文書管理方法、及びプログラム
JP6568232B2 (ja) 計算機システム、及び、装置の管理方法