JP2004133538A - ファイルの自動バックアップシステムおよび自動バックアップ方法ならびにコンピュータ読取り可能な記録媒体 - Google Patents
ファイルの自動バックアップシステムおよび自動バックアップ方法ならびにコンピュータ読取り可能な記録媒体 Download PDFInfo
- Publication number
- JP2004133538A JP2004133538A JP2002294983A JP2002294983A JP2004133538A JP 2004133538 A JP2004133538 A JP 2004133538A JP 2002294983 A JP2002294983 A JP 2002294983A JP 2002294983 A JP2002294983 A JP 2002294983A JP 2004133538 A JP2004133538 A JP 2004133538A
- Authority
- JP
- Japan
- Prior art keywords
- file
- backup
- processing history
- automatic
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】バックアップを要するファイルと不要なファイルを自動的に選別してバックアップメモリに保存する自動バックアップシステムを提供する。
【解決手段】ファイル処理部24と、ファイルを記憶する記憶装置22とを有する情報処理装置20と、バックアップメモリ32と、ファイル処理履歴管理手段34と、バックアップ制御手段36とを有するバックアップ装置30とからなり、ファイル処理履歴管理手段は、ファイル処理履歴テーブルにファイルの作成日と、更新回数と、最終更新日とを記録し、バックアップ制御手段は、ファイルが処理される毎に、ファイルのファイル処理履歴データから、該ファイルがアクセスされる確率量を算出し、予め設定した基準値と算出した確率量とを比較し、その結果によりバックアップする。
【選択図】 図1
【解決手段】ファイル処理部24と、ファイルを記憶する記憶装置22とを有する情報処理装置20と、バックアップメモリ32と、ファイル処理履歴管理手段34と、バックアップ制御手段36とを有するバックアップ装置30とからなり、ファイル処理履歴管理手段は、ファイル処理履歴テーブルにファイルの作成日と、更新回数と、最終更新日とを記録し、バックアップ制御手段は、ファイルが処理される毎に、ファイルのファイル処理履歴データから、該ファイルがアクセスされる確率量を算出し、予め設定した基準値と算出した確率量とを比較し、その結果によりバックアップする。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、コンピュータシステムにおけるファイル(データ)の自動バックアップシステム、バックアップ方法ならびに自動バックアッププログラムに関し、特に、バックアップを要するファイルと不要なファイルとを自動的に選別してバックアップメモリに保存する、ファイルの自動バックアップシステムおよび自動バックアップ方法ならびに自動バックアッププログラムに関するものである。
【0002】
【従来の技術】
ディスク装置などの外部記憶装置を含むコンピュータシステムにおいては、ディスク装置に格納されているデータをハードウエア障害から保護し、あるいは、コンピュータウイルスによる感染や人為的なミスによるデータ破壊等の不測の事態から保護するために、そのデータを他の記憶媒体に退避するバックアップ処理が行なわれる。このようなバックアップ処理では、バックアップ用の記憶装置(以下単にバックアップメモリと称する)としてRAID(Redundant Arrays of Independent Disks)と称される記憶システムや、磁気テープや光ディスク等の交換可能な記録媒体を用いた記憶装置が利用されることが多い。
【0003】
バックアップメモリとしてRAIDシステムを用いる場合、RAIDシステムが高価なシステムであり大きなコストが必要とされること、またバックアップシステムを構築するためRAIDシステムに関する知識が必要とされること等の問題が生ずる。
【0004】
また、交換可能な記録媒体を使用する記憶装置を用いる場合には、バックアップ処理において、記録媒体を記憶装置にセットし、バックアップ後の記録媒体を記憶装置から取りはずし、この記録媒体を保管しておく作業が必要とされる。また、ディスク装置の障害に対して、前記の記録媒体にバックアップされたデータを用いてディスク装置内のデータを回復する場合には、必要なデータを記録した記録媒体を記憶装置にセットする作業が必要とされる等の問題が生ずる。
【0005】
バックアップの方法としては、一定の周期で、全てのファイルをバックアップメモリにコピーするする方法が一般的であるが、その場合、故障発生のタイミングによっては、必要なファイルのバックアップが終わっていなかったり、必要でないファイルがバックアップされていたりという問題が生じる。このため、下記の特許文献1に記載の技術のように、バックアップ処理をする契機となる事象(条件)として、例えば、データの更新回数などを設定しておき、ファイルの重要度に応じて、バックアップ処理する間隔を可変にする技術が知られている。
【0006】
また、バックアップメモリの構成として、動作速度の速い磁気ディスク装置と動作速度の遅い外部補助記憶装置を用い、使用頻度の高いファイルは磁気ディスク装置に、使用頻度の低いファイルは圧縮して外部補助記憶装置にバックアップする方法もあり、例えば、下記の特許文献2に記載の技術のように、ファイルの診断結果をログデータとして保存し、このログデータを分析して各ファイルの使用頻度の高低を判断するようになした技術も知られている。
【0007】
【特許文献1】
特開平4−295941号公報
【特許文献2】
特開2000−82004号公報
【0008】
【発明が解決しようとする課題】
しかしながら、これら従来のバックアップ処理の方法は、いずれも全てのファイル(データ)をバックアップするものであり、バックアップメモリのコスト増、バックアップ処理に係わる工数増といった問題がある。この原因は、ファイル毎に、バックアップが必要なファイルであるかバックアップの必要がないファイルであるかを識別する適切な手法が提供されていないことにある。
【0009】
従って本発明は、前記の問題点を解決することを課題とし、バックアップを要するファイルとバックアップを必要としないファイルとを自動的に選別してバックアップメモリに保存するようになしたファイルの自動バックアップシステムおよび自動バックアップ方法ならびに自動バックアッププログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
前記の目的を達成するため、本発明によれば、ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなり、
前記バックアップ制御手段は、ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出して予め設定した基準値と比較し、該比較結果に応じてファイルを前記バックアップメモリにバックアップするようになしたことを特徴とし、この確率量Sは、当該ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、S=loge(U/(1+N−D))により算出することを特徴とする。
【0011】
かかる態様によれば、バックアップ装置がファイルの更新回数、作成日、最終更新日等のファイル処理履歴に基づいて自動的にバックアップの要否を判断するため、ユーザーはバックアップについて何ら意識することなくファイル処理を行うことができる。
【0012】
また、本発明に係る自動バックアッププログラムは、
ファイルが処理される毎に、ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
を有する。また、前記確率量を算出するステップでは、
確率量をSとし、該当ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、S=loge(U/(1+N−D))により算出する。
【0013】
かかる自動パックアッププログラムによって、ファイルの更新回数、作成日、最終更新日等のファイル処理履歴に基づいて自動的にバックアップの要否が判断され、必要なファイルが自動的にバックアップされる。
【0014】
また、本発明によれば、ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなるファイルの自動バックアップ方法であって、
ファイルが処理される毎に、前記ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
からなるファイルの自動バックアップ方法が提供される。
【0015】
以下、本発明の実施形態に係るファイルの自動バックアップシステムおよびファイルの自動バックアップ方法について、添付の図面を参照して詳細に説明する。
【0016】
【発明の実施の形態】
図1は、本発明の実施形態に係るファイルの自動バックアップシステムの構成を示す図である。図1においてファイルの自動バックアップシステム10は情報処理装置である共有ファイル装置(又はクライアントPC)20がローカルエリアネットワーク(LAN)12に接続され、LAN12に接続されたクライアントPC(パーソナルコンピュータ)40等のコンピュータから共有ファイル装置(又はクライアントPC)20に記憶されたファイルに任意にアクセスできるよう構成されている。
【0017】
共有ファイル装置(又はクライアントPC)20はファイル処理部24とファイルを記憶するハードディスク装置(HDD)22とからなり、インターフェース14を介してバックアップ装置30が接続されている。バックアップ装置30は、ファイル処理履歴管理手段34とバクアップ制御手段36、バックアップメモリ32とから構成されてなる。
【0018】
ここで、共有ファイル装置(又はクライアントPC)20とバックアップ装置30は物理的に一体となった装置とすることもできる。その場合、両装置間の接続はインターフェース14を介して、あるいはインターフェース14を介することなく接続することができる。図2は後者の構成を示す図である。LAN12に接続された複数のクライアントPC40〜43が共有ファイル装置20を共同で利用する構成であり、バックアップ装置はバックアップメモリ32を備え、共有ファイル装置20内に一体に構成されている。
【0019】
また、図3に示すように、共有ファイル装置20がなく、バックアップ装置が特定のクライアントPC40と一体に構成され、当該クライアントPC40で処理されるファイルの自動バックアップを行う構成、あるいは、クライアントPC40と一体に構成されたバックアップ装置が、LAN12に接続される他のクライアントPC41〜43等と共有され、各クライアントPC41〜43で処理されるファイルを含めて自動バックアップを行う構成とすることも可能である。
【0020】
以下の説明は、共有ファイル装置20とバックアップ装置30とが一体に構成されたものとして説明を進める。ハードディスク装置22には、複数のユーザーが共有するファイルが記憶されており、ファイル処理部24は、複数のクライアントPC40等からのアクセスに応答してファイル処理、すなわち、共有ファイル装置20としてのファイルの作成、更新、削除等の処理を行う。
【0021】
この際、ファイル処理部24は、共有ファイル装置20として特有の処理、例えば、ファイルの参照のみを許可するユーザーと、ファイルの更新を許可するユーザー等のユーザー資格の認証管理や、同一ファイルに関して同時アクセスがあった場合の優先処理等の機能を有する。このような共有ファイルの制御は一般的なものであり、本発明のバックアップ処理とは直接的な関係はない。
【0022】
LAN12に接続されたクライアントPC40から共有ファイル装置20のファイルにアクセスがあると、ファイル処理部24は、磁気ディスク装置22から該当するファイルを読出し、クライアントPC40に転送する。クライアントPC40においてファイルを書き換える等の処理が行われ、更新、保存の指示とともに、書き換えられたファイルがファイル処理部24に転送され、ファイル処理部24は、ユーザーがファイルの更新資格がある場合には、更新されたファイルに置き換えて、磁気ディスク装置22に記憶する。
【0023】
このファイル処理部24におけるファイル処理の履歴は、インターフェース14を介して、ファイル処理履歴管理手段34に送られ、ファイル処理履歴テーブルに記憶される。
【0024】
図4は、このファイル処理履歴テーブルの構成を示す図であり、a〜nの各ファイル毎に、そのデータ量C、作成日D、更新回数U、最終更新日N、確認日Hを記憶したものである。ここで、確認日Hは、ファイルの内容が承認資格を有するユーザーによって承認された日として以下の説明を進めるが、それに限られるものではなく、単なるファイルの参照があった日であってもよく、その場合は最終の参照日が確認日Hとなされる。また、ファイル処理履歴テーブルはバックアップメモリ32の一部の領域に構築することもできる。
【0025】
ファイル処理部24において、ファイルの保存処理が行われる際、バックアップ装置30において、バックアップ制御手段36は、該当するファイル、例えばファイルaのファイル処理履歴テーブルを参照し、そのファイルの処理履歴、すなわち、データ量C、作成日D、更新回数U、最終更新日N、確認日Hに基づいて、そのファイルが後にアクセスされる確率量を算出する。
【0026】
例えば、最も重要なデータとしてバックアップが必要なものは、一般的には現在作成中であり、更新回数も多いファイルであるといえる。すなわち、更新回数が多いということはそのファイルにアクセスしているユーザー数も多く、後になって使用(アクセス)される確率が高いといえるが、そのファイルの作成日や最終更新日によって、その確率量は変動する。
【0027】
例えば、更新回数は多くても、作成日、最終更新日がともに古いファイルは、以前はよく使用されたが最近は使用されなくなったファイルである確率が高く、後になってそのファイルに対するアクセスが発生する確率は相対的には小さくなる。
【0028】
従って、本発明では、バックアップ制御手段がファイルの処理履歴情報から、後になってそのファイルがアクセスされる確率を示す確率量Sを算出し、予め設定した基準値P以上の確率量であった場合に、そのファイルをバックアップメモリ32に記憶する(ファイルをコピーしてバックアップメモリ32に保存する)ようになされる。
【0029】
この確率量の算出は、例えば、確率量をSとし、当該ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出することができる。すなわち、本発明は、ファイルの更新回数や更新日等の要素に基づいて当該ファイルが後にアクセスされる確率を求めた場合、正規分布を示すことに着目し、その対数を取り確率量に変換して数値化し、予め設定した基準値と比較することで当該ファイルの重要度(バックアップ要否)を容易に判断可能であることを見いだしたものである。
【0030】
ファイルのエラー率(何らかの原因で記録した装置が壊れる、あるいは論理的にデータに不整合がおこるなど、ファイルへのアクセスが不可になる確率:この場合、バックアップファイルが存在すれば、そのバックアップファイルで回復することができる)を3%とし、あるファイルについて、10日間の間に30回更新があった場合、上記計算式で算出した確率量SはS=1.307となる。従って、予め基準値をPとして、例えばP=1.2と設定しておけば、前記のファイルはバックアップが必要なファイルとしてバックアップメモリ32にコピーされることになる。
【0031】
ここで、ファイル作成時期D、最終更新時期Nは日付けのデータであり、計算においてディメンジョンが異なるため、ここでは、基準の日を定め、基準日からの日数で数値化することにより確率量を算出している。例えば、1970年1月1日午前0時(UTC:世界協定時間と称される)を基準に、時間が何秒経過したかで表す。ファイルの作成日が2002年1月1日午前0時00分0秒であると1009152000秒経過、ファイルの最終更新日が2002年1月10日午前0時00分0秒であると1010016000秒経過したことになり、Dは1009152000、Nは1010016000となる。従ってN−Dは(1010016000−1009152000)/24/60/60=10となる。
【0032】
確率量の算出は、更に他の要素を加味して算出することができる。例えば、あるファイルの最終更新日が古くなり、更に更新回数が少なくなっても、データ量Cが大きなファイルは、相対的にデータが失われた際のリカバリーが困難になるため、バックアップの必要性が高いファイルであるといえる。従って、この場合の確率量SをS2とすると、
S2=loge(C×U/(1+H−N))
で算出することができる。
【0033】
前記確率量の算出は、更に、他の要素を加味して算出することができる。例えば、ファイルの内容を更新することは無くても(作成完了している情報)、後で確認(承認権限のあるユーザーによる確認等)する必要性のあるデータはバックアップの必要性が高いファイルであるといえる。ファイルの確認日をHとし、この場合の確率量SをS3とすると、
S3=loge(C×U/((1+H−N)(1+N−D)))
で算出することができる。
【0034】
図5は、本発明の実施形態に係るファイルの自動バックアップの手順を示すフローチャートである。バックアップ装置30ではステップS101においてバックアップ制御手段36によりバックアップメモリ32のデータ保存領域が確保されているものとする。
【0035】
クライアントPC40から、共有ファイル装置20にアクセスがあり、ファイル処理部24においてファイルの更新もしくは作成等の処理が行われ、ステップS102においてそのファイルの保存処理が指示されると、ファイル処理履歴管理手段34はステップS103で、当該ファイルの処理履歴テーブルの内容を更新するとともに、そのデータをバックアップ制御手段36に送り、バックアップ制御手段36はファイルのファイル処理履歴テーブルのデータから、当該ファイルが後になってアクセスされる確率量Sを算出する。
【0036】
次いで、ステップS104で予め設定した基準値PとステップS103で算出した確率量Sとを比較する。この結果、確率量Sが基準値Pより小さい場合にはバックアップは行わず、当該ファイルは共有ファイル装置20の磁気ディスク装置22に記憶(保存)される(ステップS105)。
【0037】
算出した確率量Sが基準値より大きい場合には、当該ファイルは共有ファイル装置20の磁気ディスク装置22に記憶され(ステップS106)、次いでステップS107でバックアップメモリ32のバックアップ領域(データ保存領域)の容量確認が行われる。当該ファイルの大きさがバックアップ領域の空き領域内に記憶できる大きさであれば、ステップS113で当該ファイルがバックアップメモリ32に記憶される。
【0038】
当該ファイルの大きさが、バックアップ領域の空き領域に記憶できない大きさの場合は,ステップS109において、バックアップ領域内に記憶されている各バックアップファイルの全てについて、その処理履歴データを用いて、確率量Sを再度算出し直す。次いで、ステップS110で再計算された基準値Pと比較し、基準値Pより確率量が小さくなっているバックアップファイルがあれば、ステップS111でそのバックアップファイルをバックアップメモリ32から削除してステップS108に戻る。
【0039】
ステップS110において、削除できるバックアップファイルがない、または、削除できるバックアップファイルを削除した後でもバックアップ領域が不足している場合、バックアップ制御手段36はステップS112でバックアップメモリ32のバックアップ領域(保存領域)を一時的に拡張する(バックアップ領域の最終アドレスを変更する)。その後、ステップS113において当該ファイルがコピーされ、バックアップファイルとしてバックアップメモリ32に記憶される。
【0040】
このようなバックアップ領域の管理のため、バックアップ制御手段36は図7に示すバックアップ領域管理テーブルを備えている。すなわちバックアップ領域管理テーブルには、規定のバックアップ領域がその開始アドレスと終了アドレスで設定されており、各ファイルのバックアップコピーの記憶場所がその開始アドレスと終了アドレスで記録され、それぞれの容量が記録される。
【0041】
空き容量は、規定されたバックアップ領域の中で、バックアップファイルが記憶されていない空き領域の開始アドレスと終了アドレスで管理され、その容量が記録される。バックアップ領域が不足する場合、バックアップ制御手段36はバックアップ領域を一時的に拡張することができ、その場合、拡張されたバックアップ領域の終了アドレスが拡張領域情報として拡張領域に記憶される。
【0042】
次に、人為的なミスによりファイルが失われる危険を回避するためのバックアップについて説明する。人為的なミスとは、ユーザーによってファイルが誤って削除されてしまったような場合である。従って、共有ファイル装置20のファイルに対して、あるクライアントPC40から削除の操作が行われた場合、ファイルの処理履歴のデータによらず、このファイルがアクセスされる確率量Sが基準値Pより常に大きくなるような状態定数tを設定しておき、削除の操作があったファイルはある期間、無条件にバックアップされるようにするものである。
【0043】
例えば、クライアントPC40のユーザーにより共有ファイル装置20のファイルに対して削除操作があった場合の手順について、図6のフローチャートに基づいて説明する。先ず、ステップS201でファイルの削除が指示された場合、バックアップ装置30はステップS202で状態定数tを設定する。通常この状態定数tは1.0であるが、削除処理に対するバックアップ制御時には、例えば、2.0等のように、当該ファイルの確率量Sを算出した場合に必ず基準値Pより大きな値がえられるような定数を選んで設定するものである。
【0044】
この状態で、ステップS203で確率量Sを算出し、ステップS204で基準値Pと比較するが、算出した確率量Sは基準値Pより大となるから、共有ファイル装置20においてファイルの削除を行う(ステップS206)とともに、ステップS207でバックアップメモリ32のデータ保存領域の容量確認が行われる。ファイルの大きさがデータ保存領域の空き領域内に記憶できる大きさであれば、ステップS213で当該ファイルがコピーされ、バックアップファイルとしてバックアップメモリ32に記憶される。
【0045】
ファイルの大きさがバックアップ領域の空き領域に記憶できない大きさの場合は,ステップS209において、データ保存領域内に記憶されている各バックアップファイルの全てについて、その処理履歴データを用いて、確率量Sを再度算出し直す。次いで、ステップS210で再計算された確率量Sと基準値Pと比較し、基準値Pより確率量が小さくなっているバックアップファイルがあれば、ステップS211でそのバックアップファイルをバックアップメモリ32から削除してステップS208に戻る。
【0046】
ステップS210において削除できるバックアップファイルがない、または、削除できるバックアップファイルを削除した後でもバックアップ領域が不足している場合、バックアップ制御手段36はステップS212でバックアップメモリ32のバックアップ領域(保存領域)を一時的に拡張する(バックアップ領域の終了アドレスを変更する)。その後、ステップS213において、当該ファイルがバックアップファイルとしてバックアップメモリ32に記憶される。
【0047】
以上説明した本発明の実施形態において、ファイル処理履歴テーブル、バックアップ領域管理テーブルは必ずしも物理的に独立した記憶装置を用いる必要はなく、バックアップメモリ32の一部の領域を使用した構成することができ、また、バックアップメモリ32も同様に、必ずしも物理的に独立した記憶装置でなく、通常ファイルを記憶する磁気ディスク装置の中を区画分けしてそのうちの1つの区画をバックアップ領域として使用する構成をとることもできる。
【0048】
【発明の効果】
以上説明したように、本発明のファイルの自動バックアップシステムによれば、バックアップ装置がファイルの更新回数、作成日、最終更新日等のファイル処理履歴に基づいて自動的にバックアップの要否を判断するため、ユーザーはバックアップについて何ら意識することなくファイル処理を行うことができる。
【0049】
また、バックアップ制御手段は、所定の期間が経過する毎に、前記バックアップメモリに記憶された各ファイルについて、前記ファイル処理履歴テーブルを参照して前記確率量を算出して基準値と比較し、該確率量が基準値より小なるファイルを削除する。かかる態様によれば、時間の経過とともに重要度が小さくなったファイルのバックアップファイルが削除されるため、バックアップメモリを効率良く利用することができる。
【0050】
また、本発明のファイルの自動バックアップシステムによれば、バックアップメモリの領域をダイナミックに変更することができ、バックアップすべきファイルの大きさに応じて効率的にバックアップメモリ領域を使用することができる。
【0051】
更に、本発明のファイルの自動バックアップシステムによれば、人為的なミスによってファイルが削除された場合であっても、無条件にある期間そのファイルをバックアップしてあるため、バックアップデータから復元することができる。
【0052】
また、更に、本発明のファイルの自動バックアップシステムによれば、ファイルの更新回数のみならず、そのデータ量、確認日などファイルの処理履歴データの種々の要素に基づいてそのファイルが後にアクセスされる確率を示す確率量Sを算出することができるから、作成するファイルの性格等により適切なバックアップ基準を設定することができる。
【0053】
更に、本発明のファイルの自動バックアップシステムは、共有ファイル装置のバックアップシステムとして適用されるのみならず、特定のクライアントPCに付加して適用すること、および、LANに接続された複数のクライアントPCが共用するバックアップシステムに適用することも可能である。
【0054】
なお、本発明の態様を付記すると次のとおりである。
(付記1)ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなり、
ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段を有し、
前記バックアップ制御手段は、ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出して予め設定した基準値と比較し、該比較結果に応じてファイルを前記バックアップメモリにバックアップするようになしたファイルの自動バックアップシステム。
【0055】
(付記2)前記バックアップ制御手段は、所定の期間が経過する毎に、前記バックアップメモリに記憶された各ファイルについて、前記ファイル処理履歴テーブルを参照して前記確率量を算出して基準値と比較し、該比較結果に応じてファイルを削除する(付記1)に記載のファイルの自動バックアップシステム。
【0056】
(付記3)前記バックアップ制御手段は、前記バックアップメモリのバックアップ領域を管理するためのバックアップ領域管理テーブルを備え、バックアップすべきファイルの大きさがバックアップ領域の空き領域を超える場合、前記バックアップ領域に記憶されたファイル毎に前記確率量を算出して前記基準値と比較し、該比較結果に応じてファイルを削除した後、前記バックアップすべきファイルの大きさがなお前記空き領域を超える時、前記バックアップ領域を拡張し、当該ファイルを記憶するとともに、拡張領域情報を前記バックアップ領域管理テーブルに記憶する(付記1)に記載のファイルの自動バックアップシステム。
【0057】
(付記4)前記バックアップ制御手段は、所定の期間が経過する毎に、前記バックアップメモリに記憶された各ファイルについて、前記ファイル処理履歴テーブルを参照して前記確率量を算出して基準値と比較し、該比較結果に応じてファイルを削除するとともに、前記バックアップ領域が規定の領域から拡張されており、かつ削除後の全ファイルの容量が規定のバックアップ領域内の場合には、前記バックアップ領域を規定のバックアップ領域に戻す(付記3)に記載のファイルの自動バックアップシステム。
【0058】
(付記5)前記ファイル処理部においてファイルの削除処理が行われた場合、前記バックアップ制御手段は、該ファイルのファイル処理履歴データに基づいて前記確率量を算出するにあたって、予め設定した定数を乗ずることにより前記ファイルの処理履歴データによらず確率量を算出するようになした(付記1)に記載のファイルの自動バックアップシステム。
【0059】
(付記6)前記確率量をSとし、当該ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出する(付記1)〜(付記5)のいずれかに記載のファイルの自動バックアップシステム。
【0060】
(付記7)前記ファイル処理履歴テーブルは更に、ファイルのデータ量を記憶し、前記バックアップ制御手段は、データ量をCとした時、前記確率量Sを、
S=loge(C×U/(1+N−D))
により算出する(付記1)〜(付記5)のいずれかに記載のファイルの自動バックアップシステム。
【0061】
(付記8)前記ファイル処理履歴テーブルは更に、ファイルの確認日を記憶し、前記バックアップ制御手段は、確認日をHとした時、前記確率量Sを、
S=loge(C×U/((1+H−N)(1+N−D)))
により算出する(付記1)〜(付記5)のいずれかに記載のファイルの自動バックアップシステム。
【0062】
(付記9)バックアップ装置にインストールされた自動バックアップ機能を実現する自動バックアッププログラムにおいて、
ファイルが処理される毎に、ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
を有する自動バックアッププログラム。
【0063】
(付記10)前記確率量を算出するステップは、
確率量をSとし、該当ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出する(付記9)に記載の自動バックアッププログラム。
【0064】
(付記11)ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなるファイルの自動バックアップ方法であって、
ファイルが処理される毎に、前記ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
からなるファイルの自動バックアップ方法。
【図面の簡単な説明】
【図1】本発明の実施形態に係るファイルの自動バックアップシステムの構成を示す図である。
【図2】本発明の他の実施形態に係るファイルの自動バックアップシステムの構成を示す図。
【図3】本発明の更に、他の実施形態に係るファイルの自動バックアップシステムの構成を示す図。
【図4】ファイル処理履歴テーブルの構成を示す図である。
【図5】本発明の実施形態に係るファイルの自動バックアップシステムのバックアップ処理の手順を示すフローチャートである。
【図6】ファイル削除操作がなされた場合のバックアップ処理の手順を示すフローチャートである。
【図7】バックアップ領域管理テーブルの構成を示す図である。
【符号の説明】
10…ファイルの自動バックアップシステム
12…ローカルエリアネットワーク(LAN)
14…インターフェース
20…共有ファイル装置(又はクライアントPC)
22…磁気ディスク装置(HDD)
24…ファイル処理部
30…バックアップ装置
32…バックアップメモリ
34…ファイル処理履歴管理手段
36…バックアップ制御手段
40〜43…クライアントPC
【発明の属する技術分野】
本発明は、コンピュータシステムにおけるファイル(データ)の自動バックアップシステム、バックアップ方法ならびに自動バックアッププログラムに関し、特に、バックアップを要するファイルと不要なファイルとを自動的に選別してバックアップメモリに保存する、ファイルの自動バックアップシステムおよび自動バックアップ方法ならびに自動バックアッププログラムに関するものである。
【0002】
【従来の技術】
ディスク装置などの外部記憶装置を含むコンピュータシステムにおいては、ディスク装置に格納されているデータをハードウエア障害から保護し、あるいは、コンピュータウイルスによる感染や人為的なミスによるデータ破壊等の不測の事態から保護するために、そのデータを他の記憶媒体に退避するバックアップ処理が行なわれる。このようなバックアップ処理では、バックアップ用の記憶装置(以下単にバックアップメモリと称する)としてRAID(Redundant Arrays of Independent Disks)と称される記憶システムや、磁気テープや光ディスク等の交換可能な記録媒体を用いた記憶装置が利用されることが多い。
【0003】
バックアップメモリとしてRAIDシステムを用いる場合、RAIDシステムが高価なシステムであり大きなコストが必要とされること、またバックアップシステムを構築するためRAIDシステムに関する知識が必要とされること等の問題が生ずる。
【0004】
また、交換可能な記録媒体を使用する記憶装置を用いる場合には、バックアップ処理において、記録媒体を記憶装置にセットし、バックアップ後の記録媒体を記憶装置から取りはずし、この記録媒体を保管しておく作業が必要とされる。また、ディスク装置の障害に対して、前記の記録媒体にバックアップされたデータを用いてディスク装置内のデータを回復する場合には、必要なデータを記録した記録媒体を記憶装置にセットする作業が必要とされる等の問題が生ずる。
【0005】
バックアップの方法としては、一定の周期で、全てのファイルをバックアップメモリにコピーするする方法が一般的であるが、その場合、故障発生のタイミングによっては、必要なファイルのバックアップが終わっていなかったり、必要でないファイルがバックアップされていたりという問題が生じる。このため、下記の特許文献1に記載の技術のように、バックアップ処理をする契機となる事象(条件)として、例えば、データの更新回数などを設定しておき、ファイルの重要度に応じて、バックアップ処理する間隔を可変にする技術が知られている。
【0006】
また、バックアップメモリの構成として、動作速度の速い磁気ディスク装置と動作速度の遅い外部補助記憶装置を用い、使用頻度の高いファイルは磁気ディスク装置に、使用頻度の低いファイルは圧縮して外部補助記憶装置にバックアップする方法もあり、例えば、下記の特許文献2に記載の技術のように、ファイルの診断結果をログデータとして保存し、このログデータを分析して各ファイルの使用頻度の高低を判断するようになした技術も知られている。
【0007】
【特許文献1】
特開平4−295941号公報
【特許文献2】
特開2000−82004号公報
【0008】
【発明が解決しようとする課題】
しかしながら、これら従来のバックアップ処理の方法は、いずれも全てのファイル(データ)をバックアップするものであり、バックアップメモリのコスト増、バックアップ処理に係わる工数増といった問題がある。この原因は、ファイル毎に、バックアップが必要なファイルであるかバックアップの必要がないファイルであるかを識別する適切な手法が提供されていないことにある。
【0009】
従って本発明は、前記の問題点を解決することを課題とし、バックアップを要するファイルとバックアップを必要としないファイルとを自動的に選別してバックアップメモリに保存するようになしたファイルの自動バックアップシステムおよび自動バックアップ方法ならびに自動バックアッププログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
前記の目的を達成するため、本発明によれば、ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなり、
前記バックアップ制御手段は、ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出して予め設定した基準値と比較し、該比較結果に応じてファイルを前記バックアップメモリにバックアップするようになしたことを特徴とし、この確率量Sは、当該ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、S=loge(U/(1+N−D))により算出することを特徴とする。
【0011】
かかる態様によれば、バックアップ装置がファイルの更新回数、作成日、最終更新日等のファイル処理履歴に基づいて自動的にバックアップの要否を判断するため、ユーザーはバックアップについて何ら意識することなくファイル処理を行うことができる。
【0012】
また、本発明に係る自動バックアッププログラムは、
ファイルが処理される毎に、ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
を有する。また、前記確率量を算出するステップでは、
確率量をSとし、該当ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、S=loge(U/(1+N−D))により算出する。
【0013】
かかる自動パックアッププログラムによって、ファイルの更新回数、作成日、最終更新日等のファイル処理履歴に基づいて自動的にバックアップの要否が判断され、必要なファイルが自動的にバックアップされる。
【0014】
また、本発明によれば、ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなるファイルの自動バックアップ方法であって、
ファイルが処理される毎に、前記ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
からなるファイルの自動バックアップ方法が提供される。
【0015】
以下、本発明の実施形態に係るファイルの自動バックアップシステムおよびファイルの自動バックアップ方法について、添付の図面を参照して詳細に説明する。
【0016】
【発明の実施の形態】
図1は、本発明の実施形態に係るファイルの自動バックアップシステムの構成を示す図である。図1においてファイルの自動バックアップシステム10は情報処理装置である共有ファイル装置(又はクライアントPC)20がローカルエリアネットワーク(LAN)12に接続され、LAN12に接続されたクライアントPC(パーソナルコンピュータ)40等のコンピュータから共有ファイル装置(又はクライアントPC)20に記憶されたファイルに任意にアクセスできるよう構成されている。
【0017】
共有ファイル装置(又はクライアントPC)20はファイル処理部24とファイルを記憶するハードディスク装置(HDD)22とからなり、インターフェース14を介してバックアップ装置30が接続されている。バックアップ装置30は、ファイル処理履歴管理手段34とバクアップ制御手段36、バックアップメモリ32とから構成されてなる。
【0018】
ここで、共有ファイル装置(又はクライアントPC)20とバックアップ装置30は物理的に一体となった装置とすることもできる。その場合、両装置間の接続はインターフェース14を介して、あるいはインターフェース14を介することなく接続することができる。図2は後者の構成を示す図である。LAN12に接続された複数のクライアントPC40〜43が共有ファイル装置20を共同で利用する構成であり、バックアップ装置はバックアップメモリ32を備え、共有ファイル装置20内に一体に構成されている。
【0019】
また、図3に示すように、共有ファイル装置20がなく、バックアップ装置が特定のクライアントPC40と一体に構成され、当該クライアントPC40で処理されるファイルの自動バックアップを行う構成、あるいは、クライアントPC40と一体に構成されたバックアップ装置が、LAN12に接続される他のクライアントPC41〜43等と共有され、各クライアントPC41〜43で処理されるファイルを含めて自動バックアップを行う構成とすることも可能である。
【0020】
以下の説明は、共有ファイル装置20とバックアップ装置30とが一体に構成されたものとして説明を進める。ハードディスク装置22には、複数のユーザーが共有するファイルが記憶されており、ファイル処理部24は、複数のクライアントPC40等からのアクセスに応答してファイル処理、すなわち、共有ファイル装置20としてのファイルの作成、更新、削除等の処理を行う。
【0021】
この際、ファイル処理部24は、共有ファイル装置20として特有の処理、例えば、ファイルの参照のみを許可するユーザーと、ファイルの更新を許可するユーザー等のユーザー資格の認証管理や、同一ファイルに関して同時アクセスがあった場合の優先処理等の機能を有する。このような共有ファイルの制御は一般的なものであり、本発明のバックアップ処理とは直接的な関係はない。
【0022】
LAN12に接続されたクライアントPC40から共有ファイル装置20のファイルにアクセスがあると、ファイル処理部24は、磁気ディスク装置22から該当するファイルを読出し、クライアントPC40に転送する。クライアントPC40においてファイルを書き換える等の処理が行われ、更新、保存の指示とともに、書き換えられたファイルがファイル処理部24に転送され、ファイル処理部24は、ユーザーがファイルの更新資格がある場合には、更新されたファイルに置き換えて、磁気ディスク装置22に記憶する。
【0023】
このファイル処理部24におけるファイル処理の履歴は、インターフェース14を介して、ファイル処理履歴管理手段34に送られ、ファイル処理履歴テーブルに記憶される。
【0024】
図4は、このファイル処理履歴テーブルの構成を示す図であり、a〜nの各ファイル毎に、そのデータ量C、作成日D、更新回数U、最終更新日N、確認日Hを記憶したものである。ここで、確認日Hは、ファイルの内容が承認資格を有するユーザーによって承認された日として以下の説明を進めるが、それに限られるものではなく、単なるファイルの参照があった日であってもよく、その場合は最終の参照日が確認日Hとなされる。また、ファイル処理履歴テーブルはバックアップメモリ32の一部の領域に構築することもできる。
【0025】
ファイル処理部24において、ファイルの保存処理が行われる際、バックアップ装置30において、バックアップ制御手段36は、該当するファイル、例えばファイルaのファイル処理履歴テーブルを参照し、そのファイルの処理履歴、すなわち、データ量C、作成日D、更新回数U、最終更新日N、確認日Hに基づいて、そのファイルが後にアクセスされる確率量を算出する。
【0026】
例えば、最も重要なデータとしてバックアップが必要なものは、一般的には現在作成中であり、更新回数も多いファイルであるといえる。すなわち、更新回数が多いということはそのファイルにアクセスしているユーザー数も多く、後になって使用(アクセス)される確率が高いといえるが、そのファイルの作成日や最終更新日によって、その確率量は変動する。
【0027】
例えば、更新回数は多くても、作成日、最終更新日がともに古いファイルは、以前はよく使用されたが最近は使用されなくなったファイルである確率が高く、後になってそのファイルに対するアクセスが発生する確率は相対的には小さくなる。
【0028】
従って、本発明では、バックアップ制御手段がファイルの処理履歴情報から、後になってそのファイルがアクセスされる確率を示す確率量Sを算出し、予め設定した基準値P以上の確率量であった場合に、そのファイルをバックアップメモリ32に記憶する(ファイルをコピーしてバックアップメモリ32に保存する)ようになされる。
【0029】
この確率量の算出は、例えば、確率量をSとし、当該ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出することができる。すなわち、本発明は、ファイルの更新回数や更新日等の要素に基づいて当該ファイルが後にアクセスされる確率を求めた場合、正規分布を示すことに着目し、その対数を取り確率量に変換して数値化し、予め設定した基準値と比較することで当該ファイルの重要度(バックアップ要否)を容易に判断可能であることを見いだしたものである。
【0030】
ファイルのエラー率(何らかの原因で記録した装置が壊れる、あるいは論理的にデータに不整合がおこるなど、ファイルへのアクセスが不可になる確率:この場合、バックアップファイルが存在すれば、そのバックアップファイルで回復することができる)を3%とし、あるファイルについて、10日間の間に30回更新があった場合、上記計算式で算出した確率量SはS=1.307となる。従って、予め基準値をPとして、例えばP=1.2と設定しておけば、前記のファイルはバックアップが必要なファイルとしてバックアップメモリ32にコピーされることになる。
【0031】
ここで、ファイル作成時期D、最終更新時期Nは日付けのデータであり、計算においてディメンジョンが異なるため、ここでは、基準の日を定め、基準日からの日数で数値化することにより確率量を算出している。例えば、1970年1月1日午前0時(UTC:世界協定時間と称される)を基準に、時間が何秒経過したかで表す。ファイルの作成日が2002年1月1日午前0時00分0秒であると1009152000秒経過、ファイルの最終更新日が2002年1月10日午前0時00分0秒であると1010016000秒経過したことになり、Dは1009152000、Nは1010016000となる。従ってN−Dは(1010016000−1009152000)/24/60/60=10となる。
【0032】
確率量の算出は、更に他の要素を加味して算出することができる。例えば、あるファイルの最終更新日が古くなり、更に更新回数が少なくなっても、データ量Cが大きなファイルは、相対的にデータが失われた際のリカバリーが困難になるため、バックアップの必要性が高いファイルであるといえる。従って、この場合の確率量SをS2とすると、
S2=loge(C×U/(1+H−N))
で算出することができる。
【0033】
前記確率量の算出は、更に、他の要素を加味して算出することができる。例えば、ファイルの内容を更新することは無くても(作成完了している情報)、後で確認(承認権限のあるユーザーによる確認等)する必要性のあるデータはバックアップの必要性が高いファイルであるといえる。ファイルの確認日をHとし、この場合の確率量SをS3とすると、
S3=loge(C×U/((1+H−N)(1+N−D)))
で算出することができる。
【0034】
図5は、本発明の実施形態に係るファイルの自動バックアップの手順を示すフローチャートである。バックアップ装置30ではステップS101においてバックアップ制御手段36によりバックアップメモリ32のデータ保存領域が確保されているものとする。
【0035】
クライアントPC40から、共有ファイル装置20にアクセスがあり、ファイル処理部24においてファイルの更新もしくは作成等の処理が行われ、ステップS102においてそのファイルの保存処理が指示されると、ファイル処理履歴管理手段34はステップS103で、当該ファイルの処理履歴テーブルの内容を更新するとともに、そのデータをバックアップ制御手段36に送り、バックアップ制御手段36はファイルのファイル処理履歴テーブルのデータから、当該ファイルが後になってアクセスされる確率量Sを算出する。
【0036】
次いで、ステップS104で予め設定した基準値PとステップS103で算出した確率量Sとを比較する。この結果、確率量Sが基準値Pより小さい場合にはバックアップは行わず、当該ファイルは共有ファイル装置20の磁気ディスク装置22に記憶(保存)される(ステップS105)。
【0037】
算出した確率量Sが基準値より大きい場合には、当該ファイルは共有ファイル装置20の磁気ディスク装置22に記憶され(ステップS106)、次いでステップS107でバックアップメモリ32のバックアップ領域(データ保存領域)の容量確認が行われる。当該ファイルの大きさがバックアップ領域の空き領域内に記憶できる大きさであれば、ステップS113で当該ファイルがバックアップメモリ32に記憶される。
【0038】
当該ファイルの大きさが、バックアップ領域の空き領域に記憶できない大きさの場合は,ステップS109において、バックアップ領域内に記憶されている各バックアップファイルの全てについて、その処理履歴データを用いて、確率量Sを再度算出し直す。次いで、ステップS110で再計算された基準値Pと比較し、基準値Pより確率量が小さくなっているバックアップファイルがあれば、ステップS111でそのバックアップファイルをバックアップメモリ32から削除してステップS108に戻る。
【0039】
ステップS110において、削除できるバックアップファイルがない、または、削除できるバックアップファイルを削除した後でもバックアップ領域が不足している場合、バックアップ制御手段36はステップS112でバックアップメモリ32のバックアップ領域(保存領域)を一時的に拡張する(バックアップ領域の最終アドレスを変更する)。その後、ステップS113において当該ファイルがコピーされ、バックアップファイルとしてバックアップメモリ32に記憶される。
【0040】
このようなバックアップ領域の管理のため、バックアップ制御手段36は図7に示すバックアップ領域管理テーブルを備えている。すなわちバックアップ領域管理テーブルには、規定のバックアップ領域がその開始アドレスと終了アドレスで設定されており、各ファイルのバックアップコピーの記憶場所がその開始アドレスと終了アドレスで記録され、それぞれの容量が記録される。
【0041】
空き容量は、規定されたバックアップ領域の中で、バックアップファイルが記憶されていない空き領域の開始アドレスと終了アドレスで管理され、その容量が記録される。バックアップ領域が不足する場合、バックアップ制御手段36はバックアップ領域を一時的に拡張することができ、その場合、拡張されたバックアップ領域の終了アドレスが拡張領域情報として拡張領域に記憶される。
【0042】
次に、人為的なミスによりファイルが失われる危険を回避するためのバックアップについて説明する。人為的なミスとは、ユーザーによってファイルが誤って削除されてしまったような場合である。従って、共有ファイル装置20のファイルに対して、あるクライアントPC40から削除の操作が行われた場合、ファイルの処理履歴のデータによらず、このファイルがアクセスされる確率量Sが基準値Pより常に大きくなるような状態定数tを設定しておき、削除の操作があったファイルはある期間、無条件にバックアップされるようにするものである。
【0043】
例えば、クライアントPC40のユーザーにより共有ファイル装置20のファイルに対して削除操作があった場合の手順について、図6のフローチャートに基づいて説明する。先ず、ステップS201でファイルの削除が指示された場合、バックアップ装置30はステップS202で状態定数tを設定する。通常この状態定数tは1.0であるが、削除処理に対するバックアップ制御時には、例えば、2.0等のように、当該ファイルの確率量Sを算出した場合に必ず基準値Pより大きな値がえられるような定数を選んで設定するものである。
【0044】
この状態で、ステップS203で確率量Sを算出し、ステップS204で基準値Pと比較するが、算出した確率量Sは基準値Pより大となるから、共有ファイル装置20においてファイルの削除を行う(ステップS206)とともに、ステップS207でバックアップメモリ32のデータ保存領域の容量確認が行われる。ファイルの大きさがデータ保存領域の空き領域内に記憶できる大きさであれば、ステップS213で当該ファイルがコピーされ、バックアップファイルとしてバックアップメモリ32に記憶される。
【0045】
ファイルの大きさがバックアップ領域の空き領域に記憶できない大きさの場合は,ステップS209において、データ保存領域内に記憶されている各バックアップファイルの全てについて、その処理履歴データを用いて、確率量Sを再度算出し直す。次いで、ステップS210で再計算された確率量Sと基準値Pと比較し、基準値Pより確率量が小さくなっているバックアップファイルがあれば、ステップS211でそのバックアップファイルをバックアップメモリ32から削除してステップS208に戻る。
【0046】
ステップS210において削除できるバックアップファイルがない、または、削除できるバックアップファイルを削除した後でもバックアップ領域が不足している場合、バックアップ制御手段36はステップS212でバックアップメモリ32のバックアップ領域(保存領域)を一時的に拡張する(バックアップ領域の終了アドレスを変更する)。その後、ステップS213において、当該ファイルがバックアップファイルとしてバックアップメモリ32に記憶される。
【0047】
以上説明した本発明の実施形態において、ファイル処理履歴テーブル、バックアップ領域管理テーブルは必ずしも物理的に独立した記憶装置を用いる必要はなく、バックアップメモリ32の一部の領域を使用した構成することができ、また、バックアップメモリ32も同様に、必ずしも物理的に独立した記憶装置でなく、通常ファイルを記憶する磁気ディスク装置の中を区画分けしてそのうちの1つの区画をバックアップ領域として使用する構成をとることもできる。
【0048】
【発明の効果】
以上説明したように、本発明のファイルの自動バックアップシステムによれば、バックアップ装置がファイルの更新回数、作成日、最終更新日等のファイル処理履歴に基づいて自動的にバックアップの要否を判断するため、ユーザーはバックアップについて何ら意識することなくファイル処理を行うことができる。
【0049】
また、バックアップ制御手段は、所定の期間が経過する毎に、前記バックアップメモリに記憶された各ファイルについて、前記ファイル処理履歴テーブルを参照して前記確率量を算出して基準値と比較し、該確率量が基準値より小なるファイルを削除する。かかる態様によれば、時間の経過とともに重要度が小さくなったファイルのバックアップファイルが削除されるため、バックアップメモリを効率良く利用することができる。
【0050】
また、本発明のファイルの自動バックアップシステムによれば、バックアップメモリの領域をダイナミックに変更することができ、バックアップすべきファイルの大きさに応じて効率的にバックアップメモリ領域を使用することができる。
【0051】
更に、本発明のファイルの自動バックアップシステムによれば、人為的なミスによってファイルが削除された場合であっても、無条件にある期間そのファイルをバックアップしてあるため、バックアップデータから復元することができる。
【0052】
また、更に、本発明のファイルの自動バックアップシステムによれば、ファイルの更新回数のみならず、そのデータ量、確認日などファイルの処理履歴データの種々の要素に基づいてそのファイルが後にアクセスされる確率を示す確率量Sを算出することができるから、作成するファイルの性格等により適切なバックアップ基準を設定することができる。
【0053】
更に、本発明のファイルの自動バックアップシステムは、共有ファイル装置のバックアップシステムとして適用されるのみならず、特定のクライアントPCに付加して適用すること、および、LANに接続された複数のクライアントPCが共用するバックアップシステムに適用することも可能である。
【0054】
なお、本発明の態様を付記すると次のとおりである。
(付記1)ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなり、
ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段を有し、
前記バックアップ制御手段は、ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出して予め設定した基準値と比較し、該比較結果に応じてファイルを前記バックアップメモリにバックアップするようになしたファイルの自動バックアップシステム。
【0055】
(付記2)前記バックアップ制御手段は、所定の期間が経過する毎に、前記バックアップメモリに記憶された各ファイルについて、前記ファイル処理履歴テーブルを参照して前記確率量を算出して基準値と比較し、該比較結果に応じてファイルを削除する(付記1)に記載のファイルの自動バックアップシステム。
【0056】
(付記3)前記バックアップ制御手段は、前記バックアップメモリのバックアップ領域を管理するためのバックアップ領域管理テーブルを備え、バックアップすべきファイルの大きさがバックアップ領域の空き領域を超える場合、前記バックアップ領域に記憶されたファイル毎に前記確率量を算出して前記基準値と比較し、該比較結果に応じてファイルを削除した後、前記バックアップすべきファイルの大きさがなお前記空き領域を超える時、前記バックアップ領域を拡張し、当該ファイルを記憶するとともに、拡張領域情報を前記バックアップ領域管理テーブルに記憶する(付記1)に記載のファイルの自動バックアップシステム。
【0057】
(付記4)前記バックアップ制御手段は、所定の期間が経過する毎に、前記バックアップメモリに記憶された各ファイルについて、前記ファイル処理履歴テーブルを参照して前記確率量を算出して基準値と比較し、該比較結果に応じてファイルを削除するとともに、前記バックアップ領域が規定の領域から拡張されており、かつ削除後の全ファイルの容量が規定のバックアップ領域内の場合には、前記バックアップ領域を規定のバックアップ領域に戻す(付記3)に記載のファイルの自動バックアップシステム。
【0058】
(付記5)前記ファイル処理部においてファイルの削除処理が行われた場合、前記バックアップ制御手段は、該ファイルのファイル処理履歴データに基づいて前記確率量を算出するにあたって、予め設定した定数を乗ずることにより前記ファイルの処理履歴データによらず確率量を算出するようになした(付記1)に記載のファイルの自動バックアップシステム。
【0059】
(付記6)前記確率量をSとし、当該ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出する(付記1)〜(付記5)のいずれかに記載のファイルの自動バックアップシステム。
【0060】
(付記7)前記ファイル処理履歴テーブルは更に、ファイルのデータ量を記憶し、前記バックアップ制御手段は、データ量をCとした時、前記確率量Sを、
S=loge(C×U/(1+N−D))
により算出する(付記1)〜(付記5)のいずれかに記載のファイルの自動バックアップシステム。
【0061】
(付記8)前記ファイル処理履歴テーブルは更に、ファイルの確認日を記憶し、前記バックアップ制御手段は、確認日をHとした時、前記確率量Sを、
S=loge(C×U/((1+H−N)(1+N−D)))
により算出する(付記1)〜(付記5)のいずれかに記載のファイルの自動バックアップシステム。
【0062】
(付記9)バックアップ装置にインストールされた自動バックアップ機能を実現する自動バックアッププログラムにおいて、
ファイルが処理される毎に、ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
を有する自動バックアッププログラム。
【0063】
(付記10)前記確率量を算出するステップは、
確率量をSとし、該当ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出する(付記9)に記載の自動バックアッププログラム。
【0064】
(付記11)ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなるファイルの自動バックアップ方法であって、
ファイルが処理される毎に、前記ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
からなるファイルの自動バックアップ方法。
【図面の簡単な説明】
【図1】本発明の実施形態に係るファイルの自動バックアップシステムの構成を示す図である。
【図2】本発明の他の実施形態に係るファイルの自動バックアップシステムの構成を示す図。
【図3】本発明の更に、他の実施形態に係るファイルの自動バックアップシステムの構成を示す図。
【図4】ファイル処理履歴テーブルの構成を示す図である。
【図5】本発明の実施形態に係るファイルの自動バックアップシステムのバックアップ処理の手順を示すフローチャートである。
【図6】ファイル削除操作がなされた場合のバックアップ処理の手順を示すフローチャートである。
【図7】バックアップ領域管理テーブルの構成を示す図である。
【符号の説明】
10…ファイルの自動バックアップシステム
12…ローカルエリアネットワーク(LAN)
14…インターフェース
20…共有ファイル装置(又はクライアントPC)
22…磁気ディスク装置(HDD)
24…ファイル処理部
30…バックアップ装置
32…バックアップメモリ
34…ファイル処理履歴管理手段
36…バックアップ制御手段
40〜43…クライアントPC
Claims (5)
- ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなり、
前記バックアップ制御手段は、ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出して予め設定した基準値と比較し、該比較結果に応じてファイルを前記バックアップメモリにバックアップするようになしたことを特徴とするファイルの自動バックアップシステム。 - 前記確率量をSとし、当該ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出することを特徴とする請求項1に記載のファイルの自動バックアップシステム。 - バックアップ装置にインストールされた自動バックアップ機能を実現する自動バックアッププログラムにおいて、
ファイルが処理される毎に、ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
を有することを特徴とする自動バックアッププログラム。 - 前記確率量を算出するステップは、
確率量をSとし、該当ファイルのエラー率をE、更新回数をU、ファイル作成時期をD、最終更新時期をNとした時、
S=loge(U/(1+N−D))
により算出することを特徴とする請求項3に記載の自動バックアッププログラム。 - ファイルを処理するファイル処理部と、ファイルを記憶する記憶装置とを有する情報処理装置と、
ファイル毎に少なくともファイルの作成日と、更新回数と、最終更新日を記憶するファイル処理履歴テーブルと、ファイルが処理される毎に該ファイルのファイル処理履歴テーブルを更新するファイル処理履歴管理手段と、ファイル処理履歴テーブルのデータに基づいてファイルのバックアップを制御するバックアップ制御手段と、バックアップメモリとを有するバックアップ装置とからなるファイルの自動バックアップ方法であって、
ファイルが処理される毎に、前記ファイル処理履歴テーブルの情報を更新するステップと、
ファイル処理履歴テーブルに記憶されている情報からファイルがアクセスされる確率を示す確率量を算出するステップと、
前記確率量と予め設定した基準値と比較するステップと、
前記比較ステップにより得られた比較結果に応じてファイルを前記バックアップメモリにバックアップするステップと、
からなることを特徴とするファイルの自動バックアップ方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002294983A JP2004133538A (ja) | 2002-10-08 | 2002-10-08 | ファイルの自動バックアップシステムおよび自動バックアップ方法ならびにコンピュータ読取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002294983A JP2004133538A (ja) | 2002-10-08 | 2002-10-08 | ファイルの自動バックアップシステムおよび自動バックアップ方法ならびにコンピュータ読取り可能な記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004133538A true JP2004133538A (ja) | 2004-04-30 |
Family
ID=32285376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002294983A Withdrawn JP2004133538A (ja) | 2002-10-08 | 2002-10-08 | ファイルの自動バックアップシステムおよび自動バックアップ方法ならびにコンピュータ読取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004133538A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2189857A1 (en) | 2008-11-25 | 2010-05-26 | Tac AB | Trend log transfer |
KR100979750B1 (ko) * | 2009-11-06 | 2010-09-03 | (주)피스페이스 | 분산 저장 시스템에서 파일을 관리하는 장치 및 방법 |
WO2012160870A1 (ja) * | 2011-05-23 | 2012-11-29 | コニカミノルタホールディングス株式会社 | 情報処理装置 |
JP2014154044A (ja) * | 2013-02-12 | 2014-08-25 | Hitachi Solutions Ltd | 業務文書処理装置、業務文書処理プログラム |
-
2002
- 2002-10-08 JP JP2002294983A patent/JP2004133538A/ja not_active Withdrawn
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2189857A1 (en) | 2008-11-25 | 2010-05-26 | Tac AB | Trend log transfer |
KR100979750B1 (ko) * | 2009-11-06 | 2010-09-03 | (주)피스페이스 | 분산 저장 시스템에서 파일을 관리하는 장치 및 방법 |
WO2011056002A2 (ko) * | 2009-11-06 | 2011-05-12 | (주)피스페이스 | 분산 저장 시스템에서 파일을 관리하는 장치 및 방법 |
WO2011056002A3 (ko) * | 2009-11-06 | 2011-11-10 | (주)피스페이스 | 분산 저장 시스템에서 파일을 관리하는 장치 및 방법 |
WO2012160870A1 (ja) * | 2011-05-23 | 2012-11-29 | コニカミノルタホールディングス株式会社 | 情報処理装置 |
JP2014154044A (ja) * | 2013-02-12 | 2014-08-25 | Hitachi Solutions Ltd | 業務文書処理装置、業務文書処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100437199B1 (ko) | 컴퓨터시스템및그에저장된데이터를액세싱하기위한방법 | |
JP4977565B2 (ja) | アクセス制御リストを用いてファイルへのアクセスを制御するアクセスコントローラ | |
US7263589B2 (en) | Apparatus and method for controlling booting operation of computer system | |
JP4078039B2 (ja) | スナップショットイメージの世代管理方法及び世代管理装置 | |
JP6064608B2 (ja) | ストレージ装置、バックアッププログラム、およびバックアップ方法 | |
US9092379B2 (en) | Method and apparatus for backup and recovery using storage based journaling | |
US5086502A (en) | Method of operating a data processing system | |
US6557073B1 (en) | Storage apparatus having a virtual storage area | |
US8074035B1 (en) | System and method for using multivolume snapshots for online data backup | |
JP3197382B2 (ja) | データの増分タイム・ゼロ・バックアップ・コピーの方法及びシステム | |
US20100114847A1 (en) | Methods and Apparatuses for Data Protection | |
JP2004038938A (ja) | 一次データボリューム上のデータを復元する方法およびシステム | |
JP2009205333A (ja) | 計算機システム、ストレージ装置及びデータ管理方法 | |
JP2008293317A (ja) | 情報処理装置及び方法 | |
JP3136258B2 (ja) | ディスク更新ログ記録方式 | |
JP2007265492A (ja) | データ消去機能付きディスク装置 | |
JP5159777B2 (ja) | 情報及びメタデータを管理し記憶する装置及び方法 | |
US7801858B2 (en) | File system and file information processing method | |
JP2004133538A (ja) | ファイルの自動バックアップシステムおよび自動バックアップ方法ならびにコンピュータ読取り可能な記録媒体 | |
US20060026459A1 (en) | Method and apparatus for storing data | |
JPH0973372A (ja) | 記憶制御方法及び記憶制御装置 | |
JP2005313568A (ja) | 印刷装置、印刷装置におけるデータの消去方法およびプログラムならびに記録媒体 | |
JPH06332795A (ja) | 電気的消去可能な不揮発性メモリの制御方法及びシステム | |
JP3602001B2 (ja) | ディスク装置のデータファイル二重化制御システム | |
JPH09319624A (ja) | ファイル管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060110 |