JP2004318810A - Data management method and system - Google Patents

Data management method and system Download PDF

Info

Publication number
JP2004318810A
JP2004318810A JP2003192553A JP2003192553A JP2004318810A JP 2004318810 A JP2004318810 A JP 2004318810A JP 2003192553 A JP2003192553 A JP 2003192553A JP 2003192553 A JP2003192553 A JP 2003192553A JP 2004318810 A JP2004318810 A JP 2004318810A
Authority
JP
Japan
Prior art keywords
backup
processing
time
file
management table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003192553A
Other languages
Japanese (ja)
Inventor
Hironori Sugata
裕紀 菅田
Yasuhiro Asakura
康裕 朝倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003192553A priority Critical patent/JP2004318810A/en
Publication of JP2004318810A publication Critical patent/JP2004318810A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a data management method and a system thereof that realizes resumption of interrupted backup processing. <P>SOLUTION: The system that carries out backup processing with a computer provided with a data storage device and a backup device manages a file processed with a management table and resumes the interrupted backup processing. The system manages the processing up to the interruption by estimating the backup processing time, and performs the backup processing based on the management information. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、計算機の格納されたデータの管理技術に関し、データ記憶装置へのバックアップやリストアする技術に関する。
【0002】
【従来の技術】
従来のバックアップの処理方法としては、バックアップに予想以上に時間がかかり、夜間に実施していたバックアップが朝のユーザ業務開始までに完了しなかった場合、そのバックアップは中断し、次の機会に最初からバックアップは取り直すことになる。
【0003】
バックアップ処理に関するものとして、特許文献1がある。
【0004】
【特許文献1】
特開平7−253917号公報
【0005】
【発明が解決しようとする課題】
上記従来方式は、中断したバックアップを再開することを想定しておらず、どのファイル(もしくはデータ)までバックアップされたか、またどのファイルが再開するまでに更新されたかに関して、バックアップやリストアするべきファイルをユーザが判断する必要がある。わずかだと思われる残りのバックアップを取得し、有効なバックアップデータとして利用することができないと、業務の無い休日などにバックアップをとるなどの手段が必要となってくる場合もある。
【0006】
本発明の目的は、中断したバックアップ処理の再開を可能とすることにある。
【0007】
【課題を解決するための手段】
データ記憶装置と、バックアップ装置を備えたコンピュータでバックアップ処理を行うシステムにおいて、中断前と再開後のファイルを管理表によって管理し、中断したバックアップ処理を再開することを実現する。
【0008】
【発明の実施の形態】
以下、本発明の実施の形態を、図面を用いて詳細に説明する。
【0009】
図1は本発明の構成図である。
【0010】
図1において、バックアップサーバ101がハードディスク装置102とバックアップ装置103に接続されている。
【0011】
バックアップサーバ101は、管理表制御部104、データ制御部105、中断/再開制御部106を有する。
【0012】
管理表制御部104は、管理表作成部107、管理表更新部108、管理表参照部109より成る。
【0013】
管理表作成部107では、バックアップ開始時に、バックアップするファイルの一覧表を作成する。どのファイルをバックアップするのかは、そのバックアップジョブを作成したバックアップ管理者によって決定される。この表を元に、バックアップするファイルを管理し、どのファイルがバックアップされたか、また再開する場合にどのファイルをバックアップするべきかを判断する。
【0014】
また、これらの管理単位はデータやレコード、ボリューム、論理デバイス、物理デバイス、ドライブでも良い。
【0015】
管理表更新部108では、管理表作成部107によって作成された管理表に対して、バックアップされたファイルにバックアップ済みのチェック、削除されたファイルに削除済みのチェック、追加されたファイルに管理表への追加を、ファイル単位に行う。
【0016】
管理表110は、バックアップするファイルを管理する表である。
【0017】
管理表110の詳細な管理方法を図4に示す。
【0018】
データ制御部105は、データ入力部111、対象ファイル判別部112、データ出力部113から成る。
【0019】
バックアップ時には、ハードディスク装置102からデータ入力部111に対して、対象ファイル判別部112によって判別された対象ファイルのデータが入力され、データ出力部113からバックアップ装置103に対してデータが出力されることにより、ハードディスク装置102内のデータをバックアップ装置103にバックアップする。
【0020】
詳細なバックアップ処理の流れを図2に示す。また、対象ファイル判別部112の詳細を図5に示す。
【0021】
リストア時には、バックアップ装置103からデータ入力部111に対して、対象ファイル判別部112によって判別された対象ファイルのデータが入力され、データ出力部113からハードディスク装置102に対してデータが出力されることにより、バックアップ装置103内のデータをハードディスク装置102にリストアする。
【0022】
中断/再開制御部106は、中断処理実行部114、再開処理実行部115、中断/再開日時設定部116から成る。
【0023】
中断処理実行部114では、中断処理の要求があった場合に中断処理を実行する。中断処理の要求は、ユーザがあらかじめ設定した時刻までにバックアップ処理が終わらない場合、もしくはユーザが手動で中断要求を行った場合に発生する。
【0024】
再開処理実行部115では、再開処理の要求があった場合に再開処理を実行する。再開処理は、対象ファイル判別部112によって対象となるファイルを判別し、中断後の残りの処理を再開する。
【0025】
中断/再開日時設定部116では、この時間までにバックアップ処理が終わらない場合は中断する中断日時、また中断された処理を再開する再開日時を設定する。日時の設定は、スケジュールによって自動で行われるが、ユーザが手動で設定することも可能である。
【0026】
詳細な再開処理の流れを図3に示す。
【0027】
図2は、データ制御部105の処理フローである。
【0028】
データ制御部105では、まずバックアップ処理が再開処理かを判定する(ステップ201)。再開処理であった場合は、再開処理実行部115により再開処理が実行される(ステップ202)。再開処理でない場合は、管理表作成部107によりバックアップするファイルの一覧を作成する(ステップ203)。
管理表参照部109より、作成された管理表からバックアップ対象のファイルを読み込み(ステップ204)、管理表に処理すべきファイルが無くなったら(ステップ205)バックアップが完了する(ステップ206)。
【0029】
中断/再開日時設定部116により中断時刻が設定されている場合は(ステップ207)、管理表参照部109により選択された現在の処理対象ファイルのバックアップが中断時刻までに完了するかを判定する(ステップ208)。
【0030】
この判定の詳細は図6に示す。
【0031】
完了しないと判断した場合、またはユーザが手動で中断要求を出した場合(ステップ209)、中断処理実行部114により中断処理が実行され(ステップ210)、バックアップが中断する。
【0032】
中断しない場合は、ハードディスク装置102からデータ入力部111に対して対象ファイルのデータが入力され(ステップ211)、データ出力部113からバックアップ装置103に対してデータが出力されることにより(ステップ212)、ハードディスク装置102内のデータをバックアップ装置103にバックアップする。
【0033】
その後、管理表更新部221により、管理表110に対して、対象ファイルがバックアップされたフラグを立てる更新処理を行う(ステップ213)。
【0034】
現在の対象ファイルについて処理が終了した後、管理表110の次の対象ファイルに対して処理し、管理表110に登録されているファイルがなくなるまで繰り返す。
【0035】
図3は、再開処理実行部115の処理フローである。
【0036】
管理表参照部109により、以前の処理結果を参照する(ステップ301)。次に、前回の処理の時点と今回の処理の時点で、ファイルの削除、追加があったかどうかを判定する。管理表110に存在しないファイルが処理対象ディレクトリ以下にある場合、すなわち前回の処理の時点から新たにファイルが作成された場合(ステップ302)、管理表更新部108により追加されたファイルの情報を管理表110に追加する(ステップ303)。管理表110に存在するファイルが処理対象ディレクトリ以下にない場合、すなわち前回の処理の時点から、処理されたファイルが削除された場合(ステップ304)、管理表更新部108により管理表110に存在する削除されたファイルのフラグを削除済みに更新する(ステップ305)。
【0037】
管理表参照部109より、作成された管理表からバックアップ対象のファイルを定められた優先順位に従うか、あるいは先頭から順に読み込み(ステップ306)、管理表に処理すべきファイルが無くなったら(ステップ307)バックアップが完了する(ステップ313)。
【0038】
対象ファイル判別部308により、対象ファイルについて処理が必要かどうか判定する(ステップ308)。処理が必要でなければ、次の対象ファイルに対して処理を継続する。
【0039】
処理が必要な場合は、ハードディスク装置102からデータ入力部111に対して対象ファイルのデータが入力され(ステップ310)、データ出力部113からバックアップ装置103に対してデータが出力されることにより(ステップ311)、ハードディスク装置102内のデータをバックアップ装置103にバックアップする。
【0040】
管理表更新部221により、管理表110に対して、対象ファイルがバックアップされたフラグを立てる更新処理を行う(ステップ312)。
【0041】
現在の対象ファイルについて処理が終了した後、次の対象ファイルに対して処理を継続する。その後、次の対象ファイルに対して処理を継続する。
【0042】
図4は、管理表110の例である。
【0043】
管理表110はファイル名401、更新日時402、フラグ403から成る。404、405、406はバックアップ済みで、その後に中断処理が行われ、407はバックアップされていない。
【0044】
再開処理が実行される時点で、ファイルが更新、削除、作成された場合の例を示す。
【0045】
404はバックアップ済みで更新もされていないので、408はバックアップする必要は無く、フラグは1のままにする。
【0046】
405はバックアップ済みだが更新されているので、409はバックアップする必要があり、バックアップ後にフラグを2にする。
【0047】
406はバックアップ済みだが削除されているので、410はバックアップする必要は無く、フラグを0にする。
【0048】
407はバックアップされていないので、411でバックアップする必要がある。バックアップ後にフラグを2にする。
【0049】
412は前回のバックアップの時点で存在せず、今回のバックアップの時点までに作成されたファイルなので、今回管理表110に新たに追加されたファイルである。バックアップ後にフラグを2にする。
【0050】
このデータをリストアする際は、フラグ1と2が立っているファイルが対象ファイルとなる。フラグ0が立っているファイルは、再開後に削除されているのでリストアは行わない。フラグ1が立っているファイルは、中断前のバックアップからリストアし、フラグ2が立っているファイルは、再開後のバックアップからリストアする。
【0051】
図5は、対象データ判別部115の処理フローである。
管理表110から読み込んだ対象ファイルに、バックアップ済みのフラグが立っているかどうかを判定する(ステップ501)。
バックアップ済みフラグが立っていた場合、次に対象ファイルが現在更新されているかどうかを判定する(ステップ502)。更新されていればバックアップの処理が必要となり(ステップ504)、更新されていなければ不要となる(ステップ505)。
バックアップ済みフラグが立っていなかった場合、次に削除フラグが立っているかどうかを判定する(ステップ503)。削除されていなければバックアップの処理は必要となり(ステップ504)、削除されていれば不要となる(ステップ505)。
【0052】
図6は、中断処理と処理優先順位の管理を行う表であり、ファイル名601、サイズ602、圧縮率603、バックアップ時間604、優先順位605から成る。この表にしたがって、定められた優先順位に従って順次対象ファイルに対して処理を行う。処理を行う対象ファイルが設定もしくはスケジュールされた中断日時までに終了するかどうかを判断し、終了しない場合は中断要求が出される。図7は、バックアップ時間の見積もりを考慮した中断処理方式のフローである。
【0053】
ユーザからの手動中断要求ではなく、ユーザがあらかじめ設定した時刻までにバックアップ処理が終わらないために中断しなければならない場合、限られた時間内で重要なデータを取得することが必要である。
【0054】
バックアップ処理が開始され(ステップ701)、対象となるファイルを判定する。ユーザによってあらかじめ指定された優先順位があれば(ステップ702)、その優先順位に従ってバックアップを取得する(ステップ703)。また、同じ優先順位の場合は、管理表に記載されている順に処理を行う(ステップ704)。 次に、圧縮率を考慮した対象ファイルのバックアップ時間を算出する(ステップ705)。バックアップ時間の算出についての詳細は後で詳細に述べる。ここでもし、次にバックアップ対象となるファイルが、ユーザによってあらかじめ設定された時刻までに終了しないと判断された場合(ステップ706)、優先順位に従い、対象となるファイルよりも処理時間が少なく、ユーザによってあらかじめ設定された時刻までに終了すると判断されたファイルがあるかを判断し(ステップ707)、ある場合は取得する(ステップ708)。取得できるファイルが存在しなくなった時点で、中断処理を実行する(ステップ709)。未処理のファイルがある場合は(ステップ710)、上記の処理を繰り返し、ない場合はバックアップ処理終了となる(ステップ711)。以上の処理方式により、限られた時間内で効率の良いバックアップ処理が行える。
【0055】
ステップ705における対象ファイルのバックアップ時間の算出は、以前のバックアップにおいて作成された管理表110によって行う。管理表には、ファイル名とファイルサイズ、バックアップ時間、圧縮率を記録しておく。圧縮率はデータ構造によって異なり、テキストファイルなどは圧縮率が高く、既に圧縮されているデータファイルは圧縮率が低い。従って、データ量のみからではなく、圧縮率を考慮したバックアップ時間を見積もる必要がある。一般的に、ファイルのデータ構造が同じであれば、データ量に比例したバックアップ時間を見積もることは可能である。従って、以前の管理表を参照し、ファイルサイズに変更がない場合は同じバックアップ時間を見積もり、ファイルサイズに変更があった場合には比例したバックアップ時間を見積もる。また、新規のファイルに対しては圧縮率0で見積もる。ただし、顧客業務で使用するデータ量の巨大なファイルなどで、前回の管理表からバックアップ時間が見積もれない場合は、事前に圧縮率を算出することによって見積もる。ファイルサイズの小さいものに関しては、見積もりに多少の誤差が生じても問題はない。
【0056】
バックアップ処理は、そのときの環境によって処理時間が異なってくる場合が考えられるので、見積もりに誤差が生じたときはその都度見積もり時間を修正する必要がある。バックアップ処理に時間がかかるファイルを見積もり、時間内に取得可能であると判断して処理を開始したが、実際には時間内に取得できないとなった場合、そのファイルのバックアップを中断し、そのファイルはバックアップしていないものとし、再開時に取得する。以上の方式によって、バックアップ時間の見積もりを考慮した中断処理を実現する。
【0057】
また、現状では中断を行うことなくバックアップ運用が行われていたが、バックアップ容量の日々の増加によって、設定されている業務開始時刻までにバックアップが終わらない日が出てくることが考えられる。バックアップ時間を見積もることにより、業務開始時刻までにバックアップが終わらないために処理を中断する可能性があることを、事前に管理者に通知することも可能である。
【0058】
図8は、バックアップ処理の中断、中断したバックアップ処理の再開をスケジュールする処理のフローである。ユーザによりあらかじめ業務開始時刻が設定されており、業務開始時刻までにバックアップ処理が終了しないと判断された場合、バックアップ処理の中断を要求する(ステップ801)。中断処理を実施するにあたり、中断する前にバックアップが行われたファイルと、中断したことによってバックアップされていないファイルとを管理表に反映する(ステップ802)。これにより、中断したバックアップの再開でどのファイルを処理すればよいかを判断することができる。その後、中断したバックアップの再開日時のスケジュールを行う(ステップ803)。通常は翌日の業務終了後におこなうことになるが、設定によって任意の日時に変更可能である。
【0059】
また、図8で説明した一連の処理が実際に行われる場合、事前に管理者に通知を行うことも可能である。
【0060】
以上述べたように、多大なデータを多大な時間を費やしてバックアップしていた途中で中断しても、続きのデータのバックアップを再開し、有効なバックアップデータとして利用することができる。
【0061】
【発明の効果】
本発明によれば、中断したバックアップ処理の再開が可能となる。
【図面の簡単な説明】
【図1】本発明のバックアップ装置のシステム構成を示すブロック図である。
【図2】データ制御部105による処理の流れを示すフローチャートである。
【図3】再開処理実行部115による処理の流れを示すフローチャートである。
【図4】管理表110の例である。
【図5】対象ファイル判別部112による処理の流れを示すフローチャートである。
【図6】中断処理と優先順位の管理を行う表の例である。
【図7】バックアップ時間の見積もりを考慮した中断処理の流れを示すフローチャートである。
【図8】バックアップ処理の中断、中断したバックアップ処理の再開のスケジュールを行う処理の流れを示すフローチャートである。
【符号の説明】
101 バックアップサーバ
102 ハードディスク装置
103 バックアップ装置
104 管理表制御部
105 データ制御部
106 中断/再開制御部
107 管理表作成部
108 管理表更新部
109 管理表参照部
110 管理表
111 データ入力部
112 対象ファイル判別部
113 データ出力部
114 中断処理実行部
115 再開処理実行部
116 中断/再開日時設定部
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a technique for managing data stored in a computer, and to a technique for backing up and restoring data in a data storage device.
[0002]
[Prior art]
As a conventional backup processing method, if the backup takes longer than expected and the backup performed at night is not completed by the start of user operations in the morning, the backup is interrupted and the first Will have to make a backup again.
[0003]
Japanese Patent Application Laid-Open Publication No. HEI 10-163566 relates to a backup process.
[0004]
[Patent Document 1]
JP-A-7-253917
[Problems to be solved by the invention]
The above conventional method does not assume that an interrupted backup is to be resumed, and determines which files (or data) have been backed up and which files have been updated before resuming. The user must decide. If it is not possible to obtain the remaining backup that seems to be small and use it as valid backup data, it may be necessary to take measures such as making a backup on holidays when there is no business.
[0006]
An object of the present invention is to enable restart of an interrupted backup process.
[0007]
[Means for Solving the Problems]
In a system in which a computer having a data storage device and a backup device performs backup processing, files before and after interruption are managed by a management table, and the interrupted backup processing can be resumed.
[0008]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0009]
FIG. 1 is a configuration diagram of the present invention.
[0010]
In FIG. 1, a backup server 101 is connected to a hard disk device 102 and a backup device 103.
[0011]
The backup server 101 has a management table control unit 104, a data control unit 105, and a suspension / resumption control unit 106.
[0012]
The management table control unit 104 includes a management table creation unit 107, a management table update unit 108, and a management table reference unit 109.
[0013]
The management table creation unit 107 creates a list of files to be backed up at the start of backup. Which files are backed up is determined by the backup administrator who created the backup job. Based on this table, the files to be backed up are managed, and which files have been backed up and which files should be backed up when restarting.
[0014]
These management units may be data, records, volumes, logical devices, physical devices, and drives.
[0015]
The management table update unit 108 checks the management table created by the management table creation unit 107 for the file that has been backed up, checks that the deleted file has been deleted, and adds the added file to the management table. Is added for each file.
[0016]
The management table 110 is a table for managing files to be backed up.
[0017]
FIG. 4 shows a detailed management method of the management table 110.
[0018]
The data control unit 105 includes a data input unit 111, a target file determination unit 112, and a data output unit 113.
[0019]
At the time of backup, data of the target file determined by the target file determination unit 112 is input from the hard disk device 102 to the data input unit 111, and data is output from the data output unit 113 to the backup device 103. Then, the data in the hard disk device 102 is backed up to the backup device 103.
[0020]
FIG. 2 shows a detailed backup processing flow. FIG. 5 shows details of the target file determination unit 112.
[0021]
At the time of restoration, the data of the target file determined by the target file determining unit 112 is input from the backup device 103 to the data input unit 111, and the data is output to the hard disk device 102 from the data output unit 113. Then, the data in the backup device 103 is restored to the hard disk device 102.
[0022]
The suspension / resumption control unit 106 includes a suspension processing execution unit 114, a resumption processing execution unit 115, and a suspension / resumption date / time setting unit 116.
[0023]
The interruption processing execution unit 114 executes the interruption processing when there is a request for the interruption processing. The interruption processing request occurs when the backup processing is not completed by the time set in advance by the user, or when the user manually issues an interruption request.
[0024]
The restart processing execution unit 115 executes the restart processing when a request for the restart processing is issued. In the restart process, the target file is determined by the target file determining unit 112, and the remaining process after the interruption is restarted.
[0025]
The suspension / restart date / time setting unit 116 sets a suspension date / time when the backup process is not completed by this time and a resume date / time at which the interrupted process is resumed. The setting of the date and time is automatically performed according to the schedule, but the user can also manually set the date and time.
[0026]
FIG. 3 shows a detailed flow of the restart processing.
[0027]
FIG. 2 is a processing flow of the data control unit 105.
[0028]
The data control unit 105 first determines whether the backup process is a restart process (step 201). In the case of the restart processing, the restart processing is executed by the restart processing executing unit 115 (step 202). If it is not a restart process, a list of files to be backed up is created by the management table creation unit 107 (step 203).
The backup target file is read from the created management table from the management table reference unit 109 (step 204). When there are no more files to be processed in the management table (step 205), the backup is completed (step 206).
[0029]
If the suspension time has been set by the suspension / restart date / time setting unit 116 (step 207), it is determined whether the backup of the current processing target file selected by the management table reference unit 109 is completed by the suspension time (step 207). Step 208).
[0030]
The details of this determination are shown in FIG.
[0031]
When it is determined that the processing is not completed, or when the user manually issues an interruption request (step 209), the interruption processing is executed by the interruption processing execution unit 114 (step 210), and the backup is interrupted.
[0032]
If not interrupted, the data of the target file is input from the hard disk device 102 to the data input unit 111 (step 211), and the data is output from the data output unit 113 to the backup device 103 (step 212). Then, the data in the hard disk device 102 is backed up to the backup device 103.
[0033]
Thereafter, the management table updating unit 221 performs an update process on the management table 110 to set a flag indicating that the target file has been backed up (step 213).
[0034]
After the process is completed for the current target file, the process is performed for the next target file in the management table 110, and the process is repeated until there are no more files registered in the management table 110.
[0035]
FIG. 3 is a processing flow of the restart processing execution unit 115.
[0036]
The management table reference unit 109 refers to the previous processing result (step 301). Next, it is determined whether a file has been deleted or added at the time of the previous processing and the time of the current processing. If a file that does not exist in the management table 110 is below the processing target directory, that is, if a new file has been created since the previous processing (step 302), the information of the file added by the management table updating unit 108 is managed. It is added to the table 110 (step 303). If the file existing in the management table 110 is not below the processing target directory, that is, if the processed file has been deleted from the previous processing (step 304), the file exists in the management table 110 by the management table updating unit 108. The flag of the deleted file is updated to deleted (step 305).
[0037]
The management table reference unit 109 reads the files to be backed up from the created management table in accordance with the determined priority or reads them sequentially from the top (step 306), and when there are no more files to be processed in the management table (step 307). The backup is completed (Step 313).
[0038]
The target file determining unit 308 determines whether or not processing is required for the target file (step 308). If no processing is required, the processing is continued for the next target file.
[0039]
If processing is necessary, the data of the target file is input from the hard disk device 102 to the data input unit 111 (step 310), and the data is output from the data output unit 113 to the backup device 103 (step 310). 311), the data in the hard disk device 102 is backed up to the backup device 103.
[0040]
The management table updating unit 221 performs an update process on the management table 110 to set a flag indicating that the target file has been backed up (step 312).
[0041]
After the processing is completed for the current target file, the processing is continued for the next target file. Thereafter, the processing is continued for the next target file.
[0042]
FIG. 4 is an example of the management table 110.
[0043]
The management table 110 includes a file name 401, an update date and time 402, and a flag 403. 404, 405, and 406 have been backed up, after which an interruption process is performed, and 407 is not backed up.
[0044]
An example in which a file is updated, deleted, or created at the time when the restart processing is executed will be described.
[0045]
Since 404 has been backed up and has not been updated, 408 does not need to be backed up, and the flag remains at 1.
[0046]
Since 405 has been backed up but has been updated, 409 needs to be backed up, and the flag is set to 2 after the backup.
[0047]
Since 406 has been backed up but has been deleted, 410 does not need to be backed up and sets the flag to 0.
[0048]
Since 407 is not backed up, it needs to be backed up at 411. After backup, set the flag to 2.
[0049]
A file 412 does not exist at the time of the previous backup but is a file created up to the time of the current backup, and is a file newly added to the management table 110 this time. After backup, set the flag to 2.
[0050]
When restoring this data, the file for which flags 1 and 2 are set is the target file. The file for which the flag 0 is set is not restored because it is deleted after the restart. Files with the flag 1 set are restored from the backup before the interruption, and files with the flag 2 set are restored from the backup after the restart.
[0051]
FIG. 5 is a processing flow of the target data determination unit 115.
It is determined whether or not the backup completed flag is set for the target file read from the management table 110 (step 501).
If the backup completed flag is set, it is next determined whether or not the target file is currently updated (step 502). If it has been updated, a backup process is required (step 504), and if it is not updated, it is unnecessary (step 505).
If the backup completion flag has not been set, it is determined whether or not the deletion flag has been set (step 503). If it has not been deleted, backup processing is required (step 504), and if it has been deleted, it is unnecessary (step 505).
[0052]
FIG. 6 is a table for managing the interruption processing and the processing priority, and includes a file name 601, a size 602, a compression ratio 603, a backup time 604, and a priority 605. According to this table, processing is sequentially performed on the target file according to the determined priority. It is determined whether the target file to be processed ends by the set or scheduled interruption date and time, and if not, a suspension request is issued. FIG. 7 is a flowchart of the interruption processing method in consideration of the estimation of the backup time.
[0053]
When a backup process does not end by a time set in advance by the user but must be interrupted instead of a manual interruption request from the user, it is necessary to acquire important data within a limited time.
[0054]
The backup process is started (step 701), and a target file is determined. If there is a priority specified by the user in advance (step 702), a backup is acquired according to the priority (step 703). If the priority is the same, the processing is performed in the order described in the management table (step 704). Next, the backup time of the target file is calculated in consideration of the compression ratio (step 705). Details of the calculation of the backup time will be described later in detail. Here, if it is determined that the next file to be backed up does not end by the time preset by the user (step 706), the processing time is shorter than the target file according to the priority order, It is determined whether there is a file that is determined to end by the time set in advance (step 707), and if so, it is acquired (step 708). When there is no longer any file that can be obtained, an interruption process is executed (step 709). If there is an unprocessed file (step 710), the above processing is repeated, and if not, the backup processing ends (step 711). With the above processing method, efficient backup processing can be performed within a limited time.
[0055]
The calculation of the backup time of the target file in step 705 is performed based on the management table 110 created in the previous backup. The management table records the file name, file size, backup time, and compression ratio. The compression ratio differs depending on the data structure. A text file or the like has a high compression ratio, and an already compressed data file has a low compression ratio. Therefore, it is necessary to estimate a backup time in consideration of not only the data amount but also the compression ratio. Generally, if the data structures of the files are the same, it is possible to estimate the backup time in proportion to the data amount. Therefore, referring to the previous management table, the same backup time is estimated when the file size is not changed, and the proportional backup time is estimated when the file size is changed. Also, a new file is estimated at a compression ratio of 0. However, if the backup time cannot be estimated from the previous management table for a file with a large data amount used in customer work, the compression time is estimated in advance by calculating the compression ratio. For files with small file sizes, there is no problem if there is some error in the estimation.
[0056]
Since the processing time of the backup processing may vary depending on the environment at that time, it is necessary to correct the estimated time each time an estimation error occurs. Estimate the files that take a long time to perform the backup process, and start the process because it is determined that the files can be acquired within the time.However, if the files cannot be acquired within the time, the backup of the file is interrupted. Is not backed up, and is acquired when resuming. With the above-described method, the interruption processing is performed in consideration of the estimation of the backup time.
[0057]
In addition, at present, backup operation is performed without interruption. However, due to the daily increase of the backup capacity, there may be days when the backup does not end by the set business start time. By estimating the backup time, it is possible to notify the administrator in advance that there is a possibility that the processing will be interrupted because the backup is not completed by the business start time.
[0058]
FIG. 8 is a flowchart of a process for scheduling the suspension of the backup process and the restart of the suspended backup process. The business start time is set in advance by the user, and when it is determined that the backup processing is not completed by the business start time, the backup processing is requested to be interrupted (step 801). In executing the suspending process, the files that have been backed up before the suspension and the files that have not been backed up due to the suspension are reflected in the management table (step 802). This makes it possible to determine which file should be processed when the interrupted backup is resumed. Thereafter, the schedule of the resume date and time of the interrupted backup is performed (step 803). Usually, it is performed after the end of the next day, but it can be changed to an arbitrary date and time by setting.
[0059]
When the series of processes described in FIG. 8 is actually performed, it is possible to notify the administrator in advance.
[0060]
As described above, even if a large amount of data is interrupted during backup while spending a large amount of time, the backup of the subsequent data can be resumed and used as effective backup data.
[0061]
【The invention's effect】
According to the present invention, it is possible to resume a suspended backup process.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a system configuration of a backup device according to the present invention.
FIG. 2 is a flowchart showing a flow of processing by a data control unit 105.
FIG. 3 is a flowchart showing a flow of processing by a restart processing execution unit 115;
FIG. 4 is an example of a management table 110;
FIG. 5 is a flowchart showing a flow of processing by a target file determining unit 112;
FIG. 6 is an example of a table for performing interruption processing and priority order management.
FIG. 7 is a flowchart illustrating a flow of an interruption process in consideration of an estimation of a backup time.
FIG. 8 is a flowchart illustrating a flow of a process of suspending a backup process and resuming the suspended backup process.
[Explanation of symbols]
101 backup server 102 hard disk device 103 backup device 104 management table control unit 105 data control unit 106 interruption / resumption control unit 107 management table creation unit 108 management table update unit 109 management table reference unit 110 management table 111 data input unit 112 target file determination Unit 113 data output unit 114 interruption processing execution unit 115 resumption processing execution unit 116 interruption / resumption date / time setting unit

Claims (5)

バックアップ装置と記憶手段を有する計算機とを備えたデータ管理システムにおけるデータ管理方法において、
前記計算機は、予め前記記憶手段に格納されたファイルと該ファイルと対応づけられたバックアップ中断時刻の情報を読み込み、前記ファイルのバックアップ時刻と前記読み出したバックアップ中断時刻の情報にもとづいて前記バックアップ装置に対する処理の指示を前記バックアップ装置へ送信することを特徴とするデータ管理方法。
In a data management method in a data management system including a backup device and a computer having storage means,
The computer reads a file previously stored in the storage unit and information on a backup suspension time associated with the file, and based on the backup time of the file and the read backup suspension time information, A data management method comprising transmitting a processing instruction to the backup device.
バックアップ装置と記憶手段を有する計算機とを備えたデータ管理システムにおいて、
予め前記記憶手段に格納されたファイルと該ファイルと対応づけられたバックアップ中断時刻の情報を読み出す手段と、前記ファイルのバックアップ時刻と前記読み出したバックアップ中断時刻の情報にもとづいて、前記バックアップ装置への処理の指示を送信する手段とを含むことを特徴とするデータ管理システム。
In a data management system including a backup device and a computer having storage means,
Means for reading out a file previously stored in the storage means and information on the backup suspension time associated with the file; and reading the information on the backup time of the file and the read backup suspension time on the basis of the information on the backup suspension time. Means for transmitting a processing instruction.
バックアップ装置と記憶手段を有する計算機とを備えたデータ管理システムにおいて、
中断前と再開後のファイルを管理表によって管理する手段と、中断した前記バックアップ処理を再開する手段とを含むことを特徴とするデータ管理システム。
In a data management system including a backup device and a computer having storage means,
A data management system comprising: means for managing files before and after interruption by a management table; and means for resuming the interrupted backup process.
前記バックアップの処理時間を見積もることによって、前記中断までの処理を管理し、該管理情報に基づいてバックアップ処理を行うことを特徴とする請求項1記載のデータ管理方法。2. The data management method according to claim 1, wherein the processing up to the interruption is managed by estimating the processing time of the backup, and the backup processing is performed based on the management information. 前記バックアップの処理時間を見積もることによって、中断までの処理を管理する手段を有することを特徴とする請求項2記載のデータ管理システム。3. The data management system according to claim 2, further comprising means for managing processing up to interruption by estimating a processing time of the backup.
JP2003192553A 2003-02-25 2003-07-07 Data management method and system Pending JP2004318810A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003192553A JP2004318810A (en) 2003-02-25 2003-07-07 Data management method and system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003046681 2003-02-25
JP2003192553A JP2004318810A (en) 2003-02-25 2003-07-07 Data management method and system

Publications (1)

Publication Number Publication Date
JP2004318810A true JP2004318810A (en) 2004-11-11

Family

ID=33478017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003192553A Pending JP2004318810A (en) 2003-02-25 2003-07-07 Data management method and system

Country Status (1)

Country Link
JP (1) JP2004318810A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094792A (en) * 2005-09-29 2007-04-12 Seiko Epson Corp Copy device and method
JP2008210159A (en) * 2007-02-27 2008-09-11 Kyocera Mita Corp Image forming apparatus
KR101429274B1 (en) * 2006-11-30 2014-08-11 삼성전자주식회사 Back up system and back up method
WO2014122746A1 (en) * 2013-02-07 2014-08-14 富士機械製造株式会社 Storage device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007094792A (en) * 2005-09-29 2007-04-12 Seiko Epson Corp Copy device and method
KR101429274B1 (en) * 2006-11-30 2014-08-11 삼성전자주식회사 Back up system and back up method
JP2008210159A (en) * 2007-02-27 2008-09-11 Kyocera Mita Corp Image forming apparatus
WO2014122746A1 (en) * 2013-02-07 2014-08-14 富士機械製造株式会社 Storage device
JPWO2014122746A1 (en) * 2013-02-07 2017-01-26 富士機械製造株式会社 Storage device

Similar Documents

Publication Publication Date Title
JP4996619B2 (en) Method and program for operating a system comprising a backup server and a backup storage system
CN102594849B (en) Data backup and recovery method and device, virtual machine snapshot deleting and rollback method and device
US8019726B2 (en) Method, apparatus, program and system for migrating NAS system
US6704885B1 (en) Performing data backups with a stochastic scheduler in a distributed computing environment
US9274897B2 (en) Backup policy migration and image duplication
JP5021929B2 (en) Computer system, storage system, management computer, and backup management method
JP5008991B2 (en) Apparatus and method for controlling data recovery
JP5243851B2 (en) How to back up your data
JP3592721B2 (en) Refresh Agent for Backup Software
US11768737B2 (en) Rollback procedure for failed dataset image operation
JP2009116773A (en) Backup executability judging system
JP4126706B2 (en) Apparatus, method, and program for data backup
JP2004038516A (en) Work processing system, operation management method and program for performing operation management
JP6828253B2 (en) Backup control device, backup control method and program
JP2004318810A (en) Data management method and system
JP2005316715A (en) Document management system, method and program
JP5317182B2 (en) POS terminal, module update method and module update program
JP7098280B2 (en) Information processing system and control method
JP3751476B2 (en) Database system, control method therefor, and computer-readable recording medium recording the control program
JP2008198153A (en) Continuous operation system carrying out batch processing while continuing online processing
JP2004021914A (en) Computer system and method for obtaining back up
JP2000285031A (en) Method and device for automatically duplicating computer file
JP2017068668A (en) Database system, replication controller, replication method and program
JP2004133538A (en) Automatic backup system and automatic backup method for file, and computer-readable record medium
JP2004355093A (en) Data backup restore method, and backup restore management program