JP2004046658A - データ転送方法 - Google Patents

データ転送方法 Download PDF

Info

Publication number
JP2004046658A
JP2004046658A JP2002204992A JP2002204992A JP2004046658A JP 2004046658 A JP2004046658 A JP 2004046658A JP 2002204992 A JP2002204992 A JP 2002204992A JP 2002204992 A JP2002204992 A JP 2002204992A JP 2004046658 A JP2004046658 A JP 2004046658A
Authority
JP
Japan
Prior art keywords
file
storage device
job
business
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002204992A
Other languages
English (en)
Inventor
Shogo Mikami
三上 小吾
Motoaki Hirabayashi
平林 元明
Naoki Shimada
島田 直樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002204992A priority Critical patent/JP2004046658A/ja
Priority to US10/366,557 priority patent/US7065539B2/en
Publication of JP2004046658A publication Critical patent/JP2004046658A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1461Backup scheduling policy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1469Backup restoration techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1435Saving, restoring, recovering or retrying at system level using file system or storage system metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1458Management of the backup or restore process
    • G06F11/1464Management of the backup or restore process for networked environments
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Abstract

【課題】あるスケジュールに従って業務が複数の計算機で実行されているような環境において、より早く業務の再開を行う。
【解決手段】業務サーバ120で処理される業務を特定し、特定された業務で利用されるファイルを特定し、特定されたファイルのデータをリストアする。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、ある記憶装置に記憶されたデータを他の記憶装置に転送技術に係り、特にデータのリストアを行うものに関する。
【0002】
【従来の技術】
従来、記憶装置に障害が発生した場合、この障害が発生した記憶装置を復旧させてから業務を再開することが行われていた。しかしながら、この場合、業務の再開までに時間がかかってしまうといった問題があった。
【0003】
この問題を解決するものとして、例えば特開2001−175423号公報には、全ての論理ディスクが復旧が完了する前に特定の論理ディスクを上位からアクセスすることを可能にする技術が記載されている。
【0004】
【発明が解決しようとする課題】
複雑な処理を行うために複数の計算機と記憶装置とをネットワークで接続された環境において、業務を複数の計算機で分散して実行することが行われている。また、複数の業務を効率的に処理するために、それぞれの業務のスケジュールを立てて、実行している。
【0005】
このような環境において、記憶装置に障害が発生した場合、記憶装置が完全に復旧するまでまって業務を再開すると、業務の再開までに時間がかかってしまうといった問題がある。また、先に説明した従来技術においては、全ての論理ディスクが復旧が完了する前に特定の論理ディスクを上位からアクセスすることを可能にするものであるが、計算機で実行される業務スケジュールとの関係については開示されていない。
【0006】
本発明は、あるスケジュールに従って業務が複数の計算機で実行されているような環境において、より早く業務の再開を行うための方法、装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
上記目的を達成するため、計算機で処理される業務を特定し、特定された業務で利用されるファイルを特定し、特定されたファイルのデータを他の記憶装置から転送する。
【0008】
【発明の実施の形態】
以下、図面を用いて本発明の一実施形態について説明する。図1は、予め与えられたスケジュールに従って業務を実行する情報処理システムの構成を示したものである。本システムは、管理サーバ100、業務サーバ120、記憶装置130、記憶装置150によって構成されている。図中、業務サーバ120、記憶装置130に付けられた添字(−1、−2)は、それぞれの業務サーバを特定して説明するためのもので、特に説明しない場合は構成上同じものである。管理サーバ100、業務サーバ120、記憶装置130はそれぞれCPUなどの処理部101、121、131とRAM、ROMなどの記憶部102、122、132とを有している。それぞれの処理部は記憶部に記憶されたプログラムを実行することで所定の機能を実行する。
【0009】
図1に示したシステムにおいて、管理サーバ100と業務サーバ120との間はLAN、業務サーバ120、記憶装置130、記憶装置150の間はストレージエリアネットワーク(SAN)で接続されている。
【0010】
管理サーバ100は、業務を実行するためのスケジュールを管理するジョブスケジュールプログラム103、記憶装置130に記憶されているデータを記憶装置150へ転送するデータのバックアップを管理するバックアップ管理プログラム105、記憶装置150で管理されているデータを記憶装置130へ転送するデータのリストアを管理するリストア管理プログラム104とを有している。また、管理サーバ100には、記憶装置110が接続されており、ジョブスケジュールプログラム101によって管理されるスケジュールが格納されたスケジュールファイル113、スケジュールに従って実行された業務が格納された履歴ファイル114、障害の発生により停止した業務を再実行するために必要なファイルの情報が格納された障害対策ファイル115が格納されている。尚、ここでジョブとは業務サーバ120によって実行される一つの処理の単位をいい、業務とは1つ又は複数のジョブによって実行される処理をいう。
【0011】
業務サーバ120は、管理サーバ100からの指示により実行される複数のジョブからなるジョブプログラム群125、これらのジョブの実行を管理するジョブ実行管理プログラム123、管理サーバ100からの指示により記憶装置130から記憶装置150へデータ転送してバックアップを行ったり、記憶装置150から記憶装置130へデータを転送してデータのリストアを行うバックアッププログラム124、記憶装置130又は業務サーバ120自身の障害を検出し、管理サーバ100へ報告する障害処理プログラム126とを有している。また、業務サーバ110は、記憶装置130に格納されているファイル名が登録されたファイルデータ127を有している。
【0012】
記憶装置130は、業務サーバ120がジョブを実行するときに利用するものであり、業務サーバ120からのアクセスを制御するアクセス制御プログラム133と、データの塊であるファイルが格納される記憶部140とを有している。この記憶部140は、複数のディスクによって構成されたディスクアレイであり、この記憶装置130がRAIDであってもよい。
【0013】
記憶装置150は、記憶装置130に格納されたファイルがバックアップされるものであり、業務サーバ120からのアクセスを制御するアクセス制御プログラム153と、データの塊であるファイルが格納される記憶部160とを有している。この記憶領域132はテープ、ディスクなどのデバイスで構成されている。
尚、記憶装置150のアクセス制御プログラム153は、記憶部160からファイル単位での読出しや書き込みができるものである。
【0014】
図2は、それぞれの記憶装置130−1、130−2の記憶部140−1、140−2に記憶されているデータを示したものである。図2(a)は、記憶部140−1に記憶されているデータを示したものである。この図では、データがファイル単位に記憶されていることを示している。また、ファイルA1、ファイルA2、ファイルH1は、既に記憶されているファイルを示している。実際には、ファイルB1、ファイルC1、ファイルD1、ファイルD2は、まだ記憶されていないファイルであるが、業務の実行により後に格納されるファイルである。
図2(b)は、記憶部140−2に記憶されているファイルを示したものである。ここでは、ファイルE1、ファイルE2、ファイルE3が既に記憶され、ファイルB2、ファイルF2、ファイルF3、ファイルG1は、業務の実行により後に記憶されるファイルである。
【0015】
図3は、スケジュールファイル113に格納されたスケジュール情報の一例を示したものである。スケジュール情報は実行する業務名301、業務の開始予定時刻302、業務の実行状態303、業務で実行されるジョブ304が登録されている。ここで、業務で実行されるジョブとして、例えば「ジョブH1(1)」は、ジョブH1が業務サーバ120−1で実行されることを意味する。また、それぞれのジョブで実行されるファイルは、図2で説明した各ファイルに対応している。つまり、ジョブH1で生成又は利用されるファイルはファイルH1である。図3に示したスケジュール情報は、フルバックアップまで終了し、業務Aの処理が実行されている状態であることを示している。
【0016】
図4は、履歴ファイル114に格納された履歴情報の一例を示したものである。履歴情報は、業務サーバ110で実行された業務名401、業務開始時刻402、終了時刻403、状態404、業務で実行されたジョブ405が登録されている。尚、履歴ファイル114は業務サーバで実行された業務の履歴を格納するものであるが、業務Eはスケジュールファイル113には登録されていない。これは、割り込みによって発生した業務であることを示している。尚、割り込みにより発生した業務においても、それぞれのジョブが実行される業務サーバは記憶装置110で図示しないテーブルによって管理されている。
【0017】
管理サーバ100のジョブスケジュールプログラム103により、管理者から入力された業務と業務の実行条件(開始時刻、実行順序など)に基づいてスケジュール情報を生成し、スケジュールファイル113に登録する。また、ジョブスケジュールプログラム103により、登録されたスケジュールファイル113を監視し、業務開始時刻となった業務の実行命令を業務サーバ120へ送る。この時、履歴情報として業務名、開始時刻、実行結果、実行されたジョブとを履歴ファイル114に登録する。ここで開始時刻として、業務サーバ110へ業務実行命令を発行した時刻を、また実行結果として「実行中」を登録する。業務サーバ120から業務の実行の終了報告を受けると、ジョブスケジュールプログラム103により、終了時刻、実行結果とを履歴情報として登録する。ここで、終了時刻として、業務サーバ120から業務の実行の終了報告を受けた時刻を、実行結果として「正常終了」を登録する。
【0018】
図5は、業務サーバ120の記憶部122に格納されたファイル情報の一例を示したものである。図5(a)は、業務サーバ120−1の記憶部122に格納されたファイルデータの一例を示したものである。ファイルデータとして、ジョブ名501、ファイル名502、記憶装置名503とが登録されている。また、図5(b)は、業務サーバ110−2の記憶部122に格納されたファイル情報の一例を示したものである。図5(a)、(b)に示したファイル情報は、それぞれの業務サーバ120で管理しているファイル情報であり、具体的にはジョブ実行管理プログラム123によって管理されている。ジョブ実行管理プログラム123は、管理サーバ100から業務実行命令を受けると、この業務を実行するためのジョブを起動する。そして、起動したジョブを監視し、ジョブに利用されるファイル名と記憶装置名をジョブ名とともに記憶する。尚、図5に示されたファイルデータは、図2に示す各記憶部に記憶されたファイルであり、業務の実行により生成されたものである。
【0019】
図6は、障害対策ファイル115のファイル情報の一例を示したものである。図6(a)は、業務サーバ120から受けた障害報告により業務サーバへ問合せを行い、記憶装置ごとにファイル情報を整理したものを示す。図6(b)は、図6(a)のファイル情報から障害の回復のために、リストアを行うためのファイル情報を示したものである。この図6(b)に示したファイル情報が障害多作ファイル115となる。障害ファイル情報は、障害が発生した記憶装置名601、業務名602、ファイル名603が登録される。ファイル名603は、業務サーバ120から受取ったファイル名とジョブスケジュールファイル113の情報から、業務単位にまとめて登録される。
【0020】
図1に示した本システム全体の動作について説明する。
【0021】
図6は、システム全体の動作を示した図である。
【0022】
まず、管理サーバ100のジョブスケジュールプログラム103によって、スケジュールファイル113が監視され、業務Hの実行開始時刻になったら、履歴ファイル114に業務H及び開始時刻を登録し、業務サーバ120に対して業務Hの実行指示を発行する(701)。尚、業務の実行指示はジョブを実行する業務サーバ120に対してジョブの実行単位で発行される。業務サーバ120のジョブ実行管理プログラム123によって、実行指示を受けたジョブが実行され、記憶装置130との間でデータのやり取りが行われる(702)。尚、このときジョブ実行管理プログラム123は、実行されたジョブがアクセスした記憶装置のファイルをファイルデータとして登録する。ジョブの実行が終了すると、業務サーバ120のジョブ実行管理プログラム123によって、管理サーバ100へジョブの実行が終了したことを報告する(703)。ジョブの終了の報告を受けると、管理サーバ100のジョブスケジュールプログラム103によって、業務Hの全てのジョブに対する終了報告を受けた時点で、業務Hの終了時刻、実行結果が履歴ファイル114に登録される。
【0023】
次に、ジョブスケジュールプログラム103によって、スケジュールに従ってフルバックアップを実行するため、バックアップ管理プログラム105に対してフルバックアップの指示を発行する。ここでバックアップのタイプとしては、記憶装置130に記憶されているデータをそのまま記憶装置150へ送るものと、記憶装置130に記憶されているファイル単位で記憶装置150へ送るものがある。ファイル単位で記憶装置150へ送る場合は、記憶装置150からファイル単位で読み出すことができる。
【0024】
バックアップ管理プログラム105によって、業務サーバ120に対してファイル情報の送付指示が発行される(704)。ファイル情報の送付指示を受けた業務サーバ120は、ジョブ実行管理プログラム123によって、記憶部122に記憶されているファイルデータが管理サーバ100へ送られる(705)。
【0025】
バックアップ管理プログラム105によって、業務サーバ120から送られてきたファイル情報は図6(a)に示すように記憶装置130ごとに分類される。業務サーバ120に対して分類したファイル情報とバックアップ実行指示とを送る(706)。バックアップ実行指示を受けた業務サーバ110は、バックアッププログラム124により受取ったファイル情報に基づいてファイル単位にバックアップを行う。ここでは、記憶装置130からバックアップのファイルのデータを受け取り(707)、そのデータを記憶装置150へ送り(708)、バックアップを行う操作を説明している。これは、業務サーバ120を介さずに記憶装置130と記憶装置150との間でバックアップが行われるようなものでもよい。また、1つの業務サーバ110が複数の記憶装置120に対してバックアップを行うようにしてもよい。つまり、管理サーバ100のバックアップ管理プログラム105が、記憶装置120−1のファイル情報とバックアップ実行指示とを業務サーバ120−1に送り、記憶装置120−2のファイル情報とバックアップ実行指示とを業務サーバ120−2に送ることにより、それぞれの業務サーバでバックアップが行われることになる。また、バックアップ管理プログラム105が記憶装置130−1、130−2のファイル情報とバックアップ実行指示とを業務サーバ120−1へ送ることにより、業務サーバ120−1により記憶装置130−1、130−2のバックアップが行われることになる。いずれにしても、記憶装置130のファイル単位でバックアップが行われればよい。
【0026】
バックアッププログラム124は、記憶装置130に格納されている全てのファイルについてバックアップを終了すると、管理サーバ100に対してバックアップ終了を報告する(709)。管理サーバ100のバックアップ管理プログラム105は、報告を受けると処理を終了し、ジョブスケジュールプログラム103へバックアップが終了したことを報告する。ジョブスケジュールプログラム103は、履歴ファイルに正常終了と終了時刻とを登録する。
【0027】
このようにして、管理サーバ100は業務サーバ120に対して業務の実行を指示する。
【0028】
次に、業務の実行途中で記憶装置130の障害発生した場合の動作について説明する。
【0029】
管理サーバ100は、スケジュールに従って、業務サーバ120へ業務A実行の指示を送る(710)。業務サーバ120は、実行指示に従って業務Aのジョブを実行する。ここで、業務サーバ120−1が記憶装置130−1で障害が発生したことを検出すると、障害処理プログラム126は管理サーバ100に障害が発生した記憶装置130−1と障害発生の情報を送る(711)。管理サーバ100は、障害発生の通知を受けると、ジョブスケジュールプログラム103の処理を停止し、リストア管理プログラム104を実行する。障害が発生すると、フルバックアップ後に実行された業務から処理を開始する。リストア管理プログラム104は、速やかに処理を開始するために、業務の実行に必要なファイルから順にリストアの処理を行っていく。
【0030】
リストア管理プログラム104は、それぞれの記憶装置130に記憶されているファイルを特定するため、業務サーバ120に対してファイル情報の送信要求を発行する(712)。業務サーバ120は、記憶部127に記憶されているファイル情報を管理サーバ100へ送り(713)、リストア管理プログラム104は、記憶装置130ごとにファイル情報を整理する。次に、障害が発生した記憶装置以外で、リストアする必要があるファイルを特定する。図8は、フルバックアップ以降に行われた業務及び行う予定の業務と、その業務に利用されるファイルとの関係を示したものである。記憶装置130−1に障害が発生した場合、業務Aから処理を行っても記憶装置130−2に記憶されているファイルの影響はない。これに対して例えば図8に示す場合において、業務Cで障害が発生した場合、業務Aから処理を行うと記憶装置130−2に記憶されているファイルBに影響が出る。つまり、記憶装置130−2に記憶されたファイルBを読み込み、その値を使って処理を行い、処理の結果をファイルBとして記憶装置130−2に登録している場合、ファイルBの内容が当初のものと変わってしまう場合がある。そのため、この場合には記憶装置130−2に記憶されたファイルBについてリストアを行う必要がある。尚、本実施例では障害が発生した場合、フルバックアップ後に、障害が発生した記憶装置130に格納されているファイルが利用される業務から再度実行するようにしている。つまり、図8において、記憶装置130−1に障害が発生した場合、業務Eの直前にフルバックが行われていれば業務Aから実行される。業務Bと業務Cとの間にフルバックアップが行われていれば、業務Bから実行される。このような場合において、障害が発生していない記憶装置130に対するリストアするためのファイルは次のように決定する。まず、障害が発生した業務と障害後に開始される業務との間に存在する業務を特定する。次に、その特定された業務で利用されるファイルを特定し、このファイルが記憶されている記憶装置を特定する。この記憶装置が、障害が発生した記憶装置でない場合、当該ファイルをリストアを実行するファイルの対象とする。リストア管理プログラム104は、このようにして図6に示す障害ファイルを生成する。
【0031】
リストア管理プログラム104は、再び実行される業務を履歴ファイル114から特定し、その業務で利用されるファイルのリストアを行うため、業務サーバ120へリストア実行指示を送る(714)。ここでは、図4に示された履歴情報により業務Aが実行する業務であり、ファイルA1、A2がリストの対象のファイルとなる。リストア実行指示を受取った業務サーバ120は、バックアッププログラム124で記憶装置150から指示を受けたファイルを記憶装置130へ登録する(715、716)。指示を受けた全てファイルが記憶装置130へ登録されると、業務サーバ120は、管理サーバ100へリストア終了を報告する(717)。リストア終了報告を受けたリストア管理プログラム104は、障害ファイル情報からリストアを実行したファイル名を削除し、ジョブスケジュールプログラム103へ業務実行指示を出す。具体的には、業務AのファイルA1、A2のリストアが終了した報告を受けて、ジョブスケジュールプログラム103へ業務Aの実行指示を出す。次に、リストア管理プログラム104は、履歴ファイルを参照し、次に実行する業務を特定する。ここで、履歴ファイルに実行する業務があれば、同様にファイルのリストアを行った後に業務の実行を指示する。履歴ファイルに実行する業務がなければ、スケジュールファイル113を参照し、スケジュールに従って業務を実行する。尚、リストア管理プログラム104は、図6に示した障害対策ファイルに登録されたファイルがなくなるまで、業務の実行前にリストを行う。そして、障害ファイル情報に登録されたファイルがなくなった時点で、リストア管理プログラム104は、ジョブスケジュールプログラム103にスケジュールに従って業務を行うよう指示を行い、処理を終了する。
【0032】
図9は、リストア管理プログラム104の処理を示したものである。
【0033】
リストア管理プログラム104によって、障害の発生によりリストアが必要となるファイルを特定した障害対策ファイルが生成され(901)、次に、履歴ファイルにより業務が実行される単位でリストアが実行され(902)、最後に障害対策ファイルによるリストアが実行される(903)。このように、履歴ファイルによっても全てのファイルがリストアできない場合があるために、障害対策ファイルによってリストアを行うようにしている。
【0034】
次に、各処理について詳細に説明する。
【0035】
図10は、障害対策ファイルを生成する処理を示したものである。リストア管理プログラム104は、ファイル情報の送信要求を発行する(1001)。リストア管理プログラム104は、ファイル情報を受取ると(処理1002で「Y」)、図6(a)に示すように記憶装置130ごとにファイル情報を整理する。ここで障害が発生した記憶装置については、そのまま障害対策ファイルとする(1003)。次に、リストア管理プログラム104は、障害が発生した記憶装置以外の記憶装置に格納されたファイルで、リストアが必要なファイルを特定する。まず、障害が発生した後に最初に実行すべき業務(以下、「業務A」と称す。)を特定する(1004)。次に、障害が発生した業務(以下、「業務B」と称す。)を特定する(1005)。業務Aから業務Bまでの業務を特定し(1006)、その業務が障害が発生していない記憶装置を利用した業務(以下、「業務C」と称す。)であるかを調べ、業務Cに該当する業務があれば(処理1007で「Y」)、その業務とその業務で利用されるファイルを障害対策ファイルに追加する(1008)。
【0036】
これにより、障害が発生した後に実行される業務であって、リストアをすべきファイル情報が生成される。
【0037】
図11は、履歴ファイルによる処理を示したものである。
【0038】
まず、履歴ファイルのコピーを生成する(1101)。ここでは図4に示す履歴ファイルがコピーされたものとして説明する。次に、コピーした履歴ファイルの業務Aから時系列順に業務を実行する。まず、最初に実行すべき業務(ここでは、業務A)に利用されるファイルを障害対策ファイルから特定し(1102)、特定したファイルのリストアの指示を発行する(1003)。リストアの終了処理を受けると(処理1104で「Y」)、障害対策ファイルからリストアを実行したファイルを削除し(1005)、ジョブスケジュールプログラム103へ業務の実行指示を出す(1106)。業務の終了報告を受けると、コピーした履歴ファイルから実行した業務を削除し(1107)、次に実行すべき業務があるかを確認する。次に実行すべき業務があれば、処理1102へ戻る。
【0039】
図12は、障害対策ファイルによる処理を示したものである。
【0040】
障害対策ファイルを参照し、リストアされていないファイルがあるか調べる。リストアされていないファイルがあれば(処理1201で「Y」)、リストア管理プログラム104はスケジュールファイルから次に実行すべき業務を特定し(1202)、特定した業務のファイルが障害対策ファイルにあるかを確認する。障害対策ファイルにあれば(処理1203で「Y」)、ファイルのリストアを実行し(1204)、リストアの終了報告を受けて、障害ファイルからリストアを行ったファイルを削除し(1206)、ジョブスケジュールプログラム101に業務の実行指示を発行する(1207)。まだ障害対策ファイルにファイル名が登録されているかを確認し、登録されていれば処理1202へ戻る。障害対策ファイルに登録された全てのファイルがなくなるまで、リストア管理プログラム104の管理下で業務が実行される。障害ファイルに登録された全てのファイルがなくなれば、リストア管理プログラム104はジョブスケジュールプログラム103にリストア処理の報告を行う(1209)。この報告を受けるとスケジュールプログラム103は、スケジュールファイルに従って処理を行うよう指示を出す。
【0041】
このようにリストア管理プログラム104の処理により、業務に必要なファイルの単位でリストアを実行することにより、記憶装置に登録されたファイルを全てリストアした後に業務を実行する場合に比べて、業務の再開が早くなる。
【0042】
また、障害が発生した記憶装置の状態が不安定な場合、再度障害が発生することもある。この場合、全てのファイルをリストアした後に障害が発生すると、膨大な時間を無駄にする。これに対して、リストア管理プログラム104は、業務に必要なファイルをリストアするので、再度障害が発生したとしても、それまでに要した時間は少なくなる。従って、同じ業務を実行させて障害の原因を究明するといったことにも利用することができる。
【0043】
更に、リストア管理プログラム104は障害が発生していない記憶装置についてもファイル単位でリストアを実行している。従って、全てのファイルをリストアしてから業務を実行する場合に比べて、業務の再開が早くなる。尚、障害が発生していない記憶装置に対するリストアを行う必要がない場合には、処理1004〜1008の処理を実行しなければよい。
【0044】
リストア管理プログラム104は、リストアの指示をリストアするファイルを管理している業務サーバへ依頼しているが、業務サーバが全ての記憶装置に対してアクセス可能なバックアップを行うバックアッププログラムを有していれば、業務の実行とバックアップとを分散して実行することができる。つまり、リストア管理プログラム104は、業務を実行していない業務サーバをスケジュールファイルから特定し、特定された業務サーバに対して、リストア先とリストアすべきファイルの情報を送ることにより、指定された業務サーバでリストアが行われる。これは、リストア管理プログラム104がファイル単位にリストアを行うよう指示しているので、業務の実行中にリストアが完了していなくても、次の業務の実行までそれほど時間がかからないと考えられるためにできることである。
【0045】
尚、図1に示したシステムは、複数の業務サーバが一つの記憶装置を利用可能な場合を説明したが、一つの業務サーバが一つの記憶装置しか利用できないようなシステムであっても、既に説明した処理を実行することができる。
【0046】
また、ファイル単位にリストアを実行するため、本実施例では図3で業務とジョブと業務サーバとの関係を登録し、図5又は図6でジョブとファイルとの関係を登録し、リストアを行う業務からファイルを特定する構成としているが、予めジョブごとに利用されるファイルと記憶装置とが特定できれば、図3のスケジュールファイルに、業務、ジョブ、ファイル、記憶装置とを対応付けて登録させることができる。この場合、ファイルの構成を業務サーバへ問い合わせる必要がなくなる。
【0047】
【発明の効果】
本発明によれば、あるスケジュールに従って業務が複数の計算機で実行されているような環境において、より早く業務の再開を行うことができる。
【図面の簡単な説明】
【図1】システム全体の構成を示した図である。
【図2】記憶装置に格納されたファイルを示した図である。
【図3】スケジュールファイルの一例を示した図である。
【図4】履歴ファイルの一例を示した図である。
【図5】ファイルデータの一例を示した図である。
【図6】障害対策ファイルの一例を示した図である。
【図7】システムの動作を説明するための図である。
【図8】業務とファイルとの関係を示した図である。
【図9】リストア管理プログラムの処理を示した図である。
【図10】リストア管理プログラムの処理を示した図である。
【図11】リストア管理プログラムの処理を示した図である。
【図12】リストア管理プログラムの処理を示した図である。
【符号の説明】
100 管理サーバ
103 ジョブスケジュールプログラム
104 リストア管理プログラム
105 バックアップ管理プログラム
106 アプリケーションプログラム
120 業務サーバ
123 ジョブ実行管理プログラム
124 バックアッププログラム
125 ジョブプログラム群
130 記憶装置
150 記憶装置

Claims (4)

  1. 計算機で処理されたデータが記憶される第1の記憶装置に第2記憶装置に格納されたデータを転送するデータ転送方法であって、
    前記計算機で処理される業務を特定し、特定された前記業務で利用されるファイルを特定し、特定された前記ファイルのデータを前記第2の記憶装置から前記第1の記憶装置に転送し、前記特定された業務を実行することを特徴とするデータ転送方法。
  2. 予め決められたスケジュールに従って業務を実行する複数の計算機と複数の第1の記憶装置とが接続され、障害が発生した第1の記憶装置へ第2の記憶装置に格納されたデータを転送するデータ復旧方法であって、
    障害が発生した記憶装置から再実行すべき業務を特定し、特定された業務で利用されるファイルを特定し、特定された前記ファイルを前記第2の記憶装置から第1の記憶へ転送し、前記特定された業務を実行することを特徴とするデータ転送方法。
  3. 計算機に障害が発生した記憶装置に、他の記憶装置に記憶されたデータを転送する指示を行う処理を実行させるプログラムであって、
    障害が発生した記憶装置を特定する情報から、障害が回復した後に実行される業務を特定し、特定された業務で利用されるファイルを特定し、特定された前記ファイルのデータを前記他の記憶装置から転送することを特徴とするプログラム。
  4. 請求項3記載のプログラムにおいて、特定された前記ファイルとは、障害が発生した後に実行される業務であって、障害が発生した記憶装置とは異なった記憶装置に記憶されたファイルを含むことを特徴とするプログラム。
JP2002204992A 2002-07-15 2002-07-15 データ転送方法 Pending JP2004046658A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2002204992A JP2004046658A (ja) 2002-07-15 2002-07-15 データ転送方法
US10/366,557 US7065539B2 (en) 2002-07-15 2003-02-14 Data transfer method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002204992A JP2004046658A (ja) 2002-07-15 2002-07-15 データ転送方法

Publications (1)

Publication Number Publication Date
JP2004046658A true JP2004046658A (ja) 2004-02-12

Family

ID=30112743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002204992A Pending JP2004046658A (ja) 2002-07-15 2002-07-15 データ転送方法

Country Status (2)

Country Link
US (1) US7065539B2 (ja)
JP (1) JP2004046658A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008181287A (ja) * 2007-01-24 2008-08-07 Hitachi Ltd データのリカバリを制御する装置及び方法
JP2008257421A (ja) * 2007-04-04 2008-10-23 Hitachi Ltd アプリケーション管理支援システム及び方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8359349B2 (en) * 2004-03-18 2013-01-22 Nokia Corporation System and associated terminal, method and computer program product for uploading content
JP2007140887A (ja) * 2005-11-18 2007-06-07 Hitachi Ltd ストレージシステム、ディスクアレイ装置、ボリューム提示方法及びデータ一致性確認方法
JP5061671B2 (ja) * 2007-03-15 2012-10-31 富士通株式会社 演算プログラム、分散処理プログラム、分散処理システムおよび演算処理方法
EP2693782B1 (en) * 2011-04-19 2015-10-28 Huawei Device Co., Ltd. Method for backuping and recovering data of mobile terminal and mobile terminal thereof
JP2021135981A (ja) * 2020-02-28 2021-09-13 京セラドキュメントソリューションズ株式会社 データ連携システムおよび処理監視システム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235601A (en) 1990-12-21 1993-08-10 Array Technology Corporation On-line restoration of redundancy information in a redundant array system
JP3575811B2 (ja) 1992-05-07 2004-10-13 株式会社日立製作所 記憶装置
JP3003440B2 (ja) * 1993-01-19 2000-01-31 株式会社日立製作所 負荷分散制御方法および分散処理システム
US5778395A (en) * 1995-10-23 1998-07-07 Stac, Inc. System for backing up files from disk volumes on multiple nodes of a computer network
KR19980024086A (ko) 1996-09-03 1998-07-06 니시무로 타이조 컴퓨터 시스템 및 화일 관리 방법
US5892915A (en) * 1997-04-25 1999-04-06 Emc Corporation System having client sending edit commands to server during transmission of continuous media from one clip in play list for editing the play list
US6732123B1 (en) 1998-02-23 2004-05-04 International Business Machines Corporation Database recovery to any point in time in an online environment utilizing disaster recovery technology
US6345281B1 (en) * 1999-03-01 2002-02-05 Electronic Data Systems Corporation Recovery method and system for a resource management system
US6473794B1 (en) * 1999-05-27 2002-10-29 Accenture Llp System for establishing plan to test components of web based framework by displaying pictorial representation and conveying indicia coded components of existing network framework
US6256773B1 (en) * 1999-08-31 2001-07-03 Accenture Llp System, method and article of manufacture for configuration management in a development architecture framework
JP3845239B2 (ja) 1999-12-21 2006-11-15 日本電気株式会社 ディスクアレイ装置及びディスクアレイ装置における障害復旧方法
US6769074B2 (en) 2000-05-25 2004-07-27 Lumigent Technologies, Inc. System and method for transaction-selective rollback reconstruction of database objects
US6636984B1 (en) 2000-06-15 2003-10-21 International Business Machines Corporation System and method for recovering data from mirror drives following system crash
US6970939B2 (en) * 2000-10-26 2005-11-29 Intel Corporation Method and apparatus for large payload distribution in a network
US6735293B2 (en) * 2001-06-05 2004-05-11 Bell Canada Method and system for facilitating telecommunications service provisioning and service assurance
EP1502218A4 (en) * 2002-04-15 2005-08-17 Invensys Sys Inc METHOD AND DEVICES FOR A PROCESS-, FACTORY-, ENVIRONMENT-, ENVIRONMENT- AND COMPUTER AIDED MANUFACTURING-BASED OR OTHERWISE CONTROL SYSTEM WITH REAL-TIME DATA DISTRIBUTION

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008181287A (ja) * 2007-01-24 2008-08-07 Hitachi Ltd データのリカバリを制御する装置及び方法
JP2008257421A (ja) * 2007-04-04 2008-10-23 Hitachi Ltd アプリケーション管理支援システム及び方法

Also Published As

Publication number Publication date
US20040010490A1 (en) 2004-01-15
US7065539B2 (en) 2006-06-20

Similar Documents

Publication Publication Date Title
KR100604242B1 (ko) 파일서버 기억장치
JP4688617B2 (ja) 記憶制御システム及び方法
US7383264B2 (en) Data control method for duplicating data between computer systems
US7240241B2 (en) Backup method and storage control device using the same
US7873865B2 (en) Apparatus and method for controlling data recovery
JP4321705B2 (ja) スナップショットの取得を制御するための装置及び記憶システム
US7689862B1 (en) Application failover in a cluster environment
JP3938475B2 (ja) バックアップ処理方法及びその実施システム並びにその処理プログラム
US20050149684A1 (en) Distributed failover aware storage area network backup of application data in an active-N high availability cluster
US20060173870A1 (en) Computing system and a method for calculating a recovery time of an application system
US7657720B2 (en) Storage apparatus and method of managing data using the storage apparatus
JP2005100373A (ja) 複数世代の回復スナップショットのバックアップと修復のマッピング装置
EP2524302B1 (en) Persistent application activation and timer notifications
JP4289056B2 (ja) 計算機システム間のデータ二重化制御方法
WO2015043155A1 (zh) 一种基于命令集的网元备份与恢复方法及装置
JP2011164800A (ja) ストレージシステム及びストレージ制御方法
JP2004164046A (ja) 階層型バックアップシステムにおけるバックアップ方法
JP2004046658A (ja) データ転送方法
JP4095139B2 (ja) コンピュータシステムおよびファイル管理方法
JPH1031562A (ja) 情報処理システム
US8676748B2 (en) Clearing metadata tracks in a storage system
US9355117B1 (en) Techniques for backing up replicated data
JP2003345638A (ja) 記憶制御装置の制御方法及び記憶制御装置及びプログラム
JPH05314075A (ja) オンラインコンピュータ装置
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040910

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060419

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061102

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070509

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100405