JP2007094604A - Computer backup system for countermeasure against disaster - Google Patents

Computer backup system for countermeasure against disaster Download PDF

Info

Publication number
JP2007094604A
JP2007094604A JP2005281049A JP2005281049A JP2007094604A JP 2007094604 A JP2007094604 A JP 2007094604A JP 2005281049 A JP2005281049 A JP 2005281049A JP 2005281049 A JP2005281049 A JP 2005281049A JP 2007094604 A JP2007094604 A JP 2007094604A
Authority
JP
Japan
Prior art keywords
server
disaster
backup
storage device
center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005281049A
Other languages
Japanese (ja)
Inventor
Mitsuhiko Yashiro
光彦 矢代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005281049A priority Critical patent/JP2007094604A/en
Publication of JP2007094604A publication Critical patent/JP2007094604A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a computer backup system for countermeasures against disasters attaining immediate startup of a backup auxiliary system in occurrence of a disaster. <P>SOLUTION: The computer backup system for countermeasures against disasters is provided with a plurality of regular systems having storage devices and servers, and a center comprising storage devices corresponding to the storage devices of the regular systems. The center is provided with backup storage devices in the same number as the storage devices of the regular systems and holding data, OSes, patches and application programs held in the storage devices of the regular systems, and a server group for countermeasures against disasters with a smaller number of servers arranged. OSes, patches, application programs, and the like are stored in the backup storage devices besides user data. In occurrence of the disaster, the servers of the center can be started early using the OSes, patches, application programs, and the like. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、例えば地震や洪水等の災害対策用コンピュータバックアップ方式に係り、特に、災害対策システムを構築する際に被災時に切換使用するサーバを共有することによりバックアップシステム構築コストを削減するとともに、物理的に離れた地点へ災害対策システムを構築することが困難なユーザにも災害対策システムの運用を可能としたものである。   The present invention relates to a computer backup method for disaster countermeasures such as earthquakes and floods, and in particular, reduces the cost of constructing a backup system by sharing a server that is used for switching in the event of a disaster when constructing a disaster countermeasure system. This makes it possible to operate a disaster countermeasure system even for users who are difficult to construct a disaster countermeasure system at a remote location.

企業では、情報システムつまりコンピュータシステムが停止すると企業活動そのものが停止状態になるので、コンピュータシステムの被災時に、業務を速やかに復旧させるために、例えば図13に示す如く、正システムAと副システムBの同じ2つのシステムを構築しておく。   In the enterprise, when the information system, that is, the computer system is stopped, the corporate activity itself is stopped. Therefore, in order to quickly recover the work in the event of a disaster of the computer system, for example, as shown in FIG. Build the same two systems.

正システムAは、リモートコピー101を備えたストレージ装置100、サーバ102、ファイバーチャネルスイッチ103等で構成され、副システムBは、リモートコピー201を備えたストレージ装置200、サーバ202、ファイバーチャネルスイッチ203等で構成される。そして正システムAと副システムBは広域ネットワークWANで接続されている。   The primary system A is composed of a storage apparatus 100 having a remote copy 101, a server 102, a fiber channel switch 103, etc., and the secondary system B is a storage apparatus 200 having a remote copy 201, a server 202, a fiber channel switch 203, etc. Consists of. The primary system A and the secondary system B are connected by a wide area network WAN.

通常は例えば正システムAを動作させ、副システムBでバックアップ動作を行っており、正システムAが被災した場合には、残りの副システムBに切換えることが行われている。   Normally, for example, the primary system A is operated and the backup operation is performed by the secondary system B. When the primary system A is damaged, switching to the remaining secondary system B is performed.

これら正システムA、副システムBの二つのシステムは、前記の如く、処理を行うサーバ102、202、データを格納するストレージ装置100、200と、関連する機器から構成される。   These two systems, the primary system A and the secondary system B, are composed of the servers 102 and 202 for processing, the storage apparatuses 100 and 200 for storing data, and related devices as described above.

被災時にも業務を継続させるためには、これら二つのシステムのストレージ装置100、200には、同等なデータを格納しておく必要がある。このために正システムAと副システムB間でデータの転送を行う処理が、業務と並行して実行される。この処理はサーバやストレージ装置のデータ転送機能(図13では、ストレージ装置100、200にそれぞれリモートコピー101、201として例示している。)により実現されることが多い。   In order to continue business even in the event of a disaster, it is necessary to store equivalent data in the storage devices 100 and 200 of these two systems. For this purpose, a process of transferring data between the primary system A and the secondary system B is executed in parallel with the business. This processing is often realized by a data transfer function of a server or a storage device (in FIG. 13, illustrated as remote copies 101 and 201 for the storage devices 100 and 200, respectively).

例えばストレージ装置100に書込まれるデータは、リモートコピー101により、スイッチ103、広域ネットワークWAN、スイッチ203を経由してストレージ装置200に転送され、書込まれる。   For example, data to be written in the storage apparatus 100 is transferred and written to the storage apparatus 200 by the remote copy 101 via the switch 103, the wide area network WAN, and the switch 203.

被災に備えて二つのシステムを構築する場合、システム切替え後の処理能力を確保するために、二つのシステムは同等な能力を持った機器構成をとることが多い。このため、単一のシステムに対して、倍の費用が必要となる。また火災等の他に、地震や水害などの天災に備えるためには、二つのシステムを距離的に離す必要がある。例えば地震の影響を二つのシステムが同時に受けないためには、システム間の距離を60〜100km程度離しておく必要があるといわれている。その結果単一の事業所のみからなる企業やシステムの設置地域を限定された自治体などの団体では、天災に備えた二つのシステムを構築することが困難であった。   When two systems are constructed in preparation for a disaster, the two systems often have a device configuration with an equivalent capability in order to ensure processing capability after system switching. This requires double the cost for a single system. In addition to fires, the two systems need to be separated from each other in order to prepare for natural disasters such as earthquakes and floods. For example, in order for two systems not to be affected by an earthquake at the same time, it is said that the distance between the systems needs to be separated by about 60 to 100 km. As a result, it was difficult for companies that consisted of only a single office and organizations such as local governments that had limited system installation areas to construct two systems for natural disasters.

このため、従来では、広域に分散した複数の遠隔システムを単一のシステムでバックアップし、連続したデータ処理を実現させるために、障害が発生した情報処理システムのバックアップを行うバックアップ装置において、前記バックアップ装置は、バックアップシステムを構成するリソースである構成リソースを保有するリソースプールと、前記バックアップシステム構成機構が障害発生情報処理システムと同じシステム構成を有するバックアップシステムを構成するために必要な前記構成リソースを、前記リソースプールに保有された前記構成リソースから選出し、選出された前記構成リソースを前記バックアップシステムに割り当てるリソース管理機構を有し、前記バックアップシステム構成機構は、前記リソース管理機構により割り当てられた構成リソースを用いてバックアップシステムを構成することが提案されている。
特開2001−306349号公報
Therefore, conventionally, in a backup apparatus that backs up an information processing system in which a failure has occurred in order to back up a plurality of remote systems distributed over a wide area with a single system and realize continuous data processing, the backup The apparatus includes a resource pool that holds configuration resources that are resources constituting the backup system, and the configuration resources necessary for the backup system configuration mechanism to configure a backup system having the same system configuration as the failure occurrence information processing system. A resource management mechanism that selects from the configuration resources held in the resource pool and allocates the selected configuration resources to the backup system, and the backup system configuration mechanism is allocated by the resource management mechanism. It has been proposed to configure the backup system by using a temple configuration resource.
JP 2001-306349 A

上記従来技術では、バックアップデータとしてユーザデータを保管しているものの、コンピュータの動作に必要なOS、パッチ、アプリケーションプログラム(以下アプリという)についてはバックアップしていない。そのため、災害が発生してバックアップ装置を立ち上げようとしても、データの外に必要な前記OS、パッチ、アプリについてはこれを別に読出してインストールする必要があるので、バックアップシステムの構築に非常に長時間必要とするという問題点が存在した。   In the above prior art, although user data is stored as backup data, the OS, patches, and application programs (hereinafter referred to as applications) necessary for computer operation are not backed up. Therefore, even if a disaster occurs and an attempt is made to start up a backup device, it is necessary to read and install the OS, patches, and applications required outside of the data separately, which is very long for the construction of a backup system. There was a problem of needing time.

前記課題を解決するため、本発明では下記(1)、(2)の如き災害対策用コンピュータバックアップ方式を提供する。   In order to solve the above-mentioned problems, the present invention provides a disaster countermeasure computer backup system as described in (1) and (2) below.

(1)ストレージ装置とサーバを有する複数の正システムと、この正システムのストレージ装置と対応するストレージ装置を備えたセンタを具備する災害対策用コンピュータバックアップ方式において、前記センタに、正システムのストレージ装置に保持されたデータ、OS、パッチ、アプリケーションを保持し、正システムのストレージ装置と同一数のバックアップ用ストレージ装置と、このバックアップ用ストレージ装置の数より少ない数の災害対策用サーバが配置された災害対策用サーバ群と、正システムで使用されるストレージ装置の機能と、サーバの名称及び機能と、災害発生時に使用されたセンタのストレージ装置に接続されたセンタのサーバ名が記入された第1管理テーブルと、センタのサーバの名称及び機能と、サーバの機能状態が記入される第2管理テーブルと、前記第1管理テーブル及び第2管理テーブルを管理し、災害時にセンタにおいてバックアップ用のストレージ装置に使用されるバックアップ用のサーバが選択されたとき、前記ストレージ装置と前記バックアップ用のサーバとの接続路を示すネットワーク制御データを有するネットワーク制御テーブルを保持する管理サーバを具備し、正システムに災害が発生したことがセンタに通知されたとき、前記管理サーバは前記正システムに対応するバックアップ用ストレージ装置に適する災害対策用サーバを、前記第1管理テーブル及び第2管理テーブルを参照して、前記災害対策用サーバ群より選択し、前記ネットワーク制御テーブルにもとづき、この災害対策用サーバを前記バックアップ用ストレージ装置に接続制御することを特徴とする。   (1) In a disaster countermeasure computer backup system comprising a plurality of primary systems having a storage device and a server, and a center having a storage device corresponding to the storage device of the primary system, the storage device of the primary system is installed in the center A disaster in which the same number of backup storage devices as the primary system storage device and the number of disaster countermeasure servers less than the number of backup storage devices are stored. First management in which the server group for countermeasures, the storage device function used in the primary system, the server name and function, and the server name of the center connected to the storage device of the center used in the event of a disaster are entered Table, center server name and function, server machine The second management table in which the status is written, the first management table, and the second management table are managed, and when the backup server used for the backup storage device is selected in the center at the time of disaster, the storage A management server that holds a network control table having network control data indicating a connection path between a device and the backup server, and when the center is notified that a disaster has occurred in the primary system, the management server A disaster countermeasure server suitable for the backup storage device corresponding to the primary system is selected from the disaster countermeasure server group with reference to the first management table and the second management table, and based on the network control table, This disaster recovery server is used as the backup storage. Characterized by connection control to location.

(2)前記(1)の災害対策用コンピュータバックアップ方式において、前記正システムのストレージ装置は、書込されたデータ、OS、パッチ、アプリケーションをセンタのストレージ装置に転送するリモートコピー手段を有することを特徴とする。   (2) In the disaster countermeasure computer backup method according to (1), the storage system of the primary system has remote copy means for transferring the written data, OS, patch, and application to the center storage system. Features.

本発明により下記(1)、(2)の効果を奏する。   The present invention has the following effects (1) and (2).

(1)副センタのバックアップ用のストレージ装置に、災害の復旧に不可欠なデータの外に、OS、パッチ、アプリ等コンピュータの動作に必要なソフトに関する情報も保持しているので、正システムに災害が発生してもシステム切換え時に割当てられたサーバがそれを使って起動し、そのバックアップシステムを非常に早く立ち上げることができる副システムとして迅速に稼動を開始するので、システムの信頼性を確保することができる。   (1) The secondary center's backup storage device holds information necessary for the operation of the computer, such as the OS, patches, and apps, in addition to the data essential for disaster recovery. Even if a system failure occurs, the server assigned at the time of system switching starts up using it, and the backup system can be started up quickly as a secondary system that can start up very quickly, ensuring system reliability. be able to.

(2)正システムからセンタ内のストレージ装置にデータやOS、パッチ、アプリ等の転送には、ストレージ装置が備えるリモートコピー機能を利用するので、センタ側のサーバリソースを使用せずにすむので、ハード量を軽くすることができる。   (2) Since the remote copy function of the storage device is used for transferring data, OS, patches, applications, etc. from the primary system to the storage device in the center, it is not necessary to use server resources on the center side. The amount of hardware can be reduced.

本発明の実施の形態を図1〜図12にもとづき説明する。   An embodiment of the present invention will be described with reference to FIGS.

図1は本発明の実施の形態、図2は本発明の構成状態説明図、図3は本発明の正常時の動作説明図、図4は本発明の正常時のバックアップデータ説明図、図5は本発明の災害時の動作説明図、図6は災害発生時の災害対策サーバの動作説明図(その1)、図7は災害発生時の災害対策サーバの動作説明図(その2)、図8は災害発生時の災害対策サーバの動作説明図(その3)、図9は災害発生時の災害対策サーバの動作説明図(その4)、図10は正常時の管理テーブル説明図、図11は災害発生時の管理テーブル説明図、図12は本発明における管理サーバの動作説明図である。   FIG. 1 is an embodiment of the present invention, FIG. 2 is an explanatory diagram of a configuration state of the present invention, FIG. 3 is an explanatory diagram of normal operation of the present invention, FIG. 4 is an explanatory diagram of normal backup data of the present invention, and FIG. Is an operation explanatory diagram of the disaster countermeasure server according to the present invention, FIG. 6 is an operation explanatory diagram of the disaster countermeasure server at the time of disaster (Part 1), FIG. 7 is an operation explanatory diagram of the disaster countermeasure server at the time of disaster (Part 2), FIG. 8 is a diagram for explaining the operation of the disaster countermeasure server when a disaster occurs (part 3), FIG. 9 is a diagram for explaining the operation of the disaster countermeasure server when a disaster occurs (part 4), and FIG. 10 is a diagram for explaining the management table during normal operation. Is an explanatory diagram of the management table when a disaster occurs, and FIG. 12 is an explanatory diagram of the operation of the management server in the present invention.

図1において、1、1−A〜1−Nは正システム、2−A〜2−Nは正システムのストレージ装置、3−A〜3−Nは正システムのサーバ、10はセンタ、11−A′〜11−N′はセンタ10のストレージ装置、12は管理サーバ、13はハードウェアプール、13−a〜13−mは災害対策サーバであってN>mの大小関係を有するもの、14は制御部、15は第1管理テーブル、16は第2管理テーブル、17はネットワーク制御テーブル、18は資源配置制御手段、19はネットワーク制御手段である。   In FIG. 1, 1, 1-A to 1-N are primary systems, 2-A to 2-N are storage devices of the primary system, 3-A to 3-N are servers of the primary system, 10 is a center, 11- A 'to 11-N' are storage devices of the center 10, 12 is a management server, 13 is a hardware pool, 13-a to 13-m are disaster countermeasure servers, and have a size relationship of N> m, 14 A control unit, 15 is a first management table, 16 is a second management table, 17 is a network control table, 18 is resource allocation control means, and 19 is network control means.

正システム1は、ユーザがデータ処理を行って得られた結果のデータを蓄積するデータ保持部であり、前記データのみならずこのデータ処理に必要としたOS、パッチ、アプリ等も同じく蓄積するものであり、例えばユーザA社の正システム1−A〜ユーザN社の正システム1−Nを有する。   The primary system 1 is a data holding unit that stores data obtained as a result of data processing performed by the user, and also stores the OS, patches, applications, and the like necessary for the data processing as well as the data. For example, it has a primary system 1-A of user A company to a primary system 1-N of user N company.

各正システムは、正システム1−Aについて代表的に説明するように、前記データ、OS、パッチ、アプリを蓄積するストレージ装置2−Aと、このストレージ装置2−Aに対してリード・ライト指示を行うサーバ3−Aを具備している。他のユーザの正システム1−B〜1−Nも同様にストレージ装置2−B〜2−Nと、サーバ3−B〜3−Nを具備している。   Each primary system, as will be described representatively with respect to the primary system 1-A, a storage device 2-A that stores the data, OS, patch, and application, and a read / write instruction to the storage device 2-A The server 3-A is provided. Similarly, the primary systems 1-B to 1-N of other users include storage apparatuses 2-B to 2-N and servers 3-B to 3-N.

センタ10は、前記正システム1で蓄積されたデータ、OS、パッチ、アプリを保持してバックアップするものであり、正システム1−A〜1−Nに設けられたストレージ装置2−A〜2−Nと同じ数で、ストレージ装置対応で同等の機能のバックアップ用のストレージ装置11−A′〜11−N′をセンタに設ける。すなわちストレージ装置2−Aと11A′とは同等の機能を有する。   The center 10 holds and backs up the data, OS, patches, and applications stored in the primary system 1, and the storage devices 2-A to 2- provided in the primary systems 1-A to 1-N. Backup storage apparatuses 11-A ′ to 11-N ′ having the same number as N and corresponding functions to the storage apparatus are provided in the center. That is, the storage apparatuses 2-A and 11A ′ have the same function.

管理サーバ12は、正システムが被災したとき、被災した正システムを認識するとともに、この正システムに対応するセンタ10内のバックアップ用のストレージ装置を選択し、前記バックアップ用のストレージ装置と、このストレージ装置に適当なサーバをハードウェアプール13より選択して組み合わせて副システムを構築して、業務を前記被災した正システムより引き継ぐ処理を行うものである。   When the primary system is damaged, the management server 12 recognizes the damaged primary system, selects a backup storage device in the center 10 corresponding to the primary system, and selects the backup storage device and the storage device. A server suitable for the apparatus is selected from the hardware pool 13 and combined to construct a sub-system, and processing for taking over the business from the damaged main system is performed.

管理サーバ12には制御部14、第1管理テーブル15、第2管理テーブル16、ネットワーク制御テーブル17が設けられ、制御部14には資源配置制御手段18、ネットワーク制御手段19が設けられている。   The management server 12 is provided with a control unit 14, a first management table 15, a second management table 16, and a network control table 17, and the control unit 14 is provided with resource allocation control means 18 and network control means 19.

前記制御部14はCPUで構成され、資源配置制御手段18、ネットワーク制御手段19は後述する制御を行うためのプログラムである。又第1管理テーブル15、第2管理テーブル16、ネットワーク制御テーブル17はメモリで構成されている。   The control unit 14 is composed of a CPU, and the resource allocation control unit 18 and the network control unit 19 are programs for performing control described later. The first management table 15, the second management table 16, and the network control table 17 are composed of memories.

ハードウェアプール13は、正システムが被災したとき、被災した正システムをバックアップするストレージ装置をバックアップ動作させるために必要な災害対策用サーバ13−a〜13−mを保持するものである。ハードウェア13に保持されている災害対策サーバ13−a〜13−mの台数mは、バックアップ用のストレージ装置11−A′〜11−N′の台数Nより少ない数でありN>mの関係にある。   The hardware pool 13 holds the disaster countermeasure servers 13-a to 13-m necessary for performing a backup operation of the storage device that backs up the damaged primary system when the primary system is damaged. The number m of the disaster countermeasure servers 13-a to 13-m held in the hardware 13 is smaller than the number N of the backup storage apparatuses 11-A ′ to 11-N ′, and the relationship N> m is satisfied. It is in.

第1管理テーブル15は、図10、図11に示す如く、正システムのシステム名(例えばA社システム)、正システムのサーバ名・機能、正システムのストレージ名、システム状態、センタのストレージ名、センタのサーバ名等が記入される。   As shown in FIGS. 10 and 11, the first management table 15 includes a system name of the primary system (for example, company A system), a server name / function of the primary system, a storage name of the primary system, a system state, a storage name of the center, The server name of the center is entered.

第2管理テーブル16は、図10、図11に示す如く、センタのサーバ名・機能、使用状況等が記入される。   As shown in FIGS. 10 and 11, the second management table 16 is filled with the server name / function of the center, the usage status, and the like.

管理テーブル15、16においては、Uモデルのサーバと、Iモデルのサーバが使用される例を示し、Uモデルのサーバと、Iモデルのサーバとは互換性がない場合を示している。   In the management tables 15 and 16, an example in which a U model server and an I model server are used is shown, and the U model server and the I model server are not compatible.

ネットワーク制御テーブル17は、災害発生のとき、センタ10のバックアップ用のストレージ装置に対応する災害対策サーバがハードウェアプールより選択されたとき、これらを接続するための接続回路を形成するためのルートを指示するものであり、これにより選択された災害対策サーバがバックアップ用のストレージ装置に正確に接続することができる。   When a disaster occurs, the network control table 17 indicates a route for forming a connection circuit for connecting the disaster countermeasure servers corresponding to the backup storage device of the center 10 from the hardware pool. Thus, the selected disaster countermeasure server can be accurately connected to the backup storage apparatus.

次に本発明の動作を図2〜図12にもとづき説明する。20はセンタ10におけるバックアップ用のストレージ11−A′、11−B′・・・11−N′と、災害対策サーバ13−a・・・13−b・・・13−mとを選択的に接続する接続回路網である。   Next, the operation of the present invention will be described with reference to FIGS. 20 selectively stores backup storages 11-A ′, 11-B ′... 11-N ′ and disaster countermeasure servers 13-a 13-b 13-m in the center 10. It is a connection network to be connected.

図2におけるストレージ装置A、B・・・Nは図1におけるストレージ装置2−A、2−B・・・2−Nに相当し、図2におけるサーバA、B・・・Nは図1におけるサーバ3−A、3−B、3−Nに相当する。図2におけるセンタ10のストレージ装置A′、B′・・・N′は、図1におけるストレージ装置11−A′、11−B′・・・11−N′に相当する。   2 corresponds to the storage devices 2-A, 2-B,... 2-N in FIG. 1, and the servers A, B,... N in FIG. It corresponds to the servers 3-A, 3-B, 3-N. The storage apparatuses A ′, B ′... N ′ of the center 10 in FIG. 2 correspond to the storage apparatuses 11-A ′, 11-B ′.

ストレージ装置Aは、後述するデータ、OS、パッチ、アプリが記憶される記憶部Aと、この記憶部Aに、サーバAの指示にもとづきリード・ライト動作を行うコントローラAを具備している。他のストレージ装置2−B、・・・2−Nも前記ストレージ装置2−Aと同様に、記憶部B・・・N及びコントローラB・・・Nを具備している。   The storage device A includes a storage unit A that stores data, OS, patches, and applications, which will be described later, and a controller A that performs a read / write operation based on instructions from the server A. Similarly to the storage apparatus 2-A, the other storage apparatuses 2-B,..., 2-N include storage units B.

センタ10に設けられるバックアップ用のストレージ装置A′も、後述するデータ、OS、パッチ、アプリが記憶される記憶部A′と、この記憶部A′に、前記データ、OS、パッチ、アプリをリード・ライト動作するコントローラA′を具備している。センタ10の他のストレージ装置11−B′・・・11−N′も、前記ストレージ装置11−A′と同様に、記憶部B′・・・N′及びコントローラB′・・・N′を具備している。   The storage device A ′ for backup provided in the center 10 also stores a storage unit A ′ for storing data, OS, patches, and applications, which will be described later, and reads the data, OS, patches, and applications to the storage unit A ′. A controller A ′ that performs a write operation is provided. Similarly to the storage apparatus 11-A ′, the other storage apparatuses 11-B ′... 11-N ′ of the center 10 also have storage units B ′... N ′ and controllers B ′. It has.

センタ10に設けられる災害対策サーバa、・・・mは、図1における災害対策サーバ13a・・・13mに相当する。   The disaster countermeasure servers a,... M provided in the center 10 correspond to the disaster countermeasure servers 13a.

接続回路網20は、管理サーバにおいて、バックアップ用のストレージ装置11−A′・・・11−N′と災害対策サーバa、b・・・mとの選択が行われたとき、これら選択にもとづく前記ストレージ装置と災害対策サーバとの接続回路を形成するものである。   When the management server selects the backup storage apparatuses 11-A ′... 11-N ′ and the disaster countermeasure servers a, b. A connection circuit between the storage apparatus and the disaster countermeasure server is formed.

図3に示す如く、本発明において各正システムが正常に動作している場合、サーバAはストレージ装置Aに対してリード・ライト制御を行う。そして記憶部Aにライトされたデータ、OS、パッチ、アプリは、ストレージ装置Aのリモートコピー機能によりセンタ10に設けられたバックアップ用のストレージ装置の記憶部A′に蓄積される。   As shown in FIG. 3, when each primary system is operating normally in the present invention, the server A performs read / write control on the storage apparatus A. The data, OS, patch, and application written in the storage unit A are accumulated in the storage unit A ′ of the backup storage device provided in the center 10 by the remote copy function of the storage device A.

同様に、正システムのストレージ装置B・・・Nに書き込まれたデータ、OS、パッチ、アプリ等はセンタのストレージ装置B′・・・N′に蓄積される。このとき接続回路網20はオフ状態であり、ストレージ装置A′、B′・・・N′は、災害対策サーバa、b・・・mのいずれとも接続状態ではない。   Similarly, data, OS, patches, applications, etc. written to the storage devices B... N of the primary system are accumulated in the storage devices B ′. At this time, the connection network 20 is off, and the storage apparatuses A ′, B ′... N ′ are not connected to any of the disaster countermeasure servers a, b.

本発明の正常時のバックアップデータを図4に示す。図4に示す如く、ストレージ装置BとサーバBを具備する正システムにおいて、記憶部Bに対し書込み処理が行われるとき、書込みデータは、図4に示す如く、いわゆるユーザのデータと、OS、パッチ、アプリ等で構成され、これらが記憶部Bに蓄積されるとき、同じバックアップ用のデータ、OS、パッチ、アプリがバックアップ用のストレージ装置の記憶部B′にも蓄積される。   The normal backup data of the present invention is shown in FIG. As shown in FIG. 4, in the main system including the storage apparatus B and the server B, when write processing is performed on the storage unit B, the write data includes so-called user data, OS, patch, as shown in FIG. When these are stored in the storage unit B, the same backup data, OS, patch, and application are also stored in the storage unit B ′ of the backup storage device.

本発明の災害発生時の動作を図5〜図9にもとづき説明する。   The operation of the present invention when a disaster occurs will be described with reference to FIGS.

図5に示す如く、サーバBとストレージ装置Bを具備する正システムに災害が発生したとき、管理サーバ12はこれを検知し、前記管理テーブル1、管理テーブル2を参照して、サーバBと同じ機能の災害対策サーバaを選択し、これをストレージ装置B′と接続制御する。   As shown in FIG. 5, when a disaster occurs in the main system including the server B and the storage apparatus B, the management server 12 detects this and refers to the management table 1 and the management table 2 to refer to the same as the server B. The function disaster countermeasure server a is selected and connected to the storage apparatus B ′.

それから図6に示す如く、災害対策サーバaは前記ストレージ装置B′の記憶部B′に蓄積されたデータ、OS、パッチ、アプリ等のバックアップ用のデータ等の読込みを行い、正システムの前記サーバBの代替として動作することができる。図7は前記ストレージ装置B′より、災害対策サーバaが読込んだバックアップ用のデータの詳細を示し、代替データが蓄積されているので、サーバaを使用してストレージ装置B′と共に副システムを構築できることがわかる。   Then, as shown in FIG. 6, the disaster countermeasure server a reads data stored in the storage unit B ′ of the storage apparatus B ′, backup data such as OS, patches, and applications, and the like, and the server of the primary system. Can operate as an alternative to B. FIG. 7 shows the details of the backup data read by the disaster countermeasure server a from the storage device B ′. Since the alternative data is stored, the server a is used to connect the secondary system together with the storage device B ′. You can see that it can be built.

これにより、図8に示す如く、正システムA(A社システム)、N(N社システム)はそれまで通りの構成で運用を行うが、正システムB(B社システム)では災害発生のため、今度はストレージ装置B′とサーバBの代わりの代替の災害対策サーバaを使用して副システムを構築して運用できる。   Thus, as shown in FIG. 8, the primary system A (Company A system) and N (Company N system) operate in the same configuration as before, but the primary system B (Company B system) has a disaster, This time, the secondary system can be constructed and operated using the disaster countermeasure server a instead of the storage device B ′ and the server B.

このとき、図9に示す如く、副システムでストレージ装置B′に蓄積されるものは、データ、OS、パッチ、アプリであり、図4に示す正常動作時のものと同一である。   At this time, as shown in FIG. 9, what is stored in the storage apparatus B ′ in the secondary system is data, OS, patches, and applications, which are the same as those in the normal operation shown in FIG.

本発明の動作処理を、図12にもとづき、説明する。   The operation process of the present invention will be described with reference to FIG.

S1.正システムやセンタ等を構築して運用開始に先立ち、各正システムのサーバA、B・・・Nが動作する前に、管理サーバ12は、対応するストレージ装置間のデータ(ここでは、データとはユーザのデータ、OS、パッチ、アプリ等を含めたものをいう。)の一致処理を行う。このため、正システムのサーバA、B・・・Nに対し正システムのストレージ装置A、B・・・Nとセンタ10のストレージ装置A′、B′・・・N′との内容を一致させるように指示し、一致動作が終わったら管理サーバ12に対し報告を求めることで、一致処理が可能となる。   S1. Prior to the start of operation by constructing the primary system or center, etc., before the servers A, B,... N of each primary system operate, the management server 12 receives data (in this case, data and Represents user data, OS, patch, application, etc.)). For this reason, the contents of the storage devices A, B... N of the primary system and the storage devices A ′, B ′. If the matching operation is completed, a report is requested from the management server 12 so that the matching process can be performed.

S2.管理サーバ12は全ての対応するストレージ装置間のデータが一致完了するのを待つ。   S2. The management server 12 waits for the data matching between all corresponding storage apparatuses to be completed.

S3.一致完了後、通常処理を開始する。   S3. After the match is completed, normal processing is started.

S4.正システムにおいて、例えばデータ書込み要求があれば次のS5に移り、書込み要求がなければ、後述するS6に移る。   S4. In the primary system, for example, if there is a data write request, the process proceeds to the next S5, and if there is no write request, the process proceeds to S6 described later.

S5.前記S4において、データ書込み要求があれば、正システムのストレージ装置に書込み処理を行い、また対応するストレージ装置(例えばストレージ装置Aについてはストレージ装置A′)に転送し、これに蓄積する。なおこの転送の際に、ストレージ装置Aの有するリモートコピー機能を使用すると、センタのサーバリソースを使用せずに済む。   S5. In S4, if there is a data write request, write processing is performed on the storage device of the primary system, and it is transferred to the corresponding storage device (for example, storage device A ′ for storage device A) and stored therein. In this transfer, if the remote copy function of the storage apparatus A is used, it is not necessary to use the server resource of the center.

S6.正システムが被災していなければ前記S3のマル1に戻り、次のデータ書込みを待つ。しかし被災すれば次のS7に移行する。正システムが被災すればセンタ10に通知があり、これを管理サーバ12が検出することで被災を認識できる。   S6. If the main system is not damaged, the process returns to S1 of S3 and waits for the next data write. However, if it is damaged, the process proceeds to the next S7. If the main system is damaged, the center 10 is notified, and the management server 12 can detect the damage and recognize the damage.

S7.例えば図 8で示す正システムB社システムが被災したことを管理サーバ12が検知すると、管理サーバ12は制御部(CPUで構成)がその資源配置制御手段18を制御して、第1管理テーブル15、第2管理テーブル16をアクセスして、B社システムのサーバBのサーバ名・機能等を認識して、これに適用できるセンタ10のハードウェアプール13で保持されているサーバがサーバaであることを認識し、センタ側サーバよりこのサーバbを選択する。そして管理サーバ12はネットワーク制御手段19を制御して、ネットワーク制御テーブル17をアクセスし、サーバaとストレージ装置B′とを選択接続するための接続回路網における接続データを得て、これらを選択制御する。これにより、センタ10では図5に示す如く、ストレージ装置B′とサーバaが接続され、副システムが構築される。   S7. For example, when the management server 12 detects that the main system B company system shown in FIG. 8 has been damaged, the control unit (configured by the CPU) of the management server 12 controls its resource allocation control means 18 and the first management table 15 , The second management table 16 is accessed to recognize the server name and function of the server B of the company B system, and the server held in the hardware pool 13 of the center 10 applicable to this is the server a. And the server b is selected from the center side server. Then, the management server 12 controls the network control means 19, accesses the network control table 17, obtains connection data in the connection circuit network for selectively connecting the server a and the storage device B ', and selects and controls them. To do. Thereby, in the center 10, as shown in FIG. 5, the storage apparatus B 'and the server a are connected, and a secondary system is constructed.

S8.次に、図6に示す如く、サーバaは対応するストレージ装置B′より、OS等の前記データの読込みを行う。   S8. Next, as shown in FIG. 6, the server a reads the data such as the OS from the corresponding storage apparatus B ′.

S9.この読込は完了するまで行う。   S9. This reading is performed until completion.

S10.読込が完了すると、図8に示す如く、サーバaとストレージ装置B′で構成されたセンタ側で構築された副システムを使用して通常処理を再開することができる。   S10. When the reading is completed, as shown in FIG. 8, normal processing can be resumed using a sub-system constructed on the center side composed of the server a and the storage apparatus B ′.

S11.このように副システムを使用して運用しているとき、被災システムが復旧すればこれが管理サーバ12に報告される。   S11. When operating using the secondary system in this way, if the damaged system is recovered, this is reported to the management server 12.

S12.これにより、今度は、副システム側のストレージ装置B′より正システムのサーバBに、OS、パッチ、アプリ、ユーザデータ等を転送し、正システムのストレージ装置Bのデータ内容と副システムのストレージ装置B′のデータ内容と一致させる。   S12. As a result, this time, the OS, patch, application, user data, etc. are transferred from the storage system B ′ on the secondary system side to the server B on the primary system. Match the data content of B '.

S13.一致すれば代替制御は全て完了となり、通常処理が開始でき、前記図12のマル1に移行できる。   S13. If they match, all the alternative controls are completed, the normal process can be started, and the process can move to the circle 1 in FIG.

本発明では、センタ側のストレージ装置の中に、対応する正システムのユーザのデータの外にOS、パッチ、アプリ等の正システムの稼動に必要なソフトデータを蓄えておくので、システム切替え時に割り当てられた災害対策サーバがそれを使用して起動することで、副システムとして迅速に稼動を開始することが可能である。   In the present invention, software data necessary for the operation of the primary system such as the OS, patches, and applications is stored in the storage device on the center side in addition to the corresponding primary system user data. When the prepared disaster countermeasure server is started using the server, it is possible to quickly start operation as a secondary system.

また、システムへの被災を考慮した災害対策システムを構築する際に、被災時に切換えるシステムすなわちセンタのシステムを共用することで、構築コストを削減できる。また物理的に離れた地点へ災害対策システムを構築することが困難なユーザにも、センタのシステムの共用により、災害対策システムの運用を可能とする。   Further, when building a disaster countermeasure system in consideration of damage to the system, the construction cost can be reduced by sharing the system to be switched at the time of the disaster, that is, the center system. In addition, users who have difficulty building a disaster countermeasure system at physically distant locations can operate the disaster countermeasure system by sharing the center system.

本発明の一実施の形態である。1 is an embodiment of the present invention. 本発明の構成状態説明図である。It is a configuration state explanatory view of the present invention. 本発明の正常時の動作説明図である。It is operation | movement explanatory drawing at the time of normal of this invention. 本発明のバックアップデータ説明図である。It is backup data explanatory drawing of this invention. 本発明の災害時の動作説明図である。It is operation | movement explanatory drawing at the time of disaster of this invention. 災害発生時の災害対策サーバの動作説明図(その1)である。It is operation | movement explanatory drawing (the 1) of the disaster countermeasure server at the time of disaster occurrence. 災害発生時の災害対策サーバの動作説明図(その2)である。It is operation | movement explanatory drawing (the 2) of the disaster countermeasure server at the time of disaster occurrence. 災害発生時の災害対策サーバの動作説明図(その3)である。It is operation | movement explanatory drawing (the 3) of the disaster countermeasure server at the time of disaster occurrence. 災害発生時の災害対策サーバの動作説明図(その4)である。It is operation | movement explanatory drawing (the 4) of the disaster countermeasure server at the time of disaster occurrence. 正常時の管理テーブル説明図である。It is a management table explanatory drawing at the time of normal. 災害発生時の管理テーブル説明図である。It is a management table explanatory drawing at the time of disaster occurrence. 本発明における管理サーバの動作説明図である。It is operation | movement explanatory drawing of the management server in this invention. 従来例説明図である。It is explanatory drawing of a prior art example.

符号の説明Explanation of symbols

1 正システム
10 センタ
12 管理サーバ
13 ハードウェアプール
14 制御部
15 第1管理テーブル
16 第2管理テーブル
17 ネットワーク制御テーブル
18 資源配置制御手段
19 ネットワーク制御手段
20 接続回路網
DESCRIPTION OF SYMBOLS 1 Primary system 10 Center 12 Management server 13 Hardware pool 14 Control part 15 1st management table 16 2nd management table 17 Network control table 18 Resource allocation control means 19 Network control means 20 Connection circuit network

Claims (2)

ストレージ装置とサーバを有する複数の正システムと、この正システムのストレージ装置と対応するストレージ装置を備えたセンタを具備する災害対策用コンピュータバックアップ方式において、
前記センタに、
正システムのストレージ装置に保持されたデータ、OS、パッチ、アプリケーションを保持し、正システムのストレージ装置と同一数のバックアップ用ストレージ装置と、
このバックアップ用ストレージ装置の数より少ない数の災害対策用サーバが配置された災害対策用サーバ群と、
正システムで使用されるストレージ装置の機能と、サーバの名称及び機能と、災害発生時に使用されたセンタのストレージ装置に接続されたセンタのサーバ名が記入された第1管理テーブルと、
センタのサーバの名称及び機能と、サーバの機能状態が記入される第2管理テーブルと、
前記第1管理テーブル及び第2管理テーブルを管理し、災害時にセンタにおいてバックアップ用のストレージ装置に使用されるバックアップ用のサーバが選択されたとき、前記ストレージ装置と前記バックアップ用のサーバとの接続路を示すネットワーク制御データを有するネットワーク制御テーブルを保持する管理サーバを具備し、
正システムに災害が発生したことが副センタに通知されたとき、前記管理サーバは前記正システムに対応するバックアップ用ストレージ装置に適する災害対策用サーバを、前記第1管理テーブル及び第2管理テーブルを参照して、前記災害対策用サーバ群より選択し、前記ネットワーク制御テーブルにもとづき、この災害対策用サーバを前記バックアップ用ストレージ装置に接続制御することを特徴とする災害対策用コンピュータバックアップ方式。
In a disaster recovery computer backup system comprising a plurality of primary systems having a storage device and a server, and a center provided with a storage device corresponding to the storage device of the primary system,
In the center,
The same number of backup storage devices as the primary system storage device, which holds the data, OS, patches, and applications held in the primary system storage device;
A disaster recovery server group in which a number of disaster recovery servers smaller than the number of backup storage devices are arranged;
A first management table in which the function of the storage device used in the primary system, the name and function of the server, and the name of the server of the center connected to the storage device of the center used in the event of a disaster;
A second management table in which the name and function of the center server and the function status of the server are entered;
A connection path between the storage device and the backup server when the first management table and the second management table are managed and a backup server used for the backup storage device is selected at the center in the event of a disaster A management server that holds a network control table having network control data indicating
When the secondary center is notified that a disaster has occurred in the primary system, the management server designates a disaster countermeasure server suitable for the backup storage device corresponding to the primary system as the first management table and the second management table. Referring to the disaster countermeasure server group, the disaster countermeasure computer backup system is selected from the disaster countermeasure server group, and connection control of the disaster countermeasure server to the backup storage device is performed based on the network control table.
前記正システムのストレージ装置は、書込されたデータ、OS、パッチ、アプリケーションをセンタのストレージ装置に転送するリモートコピー手段を有することを特徴とする請求項1記載の災害対策用コンピュータバックアップ方式。
2. The disaster countermeasure computer backup system according to claim 1, wherein the storage system of the primary system has remote copy means for transferring the written data, OS, patch, and application to the storage apparatus of the center.
JP2005281049A 2005-09-28 2005-09-28 Computer backup system for countermeasure against disaster Pending JP2007094604A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005281049A JP2007094604A (en) 2005-09-28 2005-09-28 Computer backup system for countermeasure against disaster

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005281049A JP2007094604A (en) 2005-09-28 2005-09-28 Computer backup system for countermeasure against disaster

Publications (1)

Publication Number Publication Date
JP2007094604A true JP2007094604A (en) 2007-04-12

Family

ID=37980277

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005281049A Pending JP2007094604A (en) 2005-09-28 2005-09-28 Computer backup system for countermeasure against disaster

Country Status (1)

Country Link
JP (1) JP2007094604A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243123A (en) * 2007-03-29 2008-10-09 Nec Corp Backup device, method, and program
WO2013027649A1 (en) 2011-08-19 2013-02-28 株式会社大塚商会 Virtual data center system
JPWO2014076838A1 (en) * 2012-11-19 2017-01-05 株式会社日立システムズ Virtual machine synchronization system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008243123A (en) * 2007-03-29 2008-10-09 Nec Corp Backup device, method, and program
WO2013027649A1 (en) 2011-08-19 2013-02-28 株式会社大塚商会 Virtual data center system
JPWO2014076838A1 (en) * 2012-11-19 2017-01-05 株式会社日立システムズ Virtual machine synchronization system

Similar Documents

Publication Publication Date Title
EP3694148B1 (en) Configuration modification method for storage cluster, storage cluster and computer system
JP4611922B2 (en) Control program, control method, and control apparatus
US7933987B2 (en) Application of virtual servers to high availability and disaster recovery solutions
US20170091221A1 (en) System and method for providing a virtualized replication and high availability environment
JP5352115B2 (en) Storage system and method for changing monitoring condition thereof
US8539087B2 (en) System and method to define, visualize and manage a composite service group in a high-availability disaster recovery environment
US20060179218A1 (en) Method, apparatus and program storage device for providing geographically isolated failover using instant RAID swapping in mirrored virtual disks
US9052833B2 (en) Protection of former primary volumes in a synchronous replication relationship
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
US11650891B2 (en) Preventing non-detectable data loss during site switchover
JP2005267216A (en) Storage remote copying method and information processing system
CN104102535B (en) Process migration method and transportable operating system
US9367409B2 (en) Method and system for handling failures by tracking status of switchover or switchback
JP4491482B2 (en) Failure recovery method, computer, cluster system, management computer, and failure recovery program
CN110557413A (en) Business service system and method for providing business service
US11144374B2 (en) Data availability in a constrained deployment of a high-availability system in the presence of pending faults
JP2006277205A (en) Storage system and its control method and control program
US11372557B2 (en) Extra-resilient cache for resilient storage array
US11182252B2 (en) High availability state machine and recovery
JP2007094604A (en) Computer backup system for countermeasure against disaster
JP2008276281A (en) Data synchronization system, method, and program
JP5947974B2 (en) Information processing apparatus, information processing apparatus exchange support system, and exchange support method
CN115858679A (en) Data synchronization method, device, equipment and medium between data centers
JP2023151189A (en) Storage system and method for controlling the same
CN116684261A (en) Cluster architecture control method and device, storage medium and electronic equipment

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090529

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090616

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091110