JP2023001446A - Control system, method, and program - Google Patents

Control system, method, and program Download PDF

Info

Publication number
JP2023001446A
JP2023001446A JP2021102170A JP2021102170A JP2023001446A JP 2023001446 A JP2023001446 A JP 2023001446A JP 2021102170 A JP2021102170 A JP 2021102170A JP 2021102170 A JP2021102170 A JP 2021102170A JP 2023001446 A JP2023001446 A JP 2023001446A
Authority
JP
Japan
Prior art keywords
time
site
main site
operating state
main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021102170A
Other languages
Japanese (ja)
Inventor
美由紀 駒形
Miyuki Komagata
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2021102170A priority Critical patent/JP2023001446A/en
Publication of JP2023001446A publication Critical patent/JP2023001446A/en
Pending legal-status Critical Current

Links

Images

Abstract

To provide a control system that suppresses simultaneous operations of a host computer of a main site and a host computer of a backup site.SOLUTION: A control system includes operation state confirmation means that compares a last transfer time of data transferred from a first storage unit included in a main site to a second storage unit included in a backup site for replication with a previous confirmation time indicating a time when an operation state was previously confirmed to confirm the operation state of the main site, and control means that controls operation of the backup site based on the operation state of the main site.SELECTED DRAWING: Figure 1

Description

本開示は、制御システム等に関する。 The present disclosure relates to control systems and the like.

情報システムを利用する企業において、障害発生時の事業継続の観点から、待機システムが設置されることがある。例えば、メインサイトの他に、待機システムとして、メインサイトと同等の冗長化構成のバックアップサイトが設けられる。メインサイトにおいて、例えば災害による障害が発生した場合、企業はバックアップサイトを用いて業務を継続できる。 A company that uses an information system sometimes installs a standby system from the viewpoint of business continuity in the event of a failure. For example, in addition to the main site, a backup site having a redundant configuration equivalent to that of the main site is provided as a standby system. In the event of a disaster, for example, at the main site, the company can continue operations using the backup site.

システムの冗長化は、多くの費用が掛かる対策である。したがって、図11に示すように、平常時にバックアップサイトを使用しないことを前提として費用低減を図る価格モデルが用意されるケースがある。 System redundancy is a costly measure. Therefore, as shown in FIG. 11, there are cases where a pricing model is prepared to reduce costs on the premise that the backup site is not used during normal times.

平常時にバックアップサイトを使用していないことを確認する方法として、バックアップサイトからネットワークを介してメインサイトの死活監視を行う方法が考えられる。メインサイトの稼働が確認された場合は、バックアップサイトは稼働できないように制御される。 A conceivable method for confirming that the backup site is not in use during normal times is to perform life-and-death monitoring of the main site via the network from the backup site. If the operation of the main site is confirmed, the backup site will be controlled so that it cannot operate.

本開示に関連する技術として、特許文献1には、ノードの運用コストを抑制するクラスタシステムが開示されている。特許文献1において、スタンバイノードの起動後、同期データを取得し、同期が完了するとスタンバイノードは自らシャットダウンしてノードを停止する。特許文献1において、他のノードの稼働状況を確認するために、ノード間で協働して、例えばハートビート通信などが行われる。 As a technique related to the present disclosure, Patent Literature 1 discloses a cluster system that reduces node operation costs. In Japanese Unexamined Patent Application Publication No. 2002-200010, after the standby node is activated, the synchronization data is acquired, and when the synchronization is completed, the standby node itself shuts down to stop the node. In Japanese Unexamined Patent Application Publication No. 2002-201000, heartbeat communication, for example, is performed in cooperation between nodes in order to confirm the operation status of other nodes.

国際公開第2017/047065号WO2017/047065

バックアップサイトからネットワークを介してメインサイトの死活監視を行う場合に、故意にメインサイトの稼働を確認できない状況にする不正が発生しうる。例えば、死活監視で使用するネットワークのケーブルが外されると、メインサイトが稼働中にもかかわらず、メインサイトがダウンしているとみなされる。したがって、メインサイトとバックアップサイトの同時稼働が可能となる場合がある。 When the main site is alive and alive monitored from the backup site via the network, there is a possibility of fraud that intentionally makes it impossible to check the operation of the main site. For example, if the cable of the network used for life-and-death monitoring is disconnected, the main site is considered to be down even though the main site is in operation. Therefore, simultaneous operation of the main site and the backup site may be possible.

特許文献1において、この点は特に言及されていない。 Patent Document 1 does not particularly mention this point.

本開示は、メインサイトのホストコンピュータとバックアップサイトのホストコンピュータの同時稼働を抑制する制御システム等を提供することを目的とする。 An object of the present disclosure is to provide a control system or the like that suppresses simultaneous operation of a host computer at a main site and a host computer at a backup site.

本開示に係る制御システムは、メインサイトが備える第1の記憶部からバックアップサイトが備える第2の記憶部へレプリケーションのために転送されたデータの最終転送時刻と、前回メインサイトの稼働状態を確認した時刻を示す前回確認時刻とを比較することで、メインサイトの稼働状態を確認する稼働状態確認手段と、前記メインサイトの稼働状態に基づいて、前記バックアップサイトの稼働を制御する制御手段と、を備える制御システム。 The control system according to the present disclosure includes the final transfer time of data transferred from the first storage unit provided at the main site to the second storage unit provided at the backup site for replication, and the time at which the operating state of the main site was last checked. and a control means for controlling the operation of the backup site based on the operation status of the main site. .

本開示に係る制御方法は、メインサイトが備える第1の記憶部からバックアップサイトが備える第2の記憶部へレプリケーションのために転送されたデータの最終転送時刻と、前回メインサイトの稼働状態を確認した時刻を示す前回確認時刻とを比較することで、メインサイトの稼働状態を確認し、前記メインサイトの稼働状態に基づいて、前記バックアップサイトの稼働を制御する。 The control method according to the present disclosure includes the final transfer time of data transferred from the first storage unit provided at the main site to the second storage unit provided at the backup site for replication, and the time at which the operating status of the main site was last checked. By comparing with the previous confirmation time indicating , the operation status of the main site is confirmed, and the operation of the backup site is controlled based on the operation status of the main site.

本開示に係る制御プログラムは、メインサイトが備える第1の記憶部からバックアップサイトが備える第2の記憶部へレプリケーションのために転送されたデータの最終転送時刻と、前回メインサイトの稼働状態を確認した時刻を示す前回確認時刻とを比較することで、メインサイトの稼働状態を確認する処理と、前記メインサイトの稼働状態に基づいて、前記バックアップサイトの稼働を制御する処理と、をコンピュータに実行させる。 The control program according to the present disclosure includes the final transfer time of data transferred from the first storage unit provided at the main site to the second storage unit provided at the backup site for replication, and the time at which the operating state of the main site was last checked. A computer is caused to execute a process of confirming the operating state of the main site by comparing with the previous confirmation time indicating the and a process of controlling the operation of the backup site based on the operating state of the main site.

本開示によれば、メインサイトのホストコンピュータとバックアップサイトのホストコンピュータの同時稼働を抑制する制御システム等を提供できる。 According to the present disclosure, it is possible to provide a control system or the like that suppresses simultaneous operation of the host computer at the main site and the host computer at the backup site.

一実施形態に係るシステム構成を示すブロック図である。1 is a block diagram showing a system configuration according to one embodiment; FIG. ディスク定義情報330の例を示す図である。3 is a diagram showing an example of disk definition information 330. FIG. 稼働状態管理テーブル340の例を示す図である。3 is a diagram showing an example of an operating state management table 340; FIG. ディスク状態管理テーブル350の例を示す図である。3 is a diagram showing an example of a disk state management table 350; FIG. 転送状態管理テーブル403の例を示す図である。4 is a diagram showing an example of a transfer status management table 403; FIG. ホストコンピュータ300の動作例を示すフローチャートである。4 is a flowchart showing an operation example of the host computer 300; 更新されたディスク状態管理テーブル350の例を示す図である。FIG. 13 is a diagram showing an example of an updated disk status management table 350; FIG. 転送状態管理テーブル403の他の例を示す図である。FIG. 12 is a diagram showing another example of the transfer status management table 403; FIG. 更新されたディスク状態管理テーブル350の例を示す図である。FIG. 13 is a diagram showing an example of an updated disk status management table 350; FIG. 稼働状態管理テーブル340の他の例を示す図である。FIG. 13 is a diagram showing another example of the operating state management table 340; FIG. 冗長化システムの運用例を示す図である。It is a figure which shows the operation example of a redundancy system. コンピュータ500のハードウェア構成の例を示すブロック図である。5 is a block diagram showing an example of the hardware configuration of computer 500. FIG.

本開示の実施形態の構成について図面を参照して説明する。図1は、一実施形態に係るシステム構成を示すブロック図である。一実施形態に係るシステムは、メインサイトと、バックアップサイトとの2つのサイトを含む。メインサイトは稼働系とも呼ばれ、バックアップサイトは待機系とも呼ばれる。 A configuration of an embodiment of the present disclosure will be described with reference to the drawings. FIG. 1 is a block diagram showing the system configuration according to one embodiment. A system according to one embodiment includes two sites, a main site and a backup site. The main site is also called an active system, and the backup site is also called a standby system.

本実施形態において、メインサイト非稼働状態でのバックアップサイトの稼働は許可される。平常時の、メインサイト稼働状態でのバックアップサイトの稼働は不正利用と判断され、稼働が抑止される。 In this embodiment, operation of the backup site is permitted while the main site is not in operation. Operation of the backup site during normal operation of the main site is determined to be unauthorized use, and its operation is deterred.

メインサイトは、ホストコンピュータ100と、メインストレージ200とを有する。ホストコンピュータ100は、プログラム制御により動作する。 The main site has a host computer 100 and main storage 200 . The host computer 100 operates under program control.

メインストレージ200は、1以上のメインディスク201を備える。図1において、メインストレージ200は、複数のメインディスク201(2011、2012、2013)を備える。 The main storage 200 comprises one or more main disks 201 . In FIG. 1, the main storage 200 comprises a plurality of main disks 201 (2011, 2012, 2013).

メインサイトとバックアップサイト間は、ネットワーク600で接続される。なお、ネットワーク600は、有線ネットワークでもよいし、無線ネットワークでもよい。メインストレージ200は、メインディスク201に記憶されたデータのレプリケーションを実行するために、ネットワーク600を介してバックアップサイトへデータを転送する。 A network 600 connects the main site and the backup site. Note that the network 600 may be a wired network or a wireless network. The main storage 200 transfers data to the backup site via the network 600 in order to replicate data stored in the main disk 201 .

バックアップサイトは、ホストコンピュータ300と、複製ストレージ400とを有する。ホストコンピュータ300は、プログラム制御により動作する。バックアップサイトは、任意のタイミングでホストコンピュータ300が起動されることにより稼働する。ホストコンピュータ300は、例えば、ユーザにより起動される。 The backup site has a host computer 300 and a replication storage 400 . The host computer 300 operates under program control. The backup site operates by activating the host computer 300 at arbitrary timing. The host computer 300 is activated, for example, by a user.

一実施形態において、ホストコンピュータ300は、稼働状態確認部310、ストレージアクセス部320、および、制御部360を備える。 In one embodiment, the host computer 300 comprises an operating status checker 310 , a storage accesser 320 and a controller 360 .

稼働状態確認部310は、メインサイトの稼働状態を確認する。バックアップサイト稼働後、稼働状態確認部310は、定期的に動作してもよい。定期的な動作とは、例えば、一定間隔での動作や、時刻指定の動作を含む。 The operating state confirmation unit 310 confirms the operating state of the main site. After the backup site is put into operation, the operation status confirmation unit 310 may operate periodically. Regular operations include, for example, operations at regular intervals and operations at specified times.

ストレージアクセス部320は、複製ストレージ400に対して、読み込み、および、書き込みを行う。 The storage access unit 320 reads from and writes to the replication storage 400 .

制御部360は、バックアップサイトの稼働、稼働の継続、および、稼働の停止を制御する。具体的には、制御部360は、ホストコンピュータ300の稼働を制御する。 The control unit 360 controls operation, continuation of operation, and suspension of operation of the backup site. Specifically, the control unit 360 controls operation of the host computer 300 .

ホストコンピュータ300は、ディスク定義情報330、稼働状態管理テーブル340、ディスク状態管理テーブル350を記憶する。ディスク定義情報330、稼働状態管理テーブル340、および、ディスク状態管理テーブル350は、例えば、不揮発性のメモリに記憶される。 The host computer 300 stores disk definition information 330 , an operating state management table 340 and a disk state management table 350 . The disk definition information 330, operating state management table 340, and disk state management table 350 are stored in, for example, non-volatile memory.

ディスク定義情報330は、監視対象とする1つ以上のディスクのディスク識別子を含む。図2は、ディスク定義情報330の例を示す図である。 The disk definition information 330 includes disk identifiers of one or more disks to be monitored. FIG. 2 is a diagram showing an example of the disk definition information 330. As shown in FIG.

なお、監視対象とするディスクの選択方法は特に限定されない。例えば、被災時にバックアップサイトで使用する業務ディスクとする方式、メインサイトにおけるディスクのアクセス状況を格納するディスクとする方式、および、前記の両方式を組み合わせる方式、などが考えられる。 Note that the method of selecting disks to be monitored is not particularly limited. For example, a method of using a business disk to be used at a backup site in the event of a disaster, a method of using a disk for storing the access status of the disk at the main site, and a method of combining the above two methods can be considered.

稼働状態管理テーブル340は、初期起動時刻と稼働状態確認時刻を記憶する。稼働状態管理テーブル340は、システム起動時に初期起動時刻を記憶し、稼働状態が確認されるごとに稼働状態確認時刻を記憶する。稼働状態管理テーブル340は、システム起動時にテーブルを初期化してもよい。図3は、稼働状態管理テーブル340の例を示す図である。 The operating state management table 340 stores initial activation time and operating state confirmation time. The operating state management table 340 stores the initial startup time when the system is started, and stores the operating state confirmation time each time the operating state is confirmed. The operating state management table 340 may be initialized when the system is started. FIG. 3 is a diagram showing an example of the operating state management table 340. As shown in FIG.

ディスク状態管理テーブル350は、ディスク識別子と、該当するディスクの最終転送時刻を記憶する。図4は、ディスク状態管理テーブル350の例を示す図である。 The disk status management table 350 stores the disk identifier and the last transfer time of the corresponding disk. FIG. 4 is a diagram showing an example of the disk status management table 350. As shown in FIG.

複製ストレージ400は、1以上の複製ディスク401と、ストレージ制御部402と、を備える。図1において、複製ストレージ400は、複数の複製ディスク401(4011、4012、4013)を備える。複製ストレージ400は、転送状態管理テーブル403を記憶する。 The replicated storage 400 comprises one or more replicated disks 401 and a storage controller 402 . In FIG. 1, the replication storage 400 comprises multiple replication disks 401 (4011, 4012, 4013). The replication storage 400 stores a transfer status management table 403. FIG.

ストレージ制御部402は、複製ストレージ400全体を制御し、複製ディスク401の転送状態に応じて転送状態管理テーブル403を更新する。 The storage control unit 402 controls the entire replication storage 400 and updates the transfer status management table 403 according to the transfer status of the replication disk 401 .

転送状態管理テーブル403は、複製ディスク401のレプリケート状態とメインディスク201から複製ディスク401に対するデータ転送の最終転送時刻を記憶する。図5は、転送状態管理テーブル403の例を示す図である。 The transfer status management table 403 stores the replication status of the replication disk 401 and the final transfer time of data transfer from the main disk 201 to the replication disk 401 . FIG. 5 is a diagram showing an example of the transfer status management table 403. As shown in FIG.

稼働状態確認部310は、さらに、データ転送状態取得部311と、転送時刻抽出部312とを備えてもよい。 The operating state confirmation unit 310 may further include a data transfer state acquisition unit 311 and a transfer time extraction unit 312 .

データ転送状態取得部311は、監視対象とする複製ディスク401の転送状態を、転送状態管理テーブル403から取得する。 The data transfer status acquisition unit 311 acquires the transfer status of the copy disk 401 to be monitored from the transfer status management table 403 .

例えば、データ転送状態取得部311は、ストレージアクセス部320を介して、ディスク定義情報330に定義されているディスクの情報を、転送状態管理テーブル403から取得する。データ転送状態取得部311は、例えば、取得した情報をディスク状態管理テーブル350に記憶する。 For example, the data transfer status acquisition unit 311 acquires disk information defined in the disk definition information 330 from the transfer status management table 403 via the storage access unit 320 . The data transfer status acquisition unit 311 stores the acquired information in the disk status management table 350, for example.

転送時刻抽出部312は、監視対象とする複製ディスク401の中から最新の転送時刻を抽出する。 The transfer time extraction unit 312 extracts the latest transfer time from the copy disk 401 to be monitored.

例えば、転送時刻抽出部312は、ディスク状態管理テーブル350から全ての監視対象ディスクの中で一番転送時刻が遅いディスクの転送時刻を抽出する。 For example, the transfer time extraction unit 312 extracts the transfer time of the disk with the latest transfer time among all the monitored disks from the disk status management table 350 .

稼働状態確認部310は、転送時刻抽出部312が抽出した転送時刻と前回確認時刻との比較を行う。 The operating state confirmation unit 310 compares the transfer time extracted by the transfer time extraction unit 312 with the previous confirmation time.

稼働状態確認部310は、前回確認時刻よりも転送時刻が新しい場合、メインサイト稼働状態と判断し、制御部360は、ホストコンピュータ300を停止する。稼働状態確認部310は、前回確認時刻よりも転送時刻が古い場合、メインサイト非稼働状態と判断する。さらに稼働状態確認部310は、稼働状態管理テーブル340の中の稼働状態確認時刻を更新し、制御部360は、ホストコンピュータ300を処理継続させる。 If the transfer time is newer than the previous confirmation time, the operating state confirmation unit 310 determines that the main site is in the operating state, and the control unit 360 stops the host computer 300 . When the transfer time is older than the previous confirmation time, the operating state confirmation unit 310 determines that the main site is in the non-operating state. Furthermore, the operating state confirmation unit 310 updates the operating state confirmation time in the operating state management table 340, and the control unit 360 allows the host computer 300 to continue processing.

なお、バックアップサイトにてメインサイトとの同時稼働を検出した場合のシステム停止条件と、停止方法については、多種の運用が考えられるため、本開示では特に言及しない。 Note that the present disclosure will not particularly mention the conditions for stopping the system and the method of stopping the system when simultaneous operation with the main site is detected at the backup site, because various operations are conceivable.

次に、実施形態の動作について詳細に説明する。 Next, operation of the embodiment will be described in detail.

図6は、ホストコンピュータ300の動作例を示すフローチャートである。 FIG. 6 is a flow chart showing an operation example of the host computer 300 .

例えば、ホストコンピュータ300は、バックアップサイト稼働後、定期的に図6に示す処理を行う。 For example, the host computer 300 periodically performs the processing shown in FIG. 6 after the backup site starts operating.

まず、図6に示す処理の概要を説明する。 First, the outline of the processing shown in FIG. 6 will be described.

最初に、データ転送状態取得部311は、ディスク定義情報330を参照し、監視対象とする複製ディスク401を確認する(ステップS1)。 First, the data transfer status acquisition unit 311 refers to the disk definition information 330 and confirms the copy disk 401 to be monitored (step S1).

データ転送状態取得部311は、ストレージアクセス部320を介して、転送状態管理テーブル403から、監視対象ディスクに該当する転送状態として、レプリケート状態とデータ転送の最終転送時刻を取得する(ステップS2)。データ転送状態取得部311は、監視対象ディスクが複数存在する場合は全てのディスクの転送状態を取得する。 The data transfer state acquisition unit 311 acquires the replication state and the final transfer time of data transfer as the transfer state corresponding to the monitored disk from the transfer state management table 403 via the storage access unit 320 (step S2). The data transfer status acquisition unit 311 acquires the transfer status of all disks when there are a plurality of monitored disks.

次に、転送時刻抽出部312は、転送状態を取得した監視対象ディスクの中から最新の転送時刻を抽出する(ステップS3)。 Next, the transfer time extraction unit 312 extracts the latest transfer time from among the monitored disks whose transfer states have been acquired (step S3).

稼働状態確認部310が初めて動作した場合は前回稼働状態確認時刻の情報がないため(ステップS4:YES)、転送時刻抽出部312は、前回稼働状態確認時刻に起動時刻を設定する(ステップS5)。 When the operating state confirmation unit 310 operates for the first time, there is no information on the previous operating state confirmation time (step S4: YES), so the transfer time extraction unit 312 sets the startup time to the previous operation state confirmation time (step S5). .

稼働状態確認部310は、ステップS3において抽出した最新転送時刻と前回稼働確認時刻とを比較する(ステップS6)。前回確認時刻よりも転送時刻が古い場合、メインサイトは稼働していない状態と判断する(ステップS7)。稼働状態管理テーブル340の中の稼働状態確認時刻を現在の時刻で更新し(ステップS8)、制御部360は、ホストコンピュータ300を処理継続させる。前回確認時刻よりも転送時刻が新しい場合、メインサイト稼働状態と判断し(ステップS9)、ホストコンピュータ300は停止する。 The operating state confirmation unit 310 compares the latest transfer time extracted in step S3 with the previous operation confirmation time (step S6). If the transfer time is older than the previous confirmation time, it is determined that the main site is not in operation (step S7). The operating state confirmation time in the operating state management table 340 is updated with the current time (step S8), and the control unit 360 causes the host computer 300 to continue processing. If the transfer time is newer than the previous confirmation time, it is determined that the main site is in operation (step S9), and the host computer 300 stops.

次に、具体例を用いて図6の動作を説明する。 Next, the operation of FIG. 6 will be described using a specific example.

まず、平常時の動作を説明する。平常時、メインサイトのホストコンピュータ100が稼働し、メインストレージ200から複製ストレージ400にデータが転送されている状態で、バックアップサイトのホストコンピュータ300が稼働する。 First, normal operation will be described. During normal times, the host computer 100 at the main site operates and the host computer 300 at the backup site operates while data is being transferred from the main storage 200 to the replication storage 400 .

バックアップサイト稼働後、ステップS1において、データ転送状態取得部311は、図3のディスク定義情報330を参照し、監視対象の複製ディスクがDISK1とDISK2であることを確認する。 After the backup site starts operating, in step S1, the data transfer status acquisition unit 311 refers to the disk definition information 330 in FIG. 3 and confirms that the copy disks to be monitored are DISK1 and DISK2.

ステップS2において、データ転送状態取得部311は、図5の転送状態管理テーブル403から、監視対象ディスクに該当するDISK1とDISK2の転送状態を取得する。具体的には、データ転送状態取得部311は、例えば、ストレージアクセス部320が読み込んだ、監視対象ディスクのレプリケート状態とデータ転送の最終転送時刻とを取得する。 In step S2, the data transfer state acquisition unit 311 acquires the transfer states of DISK1 and DISK2, which correspond to the monitored disks, from the transfer state management table 403 of FIG. Specifically, the data transfer status acquisition unit 311 acquires, for example, the replication status of the monitored disk and the final transfer time of the data transfer read by the storage access unit 320 .

データ転送状態取得部311は、例えば、ストレージアクセス部320が読み込んだ転送状態をディスク状態管理テーブル350に記憶させる。図7は、更新されたディスク状態管理テーブル350の例を示す図である。 The data transfer state acquisition unit 311 stores the transfer state read by the storage access unit 320 in the disk state management table 350, for example. FIG. 7 is a diagram showing an example of the updated disk status management table 350. As shown in FIG.

次に、ステップS3において、転送時刻抽出部312は、データ転送状態取得部311が取得した監視対象ディスクDISK1とDISK2の転送状態のうち、最新の転送時刻である「2020/05/20 09:05:05」を抽出する。 Next, in step S3, the transfer time extraction unit 312 extracts the latest transfer time "2020/05/20 09:05" from among the transfer states of the monitored disks DISK1 and DISK2 acquired by the data transfer state acquisition unit 311. :05”.

ステップS4において、稼働状態確認部310の初回動作の場合、図3に示すように、稼働状態管理テーブル340の前回稼働状態確認時刻の情報がない。したがって、ステップS5において、転送時刻抽出部312は、起動時刻である「2020/05/20 09:00:00」を前回稼働状態確認時刻に設定する。 In step S4, in the case of the initial operation of the operating state confirmation unit 310, as shown in FIG. Therefore, in step S5, the transfer time extraction unit 312 sets the activation time "2020/05/20 09:00:00" as the previous operating state check time.

ステップS6において、稼働状態確認部310は、ステップS3で抽出した最新転送時刻「2020/05/20 09:05:05」と前回稼働確認時刻「2020/05/20 09:00:00」との比較を行う。前回確認時刻よりも転送時刻が新しいため、ステップS9において、稼働状態確認部310は、メインサイト稼働状態と判断し、制御部360は、ホストコンピュータ300を停止する。 In step S6, the operation status confirmation unit 310 checks the latest transfer time "2020/05/20 09:05:05" extracted in step S3 and the previous operation confirmation time "2020/05/20 09:00:00". make a comparison. Since the transfer time is newer than the previous confirmation time, in step S<b>9 the operation state confirmation unit 310 determines that the main site is in operation state, and the control unit 360 stops the host computer 300 .

次に、メインサイトにおける障害発生時の動作を説明する。障害発生時とは、例えば、メインサイトが被災し、非稼働状態となった場合を含むが、これには限られない。障害発生時、メインサイトのホストコンピュータ100が停止し、メインストレージ200から複製ストレージ400にデータが転送されていない状態で、バックアップサイトのホストコンピュータ300が稼働する。 Next, the operation when a failure occurs at the main site will be described. The occurrence of a failure includes, but is not limited to, the case where the main site is damaged and becomes non-operational. When a failure occurs, the host computer 100 at the main site stops and the host computer 300 at the backup site operates while data is not being transferred from the main storage 200 to the replication storage 400 .

平常時の動作と同様に、ステップS1において、データ転送状態取得部311は、ディスク定義情報330を参照し、監視対象とする複製ディスクであるDISK1とDISK2を確認する。 As in the normal operation, in step S1, the data transfer status acquisition unit 311 refers to the disk definition information 330 and confirms DISK1 and DISK2, which are copy disks to be monitored.

図8は、転送状態管理テーブル403の他の例を示す図である。 FIG. 8 is a diagram showing another example of the transfer status management table 403. As shown in FIG.

ステップS2において、データ転送状態取得部311は、例えば、図8に示す転送状態管理テーブル403から、監視対象ディスクに該当するDISK1とDISK2の転送状態を取得する。具体的には、データ転送状態取得部311は、ストレージアクセス部320が読み込んだ、監視対象ディスクのレプリケート状態とデータ転送の最終転送時刻とを取得する。 In step S2, the data transfer status acquisition unit 311 acquires the transfer statuses of DISK1 and DISK2, which correspond to the monitored disks, from the transfer status management table 403 shown in FIG. 8, for example. Specifically, the data transfer status acquisition unit 311 acquires the replication status of the monitored disk and the final transfer time of the data transfer read by the storage access unit 320 .

データ転送状態取得部311は、例えば、転送状態をディスク状態管理テーブル350に記憶させる。図9は、更新されたディスク状態管理テーブル350の例を示す図である。 The data transfer status acquisition unit 311 stores the transfer status in the disk status management table 350, for example. FIG. 9 is a diagram showing an example of the updated disk status management table 350. As shown in FIG.

次に、ステップS3において、転送時刻抽出部312は、転送状態を取得した監視対象ディスクDISK1とDISK2のうち、最新の転送時刻である「2020/06/10 13:15:00」を抽出する。 Next, in step S3, the transfer time extraction unit 312 extracts the latest transfer time "2020/06/10 13:15:00" from the monitoring target disks DISK1 and DISK2 whose transfer states have been acquired.

図10は、稼働状態管理テーブル340の他の例を示す図である。ステップS4において、初回動作でない場合、稼働状態管理テーブル340の前回稼働状態確認時刻の情報として「2020/06/10 13:15:10」が存在する。 FIG. 10 is a diagram showing another example of the operating state management table 340. As shown in FIG. In step S4, if it is not the first operation, "2020/06/10 13:15:10" exists as the information of the last operating state confirmation time in the operating state management table 340. FIG.

ステップS6において、稼働状態確認部310は、ステップS3で抽出した最新転送時刻「2020/06/10 13:15:00」と前回稼働確認時刻「2020/06/10 13:15:10」との比較を行う。前回確認時刻よりも転送時刻が古いため、ステップS7において、稼働状態確認部310は、メインサイトは稼働していない状態と判断する。さらに、ステップS8において、稼働状態確認部310は、稼働状態管理テーブル340の中の稼働状態確認時刻を現在の時刻で更新し、制御部360は、ホストコンピュータ300の処理を継続させる。 In step S6, the operation status confirmation unit 310 checks the latest transfer time "2020/06/10 13:15:00" extracted in step S3 and the previous operation confirmation time "2020/06/10 13:15:10". make a comparison. Since the transfer time is older than the previous confirmation time, in step S7, the operation state confirmation unit 310 determines that the main site is not in operation. Furthermore, in step S8, the operating state confirmation unit 310 updates the operating state confirmation time in the operating state management table 340 with the current time, and the control unit 360 causes the host computer 300 to continue processing.

以上の動作により、メインサイト稼働時はバックアップサイトの稼働を抑制することが可能となる。 By the operation described above, it is possible to suppress the operation of the backup site when the main site is in operation.

本実施形態によれば、故意にメインサイトの稼働を確認できない状況にする、バックアップサイトの不正使用を抑制できる。 According to this embodiment, it is possible to suppress unauthorized use of the backup site, which intentionally makes it impossible to check the operation of the main site.

その理由は、ストレージのレプリケーションによるメインサイトからバックアップサイトへのデータ転送状態を、メインサイトの稼働状態の判断に使用するためである。 The reason is that the state of data transfer from the main site to the backup site by storage replication is used to determine the operating state of the main site.

なお、故意にレプリケーションを停止(分離状態に)することで、バックアップサイトの稼働は可能となる。しかし、故意にレプリケーションを停止して不正にバックアップサイトを不正使用した場合は、メインサイトで更新された業務データがバックアップサイトに転送されない。データが転送されない状態でメインサイトが被災した場合は、バックアップサイトでの業務継続が困難となり、業務復旧に時間を要する、というリスクを伴うため、不正使用を抑制できる。 By intentionally stopping replication (separating), the backup site can be operated. However, if replication is intentionally stopped and the backup site is illegally used, business data updated at the main site will not be transferred to the backup site. If the main site is hit by a disaster while data is not being transferred, it will be difficult to continue operations at the backup site, and there is a risk that it will take time to restore operations, so unauthorized use can be suppressed.

なお、複数コンピュータのライセンスを管理する一般的な方法としては、ネットワークで接続されたライセンス管理サーバを通じて利用環境を管理する方式がある。この方式は、フローティングライセンス、または、ネットワークライセンスとも呼ばれる。この管理方式では、同時使用可能なライセンス数の上限を超えてシステムが利用されることを制限できる。したがって、ライセンス数を1に設定することにより、メインサイトとバックアップサイトでの同時起動を不可とすることが可能である。しかし、この方式の場合、ライセンス管理サーバを別に用意する必要があり、サーバの運用管理が煩雑となるという問題がある。 As a general method of managing licenses for multiple computers, there is a method of managing usage environments through a license management server connected via a network. This method is also called floating license or network license. With this management method, it is possible to restrict the system from being used in excess of the maximum number of licenses that can be used simultaneously. Therefore, by setting the number of licenses to 1, it is possible to disable simultaneous activation at the main site and the backup site. However, in the case of this method, it is necessary to prepare a license management server separately, and there is a problem that the operation management of the server becomes complicated.

本実施形態によれば、メインサイトからバックアップサイトへのストレージのレプリケーションによるデータ転送状態をメインサイトの稼働状態の判断に使用する。したがって、ライセンス管理サーバを別に用意する必要なく、メインサイトとバックアップサイトの使用状況の監視が可能となる。 According to this embodiment, the state of data transfer by storage replication from the main site to the backup site is used to determine the operating state of the main site. Therefore, it is possible to monitor the usage status of the main site and the backup site without having to separately prepare a license management server.

[ハードウェア構成]
上述した実施形態において、稼働状態確認部310、ストレージアクセス部320、及び制御部360を含む各構成要素は、機能単位のブロックを示している。ホストコンピュータ100、300、メインストレージ200、及び、複製ストレージ400を含む各装置の各構成要素の一部又は全部は、コンピュータ500とプログラムとの任意の組み合わせにより実現されてもよい。
[Hardware configuration]
In the above-described embodiment, each component including the operating state confirmation unit 310, the storage access unit 320, and the control unit 360 represents a functional unit block. Part or all of each component of each device including the host computers 100 and 300, the main storage 200, and the replicated storage 400 may be realized by any combination of the computer 500 and programs.

図12は、コンピュータ500のハードウェア構成の例を示すブロック図である。図12を参照すると、コンピュータ500は、例えば、CPU(Central Processing Unit)501、ROM(Read Only Memory)502、RAM(Random Access Memory)503、プログラム504、記憶装置505、ドライブ装置507、通信インタフェース508、入力装置509、入出力インタフェース511、及び、バス512を含む。 FIG. 12 is a block diagram showing an example of the hardware configuration of computer 500. As shown in FIG. Referring to FIG. 12, the computer 500 includes, for example, a CPU (Central Processing Unit) 501, a ROM (Read Only Memory) 502, a RAM (Random Access Memory) 503, a program 504, a storage device 505, a drive device 507, and a communication interface 508. , an input device 509 , an input/output interface 511 and a bus 512 .

プログラム504は、各装置の各機能を実現するための命令(instruction)を含む。プログラム504は、予め、ROM502やRAM503、記憶装置505に格納される。CPU501は、プログラム504に含まれる命令を実行することにより、各装置の各機能を実現する。例えば、ホストコンピュータ300のCPU501がプログラム504に含まれる命令を実行することにより、ホストコンピュータ300の機能を実現する。また、RAM503は、各装置の各機能において処理されるデータを記憶してもよい。 The program 504 includes instructions for realizing each function of each device. The program 504 is stored in advance in the ROM 502 , RAM 503 and storage device 505 . The CPU 501 implements each function of each device by executing instructions included in the program 504 . For example, the functions of the host computer 300 are realized by the CPU 501 of the host computer 300 executing instructions included in the program 504 . Also, the RAM 503 may store data processed in each function of each device.

ドライブ装置507は、記録媒体506の読み書きを行う。通信インタフェース508は、通信ネットワークとのインタフェースを提供する。入力装置509は、例えば、マウスやキーボード等であり、システム管理者からの情報の入力を受け付ける。出力装置510は、例えば、ディスプレイであり、システム管理者へ情報を出力(表示)する。入出力インタフェース511は、周辺機器とのインタフェースを提供する。バス512は、これらハードウェアの各構成要素を接続する。なお、プログラム504は、通信ネットワークを介してCPU501に供給されてもよいし、予め、記録媒体506に格納され、ドライブ装置507により読み出され、CPU501に供給されてもよい。 A drive device 507 reads from and writes to a recording medium 506 . Communication interface 508 provides an interface with a communication network. The input device 509 is, for example, a mouse or a keyboard, and receives input of information from the system administrator. The output device 510 is, for example, a display, and outputs (displays) information to the system administrator. The input/output interface 511 provides an interface with peripheral devices. A bus 512 connects each of these hardware components. The program 504 may be supplied to the CPU 501 via a communication network, or may be stored in the recording medium 506 in advance, read by the drive device 507 and supplied to the CPU 501 .

なお、図12に示されているハードウェア構成は例示であり、これら以外の構成要素が追加されていてもよく、一部の構成要素を含まなくてもよい。 Note that the hardware configuration shown in FIG. 12 is an example, and components other than these may be added, or some components may be omitted.

各装置の実現方法には、様々な変形例がある。例えば、各装置は、構成要素毎にそれぞれ異なるコンピュータとプログラムとの任意の組み合わせにより実現されてもよい。また、各装置が備える複数の構成要素が、一つのコンピュータとプログラムとの任意の組み合わせにより実現されてもよい。例えば、稼働状態確認部310及び制御部360の機能は、ホストコンピュータ300に含まれる他の機能と、同一のコンピュータにより実現されてもよいし、複数のコンピュータにより実現されてもよい。稼働状態確認部310と、制御部360の機能を有するシステムは、制御システムとも呼ばれる。 There are various modifications in the implementation method of each device. For example, each device may be implemented by any combination of a computer and a program that are different for each component. Also, a plurality of components included in each device may be realized by any combination of a single computer and a program. For example, the functions of the operating state confirmation unit 310 and the control unit 360 may be implemented by the same computer as other functions included in the host computer 300, or may be implemented by a plurality of computers. A system having the functions of the operating state confirmation unit 310 and the control unit 360 is also called a control system.

また、各装置の各構成要素の一部又は全部は、プロセッサ等を含む汎用又は専用の回路(circuitry)や、これらの組み合わせによって実現されてもよい。これらの回路は、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各装置の各構成要素の一部又は全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。 Also, part or all of each component of each device may be realized by a general-purpose or dedicated circuit including a processor or the like, or a combination thereof. These circuits may be composed of a single chip, or may be composed of multiple chips connected via a bus. A part or all of each component of each device may be realized by a combination of the above-described circuits and the like and programs.

また、各装置の各構成要素の一部又は全部が複数のコンピュータや回路等により実現される場合、複数のコンピュータや回路等は、集中配置されてもよいし、分散配置されてもよい。 Further, when a part or all of each component of each device is realized by a plurality of computers, circuits, etc., the plurality of computers, circuits, etc. may be centrally arranged or distributed.

以上、実施形態を参照して本開示を説明したが、本開示は上記実施形態に限定されるものではない。本開示の構成や詳細には、本開示のスコープ内で当業者が理解し得る様々な変更をすることができる。また、各実施形態における構成は、本開示のスコープを逸脱しない限りにおいて、互いに組み合わせることが可能である。 Although the present disclosure has been described with reference to the embodiments, the present disclosure is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present disclosure within the scope of the present disclosure. Also, the configurations in each embodiment can be combined with each other without departing from the scope of the present disclosure.

100 ホストコンピュータ
200 メインストレージ
201 メインディスク
300 ホストコンピュータ
310 稼働状態確認部
311 データ転送状態取得部
312 転送時刻抽出部
320 ストレージアクセス部
360 制御部
400 複製ストレージ
401 複製ディスク
402 ストレージ制御部
500 コンピュータ
600 ネットワーク
100 host computer 200 main storage 201 main disk 300 host computer 310 operating state confirmation unit 311 data transfer state acquisition unit 312 transfer time extraction unit 320 storage access unit 360 control unit 400 replication storage 401 replication disk 402 storage control unit 500 computer 600 network

Claims (9)

メインサイトが備える第1の記憶部からバックアップサイトが備える第2の記憶部へレプリケーションのために転送されたデータの最終転送時刻と、前回メインサイトの稼働状態を確認した時刻を示す前回確認時刻とを比較することで、メインサイトの稼働状態を確認する稼働状態確認手段と、
前記メインサイトの稼働状態に基づいて、前記バックアップサイトの稼働を制御する制御手段と、
を備える制御システム。
Comparing the final transfer time of data transferred from the first storage section provided at the main site to the second storage section provided at the backup site for replication with the previous confirmation time indicating the time at which the operation status of the main site was checked last time By doing so, operating state confirmation means for checking the operating state of the main site;
a control means for controlling the operation of the backup site based on the operation status of the main site;
A control system with
前記稼働状態確認手段は、前回確認時刻よりも最終転送時刻が新しい場合は、メインサイトが稼働していると判断する
請求項1に記載の制御システム。
2. The control system according to claim 1, wherein said operating state confirmation means determines that the main site is in operation when the final transfer time is newer than the previous confirmation time.
前記制御手段は、前回確認時刻よりも最終転送時刻が新しい場合はバックアップサイトの稼働を停止し、前回確認時刻よりも最終転送時刻が古い場合はバックアップサイトの稼働を継続するよう制御する、
請求項1または2に記載の制御システム。
The control means stops the operation of the backup site when the final transfer time is newer than the previous confirmation time, and controls to continue the operation of the backup site when the final transfer time is older than the previous confirmation time.
3. Control system according to claim 1 or 2.
前記稼働状態確認手段は、データのレプリケート状態と最終転送時刻とを含む転送状態を前記第2の記憶部から取得する、データ転送状態取得手段をさらに備える
請求項1乃至3のいずれか1項に記載の制御システム。
4. The operating state confirmation unit according to any one of claims 1 to 3, further comprising a data transfer state acquisition unit that acquires a transfer state including a data replication state and a final transfer time from the second storage unit. Control system as described.
前記データ転送状態取得手段は、前記第2の記憶部が備える複数のディスクのそれぞれの最終転送時刻を取得し、
前記稼働状態確認手段は、前記それぞれの最終転送時刻のうち、最新の最終転送時刻を抽出する転送時刻抽出手段さらに備える
請求項4に記載の制御システム。
The data transfer state acquisition means acquires the final transfer time of each of the plurality of disks included in the second storage unit,
5. The control system according to claim 4, wherein said operating state confirmation means further comprises transfer time extracting means for extracting the latest final transfer time from said respective final transfer times.
前記稼働状態確認手段は、前記転送時刻抽出手段が抽出した最終転送時刻と、前回確認時刻とを比較する
請求項5に記載の制御システム。
6. The control system according to claim 5, wherein said operating state confirmation means compares the final transfer time extracted by said transfer time extraction means with the previous confirmation time.
前記稼働状態確認手段は、定期的にメインサイトの稼働状態を確認する
請求項1乃至6のいずれか1項に記載の制御システム。
7. The control system according to any one of claims 1 to 6, wherein the operating state checking means periodically checks the operating state of the main site.
メインサイトが備える第1の記憶部からバックアップサイトが備える第2の記憶部へレプリケーションのために転送されたデータの最終転送時刻と、前回メインサイトの稼働状態を確認した時刻を示す前回確認時刻とを比較することで、メインサイトの稼働状態を確認し、
前記メインサイトの稼働状態に基づいて、前記バックアップサイトの稼働を制御する、
制御方法。
Comparing the final transfer time of data transferred from the first storage section provided at the main site to the second storage section provided at the backup site for replication with the previous confirmation time indicating the time at which the operation status of the main site was checked last time to check the operating status of the main site,
controlling the operation of the backup site based on the operation status of the main site;
control method.
メインサイトが備える第1の記憶部からバックアップサイトが備える第2の記憶部へレプリケーションのために転送されたデータの最終転送時刻と、前回メインサイトの稼働状態を確認した時刻を示す前回確認時刻とを比較することで、メインサイトの稼働状態を確認する処理と、
前記メインサイトの稼働状態に基づいて、前記バックアップサイトの稼働を制御する処理と、
をコンピュータに実行させる制御プログラム。
Comparing the final transfer time of data transferred from the first storage section provided at the main site to the second storage section provided at the backup site for replication with the previous confirmation time indicating the time at which the operation status of the main site was checked last time By doing so, the process of checking the operating status of the main site and
a process of controlling the operation of the backup site based on the operation status of the main site;
A control program that causes a computer to execute
JP2021102170A 2021-06-21 2021-06-21 Control system, method, and program Pending JP2023001446A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021102170A JP2023001446A (en) 2021-06-21 2021-06-21 Control system, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021102170A JP2023001446A (en) 2021-06-21 2021-06-21 Control system, method, and program

Publications (1)

Publication Number Publication Date
JP2023001446A true JP2023001446A (en) 2023-01-06

Family

ID=84688799

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021102170A Pending JP2023001446A (en) 2021-06-21 2021-06-21 Control system, method, and program

Country Status (1)

Country Link
JP (1) JP2023001446A (en)

Similar Documents

Publication Publication Date Title
CN109471770B (en) System management method and device
CN101578586B (en) Using virtual copies in a failover and failback environment
JP4345334B2 (en) Fault tolerant computer system, program parallel execution method and program
US7650467B2 (en) Coordination of multiprocessor operations with shared resources
US6230246B1 (en) Non-intrusive crash consistent copying in distributed storage systems without client cooperation
US20020092008A1 (en) Method and apparatus for updating new versions of firmware in the background
JP2005196683A (en) Information processing system, information processor and control method of information processing system
JP2002333935A (en) Method and system for hot-inserting controller in redundant controller system
JP5183542B2 (en) Computer system and setting management method
CN104427002A (en) Cluster system and method for providing service availability in cluster system
US20060036832A1 (en) Virtual computer system and firmware updating method in virtual computer system
EP2936320B1 (en) Distributed cache coherency directory with failure redundancy
US7299385B2 (en) Managing a fault tolerant system
US11010086B2 (en) Data synchronization method and out-of-band management device
CN101815099A (en) Double-controller configuration information synchronization method and device in double-control disk array
JP5124237B2 (en) Storage system and storage subsystem
CN112199240A (en) Method for switching nodes during node failure and related equipment
CN104331344A (en) Data backup method and device
JP4563412B2 (en) Software replication
WO2020140615A1 (en) Backup and recovery method for application system, device and computer-readable storage medium
JP2023001446A (en) Control system, method, and program
CN107111459A (en) Storage system and its control method
US10656867B2 (en) Computer system, data management method, and data management program
JP2008217202A (en) Disk array device and firmware update method
JP2009282776A (en) Computer system

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20211112