JP4792958B2 - Data control system, shared disk device, and disk access restriction switching method used therefor - Google Patents

Data control system, shared disk device, and disk access restriction switching method used therefor Download PDF

Info

Publication number
JP4792958B2
JP4792958B2 JP2005367306A JP2005367306A JP4792958B2 JP 4792958 B2 JP4792958 B2 JP 4792958B2 JP 2005367306 A JP2005367306 A JP 2005367306A JP 2005367306 A JP2005367306 A JP 2005367306A JP 4792958 B2 JP4792958 B2 JP 4792958B2
Authority
JP
Japan
Prior art keywords
service server
disk
service
access
disk device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005367306A
Other languages
Japanese (ja)
Other versions
JP2007172192A (en
Inventor
修一 佐伯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005367306A priority Critical patent/JP4792958B2/en
Publication of JP2007172192A publication Critical patent/JP2007172192A/en
Application granted granted Critical
Publication of JP4792958B2 publication Critical patent/JP4792958B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はデータ制御システム、共有ディスク装置及びそれらに用いるディスクアクセス規制の切替方法に関し、特に共有ディスク装置におけるディスクアクセス規制の切替方法に関する。   The present invention relates to a data control system, a shared disk device, and a disk access restriction switching method used therefor, and more particularly to a disk access restriction switching method in a shared disk device.

従来、共有ディスク装置を使ったデータ制御システムにおいては、サービスサーバの冗長化を行う場合(例えば、特許文献1参照)、待機系サービスサーバ側でも、現用系サービスサーバ側の共有ディスク装置内におけるディスク装置を予めマウントすることでアクセス可能な状態としている。   Conventionally, in a data control system using a shared disk device, when service servers are made redundant (see, for example, Patent Document 1), the disk in the shared disk device on the active service server side also on the standby service server side The device is accessible by mounting it in advance.

また、上記のデータ制御システムでは、ファイル管理システムの破壊を防止するために、待機系サービスサーバ側で共有ディスク装置内のディスク装置をアンマウントし、アクセスできない状態にしている。   In the above data control system, in order to prevent destruction of the file management system, the disk device in the shared disk device is unmounted on the standby service server side to make it inaccessible.

上述した従来のデータ制御システムの構成を図1を参照して説明する。図1において、このデータ制御システムは共有ディスク装置1と、冗長化されたサービスサーバ3〜5で構成されている。   The configuration of the above-described conventional data control system will be described with reference to FIG. In FIG. 1, this data control system is composed of a shared disk device 1 and redundant service servers 3-5.

管理サーバ2はデータ制御システムにおける各装置の状態を装置監視インタフェース101を使って監視し、現用系サービスサーバ(#1)3及び現用系サービスサーバ(#2)4と待機系サービスサーバ(#3)5との間のファイル管理システムの同期化処理を行う。   The management server 2 monitors the status of each device in the data control system using the device monitoring interface 101, and the active service server (# 1) 3, the active service server (# 2) 4, and the standby service server (# 3). ) Synchronize the file management system with 5.

現用系サービスサーバ(#1)3及び現用系サービスサーバ(#2)4は、共有ディスク装置1のディスク装置(#1)12及びディスク装置(#2)13に格納されたデータを使ってサービス処理を行う。待機系サービスサーバ(#3)5は、現用系サービスサーバ(#1)3あるいは現用系サービスサーバ(#2)4が故障してサービス処理できなくなった際に、故障したサービスサーバ処理を引き継いでサービス処理を継続する。   The active service server (# 1) 3 and the active service server (# 2) 4 perform services using data stored in the disk device (# 1) 12 and the disk device (# 2) 13 of the shared disk device 1. Process. The standby service server (# 3) 5 takes over the failed service server process when the active service server (# 1) 3 or the active service server (# 2) 4 fails to perform service processing. Continue service processing.

ファイバチャネルスイッチ6は現用系サービスサーバ(#1)3及び現用系サービスサーバ(#2)4、待機系サービスサーバ(#3)5、共有ディスク装置1をファイバチャネルインタフェース102,103で接続し、ファイバチャネルデータをスイッチングする。   The fiber channel switch 6 connects the active service server (# 1) 3, the active service server (# 2) 4, the standby service server (# 3) 5, and the shared disk device 1 through the fiber channel interfaces 102 and 103. Switch Fiber Channel data.

共有ディスク装置1は共有ディスクコントローラ11と、ディスク装置(#1)12及びディスク装置(#2)13とから構成されている。共有ディスクコントローラ11はディスク装置(#1)12及びディスク装置(#2)13と、ファイバチャネルスイッチ6、現用系サービスサーバ(#1)3及び現用系サービスサーバ(#2)4、待機系サービスサーバ(#3)5にファイバチャネルインタフェース102,103,104で接続され、現用系サービスサーバ(#1)3及び現用系サービスサーバ(#2)4から共有ディスク装置1にアクセスされた際に共有ディスク装置1内のディスクアクセスを制御する。   The shared disk device 1 includes a shared disk controller 11, a disk device (# 1) 12, and a disk device (# 2) 13. The shared disk controller 11 includes a disk device (# 1) 12 and a disk device (# 2) 13, a fiber channel switch 6, an active service server (# 1) 3, an active service server (# 2) 4, and a standby service. It is connected to the server (# 3) 5 through the fiber channel interfaces 102, 103, and 104, and is shared when the shared disk device 1 is accessed from the active service server (# 1) 3 and the active service server (# 2) 4. The disk access in the disk device 1 is controlled.

特表2003−509773号公報Special table 2003-509773 gazette

上述した従来のデータ制御システムでは、サービスサーバの冗長化を行う場合、待機系サービスサーバ側でも、現用系サービスサーバ側の共有ディスク装置内におけるディスク装置を予めマウントすることでアクセス可能な状態としておくと、アプリケーションソフト不具合や故障サービスサーバの予期せぬ動作等によって、冗長化された現用系サービスサーバと待機系サービスサーバとから共有ディスク装置内の同一ディスク装置へのアクセス競合が発生し、サービスサーバ側のファイル管理システム及び共有ディスク装置内のディスク装置に格納されたデータが破壊される可能が考えられる。   In the conventional data control system described above, when the service server is made redundant, the standby service server side can be made accessible by mounting in advance the disk device in the shared disk device on the active service server side. Due to application software failures or unexpected operation of the failed service server, access conflicts from the redundant active service server and standby service server to the same disk device in the shared disk device occur. The data stored in the disk device in the file management system and the shared disk device can be destroyed.

また、従来のデータ制御システムでは、ファイル管理システムの破壊を防止するために待機系サービスサーバ側で共有ディスク装置内のディスク装置をアンマウントしてアクセスできない状態にしておくと、現用系サービスサーバに障害が発生して待機系サービスサーバに切替える際に、現用系サービスサーバのアンマウント処理、待機系サービスサーバのマウント処理を行う必要があるため、待機系サービスサーバ側で処理を引き継ぐまでに時間を要している。   Also, in the conventional data control system, if the disk device in the shared disk device is unmounted and inaccessible on the standby service server side to prevent the file management system from being destroyed, the active service server will fail. When this occurs, it is necessary to perform the unmount processing of the active service server and the mount processing of the standby service server when switching to the standby service server. Therefore, it takes time to take over the processing on the standby service server side. ing.

さらに、従来のデータ制御システムでは、障害となったサービスサーバの故障の影響によって、アンマウントできない場合、待機系サービスサーバへの切替えが出来ないあるいは障害サービスサーバをマウント状態で待機系サービスサーバ側から共有ディスク装置内のディスク装置をマウントすることで、ディスク装置へのアクセス競合でファイル管理システムや共有ディスク装置内のディスク装置に格納されたデータを破壊する可能性がある。   Furthermore, in the conventional data control system, if it is not possible to unmount due to the failure of the failed service server, it is not possible to switch to the standby service server, or the failed service server is mounted and shared from the standby service server side. By mounting the disk device in the disk device, there is a possibility that data stored in the disk device in the file management system or the shared disk device may be destroyed due to access conflict with the disk device.

つまり、従来のデータ制御システムでは、切替え時間を短縮するために現用系サービスサーバと待機系サービスサーバとを予めマウントし、双方のサービスサーバからアクセス可能な状態とした場合、アプリケーションソフト不具合、故障サービスサーバの誤動作等によって現用系サービスサーバと待機系サービスサーバとの双方から共有ディスク装置内の同一ディスクに対するアクセス競合が発生し、ファイル管理システムを破壊する可能性があり、システムの信頼性を向上できないという課題がある。   In other words, in the conventional data control system, if the active service server and the standby service server are mounted in advance in order to shorten the switching time and are made accessible from both service servers, application software malfunctions and failure services There is a possibility that access conflict to the same disk in the shared disk device from both the active service server and the standby service server may occur due to server malfunction, etc., and the file management system may be destroyed, so the system reliability cannot be improved. There is a problem.

また、従来のデータ制御システムでは、待機系サービスサーバをアンマウントし、共有ディスク装置内のディスク装置が複数のサービスサーバからマウントされない状態でシステムを運用した場合、現用系から待機系への切替えの際に、障害となった現用系のアンマウント処理後、待機系のマウント処理を行う必要があり、切替えに時間を要するという課題がある。この場合、現用系の障害内容によってはアンマウントできない状態となり、切替えができないことも考えられる。   Also, in the conventional data control system, when the standby service server is unmounted and the system is operated without the disk devices in the shared disk device being mounted from multiple service servers, when switching from the active system to the standby system In addition, there is a problem in that it is necessary to perform a mount process for the standby system after the unmount process for the active system that has failed, and switching takes time. In this case, depending on the failure contents of the active system, it may not be possible to unmount, and switching may not be possible.

そこで、本発明の目的は上記の問題点を解消し、システムの信頼性を向上させることができ、待機系への切替え時間を短縮することができるデータ制御システム、共有ディスク装置及びそれらに用いるディスクアクセス規制の切替方法を提供することにある。   SUMMARY OF THE INVENTION Therefore, an object of the present invention is to solve the above problems, improve the reliability of the system, and shorten the time for switching to the standby system, the shared disk device, and the disk used for them. It is to provide a method of switching access restrictions.

本発明によるデータ制御システムは、複数のディスク装置を含む共有ディスク装置と、冗長化されかつ前記ディスク装置を参照してサービスを行う複数のサービスサーバとからなるデータ制御システムであって、
前記共有ディスク装置は、前記複数のディスク装置に対する前記複数のサービスサーバからのアクセスを制御する制御手段を備え、
初期時に前記複数のサービスサーバから前記複数のディスク装置へのアクセスをすべて可能状態とし、
前記制御手段は、少なくとも前記サービスサーバの装置状態が現用系か待機系かに応じて前記複数のディスク装置へのアクセスの許可不許可を制御し、
前記制御手段は、前記サービスサーバ及びそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)と前記サービスサーバの状態と対象ディスクとを関係付けて記憶するメモリテーブルに基づいて前記現用系であるサービスサーバと前記待機系であるサービスサーバとから前記ディスク装置へのアクセスを制御し、
前記制御手段は、前記現用系であるサービスサーバが故障した場合、前記メモリテーブル上の参照アドレスを切替え、前記現用系であるサービスサーバから前記ディスク装置へのアクセスを規制し、前記待機系であるサービスサーバから当該ディスク装置へのアクセスを可能としている。
A data control system according to the present invention is a data control system comprising a shared disk device including a plurality of disk devices, and a plurality of service servers that are redundant and perform services with reference to the disk devices,
The shared disk device comprises control means for controlling access from the plurality of service servers to the plurality of disk devices,
In the initial stage, all the access to the plurality of disk devices from the plurality of service servers is enabled,
The control means controls permission / non-permission of access to the plurality of disk devices according to at least whether the device state of the service server is an active system or a standby system ;
The control means is a service that is the active system based on a memory table that associates and stores the service server and its WWN (World Wide Name) that is the Fiber Channel interface identification number, the state of the service server, and the target disk. Controlling access to the disk device from a server and the service server as the standby system,
When the service server as the active system fails, the control means switches the reference address on the memory table, regulates access to the disk device from the service server as the active system, and is the standby system The service server can access the disk device .

本発明による共有ディスク装置は、複数のディスク装置を含み、冗長化されかつ前記ディスク装置を参照してサービスを行う複数のサービスサーバとともにデータ制御システムを構成する共有ディスク装置であって
前記複数のディスク装置に対する前記複数のサービスサーバからのアクセスを制御する制御手段を備え、
初期時に前記複数のサービスサーバから前記複数のディスク装置へのアクセスをすべて可能状態とし、
前記制御手段が、少なくとも前記サービスサーバの装置状態が現用系か待機系かに応じて前記複数のディスク装置へのアクセスの許可不許可を制御し、
前記制御手段が、前記サービスサーバ及びそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)と前記サービスサーバの状態と対象ディスクとを関係付けて記憶するメモリテーブルに基づいて前記現用系であるサービスサーバと前記待機系であるサービスサーバとから前記ディスク装置へのアクセスを制御し、
前記制御手段は、前記現用系であるサービスサーバが故障した場合、前記メモリテーブル上の参照アドレスを切替え、前記現用系であるサービスサーバから前記ディスク装置へのアクセスを規制し、前記待機系であるサービスサーバから当該ディスク装置へのアクセスを可能としている。
Shared disk device according to the present invention is a shared disk device includes a plurality of disk devices, constituting the data control system together with a plurality of service servers to perform redundant and services by referring to the disk device,
Control means for controlling access from the plurality of service servers to the plurality of disk devices;
In the initial stage, all the access to the plurality of disk devices from the plurality of service servers is enabled,
The control means controls permission / non-permission of access to the plurality of disk devices according to at least whether the service server device status is active or standby ;
The service which is the active system based on a memory table in which the control means associates and stores the service server and its Fiber Channel interface identification number WWN (World Wide Name), the state of the service server and the target disk. Controlling access to the disk device from a server and the service server as the standby system,
When the service server as the active system fails, the control means switches the reference address on the memory table, regulates access to the disk device from the service server as the active system, and is the standby system The service server can access the disk device .

本発明によるディスクアクセス規制の切替方法は、複数のディスク装置を含む共有ディスク装置と、冗長化されかつ前記ディスク装置を参照してサービスを行う複数のサービスサーバとからなるデータ制御システムに用いるディスクアクセス規制の切替方法であって、
前記共有ディスク装置が、前記複数のディスク装置に対する前記複数のサービスサーバからのアクセスを制御する制御処理を実行し、
初期時に前記複数のサービスサーバから前記複数のディスク装置へのアクセスをすべて可能状態とし、
前記制御処理において、少なくとも前記サービスサーバの装置状態が現用系か待機系かに応じて前記複数のディスク装置へのアクセスの許可不許可を制御し、
前記制御処理において、前記サービスサーバ及びそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)と前記サービスサーバの状態と対象ディスクとを関係付けて記憶するメモリテーブルに基づいて前記現用系であるサービスサーバと前記待機系であるサービスサーバとから前記ディスク装置へのアクセスを制御し、
前記制御処理において、前記現用系であるサービスサーバが故障した場合、前記メモリテーブル上の参照アドレスを切替え、前記現用系であるサービスサーバから前記ディスク装置へのアクセスを規制し、前記待機系であるサービスサーバから当該ディスク装置へのアクセスを可能としている。
The disk access restriction switching method according to the present invention is a disk access used in a data control system comprising a shared disk device including a plurality of disk devices and a plurality of service servers which are made redundant and perform services with reference to the disk devices. A method of switching regulations,
The shared disk device executes control processing for controlling access from the plurality of service servers to the plurality of disk devices;
In the initial stage, all the access to the plurality of disk devices from the plurality of service servers is enabled,
In the control process, controlling permission / non-permission of access to the plurality of disk devices according to at least whether the device status of the service server is an active system or a standby system ,
In the control process, the service which is the active system based on the service server and a WWN (World Wide Name) which is the Fiber Channel interface identification number, a memory table which stores the state of the service server and the target disk in association with each other. Controlling access to the disk device from a server and the service server as the standby system,
In the control process, when the service server that is the active system fails, the reference address on the memory table is switched, access from the service server that is the active system to the disk device is restricted, and the standby system The service server can access the disk device .

すなわち、本発明のデータ制御システムは、冗長化されたサービスサーバと外部共有ディスク装置とから構成されるシステムにおいて、第1の現用系サービスサーバの故障発生時に、待機系サービスサーバが第1の現用系サービスサーバで使用していた共有ディスクデータを高速に引き継ぐことで、サービス復旧までの時間を短縮し、サービスを継続可能にするとともに、故障装置がシステムに及ぼす影響を完全に排除することで、システムの信頼性を向上させることを特徴としている。   That is, in the data control system of the present invention, in a system composed of redundant service servers and external shared disk devices, when a failure occurs in the first active service server, the standby service server becomes the first active service server. By taking over the shared disk data used by the system service server at high speed, the service recovery time is shortened, the service can be continued, and the influence of the failed device on the system is completely eliminated. It is characterized by improving the reliability of the system.

より具体的に説明すると、本発明のデータ制御システムでは、共有ディスクコントローラ中のアクセス制御回路が、第1〜第3のサービスサーバとそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)、サーバの状態、対象ディスクを関係付けるメモリテーブルに基づいて現用系である第1及び第2のサービスサーバと待機系である第3のサービスサーバとからディスク装置へのアクセスを制御している。   More specifically, in the data control system of the present invention, the access control circuit in the shared disk controller includes the first to third service servers, the WWN (World Wide Name) that is the Fiber Channel interface identification number, and the server. In this state, the access to the disk device is controlled from the first and second service servers as the active system and the third service server as the standby system based on the memory table relating the target disk.

アクセス制御回路は現用系である第1のサービスサーバから送出される「WWN=AAAA」によって現用系である第1のサービスサーバであることを識別するとともに、メモリテーブルを参照することで、第1のサービスサーバの状態が現用系であると判断されるため、メモリテーブルでアクセス対象となっている第1のディスク装置へのアクセスを許可する。   The access control circuit identifies the first service server as the active system by “WWN = AAAA” sent from the first service server as the active system, and refers to the first memory server by referring to the memory table. Since the status of the service server is determined to be active, access to the first disk device to be accessed in the memory table is permitted.

同様に、アクセス制御回路は現用系である第2のサービスサーバから送出される「WWN=BBBB」から現用系である第2のサービスサーバであることを識別すると共に、メモリテーブルを参照することで、第2のサービスサーバの状態が現用系であると判断されるため、メモリテーブルでアクセス対象となっている第2のディスク装置へのアクセスを許可する。   Similarly, the access control circuit identifies the second service server as the active system from “WWN = BBBB” sent from the second service server as the active system, and refers to the memory table. Since it is determined that the state of the second service server is the active system, access to the second disk device to be accessed in the memory table is permitted.

アクセス制御回路は待機系である第3のサービスサーバから送出される「WWN=CCCC」から待機系である第3のサービスサーバであることを識別すると共に、メモリテーブルを参照することで、第3のサービスサーバの状態が待機系であると判断されるため、メモリテーブル上でアクセス対象となっている第1及び第2のディスク装置へのアクセスを許可しない。   The access control circuit identifies the third service server as the standby system from “WWN = CCCC” sent from the third service server as the standby system, and refers to the memory table to Since the service server state is determined to be the standby system, access to the first and second disk devices to be accessed on the memory table is not permitted.

現用系である第1のサービスサーバが障害となると、アクセス制御回路はメモリテーブル中の現用系である第1のサービスサーバの状態を待機系に変更すると同時に、待機系である第3のサービスサーバの状態を現用系に変更し、現用系である第1のサービスサーバから第1のディスク装置へのアクセスを不可状態とし、待機系である第3のサービスサーバから第1のディスク装置へのアクセスを許可状態とすることで、旧現用系である第1のサービスサーバで処理していた共有ディスク内のデータベースを待機系である第3のサービスサーバに高速に引き継ぐことが可能となる。   When the first service server that is the active system fails, the access control circuit changes the state of the first service server that is the active system in the memory table to the standby system, and at the same time, the third service server that is the standby system. Is changed to the active system, access from the first service server that is the active system to the first disk device is disabled, and access from the third service server that is the standby system to the first disk device In the permitted state, the database in the shared disk that has been processed by the first service server that is the former active system can be transferred to the third service server that is the standby system at high speed.

また、予め現用系である第1のサービスサーバと待機系である第3のサービスサーバとが同一ディスク装置をマウントし、アクセス可能状態にしても共有ディスク装置側で第1及び第3のサービスサーバ側から第1のディスク装置へのアクセス競合を防止することが可能となるため、現用系である第1のサービスサーバから待機系である第3のサービスサーバへの切替え時に、システムの信頼性向上を行い、且つ切替え時に信頼性を向上しつつアンマウント、マウント処理を省略することで、切替えの高速化をも可能としている。   In addition, the first and third service servers on the shared disk device side are mounted on the same disk device in advance by the first service server that is the active system and the third service server that is the standby system in the accessible state. Since it is possible to prevent access contention from the side to the first disk device, system reliability is improved when switching from the first service server that is the active system to the third service server that is the standby system In addition, the switching speed can be increased by omitting the unmounting and mounting processes while improving the reliability at the time of switching.

上記のように、本発明のデータ制御システムでは、共有ディスク装置及び冗長化されたサービスサーバで構成されたシステムにおいて、現用系サービスサーバ側と待機系サービスサーバ側とが共有ディスク装置内の同一のディスク装置をマウントした状態でも、共有ディスク装置内のアクセス制御回路で、現用系サービスサーバあるいは待機系サービスサーバ故障時の誤動作で両サービスサーバからのアクセス競合される可能性を排除することが可能となり、障害発生時のシステムの信頼性向上を行うことが可能となる。   As described above, in the data control system of the present invention, in the system configured with the shared disk device and the redundant service server, the active service server side and the standby service server side are the same in the shared disk device. Even when the disk unit is mounted, the access control circuit in the shared disk unit can eliminate the possibility of access conflicts from both service servers due to malfunction when the active service server or standby service server fails. It becomes possible to improve the reliability of the system when a failure occurs.

また、本発明のデータ制御システムでは、現用系サービスサーバの故障によって、現用系サービスサーバからのアンマウントを行うことができず、現用系サービスサーバ、待機系サービスサーバ共にマウント状態となった場合においても、共有ディスク装置側でアクセス制御が可能であるため、アクセス競合となる可能性を、上記と同様に、排除することが可能となる。   In the data control system of the present invention, the active service server cannot be unmounted due to a failure of the active service server, and both the active service server and the standby service server are mounted. Since access control is possible on the shared disk device side, the possibility of access contention can be eliminated in the same manner as described above.

さらに、本発明のデータ制御システムでは、上記のシステムの信頼性を確保したまま、現用系サービスサーバと待機系サービスサーバとから共有ディスク装置内の同じディスク装置をマウントすることが可能となり、現用系サービスサーバが障害となった際に、待機系サービスサーバによる処理引継ぎを共有ディスク装置内でメモリテーブル内の参照先変更のみで行うことが可能となるため、サービスサーバの障害発生時の切替え時間が従来よりも短縮可能となる。   Furthermore, in the data control system of the present invention, it becomes possible to mount the same disk device in the shared disk device from the active service server and the standby service server while ensuring the reliability of the above system, and the active system When a service server fails, processing can be taken over by the standby service server only by changing the reference destination in the memory table in the shared disk device. It becomes possible to shorten than before.

本発明は、上記のような構成及び動作とすることで、システムの信頼性を向上させることができ、待機系への切替え時間を短縮することができるという効果が得られる。   By adopting the configuration and operation as described above, the present invention can improve the reliability of the system and can shorten the switching time to the standby system.

次に、本発明の実施例について図面を参照して説明する。図1は本発明の一実施例によるデータ制御システムの構成を示すブロック図である。図1においては、本発明の一実施例による共有ディスク装置を使ったシステムにおいて、冗長化されたサービスサーバの構成を示している。   Next, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a data control system according to an embodiment of the present invention. FIG. 1 shows a configuration of a redundant service server in a system using a shared disk device according to an embodiment of the present invention.

本発明の一実施例によるデータ制御システムは、共有ディスク装置1と、管理サーバ2と、冗長化されたサービスサーバ(#1〜#3)3〜5と、ファイバチャネルスイッチ6とから構成されている。共有ディスク装置1は共有ディスクコントローラ11と、ディスク装置(#1,#2)12,13とから構成されている。   A data control system according to an embodiment of the present invention includes a shared disk device 1, a management server 2, redundant service servers (# 1 to # 3) 3 to 5, and a fiber channel switch 6. Yes. The shared disk device 1 includes a shared disk controller 11 and disk devices (# 1, # 2) 12, 13.

管理サーバ2はデータ制御システム内の全ての装置の状態を監視するとともに、現用系であるサービスサーバ(#1)3及びサービスサーバ(#2)4と、待機系であるサービスサーバ(#3)5とにおけるファイル管理システムの同期化をも実施している。   The management server 2 monitors the status of all the devices in the data control system, and the active service server (# 1) 3 and service server (# 2) 4 and the standby service server (# 3). The file management system is synchronized with the system 5.

現用系であるサービスサーバ(#1)3は、ディスク装置(#1)12に格納されたデータベースを使ってサービス処理を行う。現用系であるサービスサーバ(#2)4は、ディスク装置(#2)13に格納されたデータベースを使ってサービス処理を行う。待機系であるサービスサーバ(#3)5は、現用系であるサービスサーバ(#1)3あるいは現用系であるサービスサーバ(#2)4が故障した際に、ディスク装置(#1)12あるいはディスク装置(#2)13を使ってサービス処理を引き継ぐ。   The active service server (# 1) 3 performs service processing using a database stored in the disk device (# 1) 12. The active service server (# 2) 4 performs service processing using a database stored in the disk device (# 2) 13. The service server (# 3) 5 serving as the standby system is configured such that when the service server (# 1) 3 serving as the active system or the service server (# 2) 4 serving as the active system fails, the disk server (# 1) 12 or The disk device (# 2) 13 is used to take over service processing.

ファイバチャネルスイッチ6は、現用系であるサービスサーバ(#1,#2)3,4、待機系であるサービスサーバ(#3)5、共有ディスク装置1をファイバチャネルインタフェース102,103で接続し、各サービスサーバ(#1〜#3)3〜5からディスク装置(#1)12へのアクセスを可能とする。ディスク装置(#1)12は、共有ディスクコントローラ11と、ディスク装置(#1)12、ディスク装置(#2)13とから構成され、外部ディスク機能を提供する。   The fiber channel switch 6 connects the service servers (# 1, # 2) 3 and 4 which are active systems, the service server (# 3) 5 which is a standby system, and the shared disk device 1 through fiber channel interfaces 102 and 103, Each service server (# 1 to # 3) 3 to 5 can access the disk device (# 1) 12. The disk device (# 1) 12 includes a shared disk controller 11, a disk device (# 1) 12, and a disk device (# 2) 13, and provides an external disk function.

図2は図1の共有ディスクコントローラ11の構成を示すブロック図である。図2において、共有ディスクコントローラ11はディスク制御回路111と、アクセス制御回路112とから構成されており、アクセス制御回路112が参照するメモリテーブル[図2(a),(b)参照]を備え、各サービスサーバ(#1〜#3)3〜5からディスク装置(#1,#2)12,13へのアクセスを制御している。   FIG. 2 is a block diagram showing the configuration of the shared disk controller 11 of FIG. 2, the shared disk controller 11 includes a disk control circuit 111 and an access control circuit 112, and includes a memory table [see FIGS. 2A and 2B] referred to by the access control circuit 112. Access to the disk devices (# 1, # 2) 12, 13 from the service servers (# 1- # 3) 3-5 is controlled.

ここで、図2(a)は障害前のメモリテーブルを示し、図2(b)は障害後のメモリテーブルを示している。これらのメモリテーブルには、サービスサーバ(#1〜#3)とそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)、サーバの状態、対象ディスクそれぞれの情報が関係付けられて記憶されている。   Here, FIG. 2A shows the memory table before the failure, and FIG. 2B shows the memory table after the failure. In these memory tables, the service server (# 1 to # 3) and its Fiber Channel interface identification number WWN (World Wide Name), server status, and information on each target disk are stored in association with each other. .

ディスク制御回路111はアクセス制御回路112の指示に基づいてディスク装置(#1)12、ディスク装置(#2)13へのアクセスを制御する。アクセス制御回路112はメモリテーブル内の情報に基づいて現用系であるサービスサーバ(#1)3、現用系であるサービスサーバ(#2)4、待機系であるサービスサーバ(#3)5からディスク装置(#1)12、ディスク装置(#2)13へのアクセス制御指示をディスク制御回路111に対して行う。   The disk control circuit 111 controls access to the disk device (# 1) 12 and the disk device (# 2) 13 based on an instruction from the access control circuit 112. Based on the information in the memory table, the access control circuit 112 sends a disk from the service server (# 1) 3 that is the active system, the service server (# 2) 4 that is the active system, and the service server (# 3) 5 that is the standby system. The disk control circuit 111 is instructed to control access to the device (# 1) 12 and the disk device (# 2) 13.

これら図1及び図2を参照して本発明の一実施例によるデータ制御システムの動作について説明する。   The operation of the data control system according to the embodiment of the present invention will be described with reference to FIGS.

管理サーバ2はデータ制御システムにおける各装置の状態を装置監視インタフェース101を使って監視し、現用系であるサービスサーバ(#1,#2)3,4と待機系であるサービスサーバ(#3)5との間のファイル管理システムの同期化処理を行う。   The management server 2 monitors the status of each device in the data control system using the device monitoring interface 101, and the active service servers (# 1, # 2) 3 and 4 and the standby service server (# 3). 5 is synchronized with the file management system.

現用系であるサービスサーバ(#1,#2)3,4は、共有ディスク装置1のディスク装置(#1,#2)12,13に格納されたデータを使ってサービス処理を行う。待機系であるサービスサーバ(#3)5は現用系であるサービスサーバ(#1)3あるいは現用系であるサービスサーバ(#2)4が故障し、サービス処理を行うことができなくなった際に、故障したサービスサーバの処理を引き継ぎ、サービス処理を継続する。   The active service servers (# 1, # 2) 3 and 4 perform service processing using data stored in the disk devices (# 1, # 2) 12 and 13 of the shared disk device 1. When the service server (# 3) 5 which is the active system fails or the service server (# 2) 4 which is the active system fails, the service server (# 3) 5 which is the standby system cannot perform service processing. Then, take over the processing of the failed service server and continue the service processing.

ファイバチャネルスイッチ6は現用系であるサービスサーバ(#1,#2)3,4、待機系であるサービスサーバ(#3)5、共有ディスク装置1をファイバチャネルインタフェース102,103で接続し、ファイバチャネルデータをスイッチングする。   The fiber channel switch 6 connects the service servers (# 1, # 2) 3 and 4 which are active systems, the service server (# 3) 5 which is a standby system, and the shared disk device 1 through fiber channel interfaces 102 and 103, and fiber Switch channel data.

共有ディスクコントローラ11はディスク装置(#1,#2)12,13、ファイバチャネルスイッチ6、現用系であるサービスサーバ(#1,#2)3,4、待機系であるサービスサーバ(#3)5とファイバチャネルインタフェース102〜104で接続され、現用系であるサービスサーバ(#1,#2)3,4から共有ディスク装置1へアクセスされた際に、共有ディスク装置1内のディスクアクセスを制御する。   The shared disk controller 11 includes disk devices (# 1, # 2) 12, 13, a fiber channel switch 6, service servers (# 1, # 2) 3, 4 as active systems, and service server (# 3) as a standby system 5 and fiber channel interfaces 102 to 104, and when the shared disk device 1 is accessed from the service servers (# 1, # 2) 3 and 4 which are active systems, the disk access in the shared disk device 1 is controlled. To do.

ディスク制御回路111は現用系であるサービスサーバ(#1,#2)3,4からの共有ディスク装置1へのアクセスが行われた際に、アクセス制御回路112の指示を受け、ディスク装置(#1,#2)12,13のアクセス制御を行う。アクセス制御回路112は、事前に登録された現用系であるサービスサーバ(#1,#2)3,4のファイバチャネルインタフェース識別ナンバーであるWWN、状態、ディスク装置等のメモリテーブルの情報にしたがって、サービスサーバ(#1〜#3)3〜5からディスク装置(#1,#2)12,13へのアクセスを制御する。   The disk control circuit 111 receives an instruction from the access control circuit 112 when the service server (# 1, # 2) 3, 4 serving as the active system accesses the shared disk device 1, and receives the instruction from the access control circuit 112. 1, # 2) Access control of 12 and 13 is performed. The access control circuit 112 follows the information in the memory table such as the WWN, status, and disk device that are the Fiber Channel interface identification numbers of the service servers (# 1, # 2) 3, 4 that are the active systems registered in advance. Access to the disk devices (# 1, # 2) 12, 13 from the service servers (# 1- # 3) 3-5 is controlled.

アクセス制御回路112が現用系であるサービスサーバ(#1)3からディスク装置(#1)12へのアクセスを現用系とするメモリテーブル上のアドレスを参照した場合、現用系であるサービスサーバ(#1)3からディスク装置(#1)12へのアクセスを実施することができる。しかしながら、ディスク装置(#2)13へのアクセスはアクセス制御回路112によって規制されるので、現用系であるサービスサーバ(#1)3からディスク装置(#2)13へのアクセスを実施することができない。   When the access control circuit 112 refers to the address on the memory table in which the access from the service server (# 1) 3 which is the active system to the disk device (# 1) 12 is the active system, the service server (# which is the active system) 1) The disk device (# 1) 12 can be accessed from 3. However, since access to the disk device (# 2) 13 is restricted by the access control circuit 112, the service server (# 1) 3 which is the active system can access the disk device (# 2) 13. Can not.

アクセス制御回路112が現用系であるサービスサーバ(#2)4からディス装置(#2)13へのアクセスを現用系とするメモリテーブル上のアドレスを参照した場合、現用系であるサービスサーバ(#2)4からディスク装置(#2)13へのアクセスを実施することができる。しかしながら、ディスク装置(#1)12へのアクセスはアクセス制御回路112によって規制されるので、現用系であるサービスサーバ(#2)4からディスク装置(#1)12へのアクセスを実施することができない。   When the access control circuit 112 refers to the address on the memory table where the access from the service server (# 2) 4 that is the active system to the disk device (# 2) 13 is the active system, the service server (# that is the active system) 2) Access to the disk device (# 2) 13 from 4 can be performed. However, since access to the disk device (# 1) 12 is restricted by the access control circuit 112, the service server (# 2) 4 which is the active system can access the disk device (# 1) 12. Can not.

アクセス制御回路112が待機系であるサービスサーバ(#3)5からディスク装置(#1,#2)12,13へのアクセスを待機系とするメモリテーブル上のアドレスを参照した場合、待機系であるサービスサーバ(#3)5からディスク装置(#1,#2)12,13のデバイスを認識することができるが、それらへのアクセスはアクセス制御回路112で規制され、待機系であるサービスサーバ(#3)5からディスク装置(#1,#2)12,13へのアクセスを実施することはできない。   When the access control circuit 112 refers to an address on a memory table in which the access from the service server (# 3) 5 which is a standby system to the disk devices (# 1, # 2) 12 and 13 is a standby system, The service server (# 3) 5 can recognize the devices of the disk devices (# 1, # 2) 12 and 13, but access to them is restricted by the access control circuit 112 and is a standby service server. (# 3) 5 cannot access the disk devices (# 1, # 2) 12, 13.

現用系であるサービスサーバ(#1)3が故障した場合、アクセス制御回路112がメモリテーブル上の参照アドレスを切替え、現用系であるサービスサーバ(#1)3からディスク装置(#1)12へのアクセスを規制し、待機系であるサービスサーバ(#3)5からディスク装置(#1)12へのアクセスを可能とする。   When the service server (# 1) 3 that is the active system fails, the access control circuit 112 switches the reference address on the memory table, and the service server (# 1) 3 that is the active system switches to the disk device (# 1) 12. Access to the disk device (# 1) 12 from the standby service server (# 3) 5 is made possible.

この場合、アクセス制御回路112が参照するメモリテーブル上の参照アドレスは、障害前に「1」,「3」,「6」,「8」であるが[図2(a)参照]、障害後に「2」,「3」,「5」,「8」と切替えられる[図2(b)参照]。   In this case, the reference addresses on the memory table referred to by the access control circuit 112 are “1”, “3”, “6”, “8” before the failure [see FIG. 2A], but after the failure. It is switched to “2”, “3”, “5”, “8” [see FIG. 2B].

このように、本実施例では、共有ディスク装置1側のアクセス制御回路112でディスク装置(#1,#2)12,13に対する各サービスサーバ(#1〜#3)3〜5からのアクセス規制を行うことができるため、待機系であるサービスサーバ(#3)5でも現用系であるサービスサーバ(#1,#2)3,4各々で使用するディスク装置(#1,#2)12,13を予めマウントさせておき、待機系であるサービスサーバ(#3)5からもディスク装置(#1,#2)12,13にアクセス可能な状態としておいてもサービスサーバ(#1〜#3)3〜5側の動作に関係なく、共有ディスク装置1内でディスク装置(#1,#2)12,13への排他制御を実現することができるため、サービスサーバ(#1〜#3)3〜5の競合アクセスによるファイル管理システムの破壊を防止することができ、システムの信頼性を向上させることができる。   Thus, in this embodiment, the access control circuit 112 on the shared disk device 1 side restricts access from the service servers (# 1 to # 3) 3 to 5 to the disk devices (# 1 and # 2) 12 and 13. Therefore, the disk servers (# 1, # 2) 12, which are used in the service servers (# 1, # 2) 3, 4 in the active system even in the service server (# 3) 5, which is the standby system, 13 is mounted in advance, and the service servers (# 1 to # 3) can be accessed even when the disk servers (# 1, # 2) 12 and 13 are accessible from the service server (# 3) 5 which is a standby system. ) Since the exclusive control to the disk devices (# 1, # 2) 12, 13 can be realized within the shared disk device 1 regardless of the operations on the 3-5 side, the service servers (# 1- # 3) 3-5 competitive access It is possible to prevent the destruction of the file management system according to, it is possible to improve the reliability of the system.

また、本実施例では、現用系であるサービスサーバ(#1,#2)3,4から待機系であるサービスサーバ(#3)5への切替え発生時に、アンマウント、マウント制御を行う必要がなく、共有ディスク装置1内におけるアクセス制御回路112のメモリテーブルの参照先を変更するだけでアクセス経路を切替えることができるため、障害発生時の切替え時に要する時間を短縮することができ、障害発生時のサービス中断時間を短縮することができる。   Further, in this embodiment, there is no need to perform unmounting and mounting control when switching from the service servers (# 1, # 2) 3 and 4 as the active system to the service server (# 3) 5 as the standby system occurs. Since the access path can be switched simply by changing the reference destination of the memory table of the access control circuit 112 in the shared disk device 1, the time required for switching when a failure occurs can be shortened. Service interruption time can be shortened.

次に、図1及び図2における現用系であるサービスサーバ(#1,#2)3,4からディスク装置(#1,#2)12,13へのアクセス状態が、現用系であるサービスサーバ(#1)3の故障発生によって、現用系であるサービスサーバ(#2)4、待機系であるサービスサーバ(#3)5からディスク装置(#1,#2)12,13へのアクセスに切替える動作について説明する。   Next, the access state from the service servers (# 1, # 2) 3, 4 as the active system in FIGS. 1 and 2 to the disk devices (# 1, # 2) 12, 13 is the service server as the active system. (# 1) When the failure of 3 occurs, the service server (# 2) 4 as the active system and the service server (# 3) 5 as the standby system can access the disk devices (# 1, # 2) 12 and 13 The switching operation will be described.

アクセス制御回路112は、初期状態として予めメモリテーブルのアドレス「1」,「3」,「6」,「8」を参照対象として登録されている。現用系であるサービスサーバ(#1)3はディスク装置(#1)12をマウントしており、現用系であるサービスサーバ(#1)3としてはアクセス可能状態とする。現用系であるサービスサーバ(#2)4はディスク装置(#2)13をマウントしており、現用系であるサービスサーバ(#2)4としてはアクセス可能状態とする。待機系であるサービスサーバ(#3)5はディスク装置(#1)12、ディスク装置(#2)13をマウントしており、待機系であるサービスサーバ(#3)5としてはアクセス可能状態とする。   The access control circuit 112 is registered in advance with reference to addresses “1”, “3”, “6”, and “8” of the memory table as an initial state. The service server (# 1) 3 which is the active system has the disk device (# 1) 12 mounted, and the service server (# 1) 3 which is the active system is in an accessible state. The service server (# 2) 4 which is the active system has the disk device (# 2) 13 mounted, and the service server (# 2) 4 which is the active system is made accessible. The service server (# 3) 5 as the standby system has the disk device (# 1) 12 and the disk device (# 2) 13 mounted thereon, and the service server (# 3) 5 as the standby system is in an accessible state. To do.

現用系であるサービスサーバ(#1)3と待機系であるサービスサーバ(#3)5及び現用系であるサービスサーバ(#2)4と待機系であるサービスサーバ(#3)5のファイル管理システムは管理サーバ2によって同期化される。   File management of the service server (# 1) 3 which is the active system, the service server (# 3) 5 which is the standby system, and the service server (# 2) 4 which is the active system and the service server (# 3) 5 which is the standby system The system is synchronized by the management server 2.

現用系サービスサーバ(#1)3からのアクセス時、アクセス制御回路112に「WWN=AAAA」が送出されると、アクセス制御回路112はメモリテーブルを参照し、「WWN=AAAA」が現用系であるサービスサーバ(#1)3であることを識別する。また同時に、アクセス制御回路112は、状態が現用系、アクセス対象ディスク装置がディスク装置(#1)12であることを認識し、現用系であるサービスサーバ(#1)3からディスク装置(#1)12へのアクセス許可をディスク制御回路111に指示し、ディスク制御回路111がアクセスを可能とする。   When “WWN = AAAAA” is sent to the access control circuit 112 during access from the active service server (# 1) 3, the access control circuit 112 refers to the memory table, and “WWN = AAAA” is the active system. The service server (# 1) 3 is identified. At the same time, the access control circuit 112 recognizes that the status is the active system and the disk device to be accessed is the disk device (# 1) 12, and receives the disk device (# 1) from the service server (# 1) 3 that is the active system. ) The disk control circuit 111 is instructed to permit access to 12, and the disk control circuit 111 enables access.

現用系であるサービスサーバ(#2)4からアクセス制御回路112に「WWN=BBBB」が送出されると、アクセス制御回路112はメモリテーブルを参照し、「WWN=BBBB」が現用系であるサービスサーバ(#2)4であることを識別する。また同時に、アクセス制御回路112は状態が現用系、アクセス対象ディスク装置がディスク装置(#2)13であることを認識し、現用系であるサービスサーバ(#2)4からディスク装置(#2)13へのアクセス許可をディスク制御回路111に指示し、ディスク制御回路111がアクセスを可能とする。   When “WWN = BBBB” is sent from the service server (# 2) 4 which is the active system to the access control circuit 112, the access control circuit 112 refers to the memory table, and “WWN = BBBB” is the service which is the active system. The server (# 2) 4 is identified. At the same time, the access control circuit 112 recognizes that the status is the active system and the access target disk device is the disk device (# 2) 13, and from the service server (# 2) 4 that is the active system to the disk device (# 2). 13 is instructed to the disk control circuit 111 to allow access to the disk control circuit 111.

待機系であるサービスサーバ(#3)5からアクセス制御回路112に「WWN=CCCC」が送出されると、アクセス制御回路112はメモリテーブルを参照し、「WWN=CCCC」が待機系であるサービスサーバ(#3)5であることを識別する、また同時に、アクセス制御回路112は状態が待機系、アクセス対象ディスク装置がディスク装置(#1)12、ディスク装置(#2)13であることを認識し、待機系であるサービスサーバ(#3)5からディスク装置(#1)12、ディスク装置(#2)13へのアクセスの不可をディスク制御回路111に指示し、ディスク制御回路111がアクセスを不可とする。   When “WWN = CCCC” is sent from the service server (# 3) 5 which is a standby system to the access control circuit 112, the access control circuit 112 refers to the memory table, and “WWN = CCCC” is a service which is the standby system. The server (# 3) 5 is identified. At the same time, the access control circuit 112 determines that the status is standby and the disk device to be accessed is the disk device (# 1) 12 and the disk device (# 2) 13. Recognizing and instructing the disk control circuit 111 that the access to the disk device (# 1) 12 and the disk device (# 2) 13 from the service server (# 3) 5 as the standby system is impossible, and the disk control circuit 111 accesses Is prohibited.

現用系であるサービスサーバ(#1)3が障害になると、管理サーバ2がその障害を検出し、装置監視インタフェース101を使って共有ディスクコントローラ11に現用系であるサービスサーバ(#1)3が障害になったことを通知する。この通知は共有ディスクコントローラ11のアクセス制御回路112で受信後、アクセス制御回路112はメモリテーブルの参照対象のアドレスを「1」から「2」へ切替え、ディスク制御回路111に現用系であるサービスサーバ(#1)3からディスク装置(#1)12へのアクセスを不可とする指示を行う。ディスク制御回路111は現用系であるサービスサーバ(#1)3からディスク装置(#1)12へのアクセスを不可状態とする。   When the active service server (# 1) 3 fails, the management server 2 detects the failure, and the device monitoring interface 101 is used to connect the active service server (# 1) 3 to the shared disk controller 11. Notify that a failure has occurred. After this notification is received by the access control circuit 112 of the shared disk controller 11, the access control circuit 112 switches the address to be referenced in the memory table from “1” to “2”, and the disk control circuit 111 is switched to the active service server. (# 1) 3 is instructed to disable access to the disk device (# 1) 12. The disk control circuit 111 disables access to the disk device (# 1) 12 from the service server (# 1) 3 which is the active system.

また同時に、アクセス制御回路112はメモリテーブルの参照対象のアドレスを「6」から「5」へ切替え、ディスク制御回路111に待機系であるサービスサーバ(#3)5からディスク装置(#1)12へのアクセスを許可とする指示を行う。ディスク制御回路111は待機系であるサービスサーバ(#3)5からディスク装置(#1)12へのアクセスを可能状態にする。   At the same time, the access control circuit 112 switches the address to be referenced in the memory table from “6” to “5”, and the disk control circuit 111 is switched from the service server (# 3) 5 which is a standby system to the disk device (# 1) 12. Instruct to allow access to. The disk control circuit 111 enables access to the disk device (# 1) 12 from the service server (# 3) 5 as a standby system.

待機系であるサービスサーバ(#3)5からディスク装置(#1)12へのアクセスが可能状態になると、アクセス制御回路112は管理サーバ2に対してアクセス可能状態を通知する。通知を受けた管理サーバ2は、待機系であるサービスサーバ(#3)5に、状態が運用状態に変化したことを通知し、ディスク装置(#1)12を使ってサービス処理を継続させる。   When the service server (# 3) 5 as the standby system becomes accessible to the disk device (# 1) 12, the access control circuit 112 notifies the management server 2 of the accessible state. Upon receiving the notification, the management server 2 notifies the service server (# 3) 5 which is a standby system that the state has changed to the operation state, and continues the service processing using the disk device (# 1) 12.

このように、本実施例では、共有ディスク装置1及び冗長化されたサービスサーバ(#1〜#3)3〜5で構成されたデータ制御システムにおいて、現用系であるサービスサーバ(#1,#2)3,4側と待機系であるサービスサーバ(#3)5側とで共有ディスク装置1内の同一のディスク装置をマウントした状態でも、共有ディスク装置1内のアクセス制御回路112で、現用系であるサービスサーバ(#1,#2)3,4あるいは待機系であるサービスサーバ(#3)5の故障時の誤動作で両サービスサーバからのアクセスが競合される可能性を排除することができ、障害発生時のシステムの信頼性の向上を図ることができる。   As described above, in the present embodiment, in the data control system including the shared disk device 1 and the redundant service servers (# 1 to # 3) 3 to 5, the service servers (# 1 and # 1) which are active systems are used. 2) Even when the same disk device in the shared disk device 1 is mounted on the side of the service server (# 3) 5 as the standby system on the side of 3 and 4, the active control is performed by the access control circuit 112 in the shared disk device 1. To eliminate the possibility of conflicting access from both service servers due to malfunctions at the time of failure of the service servers (# 1, # 2) 3 and 4 as the system or the service server (# 3) 5 as the standby system It is possible to improve the reliability of the system when a failure occurs.

現用系であるサービスサーバ(#1)3の故障によって、現用系であるサービスサーバ(#1)3からのアンマウントができず、現用系であるサービスサーバ(#1,#2)3,4、待機系であるサービスサーバ(#3)5がともにマウント状態となった場合においても、共有ディスク装置1側でアクセス制御を行うことが可能であるため、アクセス競合となる可能性を同様に排除することができる。   Due to the failure of the service server (# 1) 3 which is the active system, the service server (# 1, # 2) 3, 4 which is the active system cannot be unmounted from the service server (# 1) 3 which is the active system. Even when the service server (# 3) 5 which is the standby system is both mounted, access control can be performed on the shared disk device 1 side, so the possibility of access contention is similarly eliminated. be able to.

また、本実施例では、上記の効果にて信頼性を確保したまま、現用系であるサービスサーバ(#1,#2)3,4と待機系であるサービスサーバ(#3)5とから共有ディスク装置1内の同じディスク装置をマウントすることができ、また現用系であるサービスサーバ(#1)3が障害となった際に、待機系であるサービスサーバ(#3)5による処理引継ぎを共有ディスク装置1内でメモリてーぶるの参照先変更のみで行うことができるため、現用系であるサービスサーバ(#1,#2)の障害発生時の切替え時間を従来よりも短縮することができる。   Further, in this embodiment, the service server (# 1, # 2) 3, 4 which is the active system and the service server (# 3) 5, which is the standby system, share the reliability while ensuring the above effect. The same disk device in the disk device 1 can be mounted, and when the service server (# 1) 3 which is the active system becomes a failure, the process takeover by the service server (# 3) 5 which is the standby system is taken over Since it can be performed only by changing the reference destination of the memory table in the shared disk device 1, the switching time when a failure occurs in the active service servers (# 1, # 2) can be shortened compared to the conventional case. it can.

本発明の一実施例によるデータ制御システムの構成を示すブロック図である。It is a block diagram which shows the structure of the data control system by one Example of this invention. 図1の共有ディスクコントローラの構成を示すブロック図である。FIG. 2 is a block diagram showing a configuration of a shared disk controller in FIG. 1.

符号の説明Explanation of symbols

1 共有ディスク装置
2 管理サーバ
3〜5 サービスサーバ(#1〜#3)
6 ファイバチャネルスイッチ
11 共有ディスクコントローラ
12,13 ディスク装置(#1,#2)
101 装置監視インタフェース
102〜104 ファイバチャネルインタフェース
111 ディスク制御回路
112 アクセス制御回路
1 Shared disk device
2 management server
3-5 service servers (# 1 to # 3)
6 Fiber Channel switch
11 Shared disk controller 12, 13 Disk device (# 1, # 2)
101 Device monitoring interface 102-104 Fiber channel interface
111 Disk control circuit
112 Access control circuit

Claims (9)

複数のディスク装置を含む共有ディスク装置と、冗長化されかつ前記ディスク装置を参照してサービスを行う複数のサービスサーバとからなるデータ制御システムであって、
前記共有ディスク装置は、前記複数のディスク装置に対する前記複数のサービスサーバからのアクセスを制御する制御手段を有し、
初期時に前記複数のサービスサーバから前記複数のディスク装置へのアクセスをすべて可能状態とし、
前記制御手段は、少なくとも前記サービスサーバの装置状態が現用系か待機系かに応じて前記複数のディスク装置へのアクセスの許可不許可を制御し、
前記制御手段は、前記サービスサーバ及びそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)と前記サービスサーバの状態と対象ディスクとを関係付けて記憶するメモリテーブルに基づいて前記現用系であるサービスサーバと前記待機系であるサービスサーバとから前記ディスク装置へのアクセスを制御し、
前記制御手段は、前記現用系であるサービスサーバが故障した場合、前記メモリテーブル上の参照アドレスを切替え、前記現用系であるサービスサーバから前記ディスク装置へのアクセスを規制し、前記待機系であるサービスサーバから当該ディスク装置へのアクセスを可能とすることを特徴とするデータ制御システム。
A data control system comprising a shared disk device including a plurality of disk devices and a plurality of service servers that are redundant and perform services with reference to the disk devices,
The shared disk device has control means for controlling access from the plurality of service servers to the plurality of disk devices,
In the initial stage, all the access to the plurality of disk devices from the plurality of service servers is enabled,
The control means controls permission / non-permission of access to the plurality of disk devices according to at least whether the device state of the service server is an active system or a standby system;
The control means is a service that is the active system based on a memory table that associates and stores the service server and its WWN (World Wide Name) that is the Fiber Channel interface identification number, the state of the service server, and the target disk. Controlling access to the disk device from a server and the service server as the standby system,
When the service server as the active system fails, the control means switches the reference address on the memory table, regulates access to the disk device from the service server as the active system, and is the standby system A data control system that enables access to the disk device from a service server .
前記制御手段は、前記初期時に、前記装置状態が現用系であるサービスサーバに対して前記複数のディスク装置のうちのいずれか一つをアクセス可能とし、前記装置状態が待機系であるサービスサーバに対して前記複数のディスク装置すべてをアクセス可能とし、前記サービスサーバによるサービス提供時に、前記装置状態が待機系であるサービスサーバに対して前記複数のディスク装置すべてをアクセス不可とすることを特徴とする請求項1記載のデータ制御システム。In the initial stage, the control means makes it possible to access any one of the plurality of disk devices to the service server whose device status is the active system, and to the service server whose device status is the standby system. On the other hand, all of the plurality of disk devices are made accessible, and when the service is provided by the service server, all of the plurality of disk devices are made inaccessible to a service server whose device state is a standby system. The data control system according to claim 1. 前記制御手段は、前記サービスサーバによるサービス提供時に、前記装置状態が現用系であるサービスサーバに障害が発生すると、前記装置状態が待機系であるサービスサーバに対して前記障害が発生したサービスサーバにて使用していたディスク装置をアクセス可能とすることを特徴とする請求項2記載のデータ制御システム。When the service is provided by the service server, if a failure occurs in the service server whose device status is the active system, the control means determines whether the failure occurs for the service server whose device status is the standby system. 3. The data control system according to claim 2, wherein the disk device used in the past can be accessed. 複数のディスク装置を含み、冗長化されかつ前記ディスク装置を参照してサービスを行う複数のサービスサーバとともにデータ制御システムを構成する共有ディスク装置であって
前記複数のディスク装置に対する前記複数のサービスサーバからのアクセスを制御する制御手段を有し、
初期時に前記複数のサービスサーバから前記複数のディスク装置へのアクセスをすべて可能状態とし、
前記制御手段が、少なくとも前記サービスサーバの装置状態が現用系か待機系かに応じて前記複数のディスク装置へのアクセスの許可不許可を制御し、
前記制御手段が、前記サービスサーバ及びそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)と前記サービスサーバの状態と対象ディスクとを関係付けて記憶するメモリテーブルに基づいて前記現用系であるサービスサーバと前記待機系であるサービスサーバとから前記ディスク装置へのアクセスを制御し、
前記制御手段は、前記現用系であるサービスサーバが故障した場合、前記メモリテーブル上の参照アドレスを切替え、前記現用系であるサービスサーバから前記ディスク装置へのアクセスを規制し、前記待機系であるサービスサーバから当該ディスク装置へのアクセスを可能とすることを特徴とする共有ディスク装置。
A shared disk device that includes a plurality of disk devices, configures a data control system together with a plurality of service servers that are made redundant and perform services with reference to the disk devices ,
Control means for controlling access from the plurality of service servers to the plurality of disk devices;
In the initial stage, all the access to the plurality of disk devices from the plurality of service servers is enabled,
The control means controls permission / non-permission of access to the plurality of disk devices according to at least whether the service server device status is active or standby;
The service which is the active system based on a memory table in which the control means associates and stores the service server and its Fiber Channel interface identification number WWN (World Wide Name), the state of the service server and the target disk. Controlling access to the disk device from a server and the service server as the standby system,
When the service server as the active system fails, the control means switches the reference address on the memory table, regulates access to the disk device from the service server as the active system, and is the standby system A shared disk device, wherein a service server can access the disk device.
前記制御手段が、前記初期時に、前記装置状態が現用系であるサービスサーバに対して前記複数のディスク装置のうちのいずれか一つをアクセス可能とし、前記装置状態が待機系であるサービスサーバに対して前記複数のディスク装置すべてをアクセス可能とし、前記サービスサーバによるサービス提供時に、前記装置状態が待機系であるサービスサーバに対して前記複数のディスク装置すべてをアクセス不可とすることを特徴とする請求項4記載の共有ディスク装置。In the initial stage, the control means makes it possible to access any one of the plurality of disk devices to the service server whose device status is the active system, and to the service server whose device status is the standby system. On the other hand, all of the plurality of disk devices are made accessible, and when the service is provided by the service server, all of the plurality of disk devices are made inaccessible to a service server whose device state is a standby system. The shared disk device according to claim 4. 前記制御手段が、前記サービスサーバによるサービス提供時に、前記装置状態が現用系であるサービスサーバに障害が発生すると、前記装置状態が待機系であるサービスサーバに対して前記障害が発生したサービスサーバにて使用していたディスク装置をアクセス可能とすることを特徴とする請求項5記載の共有ディスク装置。When a failure occurs in the service server whose device state is the active system when the control means provides the service by the service server, the control unit determines that the service server in which the failure has occurred with respect to the service server whose device state is the standby system 6. The shared disk device according to claim 5, wherein the disk device that has been used can be accessed. 複数のディスク装置を含む共有ディスク装置と、冗長化されかつ前記ディスク装置を参照してサービスを行う複数のサービスサーバとからなるデータ制御システムに用いるディスクアクセス規制の切替方法であって、A disk access restriction switching method used for a data control system including a shared disk device including a plurality of disk devices and a plurality of service servers that are redundant and perform services with reference to the disk devices,
前記共有ディスク装置が、前記複数のディスク装置に対する前記複数のサービスサーバからのアクセスを制御する制御処理を実行し、The shared disk device executes control processing for controlling access from the plurality of service servers to the plurality of disk devices;
初期時に前記複数のサービスサーバから前記複数のディスク装置へのアクセスをすべて可能状態とし、In the initial stage, all the access to the plurality of disk devices from the plurality of service servers is enabled,
前記制御処理において、少なくとも前記サービスサーバの装置状態が現用系か待機系かに応じて前記複数のディスク装置へのアクセスの許可不許可を制御し、In the control process, controlling permission / non-permission of access to the plurality of disk devices according to at least whether the device status of the service server is an active system or a standby system,
前記制御処理において、前記サービスサーバ及びそのファイバチャネルインタフェース識別ナンバーであるWWN(World Wide Name)と前記サービスサーバの状態と対象ディスクとを関係付けて記憶するメモリテーブルに基づいて前記現用系であるサービスサーバと前記待機系であるサービスサーバとから前記ディスク装置へのアクセスを制御し、In the control process, the service which is the active system based on the service server and the WWN (World Wide Name) which is the Fiber Channel interface identification number, and the memory table which stores the state of the service server and the target disk in association with each other. Controlling access to the disk device from a server and the service server as the standby system,
前記制御処理において、前記現用系であるサービスサーバが故障した場合、前記メモリテーブル上の参照アドレスを切替え、前記現用系であるサービスサーバから前記ディスク装置へのアクセスを規制し、前記待機系であるサービスサーバから当該ディスク装置へのアクセスを可能とすることを特徴とするディスクアクセス規制の切替方法。In the control process, when the service server that is the active system fails, the reference address on the memory table is switched, access from the service server that is the active system to the disk device is restricted, and the standby system A disk access restriction switching method, characterized in that a service server can access the disk device.
前記制御処理において、前記初期時に、前記装置状態が現用系であるサービスサーバに対して前記複数のディスク装置のうちのいずれか一つをアクセス可能とし、前記装置状態が待機系であるサービスサーバに対して前記複数のディスク装置すべてをアクセス可能とし、前記サービスサーバによるサービス提供時に、前記装置状態が待機系であるサービスサーバに対して前記複数のディスク装置すべてをアクセス不可とすることを特徴とする請求項7記載のディスクアクセス規制の切替方法。In the control process, at the initial stage, any one of the plurality of disk devices can be accessed to a service server whose device status is the active system, and the service server whose device status is the standby system. On the other hand, all of the plurality of disk devices are made accessible, and when the service is provided by the service server, all of the plurality of disk devices are made inaccessible to a service server whose device state is a standby system. The method for switching disk access regulation according to claim 7. 前記制御処理において、前記サービスサーバによるサービス提供時に、前記装置状態が現用系であるサービスサーバに障害が発生すると、前記装置状態が待機系であるサービスサーバに対して前記障害が発生したサービスサーバにて使用していたディスク装置をアクセス可能とすることを特徴とする請求項8記載のディスクアクセス規制の切替方法。In the control process, when a failure occurs in the service server whose device status is the active system when the service server provides a service, the service server in which the failure occurs with respect to the service server whose device status is the standby system 9. The disk access restriction switching method according to claim 8, wherein the disk device that has been used can be accessed.
JP2005367306A 2005-12-21 2005-12-21 Data control system, shared disk device, and disk access restriction switching method used therefor Active JP4792958B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005367306A JP4792958B2 (en) 2005-12-21 2005-12-21 Data control system, shared disk device, and disk access restriction switching method used therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005367306A JP4792958B2 (en) 2005-12-21 2005-12-21 Data control system, shared disk device, and disk access restriction switching method used therefor

Publications (2)

Publication Number Publication Date
JP2007172192A JP2007172192A (en) 2007-07-05
JP4792958B2 true JP4792958B2 (en) 2011-10-12

Family

ID=38298687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005367306A Active JP4792958B2 (en) 2005-12-21 2005-12-21 Data control system, shared disk device, and disk access restriction switching method used therefor

Country Status (1)

Country Link
JP (1) JP4792958B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104156286B (en) * 2014-08-22 2017-07-04 福建星网视易信息系统有限公司 The system disk changing method and device of a kind of linux operating systems

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2664144B2 (en) * 1986-01-16 1997-10-15 株式会社日立製作所 Multiplexing device switching method and device
JPH09231185A (en) * 1996-02-28 1997-09-05 Toshiba Corp Hot standby system and method for data equivalent processing between computers in the system
JP3130892B2 (en) * 1999-03-09 2001-01-31 日本電気通信システム株式会社 Redundant system
US6343324B1 (en) * 1999-09-13 2002-01-29 International Business Machines Corporation Method and system for controlling access share storage devices in a network environment by configuring host-to-volume mapping data structures in the controller memory for granting and denying access to the devices
JP2005128781A (en) * 2003-10-23 2005-05-19 Hitachi Ltd System changeover method and information processing system

Also Published As

Publication number Publication date
JP2007172192A (en) 2007-07-05

Similar Documents

Publication Publication Date Title
US7134048B2 (en) Logical unit security for clustered storage area networks
JP6056554B2 (en) Cluster system
US8032786B2 (en) Information-processing equipment and system therefor with switching control for switchover operation
US20080301489A1 (en) Multi-agent hot-standby system and failover method for the same
US20070180288A1 (en) Method, system and program for securing redundancy in parallel computing sytem
US7484114B2 (en) Method and apparatus for providing redundant access to a shared resource with a shareable spare adapter
CN111585835B (en) Control method and device for out-of-band management system and storage medium
JP5531487B2 (en) Server system and server system management method
US7730168B2 (en) Method and apparatus for assigning packet addresses to a plurality of devices
JP6083480B1 (en) Monitoring device, fault tolerant system and method
JP2006178659A (en) Fault tolerant computer system and interrupt control method therefor
JP4792958B2 (en) Data control system, shared disk device, and disk access restriction switching method used therefor
JP2005128781A (en) System changeover method and information processing system
JP2007304700A (en) System and method for address management in duplex node system
KR19990078536A (en) Database duplication method for intelligent service system
JP2004102852A (en) Hot standby computer system
KR20160028250A (en) Duplex control system and method for control in software defined network
JP5439736B2 (en) Computer management system, computer system management method, and computer system management program
KR100228306B1 (en) Hot-standby multiplexer and implementation method
JP4146412B2 (en) Cluster system and exclusive control method for shared storage device applied to the same system
JP2006178614A (en) Fault tolerant computer and its bus selection control method
JP2006227770A (en) High-availability computer system
JP2005085170A (en) Cluster system, and majority control method
JP2014235503A (en) Information processing device, information processing system, hard disk failure detection method, service continuation method, hard disk failure detection program, and service continuation program
JP2001175489A (en) Device and method for deciding operation mode at detection of abnormality

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110628

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110711

R150 Certificate of patent or registration of utility model

Ref document number: 4792958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3