WO2011121666A1 - マルチクラスタシステム - Google Patents

マルチクラスタシステム Download PDF

Info

Publication number
WO2011121666A1
WO2011121666A1 PCT/JP2010/002375 JP2010002375W WO2011121666A1 WO 2011121666 A1 WO2011121666 A1 WO 2011121666A1 JP 2010002375 W JP2010002375 W JP 2010002375W WO 2011121666 A1 WO2011121666 A1 WO 2011121666A1
Authority
WO
WIPO (PCT)
Prior art keywords
system storage
storage device
connection
circuit
cluster
Prior art date
Application number
PCT/JP2010/002375
Other languages
English (en)
French (fr)
Inventor
佐野好次
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP2012507910A priority Critical patent/JP5488693B2/ja
Priority to PCT/JP2010/002375 priority patent/WO2011121666A1/ja
Priority to EP10848848A priority patent/EP2555116A1/en
Publication of WO2011121666A1 publication Critical patent/WO2011121666A1/ja
Priority to US13/602,804 priority patent/US20120331334A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space

Definitions

  • the disclosed technology relates to a multi-cluster system in which a plurality of clusters are connected to a plurality of system storage devices via a network.
  • a multi-cluster system consists of multiple computers, or clusters.
  • the multi-cluster system executes, for example, database processing using, for example, a system storage device shared by a plurality of clusters.
  • the plurality of clusters and the plurality of system storage devices are connected via, for example, electric cables or optical cables.
  • each system storage device needs to hold the same data in order to ensure equivalence.
  • a logical connection state between each cluster and each system storage device is determined by a connection state flag indicating a logical connection state with each cluster provided in the system storage device.
  • the survival state between a plurality of clusters is confirmed by, for example, packet communication between clusters performed at a predetermined interval. Packet communication between a plurality of clusters is performed mutually via the system storage device.
  • a cluster using a plurality of multiplexed system storage devices checks the survival monitoring between the plurality of clusters via the system storage device as a master at a predetermined interval by the operation system (Operation System, OS). Is going on.
  • the cluster in which the path to the system storage device is disconnected cannot check the existence of the other cluster connected through the disconnected system storage device.
  • Clusters for which alive confirmation cannot be confirmed are separated from the multi-cluster system. The phenomenon that a cluster is separated is called cluster down. When a cluster down occurs, the number of clusters to be processed decreases, which causes a problem that processing of the entire multi-cluster system is delayed.
  • Multiple clusters running the program A plurality of system storage devices each connected to the plurality of clusters; At least one system storage device A first circuit for detecting connection information including connection failure information indicating a connection failure that has occurred with a connected cluster; A second circuit for notifying a plurality of clusters connected to the system storage device of connection information detected by the first circuit; The cluster is A third circuit for receiving connection information from each of a plurality of connected system storage devices; A fourth circuit for executing a process of disconnecting the system storage device based on connection information from each system storage device received by the third circuit; A multi-cluster system is provided.
  • a cluster receives connection information from each of a plurality of connected system storage devices, and a system storage device in which a connection failure is detected based on the received connection information from each system storage device Can be executed. Therefore, it is possible to disconnect the system storage device in which the connection failure is detected while maintaining the connection state to the system storage device in which the connection failure of each cluster is not detected. Furthermore, since the decrease in the number of clusters to be processed can be suppressed by preventing the separation of the clusters, the decrease in the number of clusters to be processed can be suppressed, so that the delay of the entire multi-cluster system can be suppressed.
  • FIG. 1 is a schematic diagram of the multi-cluster system according to the first embodiment.
  • FIG. 2 is a diagram illustrating a configuration diagram of the multi-cluster system according to the first embodiment.
  • FIG. 3 is a diagram illustrating a part of the internal configuration of the interface circuit according to the first embodiment.
  • FIG. 4 is a diagram illustrating a part of the internal configuration of the interface circuit according to the first embodiment.
  • FIG. 5 is a sequence diagram illustrating an operation example of the multi-cluster system according to the first embodiment.
  • FIG. 6 is a sequence diagram illustrating an operation example of the multi-cluster system according to the first embodiment.
  • FIG. 7 is a time chart illustrating an example of communication command processing of the multi-cluster system according to the first embodiment.
  • FIG. 8 is a time chart illustrating an example of communication command processing of the multi-cluster system according to the first embodiment.
  • FIG. 9 is a time chart illustrating an example of communication command processing of the multi-cluster system according to the first embodiment.
  • FIG. 10 is a sequence diagram illustrating an operation example of the multi-cluster system according to the second embodiment.
  • control method of the multi-cluster system 1000 and the multi-cluster system 1000 according to the first and second embodiments of the disclosed technology will be described.
  • the disclosed technology is not limited to each embodiment.
  • Example 1 1 to 9 illustrate a multi-cluster system 1000 and a control method for the multi-cluster system 1000 according to the first embodiment.
  • FIG. 1 is a schematic configuration diagram of a multi-cluster system 1000 according to the first embodiment.
  • the multi-cluster system 1000 includes a system storage device 100, a system storage device 200, a cluster 300, a cluster 400, a connection line 11, a connection line 12, a connection line 21, and a connection line 22.
  • the system storage device 100 and the system storage device 200 have the same configuration.
  • the same components as those described in the system storage device 100 are denoted by the same reference numerals and description thereof is omitted.
  • the cluster 300 and the cluster 400 have the same configuration.
  • the same components as those described in the cluster 300 are denoted by the same reference numerals, and the description thereof is omitted.
  • connection line 11 For the connection line 11, the connection line 12, the connection line 21, and the connection line 22, for example, an electric cable or an optical cable can be used.
  • the system storage device 100 and the cluster 300 are connected via a connection line 11.
  • the system storage device 100 and the cluster 400 are connected via a connection line 21.
  • the system storage device 200 and the cluster 300 are connected via the connection line 12.
  • the system storage device 200 and the cluster 400 are connected via the connection line 22.
  • the cluster 300 and the cluster 400 read data stored in the system storage device 100 and the system storage device 200, or write data to the system storage device 100 and the system storage device 200, and perform necessary processing.
  • the system storage device 100 includes an interface circuit 110, a system configuration control circuit 120, a priority control circuit 130, a plurality of memory access controllers 140, a service processor 150, a memory 160, and a bus 170.
  • the interface circuit 110, the system configuration control circuit 120, the priority control circuit 130, the memory access controller 140, and the memory 160 are connected to each other via a bus 170.
  • the system storage device 100 is multiplexed with the system storage device 200 to ensure that data stored in the system storage device 100 is prevented from being damaged.
  • the system storage device 100 stores the same data and program as the data and program stored in the system storage device 200.
  • the system storage device 100 is connected so as to be shared by the cluster 300 and the cluster 400 via the connection line 11 and the connection line 21.
  • the system storage device 100 relays the connection between the cluster 300 and the cluster 400 connected to the system storage device 100.
  • the interface circuit 110 is provided to connect the system storage device 100 to the cluster 300 and the cluster 400.
  • the interface circuit 110 analyzes the received packets transmitted from the cluster 300 and the cluster 400 and transmits commands and data to the system configuration control circuit 120 and the priority control circuit 130.
  • the interface circuit 110 sets which commands and data are accessed with priority over the clusters 300 and 400.
  • the interface circuit 110 receives the packetized commands and data from the cluster 300 and the cluster 400, and transmits the packetized commands and data to the cluster 300 and the cluster 400.
  • the system configuration control circuit 120 analyzes the commands from the cluster 300 and the cluster 400 received via the interface circuit 110, and sets them in correspondence with the analyzed commands of the system storage device 100.
  • the priority control circuit 130 controls access to the memory access controller 140.
  • the priority control circuit 130 notifies the memory access controller 140 of the priority of access.
  • the memory access controller 140 controls access to the memory 160 according to the access priority notified by the priority control circuit 130.
  • the service processor 150 performs system control including control of operation and maintenance diagnosis of the multi-cluster system 1000, for example.
  • the service processor 150 has an operator console function, for example.
  • the memory 160 temporarily stores, for example, at least a part of data used in the cluster 300 and the cluster 400, an OS program executed by the cluster 300 and the cluster 400, and an arithmetic program 160A.
  • the arithmetic program 160A is a program for performing arithmetic processing according to the first embodiment.
  • the arithmetic program 160A is executed by the cluster 300 and the cluster 400.
  • the processing of the arithmetic program 160A is executed by a standby cluster (not shown) connected to the system storage devices 100 and 200.
  • the arithmetic program 160A is not necessarily stored in the memory 160.
  • the arithmetic program 160A is stored in a “portable physical storage medium” such as a flexible disk (FD), a CD-ROM, an MO disk, a DVD disk, a magneto-optical disk, and an IC card inserted into the system storage device 100, for example.
  • the arithmetic program 160A is a disk device provided inside or outside the system storage device 100, or “another computer (or server)” connected to the system storage device 100 via a public line, the Internet, a LAN, a WAN, or the like. It is stored in a storage medium.
  • the system storage device 100 can read and execute the arithmetic program 160A from the storage medium.
  • the system storage device 200 includes an interface circuit 210, a system configuration control circuit 220, a priority control circuit 230, a memory access controller 240, a service processor 250, a memory 260, and a bus 270.
  • the interface circuit 210, the system configuration control circuit 220, the priority control circuit 230, the memory access controller 240, and the memory 260 are connected to each other via a bus 270.
  • the system storage device 200 is multiplexed with the system storage device 100 in order to ensure that data stored in the system storage device 200 is prevented from being damaged.
  • the system storage device 200 stores the same data and program as the system storage device 100.
  • the system storage device 200 is connected so as to be shared by the cluster 300 and the cluster 400 via the connection line 12 and the connection line 22.
  • the system storage device 200 relays the connection between the cluster 300 and the cluster 400 connected to the system storage device 200.
  • the cluster 300 includes an interface circuit 310, a system storage transfer unit 320, a channel device 330, a system controller 340, a main storage device 350, a service processor 360, a plurality of central processing units 370, and a bus 380.
  • the interface circuit 310, the system storage transfer unit 320, the channel device 330, the system controller 340, the main storage device 350, and the central processing unit 370 are connected to each other via a bus 380.
  • the interface circuit 310 is provided for the cluster 300 to connect to the system storage device 100 and the system storage device 200.
  • the interface circuit 310 analyzes the received packet transmitted from the system storage device 100 and the system storage device 200, and transmits a command response and data transfer to the system storage transfer unit 320.
  • the interface circuit 310 sets a command and data access priority order for the system storage transfer unit 320.
  • the interface circuit 310 packetizes the command and data received from the system storage transfer unit 320 and transmits the packetized command and data to the system storage device 100 and the system storage device 200.
  • the system storage transfer unit 320 controls data transfer between the interface circuit 310 and the main storage device 350.
  • the system storage transfer unit 320 controls communication with the cluster 400 connected via the interface circuit 310 and the interface circuit 210 of the system storage device 200.
  • the channel device 330 reads data from the main storage device 350 via the system storage transfer unit 320 and transfers the data to the central processing unit 370.
  • the system controller 340 controls data transfer among the system storage transfer unit 320, the channel device 330, the main storage device 350, and the central processing unit 370.
  • the main storage device 350 stores and holds data in response to requests from the system storage transfer unit 320 and the central processing unit 370.
  • the service processor 360 performs system control including control of operation and maintenance diagnosis of the multi-cluster system 1000, similarly to the service processor 150 related to the system storage device 100.
  • the central processing unit 370 executes arithmetic processing related to the cluster 300.
  • the central processing unit 370 controls the system storage transfer unit 320, the channel device 330, the system controller 340, and the main storage device 350.
  • the cluster 400 includes an interface circuit 410, a system storage transfer unit 420, a channel device 430, a system controller 440, a main storage device 450, a service processor 460, a central processing unit 470, and a bus 480.
  • the interface circuit 410, the system storage transfer unit 420, the channel device 430, the system controller 440, the main storage device 450, and the central processing unit 470 are connected to each other via a bus 480.
  • FIG. 2 is a diagram showing a configuration diagram of a location A indicated by a one-dot chain line in the multi-cluster system 1000 of FIG.
  • the system storage device 100 operates as a master and the system storage device 200 operates as a slave.
  • the system storage device 100 as a master operates as an active device.
  • the interface circuit 110 includes a failure detection notification circuit 110A1 and a failure detection notification circuit 110A2.
  • the failure detection notification circuit 110A1 is connected to the failure detection notification circuit 310A1 provided in the cluster 300 via the connection line 11.
  • the failure detection notification circuit 110A2 is connected to the failure detection notification circuit 410A1 provided in the cluster 400 via the connection line 21.
  • the failure detection notification circuit 110A1 and the failure detection notification circuit 110A2 provided in the interface circuit 110 of the system storage device 100 detect a connection failure between the system storage device 100 and the corresponding cluster. Specifically, the failure detection notification circuit 110A1 receives connection failure information notified from the cluster 300, and the failure detection notification circuit 110A2 receives connection failure information notified from the cluster 400, respectively.
  • the failure detection notification circuits 110A1 and 110A2 also analyze and check the packet transmitted in the corresponding cluster, and detect a connection failure with the corresponding cluster in the interface circuit 110. Even if there is no problem in the data check as a result of checking the error of the data received from the cluster, a connection failure may occur on the path until the data is taken into the system storage device 100.
  • the failure detection notification circuit 110 ⁇ / b> A ⁇ b> 1 and the failure detection notification circuit 110 ⁇ / b> A ⁇ b> 2 detect all connection failures that occur on the path until data is taken into the system storage device 100 as connection failures in the interface circuit 110.
  • the system configuration control circuit 120 includes an area for storing the connection state flag 120A1 and the connection state flag 120A2.
  • the connection state flag 120A1 is a flag indicating a logical connection state between the cluster 300 and the system storage device 100.
  • the connection status flag 120A1 is turned off when the failure detection notification circuit 110A1 detects a connection failure between the cluster 300 and the system storage device 100.
  • the connection state flag 120A2 is a flag indicating a logical connection state between the cluster 400 and the system storage device 100.
  • the connection status flag 120A2 is turned off when the failure detection notification circuit 110A2 detects a connection failure between the cluster 400 and the system storage device 100.
  • the system configuration control circuit 120 logically disconnects the connection with the cluster corresponding to the connection state flag 120A1 and the connection state flag 120A2 that have been turned off.
  • the priority control circuit 130 according to the system storage device 100 includes an interface failure notification circuit 130A.
  • the interface failure notification circuit 130A is connected to the failure detection notification circuit 110A1 and the failure detection notification circuit 110A2.
  • the interface failure notification circuit 130A connects the connection failure received from the failure detection notification circuit 110A1 to the cluster 400. Is notified to the failure detection notification circuit 110A2.
  • the function of each unit provided in the system storage device 200 is basically the same as the function of each unit provided in the system storage device 100, and thus detailed description thereof is omitted.
  • the interface circuit 310 related to the cluster 300 includes a failure detection notification circuit 310A1, a failure detection notification circuit 310A2, a connection state reception circuit 310B, and a command generation / issuance circuit 310C.
  • the failure detection notification circuit 310A1 is connected to the failure detection notification circuit 110A1 provided in the system storage device 100 via the connection line 11.
  • the failure detection notification circuit 310A2 is connected to the failure detection notification circuit 210A1 provided in the system storage device 200 via the connection line 21.
  • the failure detection notification circuit 310A1 and the failure detection notification circuit 310A2 detect a connection failure with the connected system storage device. Specifically, the failure detection notification circuit 310A1 receives connection failure information from the system storage device 100, and the failure detection notification circuit 310A2 receives connection failure information from the system storage device 200, respectively.
  • the failure detection notification circuits 310A1 and 310A2 analyze and check the packet transmitted from the corresponding system storage device, and detect a connection failure with the corresponding system storage device. Even when there is no problem in the data check, a connection failure may occur on the route until the data is taken into the cluster 300.
  • the failure detection notification circuit 310 ⁇ / b> A ⁇ b> 1 and the failure detection notification circuit 310 ⁇ / b> A ⁇ b> 2 detect all connection failures that have occurred on the route up to being taken into the cluster 300 as connection failures in the interface circuit 310.
  • the connection state reception circuit 310B receives connection information indicating a connection state with the corresponding system storage device from the failure detection notification circuit 310A1 or the failure detection notification circuit 310A2.
  • the connection information from the failure detection notification circuit of the interface circuit 310 that detects the connection failure with the corresponding system storage device includes information indicating the connection failure.
  • the connection state reception circuit 310B connects the connection information from the failure detection notification circuit that has detected the connection failure and the connection from the failure detection notification circuit that has not detected the connection failure. Receive information and.
  • the connection state reception circuit 310B When the failure detection notification circuit of any of the failure detection notification circuits 310A1 and 310A2 is notified of a connection failure with the corresponding system storage device, the connection state reception circuit 310B has not detected a connection failure. Based on the connection state between the other system storage device and the cluster 300, it is determined whether or not equivalence between the system storage devices connected to the cluster 300 is guaranteed. When the other system storage device in which the connection failure is not detected is not logically connected to the cluster 300, the connection state receiving circuit 310B transmits the connection failure to the system storage device in which the connection failure is detected and the other system storage device. It is determined that the same data and program are stored. That is, the connection status receiving circuit 310B determines that the equivalence between the system storage device in which the connection failure is detected and the other system storage devices is guaranteed.
  • the connection state receiving circuit 310B includes other system storage in the system storage device in which the connection failure is detected. It is determined that the same data and program as the device are not stored. That is, the connection state receiving circuit 310B determines that the equivalence between the system storage device in which the connection failure is detected and the other system storage device is not guaranteed. The connection state reception circuit 310B notifies the command generation / issuance circuit 310C of the determination result as reception information.
  • the command generation / issuance circuit 310C generates and issues a disconnection request command for the system storage device to be disconnected from the cluster 300 based on the reception information obtained from the connection state reception circuit 310B. Specifically, the command generation / issuance circuit 310C responds to a failure detection notification circuit in which a connection failure has occurred with the corresponding system storage device in the failure detection notification circuit 310A1 or the failure detection notification circuit 310A2. Issue a request command to disconnect the system storage device.
  • the request command can use, for example, a packetized command and data.
  • the interface circuit 410 related to the cluster 400 includes a failure detection notification circuit 410A1, a failure detection notification circuit 410A2, a connection state reception circuit 410B, and a command generation / issuance circuit 410C. Since the basic functions of the respective units are the same as those of the respective units of the cluster 300, detailed description thereof is omitted.
  • FIG. 3 is a diagram showing the configuration of the interface circuit 310 and the system storage transfer unit 320 at the location B indicated by the broken line in the cluster 300 of FIG.
  • the interface circuit 310 includes an interface circuit 310-1 corresponding to the system storage device 100 and an interface circuit 310-2 corresponding to the system storage device 200.
  • the interface circuit 310-1 includes a failure detection notification circuit 310-1A, a connection state reception circuit 310-1B, a command generation / issuance circuit 310-1C, a flip-flop 310-1D, a cyclic redundancy check circuit 310-1E, and a packet interval monitoring circuit 310.
  • -1F error correction code generation circuit 310-1G, Random Access Memory (RAM) 310-1H, error correction code inspection circuit 310-1I, command analysis circuit 310-1J, command generation circuit 310-1K, command priority selection circuit 310 -1L, command holding register circuit 310-1M, packet generation circuit 310-1N, and flip-flop 310-1O.
  • connection state reception circuit 310-1B in FIG. 3 and the connection state reception circuits 310B1 and 310B2 in FIG. 2 are the same elements.
  • the command generation / issue circuit 310-1C of FIG. 3 and the command generation / issue circuits 310C1, 310C2 of FIG. 2 are the same elements.
  • the flip-flop 310-1D receives the data packet transferred from the system storage device 100 and transmits it to the cyclic redundancy check circuit 310-1E.
  • the data packet includes connection information between the system storage device 100 and the cluster 300. When a connection failure is detected by the system storage device 100, a packet including failure detection information is transmitted from the system storage device 100.
  • the cyclic redundancy check circuit 310-1E performs error detection for detecting a packet error based on the packet transferred from the flip-flop 310-1D, for example, Cyclic Redundancy Check (CRC), and then transmits it to the RAM 310-1H.
  • CRC Cyclic Redundancy Check
  • the cyclic redundancy check circuit 310-1E transmits the CRC to the packet interval monitoring circuit 310-1F and the error correction code generation circuit 310-1G after executing the CRC.
  • the packet interval monitoring circuit 310-1F monitors the communication interval of the transferred packet, and transmits a connection failure notification to the failure detection notification circuit 310-1A when reception of the packet is interrupted for a certain time.
  • the error correction code generation circuit 310-1G generates an error correction code to be provided when a code error related to data occurs, and transmits the error correction code to the RAM 310-1H.
  • the RAM 310-1H writes the data checked by the cyclic redundancy check circuit 310-1E and the error correction code generated by the error correction code generation circuit 310-1G, and writes the written information to the error correction code check circuit 310-1I. And to the command analysis circuit 310-1J.
  • the error correction code check circuit 310-1I transmits a connection failure notification to the failure detection notification circuit 310-1A when a code error related to data occurs.
  • the command analysis circuit 310-1J analyzes the command received from the RAM 310-1H.
  • the command analysis circuit 310-1J transmits connection information between the system storage device 100 and the cluster 300 obtained as a result of the analysis to the interface circuit 310-2 corresponding to the system storage device 200. Further, the command analysis circuit 310-1J transmits a connection failure between the system storage device 100 and the cluster 300, that is, error information to the connection state reception circuit 310-1B.
  • the connection state reception circuit 310-1B transmits a connection failure between the system storage device 100 and the cluster 300 transmitted from the command analysis circuit 310-1J and an interface circuit 310-2 corresponding to the system storage device 200. Connection information between the system storage device 200 and the cluster 300 is received. When the connection failure is notified from the system storage device 100 and the connection information is notified from the system storage device 200 transmitted from the interface circuit 310-2, the connection state reception circuit 310-1B is connected to the system storage device 100. It is determined that the system storage device 200 does not hold the same data. When the system storage device 100 and the system storage device 200 do not hold the same data, the equivalence between the system storage device 100 and the system storage device 200 is not guaranteed.
  • the system storage device 100 determines that equivalence with the system storage device 200 is not guaranteed.
  • the connection state reception circuit 310-1B transmits a connection failure detection signal of the system storage device 100 to the command holding register circuit 310-1M.
  • the failure detection notification circuit 310-1A has a 2-bit error in data read from the RAM 310-1H transmitted from the error correction code check circuit 310-1I and a timeout of the packet communication interval detected by the packet interval monitoring circuit 310-1F. Receive an error.
  • the failure detection notification circuit 310-1A receives a 2-bit error or a timeout error, the failure detection notification circuit 310-1A transmits a command to the command generation / issuance circuit 310-1C.
  • the command transmitted to the command generation / issuance circuit 310-1C includes a connection failure between the system storage device 100 and the cluster 300. The transmitted command is held in the failure detection notification circuit 310-1A.
  • the command generation circuit 310-1K generates commands necessary for data transfer and packet transfer with each system storage device. Various commands generated by the command generation circuit 310-1K are transmitted to the command holding register circuit 310-1M and held in the command holding register circuit 310-1M.
  • the command holding register circuit 310-1M holds the disconnection command transmitted by the connection state receiving circuit 310-1B. At this time, the command holding register circuit 310-1M also holds information of the system storage device to be disconnected.
  • the command holding register circuit 310-1M holds a command including a connection failure between the system storage device 100 and the cluster 300 received from the failure detection notification circuit 310-1A.
  • the command holding register circuit 310-1M holds data received from the system storage transfer unit 320.
  • the command holding register circuit 310-1M resets the holding register generated by the command in response to a reset instruction from the command generation / issuance circuit 310-1C.
  • the command holding register circuit 310-1M transmits each held command and instruction to the command priority selection circuit 310-1L.
  • the command priority selection circuit 310-1L selects which command has priority among the commands held by the command holding register circuit 310-1M. For example, the command priority selection circuit 310-1L selects a command for disconnecting the system storage device held by the command holding register circuit 310-1M. The command priority selection circuit 310-1L transmits to the selected command generation / issuance circuit 310-1C.
  • the command generation / issuance circuit 310-1C selects data necessary for executing the command selected by the command priority selection circuit 310-1L, and transmits the data to the packet generation circuit 310-1N.
  • the command generation / issuance circuit 310-1C issues a command for disconnecting the system storage device selected by the command priority selection circuit 310-1L.
  • Data necessary for execution is selected and transmitted to the packet generation circuit 310-1N.
  • the command generation / issuance circuit 310-1C issues an instruction to reset the command holding of the command holding register circuit 310-1M after the data necessary for disconnecting the system storage device is generated. Send to.
  • the packet generation circuit 310-1N generates a packet based on the data for disconnecting the system storage device transmitted from the command generation / issuance circuit 310-1C.
  • the packet generation circuit 310-1N transmits the generated packet to the flip-flop 310-1O.
  • the flip-flop 310-1O receives the packet from the packet generation circuit 310-1N.
  • the packet includes disconnection information for disconnecting the system storage device 100 and the cluster 300.
  • the flip-flop 310-1 O transmits a packet for separating the system storage device 100 and the cluster 300 to the system storage device 100.
  • the interface circuit 310-2 transmits and receives packets to and from the system storage device 200.
  • the interface circuit 310-2 has the same configuration as the interface circuit 310-1.
  • FIG. 4 is a diagram showing a configuration diagram of the interface circuit 310-1 at the location C indicated by a broken line in the interface circuit 310-1 according to FIG.
  • FIG. 4 shows a command holding register circuit 310-1M, a command priority selection circuit 310-1L, a command generation / issuance circuit 310-1C, and a packet generation circuit 310-1N in the interface circuit 310-1.
  • the same components as those described in FIG. 3 are denoted by the same reference numerals, and description thereof is omitted.
  • the command holding register circuit 310-1M includes an isolation command generation flag 310-1M1 and an isolation selection register group 310-1M2.
  • the disconnect command generation flag 310-1M1 generates a command for disconnecting the system storage device from the clusters 300 and 400 when the connection failure detection signal is received from the connection state receiving circuit 310-1B.
  • the disconnect command generation flag 310-1M1 transmits the generated command to the command priority selection circuit 310-1L.
  • the disconnection selection register group 310-1M2 When the disconnection selection register group 310-1M2 receives the connection failure detection signal from the connection state reception circuit 310-1B, the disconnection selection register group 310-1M2 generates a selection command for selecting a system storage device to be disconnected from the cluster 300. The disconnection selection register group 310-1M2 transmits the generated selection command to the command generation issue circuit 310-1C.
  • the command generation / issuance circuit 310-1C includes timing shift registers 310-1C1 to 310-1C4.
  • Timing shift registers 310-1C1 to 310-1C4 include, for example, flip-flops.
  • the timing shift registers 310-1C1 to 310-1C4 receive from the command priority selection circuit 310-1L a command necessary for disconnecting the system storage device to be disconnected.
  • the timing shift registers 310-1C1 to 310-1C4 generate, for example, data necessary for selecting a system storage device to be separated and data necessary for selecting a separation location of the system storage device.
  • the command generation / issuance circuit 310-1C transmits a reset command that instructs the command holding register circuit 310-1M to reset the held command after data generation.
  • the command generation / issuance circuit 310-1C selects data necessary for executing a command for disconnecting the system storage device from the timing shift registers 310-1C1 to 310-1C4. Data selection is performed at an arbitrary timing by the timing shift registers 310-1C1 to 310-1C4.
  • the command generation / issuance circuit 310-1C transmits the selected data to the packet generation circuit 310-1N.
  • FIGS. 5 and 6 are sequence diagrams illustrating an operation example of the multi-cluster system 1000 according to the first embodiment.
  • the processing shown in FIG. 5 continues to A in FIG.
  • the processing illustrated in FIGS. 5 and 6 is a diagram illustrating processing when the failure detection notification circuit 110 ⁇ / b> A ⁇ b> 1 of the system storage device 100 detects a connection failure between the system storage device 100 and the cluster 300.
  • the system storage device 100 operates as a master and the system storage device 200 operates as a slave.
  • the system storage device 100 detects a connection failure with the cluster 300 by the failure detection notification circuit 110A1 (OP1).
  • the system storage device 100 In response to the detection of the connection state with the cluster 300, the system storage device 100 turns off the connection state flag corresponding to the cluster 300 by the system configuration control circuit 120 (OP2).
  • the system storage device 100 notifies the cluster 300 and the cluster 400 of connection information including connection failure information indicating that a connection failure has occurred between the system storage device 100 and the cluster 300 by the priority control circuit 130. (OP3).
  • the following shows processing between the system storage device 100 and the cluster 400.
  • the system storage device 200 also notifies the connection information to both the connected cluster 300 and cluster 400 (OP4).
  • the connection information notified from the system storage device 200 to each cluster 300 and 400 includes a connection failure. The information shown is not included.
  • the cluster 400 receives connection information from the system storage device 100 and connection information from the system storage device 200 via the interface circuit 410.
  • the connection state reception circuit 410B of the interface circuit 410 refers to the connection information from the system storage device 100 and the connection information from the system storage device 200, and the connection failure information is included in the connection information received from any of the system storage devices. It is determined whether or not.
  • the connection status receiving circuit 410B also refers to the connection information received from the other system storage device when the connection failure information is included in the connection information received from one of the system storage devices, and the other system storage device.
  • the logical connection state of the cluster 400 are determined (OP11). In OP11, connection failure information is included in the connection information from the system storage device 100, and it is determined from the connection information of the system storage device 200 that the cluster 400 and the system storage device 200 are logically connected. Next, the process of OP12 is performed.
  • the cluster 400 generates a disconnect command for the system storage device 100 using the command generation / issue circuit 410C (OP12).
  • the cluster 400 uses the command generation / issuance circuit 410C to issue the generated disconnection instruction to the system storage device 100 (OP13).
  • the failure detection notification circuit 110A2 of the system storage device 100 receives a system storage device disconnection command from the cluster 400. Similarly to the cluster 400, the cluster 300 also generates a disconnect command for the system storage device 100 based on connection information from each system storage device. However, a connection failure occurs between the cluster 300 and the system storage device 100. Therefore, the system storage device 100 cannot receive a disconnect command from the cluster 300.
  • the system storage device 100 that has received the disconnection command from the cluster 400 turns off the connection state flags corresponding to all the connected clusters via the failure detection notification circuit 110A1. In this example, the failure detection notification circuit 110A1 turns off the connection state flag 120A1 and the connection state flag 120A2 (OP14).
  • the system storage device 100 logically separates the cluster 300 and the cluster 400 from the system storage device 100 (OP15).
  • the cluster 400 Ignores the failure notification received from the system storage device 100 (OP16).
  • FIGS. 7 to 9 are time charts illustrating an example of communication command processing of the multi-cluster system 1000 according to the first embodiment.
  • the horizontal axis shown in FIGS. 7 to 9 indicates time t.
  • One scale on the horizontal axis indicates one clock.
  • the processing according to FIGS. 7 to 9 shows processing for detecting a connection failure between the system storage device 100 and the cluster 300.
  • FIG. 7 is a time chart showing an example of communication command processing in the interface circuit 310 of the cluster 300.
  • the failure detection notification circuit 310-1A detects a connection failure between the system storage device 100 and the cluster 300 (T1).
  • the command generation / issuance circuit 310-1C starts generating a failure notification command generation flag (T2).
  • the command generation / issuance circuit 310-1C starts generating a failure notification command generation flag (T3).
  • the command generation / issuance circuit 310-1C transmits a command to the packet generation circuit 310-1N to the command holding register circuit 310-1M, and then transmits a command holding reset command (T3 '). While the failure notification command generation flag is generated, no other command is selected in the command generation / issuance circuit 310-1C.
  • Timing shift registers 310-1C1 to 310-1C7 transmit only data necessary for disconnecting the selected system storage device 100 to the packet generation circuit 310-1N (T4).
  • the packet generation circuit 310-1N receives the data from the command generation / issuance circuit 310-1C and packetizes it (T5).
  • the packet generation circuit 310-1N outputs the packetized data (T6).
  • the packet generation circuit 310-1N adds data necessary for packet transfer to the input data and transmits it to the system storage device 100.
  • FIG. 8 is a time chart showing an example of communication command processing in the failure detection notification circuit 110A1 and the failure detection notification circuit 110A2 of the system storage device 100.
  • FIG. 8 shows processing when the failure detection notification circuit 310A1 of the cluster 300 starts to receive data including failure detection information from the failure detection notification circuit 110A2 of the system storage device 100.
  • the failure detection notification circuit 110A1 of the system storage device 100 corresponds to the failure detection notification circuit 310A1 of the cluster 300.
  • the failure detection notification circuit 110A2 of the system storage device 100 corresponds to the failure detection notification circuit 410A2 of the cluster 400.
  • the failure detection notification circuit 110A1 performs command analysis of the input data received from the cluster 300 (T11).
  • the input data includes failure detection information between the failure detection notification circuit 310A1 of the cluster 300 and the failure detection notification circuit 110A1 of the system storage device 100.
  • the failure detection notification circuit 110A1 After performing the command analysis, the failure detection notification circuit 110A1 transmits a connection failure to the other failure detection notification circuit 110A2 of the system storage device 100 via the interface failure notification circuit 130A (T12).
  • the failure detection notification circuit 110A2 After receiving the connection failure from 110A1, the failure detection notification circuit 110A2 transmits to the cluster 400 that a connection failure has been detected between the system storage device 100 and the cluster 300 (T13).
  • FIG. 9 is a time chart showing an example of communication command processing in the interface circuit 410 of the cluster 400.
  • FIG. 9 shows processing when data including failure detection information for the failure detection notification circuit 410A2 of the cluster 400 is received from the failure detection notification circuit 110A2 of the system storage device 100.
  • the failure detection notification circuit 410A1 of the cluster 400 corresponds to the failure detection notification circuit 110A2 of the system storage device 100.
  • the configuration of the interface circuit 410 of the cluster 400 is the same as the configuration of the interface circuit 310 of the cluster 300 described with reference to FIGS.
  • the command analysis circuit 410-1J analyzes the input data received from the system storage device 100 (T21).
  • the input data includes failure detection information between the failure detection notification circuit 310A1 of the cluster 300 and the failure detection notification circuit 110A1 of the system storage device 100.
  • the command analysis circuit 410-1J receives data from the system storage device 100.
  • the command analysis circuit 410-1J analyzes and receives a connection failure between the system storage device 100 and the cluster 300 (T22).
  • connection state reception circuit 410-1B receives connection information between the system storage device 200 and the cluster 400 from the failure detection notification circuit 410A2 (T23).
  • the connection state reception circuit 410-1B includes connection information including a connection failure between the system storage device 100 and the cluster 300 transmitted from the command analysis circuit 410-1J, and the system storage device 200 notified from the failure detection notification circuit 410A2. Connection information with the cluster 400 is received. When it is determined that the equivalence between the system storage device 100 and the system storage device 200 is not guaranteed based on the connection information, the connection state reception circuit 410-1B determines whether the command holding register circuit 410-1M The connection information including the connection failure of the system storage device 100 is transmitted (T24).
  • the command generation / issuance circuit 410-1C sets a failure notification command generation flag based on the connection information received from the connection state reception circuit 410-1B (T25).
  • the command generation / issuance circuit 410-1C also sets a failure notification command generation flag (T26).
  • the command generation / issuance circuit 410-1C transmits a command to the packet generation circuit 410-1N to the command holding register circuit 410-1M, and then transmits a command holding reset command (T26 '). While the failure notification command generation flag is set, no other command is selected in the command generation / issuance circuit 410-1C.
  • Timing shift registers 410-1C1 to 410-1C7 transmit only data necessary for disconnecting the selected system storage device 100 to the packet generation circuit 410-1N (T27).
  • the packet generation circuit 410-1N receives the data from the command generation / issuance circuit 410-1C and packetizes it (T28).
  • the packet generation circuit 410-1N outputs the packetized data (T28).
  • the packet generation circuit 410-1N adds data necessary for packet transfer to the input data and transmits it to the system storage device 100.
  • the system storage device 100 is disconnected from the clusters 300 and 400.
  • the cluster 400 includes connection information including a connection failure notified by the system storage device 100, connection information notified by the system storage device 200, and The system storage device 100 can be disconnected based on the above. Therefore, it is possible to disconnect the system storage device 100 in which a connection failure is detected while maintaining the connection state of the cluster 300 and the cluster 400 to the system storage device 200. Furthermore, since it is possible to prevent the cluster 300 from being detached and to suppress a decrease in the number of clusters to be processed, it is possible to suppress processing delay of the entire multi-cluster system 1000.
  • FIG. 10 illustrates a multi-cluster system 1000 and a control method for the multi-cluster system 1000 according to the second embodiment. Since the configuration of the multi-cluster system 1000 according to the second embodiment is the same as the configuration of the multi-cluster system 1000 according to the first embodiment, the description thereof is omitted.
  • FIG. 10 is a sequence diagram illustrating an operation example of the multi-cluster system 1000 according to the second embodiment.
  • the processing shown in FIG. 10 is a diagram illustrating processing when a failure in connection between the system storage device 100 and the cluster 300 is detected by the failure detection notification circuit 310A1 of the cluster 300.
  • the cluster 300 detects a connection failure between the system storage device 100 and the cluster 300 by the failure detection notification circuit 310A1 (OP21).
  • the cluster 300 indicates that a connection failure has occurred between the system storage device 100 and the cluster 300 from the failure detection notification circuit 310A1 to the failure detection notification circuit 110A1 of the system storage device 100 due to the detection of the connection failure by OP21.
  • Connection information including connection failure information is notified (OP22).
  • the system storage device 100 that has received the connection information from the cluster 300 causes the priority control circuit 130 to send connection information including information indicating that a connection failure has occurred between the system storage device 100 and the cluster 300 to the cluster 400. Notification is made (OP23). On the other hand, the system storage device 200 also notifies the connection information to both the connected cluster 300 and cluster 400 (OP24). When the system storage device 200 does not detect a connection failure between the connected clusters 300 and 400, the connection information notified from the system storage device 200 to each cluster 300 and 400 includes a connection failure. The information shown is not included.
  • the cluster 400 receives the connection information from the system storage devices 100 and 200 by the processing of OP23 and OP24, and then executes the same processing as OP11 to OP15 of the first embodiment (OP25). That is, the separation process of the system storage device 100 by the cluster 400 is performed.
  • connection information including the connection failure between the system storage device 100 and the cluster 300 notified by the cluster 300 and the interface circuit 410 of the cluster 400 are used.
  • the system storage device 100 can be disconnected based on the notified connection information.
  • the multi-cluster system having the system storage devices 100 and 200 and the clusters 300 and 400 has been described.
  • the number of system storage devices and clusters related to the multi-cluster system is not limited to two.
  • the disclosed technique can be applied to a multi-cluster system having an arbitrary number of system storage devices and clusters of two or more.
  • the cluster 400 receives connection information from each of a plurality of connected system storage devices 100 and 200, and based on the received connection information from each of the system storage devices 100 and 200, a connection failure It is possible to execute a process of disconnecting the system storage device 100 in which is detected. Therefore, it is possible to disconnect the system storage device in which the connection failure is detected while maintaining the connection state with respect to the system storage device 200 in which the connection failure of each cluster 300, 400 is not detected. Furthermore, since the decrease in the number of clusters that perform processing can be suppressed by preventing the separation of the cluster 300, the decrease in the number of clusters that perform processing can be suppressed, and therefore the processing delay of the entire multi-cluster system 1000 can be suppressed.
  • System storage device 110 210, 310, 410 Interface circuit 110A1, 110A2, 210A1, 210A2, 310A1, 310A2, 410A1, 410A2 Fault detection notification circuit 120, 220 System configuration control circuit 120A1, 120A2, 220A1, 220A2 Connection status flag 130, 230 Priority control circuit 130A, 230A Interface failure notification circuit 300, 400 Cluster 310B, 410B Connection status reception circuit 310C, 410C Command generation / issuance circuit 320, 420 System storage transfer unit 340, 440 system controller 1000 multi-cluster system

Abstract

 接続障害が検出されたシステム記憶装置を切り離す際にクラスタの接続状態を維持する。 プログラムを実行する複数のクラスタと、それぞれが複数のクラスタに接続された複数のシステム記憶装置と、を有し、少なくとも1つのシステム記憶装置は、接続されているクラスタとの間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、第1回路で検出された接続情報を、システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、クラスタは、接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、第3回路で受信した各システム記憶装置からの接続情報に基づいて、システム記憶装置を切り離す処理を実行する第4回路と、を有する。

Description

マルチクラスタシステム
 開示の技術は、複数のクラスタがネットワークにより複数のシステム記憶装置に接続されたマルチクラスタシステムに関する。
 マルチクラスタシステムは複数の計算機、即ちクラスタにより構成される。マルチクラスタシステムは、複数のクラスタにより共有される例えばシステム記憶装置を用いて、例えばデータベース処理を実行する。複数のクラスタ及び複数のシステム記憶装置間は、例えば電気ケーブル又は光ケーブルを介して接続されている。
 なお、複数のシステム記憶装置には、多重化のために同一のデータが格納されている。そのため、複数のシステム記憶装置の1つが故障となっても、他のシステム記憶装置を代わりに用いることができる。他のシステム記憶装置を用いることにより、マルチクラスタシステム全体としては連続的に稼働できる。複数のシステム記憶装置を多重化するために、お互いのシステム記憶装置は等価性を保証するために同一のデータを保持する必要がある。
 一方、各クラスタと各システム記憶装置間との論理的な接続状態は、システム記憶装置に備えられた、各クラスタとの論理的接続状態を示す接続状態フラグにより判断される。また、複数のクラスタ間の生存状態は、例えば所定の間隔で行われるクラスタ間のパケット通信により確認される。複数のクラスタ間におけるパケット通信は、システム記憶装置を介して相互に行われる。複数のクラスタ間の経路において接続障害が発生してクラスタ間のパケット通信が出来なくなった場合、一方のクラスタは、生存途絶が検出された他方のクラスタとシステム記憶装置との間のパスを論理的に切り離す。パスが論理的に切り離されたシステム記憶装置は、他のシステム記憶装置とはクラスタの接続構成が異なるため、他のシステム記憶装置と同一のデータを保持することができない。
 多重化されている複数のシステム記憶装置を使用しているクラスタは、マスタとなるシステム記憶装置を介して複数のクラスタ間の生存監視のチェックを、オペレーションシステム(Operation System、OS)により所定の間隔で行っている。システム記憶装置との間のパスが切り離されたクラスタは、切り離したシステム記憶装置を介して接続された他方のクラスタの生存確認を実施することができない。生存確認が確認できないクラスタは、マルチクラスタシステムから切り離される。クラスタが切り離される現象をクラスタダウンという。クラスタダウンが発生すると、処理を実施するクラスタ数が減少するため、マルチクラスタシステム全体の処理が遅延する問題が発生する。
 従来技術として、下記の文献がある。
特開平5-46580号公報 特開平4-23149号公報
(発明が解決しようとする課題)
 開示の技術は、接続障害が検出されたシステム記憶装置を切り離す際にクラスタの接続状態を維持するマルチクラスタシステムを提供することを目的とする。
(課題を解決するための手段)
 本発明の課題を解決するため、開示の技術の第1の側面によれば、
 プログラムを実行する複数のクラスタと、
 それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
 少なくとも1つのシステム記憶装置は、
 接続されているクラスタとの間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
 前記第1回路で検出された接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
 前記クラスタは、
 接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
 前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
を有することを特徴とするマルチクラスタシステムを提供する。
 本発明の課題を解決するため、開示の技術の第2の側面によれば、
 プログラムを実行する複数のクラスタと、
 それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
 少なくとも1つのクラスタは、
 接続されているシステム記憶装置との間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
 前記第1回路で検出された第1接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
 前記クラスタは、
 接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
 前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
を有することを特徴とするマルチクラスタシステムを提供する。
(発明の効果)
 開示の技術によれば、クラスタは接続されている複数のシステム記憶装置のそれぞれから接続情報を受信し、受信した各システム記憶装置からの接続情報に基づいて、接続障害が検出されたシステム記憶装置を切り離す処理を実行することができる。そのため、各クラスタの接続障害が検出されていないシステム記憶装置に対する接続状態を維持して接続障害が検出されたシステム記憶装置の切り離しを実施することができる。更に、クラスタの切り離しを防止して処理を実施するクラスタ数の減少を抑制できるため、処理を実施するクラスタ数の減少を抑制できるため、マルチクラスタシステム全体の処理の遅延を抑制できる。
図1は、実施例1に係るマルチクラスタシステムの概略図を示す図である。 図2は、実施例1に係るマルチクラスタシステムの構成図を示す図である。 図3は、実施例1に係るインタフェース回路の内部構成の一部を示す図である。 図4は、実施例1に係るインタフェース回路の内部構成の一部を示す図である。 図5は、実施例1に係るマルチクラスタシステムの動作例を示すシーケンス図である。 図6は、実施例1に係るマルチクラスタシステムの動作例を示すシーケンス図である。 図7は、実施例1に係るマルチクラスタシステムの通信命令処理の一例を示すタイムチャートである。 図8は、実施例1に係るマルチクラスタシステムの通信命令処理の一例を示すタイムチャートである。 図9は、実施例1に係るマルチクラスタシステムの通信命令処理の一例を示すタイムチャートである。 図10は、実施例2に係るマルチクラスタシステムの動作例を示すシーケンス図である。
 以下、開示の技術の実施例1及び実施例2に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。ただし、開示の技術は各実施例に限定されるものではない。
 (実施例1)
 図1から図9では、実施例1に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。
 図1は、実施例1に係るマルチクラスタシステム1000の概略構成図を示す。マルチクラスタシステム1000は、システム記憶装置100、システム記憶装置200、クラスタ300、クラスタ400、接続線11、接続線12、接続線21及び接続線22を備える。システム記憶装置100及びシステム記憶装置200は同一の構成を備える。システム記憶装置200において、システム記憶装置100で説明した構成と同様の構成には同一符号を付し、説明を省略する。クラスタ300及びクラスタ400は同一の構成を備える。クラスタ400において、クラスタ300で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
 接続線11、接続線12、接続線21及び接続線22は、例えば電気ケーブル又は光ケーブルを用いることができる。システム記憶装置100及びクラスタ300は接続線11を介して接続されている。システム記憶装置100及びクラスタ400は接続線21を介して接続されている。システム記憶装置200及びクラスタ300は接続線12を介して接続されている。システム記憶装置200及びクラスタ400は接続線22を介して接続されている。クラスタ300及びクラスタ400は、システム記憶装置100及びシステム記憶装置200に格納されるデータを読出し、又はシステム記憶装置100及びシステム記憶装置200にデータを書込み、必要な処理を行う。
 システム記憶装置100は、インタフェース回路110、システム構成制御回路120、優先制御回路130、複数のメモリアクセスコントローラ140、サービスプロセッサ150、メモリ160及びバス170を備える。インタフェース回路110、システム構成制御回路120、優先制御回路130、メモリアクセスコントローラ140及びメモリ160は、バス170を介して互いに接続されている。
 システム記憶装置100は、システム記憶装置100が格納するデータの破損防止を保証するためにシステム記憶装置200と多重化されている。システム記憶装置100は、システム記憶装置200が格納するデータおよびプログラムと同一のデータ及びプログラムを格納する。システム記憶装置100は、接続線11及び接続線21を介してクラスタ300及びクラスタ400に共有されるように接続されている。システム記憶装置100は、システム記憶装置100に接続されているクラスタ300及びクラスタ400の接続を中継する。
 インタフェース回路110は、システム記憶装置100をクラスタ300及びクラスタ400と接続するために設けられる。インタフェース回路110は、クラスタ300及びクラスタ400から送信された受信パケットの解析を行い、システム構成制御回路120及び優先制御回路130に対しコマンド及びデータを送信する。インタフェース回路110は、コマンド及びデータがクラスタ300及びクラスタ400と比較してどちらが優先してアクセスされるか設定する。インタフェース回路110は、クラスタ300及びクラスタ400からパケット化されたコマンド及びデータを受信し、またクラスタ300及びクラスタ400に対してパケット化したコマンド及びデータを送信する。
 システム構成制御回路120は、インタフェース回路110を介して受信したクラスタ300及びクラスタ400からのコマンドを解析して、システム記憶装置100の構成を解析したコマンドと対応させて設定する。
 優先制御回路130は、メモリアクセスコントローラ140に対するアクセス制御を行う。優先制御回路130は、アクセスの優先順位をメモリアクセスコントローラ140に通知する。
 メモリアクセスコントローラ140は、優先制御回路130によって通知されたアクセスの優先順位に応じて、メモリ160に対するアクセスの制御を行う。
 サービスプロセッサ150は、例えば、マルチクラスタシステム1000の運転及び保守診断の制御を含むシステム制御を行う。サービスプロセッサ150は、例えばオペレータコンソール機能を備える。
 メモリ160は、例えば、クラスタ300及びクラスタ400で使用されるデータ、クラスタ300及びクラスタ400に実行させるOSのプログラム及び演算プログラム160Aの少なくとも一部を一時的に格納する。演算プログラム160Aは、実施例1に係る演算処理を実施するためのプログラムである。演算プログラム160Aは、クラスタ300及びクラスタ400によって実行される。クラスタ300又は400がダウン又は接続障害により使用できなくなった場合、演算プログラム160Aの処理は、システム記憶装置100及び200に接続された不図示の待機系クラスタにより実行される。
 なお、演算プログラム160Aは、必ずしもメモリ160に記憶させておく必要は無い。演算プログラム160Aは、例えば、システム記憶装置100に挿入されるフレキシブルディスク(FD)、CD-ROM、MOディスク、DVDディスク、光磁気ディスク及びICカードなどの「可搬用の物理的な記憶媒体」に記憶される。また、演算プログラム160Aは、システム記憶装置100の内外に備えられるディスク装置、あるいは公衆回線やインターネット、LAN、WANなどを介してシステム記憶装置100に接続される「他のコンピュータ(またはサーバ)」の記憶媒体に記憶される。システム記憶装置100は、上記記憶媒体から演算プログラム160Aを読み出して実行することができる。
 システム記憶装置200は、インタフェース回路210、システム構成制御回路220、優先制御回路230、メモリアクセスコントローラ240、サービスプロセッサ250、メモリ260及びバス270を備える。インタフェース回路210、システム構成制御回路220、優先制御回路230、メモリアクセスコントローラ240及びメモリ260は、バス270を介して互いに接続されている。
 システム記憶装置200は、システム記憶装置200が格納するデータの破損防止を保証するためにシステム記憶装置100と多重化されている。システム記憶装置200は、システム記憶装置100と同一のデータ及びプログラムを格納する。システム記憶装置200は、接続線12及び接続線22を介してクラスタ300及びクラスタ400に共有されるように接続されている。また、システム記憶装置200は、システム記憶装置200に接続されているクラスタ300及びクラスタ400間の接続を中継する。
 クラスタ300は、インタフェース回路310、システム記憶転送部320、チャネル装置330、システムコントローラ340、主記憶装置350、サービスプロセッサ360、複数の中央処理装置370及びバス380を備える。インタフェース回路310、システム記憶転送部320、チャネル装置330、システムコントローラ340、主記憶装置350及び中央処理装置370は、バス380を介して互いに接続されている。
 インタフェース回路310は、クラスタ300がシステム記憶装置100及びシステム記憶装置200と接続するために設けられる。インタフェース回路310は、システム記憶装置100及びシステム記憶装置200から送信された受信パケットの解析を行い、システム記憶転送部320に対する命令の応答やデータの転送を行う。インタフェース回路310は、システム記憶転送部320に対し、コマンド及びデータのアクセスの優先順位を設定する。インタフェース回路310は、システム記憶転送部320から受信したコマンド及びデータをパケット化し、システム記憶装置100及びシステム記憶装置200に対してパケット化されたコマンド及びデータを送信する。
 システム記憶転送部320は、インタフェース回路310と主記憶装置350との間のデータ転送の制御を行う。システム記憶転送部320は、インタフェース回路310及びシステム記憶装置200のインタフェース回路210を介して接続されるクラスタ400との通信の制御を行う。
 チャネル装置330は、システム記憶転送部320を介して主記憶装置350からデータを読み出して中央処理装置370へデータ転送を行う。
 システムコントローラ340は、システム記憶転送部320、チャネル装置330、主記憶装置350及び中央処理装置370間のデータ転送を制御する。
 主記憶装置350は、システム記憶転送部320及び中央処理装置370からの要求により、データの記憶及び保持を行う。
 サービスプロセッサ360は、システム記憶装置100に係るサービスプロセッサ150と同様に、マルチクラスタシステム1000の運転及び保守診断の制御を含むシステム制御を行う。
 中央処理装置370は、クラスタ300に係る演算処理を実行する。中央処理装置370は、システム記憶転送部320、チャネル装置330、システムコントローラ340及び主記憶装置350を制御する。
 クラスタ400は、インタフェース回路410、システム記憶転送部420、チャネル装置430、システムコントローラ440、主記憶装置450、サービスプロセッサ460、中央処理装置470及びバス480を備える。インタフェース回路410、システム記憶転送部420、チャネル装置430、システムコントローラ440、主記憶装置450及び中央処理装置470は、バス480を介して互いに接続されている。
 図2は、図1のマルチクラスタシステム1000において、一点鎖線で示した箇所Aの構成図を示す図である。なお、図1に示すマルチクラスタシステム1000において、図1で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
 以下の説明では、システム記憶装置100がマスタ、システム記憶装置200がスレーブとして動作しているものとする。マスタであるシステム記憶装置100が現用装置として動作する。
 システム記憶装置100に係るインタフェース回路110は、障害検出通知回路110A1及び障害検出通知回路110A2を備える。障害検出通知回路110A1は、クラスタ300に備えられた障害検出通知回路310A1に、接続線11を介して接続されている。障害検出通知回路110A2は、クラスタ400に備えられた障害検出通知回路410A1に、接続線21を介して接続されている。
 システム記憶装置100のインタフェース回路110に設けられた障害検出通知回路110A1及び障害検出通知回路110A2は、システム記憶装置100と対応するクラスタとの間の接続障害を検出する。具体的には、障害検出通知回路110A1はクラスタ300から、障害検出通知回路110A2はクラスタ400からそれぞれ通知される接続障害情報を受信する。障害検出通知回路110A1、110A2はまた、対応するクラスタ送信されるパケットの解析及びチェックを行い、インタフェース回路110において対応するクラスタとの間の接続障害を検出する。なお、クラスタから受信したデータのエラーをチェックした結果、データチェックに問題が無い場合でも、データをシステム記憶装置100の内部に取り込むまでの経路上で接続障害が発生する場合がある。そのため、障害検出通知回路110A1及び障害検出通知回路110A2は、システム記憶装置100の内部にデータを取り込むまでの経路で発生する接続障害を、全てインタフェース回路110における接続障害として検出する。
 システム記憶装置100に係るシステム構成制御回路120は、接続状態フラグ120A1及び接続状態フラグ120A2を記憶する領域を備える。接続状態フラグ120A1は、クラスタ300とシステム記憶装置100との論理的な接続状態を示すフラグである。接続状態フラグ120A1は、障害検出通知回路110A1によりクラスタ300とシステム記憶装置100との間の接続障害が検出されるとオフされる。接続状態フラグ120A2は、クラスタ400とシステム記憶装置100との論理的な接続状態を示すフラグである。接続状態フラグ120A2は、障害検出通知回路110A2によりクラスタ400とシステム記憶装置100との間の接続障害が検出されるとオフされる。システム構成制御回路120では、オフされた接続状態フラグ120A1及び接続状態フラグ120A2に対応するクラスタとの接続を論理的に切断する。
 システム記憶装置100に係る優先制御回路130は、インタフェース障害通知回路130Aを備える。インタフェース障害通知回路130Aは、障害検出通知回路110A1及び障害検出通知回路110A2に接続される。例えば、クラスタ300との間の接続障害が障害検出通知回路110A1からインタフェース障害通知回路130Aに通知された場合、インタフェース障害通知回路130Aは障害検出通知回路110A1から受信した接続障害を、クラスタ400に接続された障害検出通知回路110A2に通知する。
 システム記憶装置200に設けられた各部の機能は、システム記憶装置100に設けられた各部の機能と基本的に同一であるため、詳細説明は省略する。
 クラスタ300に係るインタフェース回路310は、障害検出通知回路310A1、障害検出通知回路310A2、接続状態受信回路310B及びコマンド生成発行回路310Cを備える。
 障害検出通知回路310A1は、システム記憶装置100に備えられた障害検出通知回路110A1に、接続線11を介して接続されている。障害検出通知回路310A2は、システム記憶装置200に備えられた障害検出通知回路210A1に、接続線21を介して接続されている。
 障害検出通知回路310A1及び障害検出通知回路310A2は、接続されたシステム記憶装置との間の接続障害を検出する。具体的には、障害検出通知回路310A1はシステム記憶装置100から、障害検出通知回路310A2はシステム記憶装置200からそれぞれ接続障害情報を受信する。また、障害検出通知回路310A1、310A2は、対応するしステム記憶装置から送信されるパケットの解析及びチェックを行い、対応するシステム記憶装置との間の接続障害を検出する。なお、データチェックに問題が無い場合でも、データをクラスタ300の内部に取り込むまでの経路上に接続障害が発生する場合がある。障害検出通知回路310A1及び障害検出通知回路310A2は、クラスタ300の内部に取り込むまでの経路で生じた接続障害を、全てインタフェース回路310における接続障害として検出する。
 接続状態受信回路310Bは、障害検出通知回路310A1又は障害検出通知回路310A2から対応するシステム記憶装置との間の接続状態を示す接続情報を受信する。対応するシステム記憶装置との間の接続障害を検出した、インタフェース回路310の障害検出通知回路からの接続情報は、接続障害を示す情報が含まれる。システム記憶装置との間に接続障害が発生した場合、接続状態受信回路310Bは、接続障害を検出した障害検出通知回路からの接続情報と、接続障害を検出していない障害検出通知回路からの接続情報とを受信する。
 障害検出通知回路310A1と310A2とのいずれかの障害検出通知回路から、対応するシステム記憶装置との間の接続障害が通知された場合、接続状態受信回路310Bは、接続障害が検出されていない、他方のシステム記憶装置とクラスタ300との間の接続状態に基づいて、クラスタ300に接続されているシステム記憶装置間の等価性が保証されている状態にあるか否かを判断する。
 接続障害が検出されていない他方のシステム記憶装置がクラスタ300とは論理的に接続されていない場合、接続状態受信回路310Bは、接続障害が検出されたシステム記憶装置と他方のシステム記憶装置とに同一のデータ及びプログラムが格納されていると判断する。即ち、接続状態受信回路310Bは接続障害が検出されたシステム記憶装置と他のシステム記憶装置との等価性が保証されていると判断する。
 一方、接続障害が検出されていない他方のシステム記憶装置がクラスタ300と論理的に接続されている場合、接続状態受信回路310Bは、接続障害が検出されたシステム記憶装置には、他のシステム記憶装置と同一のデータ及びプログラムが格納されていないと判断する。即ち、接続状態受信回路310Bは、接続障害が検出されたシステム記憶装置と他方のシステム記憶装置との等価性が保証されていないと判断する。
 接続状態受信回路310Bは、判断した結果を受信情報としてコマンド生成発行回路310Cに通知する。
 コマンド生成発行回路310Cは、接続状態受信回路310Bから得られた受信情報に基づいて、クラスタ300から切り離すシステム記憶装置に対する切り離し要求コマンドを生成し、発行する。具体的には、コマンド生成発行回路310Cは、障害検出通知回路310A1又は障害検出通知回路310A2のうち、対応するシステム記憶装置との間に接続障害が発生した障害検出通知回路に対して、対応するシステム記憶装置を切り離すための要求コマンドを発行する。要求コマンドは、例えばパケット化されたコマンド及びデータを使用することができる。
 クラスタ400に係るインタフェース回路410は、障害検出通知回路410A1、障害検出通知回路410A2、接続状態受信回路410B及びコマンド生成発行回路410Cを備える。各部の基本的な機能はクラスタ300の各部と同様であるため、詳細説明は省略する。
 図3は、図1のクラスタ300において、破線で示した箇所Bのインタフェース回路310とシステム記憶転送部320との構成を示す図である。なお、図3に示すマルチクラスタシステム1000において、図1で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
 インタフェース回路310は、システム記憶装置100に対応するインタフェース回路310-1及びシステム記憶装置200に対応するインタフェース回路310-2を備える。
 インタフェース回路310-1は、障害検出通知回路310-1A、接続状態受信回路310-1B、コマンド生成発行回路310-1C、フリップフロップ310-1D、巡回冗長検査回路310-1E、パケット間隔監視回路310-1F、誤り訂正符号生成回路310-1G、Random Access Memory(RAM)310-1H、誤り訂正符号検査回路310-1I、コマンド解析回路310-1J、コマンド生成回路310-1K、コマンド優先選択回路310-1L、コマンド保持レジスタ回路310-1M、パケット生成回路310-1N及びフリップフロップ310-1Oを備える。
 なお、図3の障害検出通知回路310-1A、図2の障害検出通知回路310A1、310A2は同じ要素である。図3の接続状態受信回路310-1B、図2の接続状態受信回路310B1、310B2は同じ要素である。図3のコマンド生成発行回路310-1C、図2のコマンド生成発行回路310C1、310C2は同じ要素である。
 フリップフロップ310-1Dは、システム記憶装置100から転送されたデータのパケットを受信し、巡回冗長検査回路310-1Eに送信する。データのパケットは、システム記憶装置100とクラスタ300との間の接続情報を含む。システム記憶装置100によって接続障害が検出された場合、システム記憶装置100から障害検出情報を含むパケットが送信される。
 巡回冗長検査回路310-1Eは、フリップフロップ310-1Dから転送されたパケットに基づいて、パケットのエラーを検出するエラー検出、例えばCyclic Redundancy Check(CRC)を実行後、RAM310-1Hに送信する。また、巡回冗長検査回路310-1Eは、CRCを実行後、パケット間隔監視回路310-1F及び誤り訂正符号生成回路310-1Gに送信する。
 パケット間隔監視回路310-1Fは、転送されたパケットの通信間隔を監視し、一定時間パケットの受信が途絶えた場合に接続障害通知を障害検出通知回路310-1Aに送信する。
 誤り訂正符号生成回路310-1Gは、データに係る符号の誤りが発生した場合に付与する誤り訂正符号を生成し、RAM310-1Hに送信する。
 RAM310-1Hは、巡回冗長検査回路310-1Eによりチェックされたデータ、及び誤り訂正符号生成回路310-1Gにより生成された誤り訂正符号を書き込み、書き込まれた情報を誤り訂正符号検査回路310-1I及びコマンド解析回路310-1Jに送信する。
 誤り訂正符号検査回路310-1Iは、データに係る符号の誤りが発生した場合に、接続障害通知を障害検出通知回路310-1Aに送信する。
 コマンド解析回路310-1Jは、RAM310-1Hから受信したコマンドを解析する。コマンド解析回路310-1Jは、解析の結果得られたシステム記憶装置100とクラスタ300との間の接続情報を、システム記憶装置200に対応するインタフェース回路310-2に送信する。また、コマンド解析回路310-1Jは、システム記憶装置100とクラスタ300との間における接続障害、即ちエラー情報を接続状態受信回路310-1Bに送信する。
 接続状態受信回路310-1Bは、コマンド解析回路310-1Jから送信されたシステム記憶装置100とクラスタ300との間の接続障害と、システム記憶装置200に対応するインタフェース回路310-2から送信されたシステム記憶装置200とクラスタ300との間の接続情報とを受信する。接続状態受信回路310-1Bは、システム記憶装置100から接続障害が通知され、且つインタフェース回路310-2から送信されているシステム記憶装置200から接続情報が通知されている場合、システム記憶装置100とシステム記憶装置200は同一のデータを保持していないと判断する。システム記憶装置100とシステム記憶装置200が同一のデータを保持していない場合、システム記憶装置100とシステム記憶装置200との等価性は保証されていない。即ち、システム記憶装置100は、システム記憶装置200との等価性が保証されていないと判断する。システム記憶装置100とシステム記憶装置200との等価性が保証されていない場合、接続状態受信回路310-1Bは、システム記憶装置100の接続障害検出信号をコマンド保持レジスタ回路310-1Mに送信する。
 障害検出通知回路310-1Aは、誤り訂正符号検査回路310-1Iから送信された、RAM310-1Hから読み出したデータの2ビットエラー及びパケット間隔監視回路310-1Fによって検出されたパケット通信間隔のタイムアウトエラーを受信する。障害検出通知回路310-1Aは、2ビットエラー又はタイムアウトエラーを受信した場合、コマンド生成発行回路310-1Cにコマンドを送信する。コマンド生成発行回路310-1Cに送信されるコマンドは、システム記憶装置100とクラスタ300との間の接続障害を含む。送信されるコマンドは、障害検出通知回路310-1Aに保持される。
 コマンド生成回路310-1Kは、各システム記憶装置との間のデータ転送及びパケット転送に必要なコマンドを生成する。コマンド生成回路310-1Kにより生成された各種コマンドは、コマンド保持レジスタ回路310-1Mに送信され、コマンド保持レジスタ回路310-1Mに保持される。
 コマンド保持レジスタ回路310-1Mは、接続状態受信回路310-1Bにより送信された切り離しコマンドを保持する。コマンド保持レジスタ回路310-1Mは、このときに、切り離しの対象となるシステム記憶装置の情報も保持する。コマンド保持レジスタ回路310-1Mは、障害検出通知回路310-1Aから受信したシステム記憶装置100とクラスタ300との間の接続障害を含むコマンドを保持する。コマンド保持レジスタ回路310-1Mは、システム記憶転送部320から受信したデータを保持する。コマンド保持レジスタ回路310-1Mは、コマンド生成発行回路310-1Cからのリセット指示によりコマンド生成された保持レジスタをリセットする。コマンド保持レジスタ回路310-1Mは、保持している各コマンド及び指示をコマンド優先選択回路310-1Lに送信する。
 コマンド優先選択回路310-1Lは、コマンド保持レジスタ回路310-1Mにより保持されているコマンドのうち、どのコマンドを優先するか選択する。コマンド優先選択回路310-1Lは、例えば、コマンド保持レジスタ回路310-1Mにより保持された、システム記憶装置を切り離すためのコマンドを選択する。コマンド優先選択回路310-1Lは、選択されたコマンド生成発行回路310-1Cに送信する。
 コマンド生成発行回路310-1Cは、コマンド優先選択回路310-1Lにより選択されたコマンドを実行する際に必要なデータを選択し、パケット生成回路310-1Nに送信する。システム記憶装置を切り離すためのコマンドをコマンド優先選択回路310-1Lが選択した場合、コマンド生成発行回路310-1Cは、コマンド優先選択回路310-1Lにより選択されたシステム記憶装置を切り離すためのコマンドを実行する際に必要なデータを選択し、パケット生成回路310-1Nに送信する。また、コマンド生成発行回路310-1Cは、システム記憶装置を切り離す際に必要なデータが生成された後、コマンド保持レジスタ回路310-1Mのコマンドの保持をリセットする命令をコマンド保持レジスタ回路310-1Mに送信する。
 パケット生成回路310-1Nは、コマンド生成発行回路310-1Cから送信されたシステム記憶装置を切り離すためのデータに基づきパケットを生成する。パケット生成回路310-1Nは、生成したパケットをフリップフロップ310-1Oに送信する。
 フリップフロップ310-1Oは、パケット生成回路310-1Nからパケットを受信する。パケットは、システム記憶装置100及びクラスタ300間を切り離すための切り離し情報を含む。フリップフロップ310-1Oは、システム記憶装置100に対し、システム記憶装置100及びクラスタ300間を切り離すためのパケットを送信する。
 インタフェース回路310-2は、システム記憶装置200とパケットの送受信を行う。インタフェース回路310-2は、インタフェース回路310-1と同一の構成を備える。
 図4は、図3に係るインタフェース回路310-1のうち、破線で示した箇所Cのインタフェース回路310-1の構成図を示す図である。図4は、インタフェース回路310-1のうち、コマンド保持レジスタ回路310-1M、コマンド優先選択回路310-1L、コマンド生成発行回路310-1C及びパケット生成回路310-1Nを示す。なお、図4に示すインタフェース回路310-1において、図3で説明した構成と同様の構成には同様の符号を付し、説明を省略する。
 コマンド保持レジスタ回路310-1Mは、切離コマンド生成フラグ310-1M1及び切離選択レジスタ郡310-1M2を備える。
 切離コマンド生成フラグ310-1M1は、接続状態受信回路310-1Bから接続障害検出信号を受信すると、システム記憶装置をクラスタ300及び400から切離すためのコマンドを生成する。切離コマンド生成フラグ310-1M1は、生成したコマンドをコマンド優先選択回路310-1Lに送信する。
 切離選択レジスタ郡310-1M2は、接続状態受信回路310-1Bから接続障害検出信号を受信すると、クラスタ300からの切り離しの対象となるシステム記憶装置を選択するための選択コマンドを生成する。切離選択レジスタ郡310-1M2は、生成した選択コマンドをコマンド生成発行回路310-1Cに送信する。
 コマンド生成発行回路310-1Cは、タイミングシフトレジスタ310-1C1~310-1C4を備える。
 タイミングシフトレジスタ310-1C1~310-1C4は、例えばフリップフロップを備える。タイミングシフトレジスタ310-1C1~310-1C4は、コマンド優先選択回路310-1Lから、切り離しの対象となるシステム記憶装置を切離すために必要なコマンドを受信する。タイミングシフトレジスタ310-1C1~310-1C4は、例えば切離の対象となるシステム記憶装置を選択するために必要なデータ及びシステム記憶装置の切離箇所を選択するために必要なデータを生成する。
 コマンド生成発行回路310-1Cは、データ生成後、コマンド保持レジスタ回路310-1Mに対して保持しているコマンドのリセットを指示するリセット命令を送信する。コマンド生成発行回路310-1Cは、システム記憶装置を切り離すためのコマンドを実行する際に必要なデータをタイミングシフトレジスタ310-1C1~310-1C4から選択する。データの選択は、タイミングシフトレジスタ310-1C1~310-1C4により任意のタイミングで行われる。コマンド生成発行回路310-1Cは、選択されたデータをパケット生成回路310-1Nに送信する。
 図5及び図6は、実施例1に係るマルチクラスタシステム1000の動作例を示すシーケンス図である。図5に示す処理は図6のAに続いている。図5及び図6に示す処理は、システム記憶装置100の障害検出通知回路110A1で、システム記憶装置100とクラスタ300との間の接続障害が検出された際の処理を示す図である。なお、図5および図6でも、システム記憶装置100がマスタとして動作し、システム記憶装置200がスレーブとして動作するものとする。
 図5に示すように、システム記憶装置100は、障害検出通知回路110A1でクラスタ300との間の接続障害を検出する(OP1)。
 クラスタ300との間の接続状態検出に応じて、システム記憶装置100は、システム構成制御回路120によりクラスタ300に対応する接続状態フラグをオフにする(OP2)。
 システム記憶装置100は、優先制御回路130により、クラスタ300及びクラスタ400に対して、システム記憶装置100とクラスタ300との間に接続障害が発生したことを示す接続障害情報を含む接続情報を通知する(OP3)。以下は、システム記憶装置100とクラスタ400との間の処理を示す。
 一方、システム記憶装置200も、接続されているクラスタ300、クラスタ400の双方に対し接続情報を通知する(OP4)。接続されているクラスタ300、400との間の接続障害をシステム記憶装置200が検出していない場合には、システム記憶装置200から各クラスタ300、400に通知される接続情報には、接続障害を示す情報は含まれていない。
 クラスタ400は、システム記憶装置100からの接続情報と、システム記憶装置200から接続情報とを、インタフェース回路410を介して受信する。インタフェース回路410の接続状態受信回路410Bは、システム記憶装置100からの接続情報と、システム記憶装置200からの接続情報を参照し、いずれかのシステム記憶装置から受信した接続情報に接続障害情報が含まれているか否かを判断する。接続状態受信回路410Bはまた、いずれかのシステム記憶装置から受信した接続情報に接続障害情報が含まれていた場合、他方のシステム記憶装置から受信した接続情報を参照して、他方のシステム記憶装置とクラスタ400との論理的な接続状態を判断する(OP11)。OP11において、システム記憶装置100からの接続情報に接続障害情報が含まれ、且つシステム記憶装置200の接続情報からクラスタ400とシステム記憶装置200とが論理的に接続されていると判断され、クラスタ400は次にOP12の処理を行う。
 クラスタ400は、コマンド生成発行回路410Cを用いて、システム記憶装置100に対する切離し命令を生成する(OP12)。
 クラスタ400は、コマンド生成発行回路410Cを用いて、生成した切り離し命令をシステム記憶装置100に対して発行する(OP13)。
 システム記憶装置100の障害検出通知回路110A2は、クラスタ400からシステム記憶装置の切離し命令を受信する。
 クラスタ300も、クラスタ400と同様に各システム記憶装置からの接続情報に基づいて、システム記憶装置100に対する切り離し命令を生成するが、クラスタ300とシステム記憶装置100との間には接続障害が生じているため、システム記憶装置100はクラスタ300からの切り離し命令を受けることは出来ない。
 クラスタ400から切り離し命令を受信したシステム記憶装置100は、障害検出通知回路110A1を介して、接続されている全クラスタに対応する接続状態フラグをオフにする。この例では、障害検出通知回路110A1は接続状態フラグ120A1及び接続状態フラグ120A2をオフにする(OP14)。
 システム記憶装置100は、クラスタ300及びクラスタ400をシステム記憶装置100から論理的に切り離す(OP15)。
 なお、図6に係るOP11において、システム記憶装置100及びシステム記憶装置200の接続情報に基づいて、システム記憶装置200がクラスタ400に対して論理的に接続されていないと判断されると、クラスタ400は、システム記憶装置100から受信した障害通知を無視する(OP16)。
 図7から図9は、実施例1に係るマルチクラスタシステム1000の通信命令処理の一例を示すタイムチャートである。図7から図9に示す横軸は時刻tを示す。横軸における1目盛は1クロックを示す。図7から図9に係る処理は、システム記憶装置100とクラスタ300との間の接続障害を検出する処理を示す。
 図7は、クラスタ300のインタフェース回路310における通信命令処理の一例を示すタイムチャートである。
 図7に示すように、障害検出通知回路310-1Aは、システム記憶装置100とクラスタ300間の接続障害を検出する(T1)。
 コマンド生成発行回路310-1Cは、障害通知コマンド生成フラグの生成を開始する(T2)。
 コマンド生成発行回路310-1Cは、障害通知コマンド生成フラグの生成を開始する(T3)。コマンド生成発行回路310-1Cは、コマンド保持レジスタ回路310-1Mに対してパケット生成回路310-1Nに対してコマンドを送信した後、コマンド保持のリセット命令を送信する(T3’)。障害通知コマンド生成フラグが生成される間、コマンド生成発行回路310-1Cにおいて他のコマンドは選択されない。
 タイミングシフトレジスタ310-1C1~310-1C7は、選択されたシステム記憶装置100を切離すために必要なデータのみパケット生成回路310-1Nに送信する(T4)。
 パケット生成回路310-1Nは、コマンド生成発行回路310-1Cからデータを受信しパケット化する(T5)。
 パケット生成回路310-1Nは、パケット化されたデータを出力する(T6)。パケット生成回路310-1Nは、入力データに対してパケット転送のために必要なデータを追加してシステム記憶装置100に送信する。
 図8は、システム記憶装置100の障害検出通知回路110A1及び障害検出通知回路110A2における通信命令処理の一例を示すタイムチャートである。図8は、クラスタ300の障害検出通知回路310A1から、システム記憶装置100の障害検出通知回路110A2に対して障害検出情報を含むデータの受信を開始する際の処理である。なお、システム記憶装置100の障害検出通知回路110A1はクラスタ300の障害検出通知回路310A1に対応している。システム記憶装置100の障害検出通知回路110A2はクラスタ400の障害検出通知回路410A2に対応している。
 障害検出通知回路110A1は、クラスタ300から受信した入力データのコマンド解析を行う(T11)。入力データは、クラスタ300の障害検出通知回路310A1とシステム記憶装置100の障害検出通知回路110A1との間の障害検出情報を含む。
 障害検出通知回路110A1は、コマンド解析を行った後、システム記憶装置100の他の障害検出通知回路110A2にインタフェース障害通知回路130Aを経由して接続障害を送信する(T12)。
 障害検出通知回路110A2は、110A1から接続障害を受信した後、システム記憶装置100とクラスタ300との間で接続障害が検出されたことをクラスタ400に送信する(T13)。
 図9は、クラスタ400のインタフェース回路410における通信命令処理の一例を示すタイムチャートである。図9は、システム記憶装置100の障害検出通知回路110A2から、クラスタ400の障害検出通知回路410A2に対する障害検出情報を含むデータを受信する際の処理である。なお、クラスタ400の障害検出通知回路410A1は、システム記憶装置100の障害検出通知回路110A2に対応している。なお、クラスタ400のインタフェース回路410の構成は、図2~図4で説明したクラスタ300のインタフェース回路310の構成と同じであるため、説明を省略する。
 図9に示すように、コマンド解析回路410-1Jは、システム記憶装置100から受信した入力データの解析を行う(T21)。入力データは、クラスタ300の障害検出通知回路310A1とシステム記憶装置100の障害検出通知回路110A1との間の障害検出情報を含む。
 コマンド解析回路410-1Jは、システム記憶装置100からデータを受信する。コマンド解析回路410-1Jは、システム記憶装置100とクラスタ300との間の接続障害を解析し受信する(T22)。
 接続状態受信回路410-1Bは、システム記憶装置200とクラスタ400との間の接続情報を障害検出通知回路410A2から受信する(T23)。
 接続状態受信回路410-1Bは、コマンド解析回路410-1Jから送信されたシステム記憶装置100及びクラスタ300間の接続障害を含む接続情報と、障害検出通知回路410A2から通知されたシステム記憶装置200とクラスタ400との間の接続情報を受信する。各々の接続情報に基づいて、システム記憶装置100及びシステム記憶装置200との等価性が保証されていないと判断された場合、接続状態受信回路410-1Bは、コマンド保持レジスタ回路410-1Mに対してシステム記憶装置100の接続障害を含む接続情報を送信する(T24)。
 コマンド生成発行回路410-1Cは、接続状態受信回路410-1Bから受信した接続情報に基づいて、障害通知コマンド生成フラグをセットする(T25)。
 コマンド生成発行回路410-1Cはまた、障害通知コマンド生成フラグをセットする(T26)。コマンド生成発行回路410-1Cは、コマンド保持レジスタ回路410-1Mに対してパケット生成回路410-1Nに対してコマンドを送信した後、コマンド保持のリセット命令を送信する(T26’)。障害通知コマンド生成フラグがセットされている間、コマンド生成発行回路410-1Cにおいて他のコマンドは選択されない。
 タイミングシフトレジスタ410-1C1~410-1C7は、選択されたシステム記憶装置100を切離すために必要なデータのみパケット生成回路410-1Nに送信する(T27)。
 パケット生成回路410-1Nは、コマンド生成発行回路410-1Cからデータを受信しパケット化する(T28)。
 パケット生成回路410-1Nは、パケット化されたデータが出力される(T28)。パケット生成回路410-1Nは、入力データに対してパケット転送のために必要なデータを追加してシステム記憶装置100に送信する。システム記憶装置100は、クラスタ300及び400から切り離される。
 実施例1におけるマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法によれば、クラスタ400はシステム記憶装置100により通知された接続障害を含む接続情報と、システム記憶装置200により通知された接続情報とに基づいて、システム記憶装置100を切り離すことができる。そのため、クラスタ300及びクラスタ400のシステム記憶装置200に対する接続状態を維持して接続障害が検出されたシステム記憶装置100の切り離しを実施することができる。更に、クラスタ300の切り離しを防止して処理を実施するクラスタ数の減少を抑制できるため、マルチクラスタシステム1000全体の処理の遅延を抑制できる。
 (実施例2)
 図10では、実施例2に係るマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法が説明される。実施例2に係るマルチクラスタシステム1000の構成は、実施例1に係るマルチクラスタシステム1000の構成と同一であるため説明を省略する。
 図10は、実施例2に係るマルチクラスタシステム1000の動作例を示すシーケンス図である。図10に示す処理は、クラスタ300の障害検出通知回路310A1で、システム記憶装置100とクラスタ300との間の接続障害が検出された際の処理を示す図である。
 図10に示すように、クラスタ300は障害検出通知回路310A1で、システム記憶装置100とクラスタ300との間の接続障害を検出したものとする(OP21)。
 OP21による接続障害検出により、クラスタ300は、障害検出通知回路310A1からシステム記憶装置100の障害検出通知回路110A1に対して、システム記憶装置100とクラスタ300との間に接続障害が生じたことを示す接続障害情報を含む接続情報を通知する(OP22)。
 クラスタ300からの接続情報を受信したシステム記憶装置100は、優先制御回路130により、システム記憶装置100とクラスタ300との間に接続障害が発生したことを示す情報を含む接続情報を、クラスタ400に対して通知する(OP23)。
 一方、システム記憶装置200も、接続されているクラスタ300、クラスタ400の双方に対し接続情報を通知する(OP24)。接続されているクラスタ300、400との間の接続障害をシステム記憶装置200が検出していない場合には、システム記憶装置200から各クラスタ300、400に通知される接続情報には、接続障害を示す情報は含まれていない。
 クラスタ400は、OP23、OP24の処理によってシステム記憶装置100、200から接続情報を受信した後、実施例1のOP11~OP15と同様の処理を実行する(OP25)。即ち、クラスタ400によるシステム記憶装置100の切り離し処理が行われる。
 実施例2におけるマルチクラスタシステム1000及びマルチクラスタシステム1000の制御方法によれば、クラスタ300により通知されたシステム記憶装置100-クラスタ300間の接続障害を含む接続情報と、クラスタ400のインタフェース回路410から通知された接続情報とに基づいて、システム記憶装置100を切り離すことができる。
 なお、実施例1及び実施例2ではシステム記憶装置100及び200、クラスタ300及び400を有するマルチクラスタシステムについて説明した。しかし、マルチクラスタシステムに係るシステム記憶装置及びクラスタの数は2台に限定されない。開示の技術は、2台以上である任意の数の複数のシステム記憶装置及びクラスタを有するマルチクラスタシステムに適用することができる。
 開示の技術によれば、クラスタ400は接続されている複数のシステム記憶装置100、200のそれぞれから接続情報を受信し、受信した各システム記憶装置100、200からの接続情報に基づいて、接続障害が検出されたシステム記憶装置100を切り離す処理を実行することができる。そのため、各クラスタ300、400の接続障害が検出されていないシステム記憶装置200に対する接続状態を維持して接続障害が検出されたシステム記憶装置の切り離しを実施することができる。更に、クラスタ300の切り離しを防止して処理を実施するクラスタ数の減少を抑制できるため、処理を実施するクラスタ数の減少を抑制できるため、マルチクラスタシステム1000全体の処理の遅延を抑制できる。
 11、12、21、22 接続線
 100、200 システム記憶装置
 110、210,310、410 インタフェース回路
 110A1、110A2、210A1、210A2、310A1、310A2、410A1、410A2 障害検出通知回路
 120,220 システム構成制御回路
 120A1、120A2、220A1、220A2 接続状態フラグ
 130、230 優先制御回路
 130A、230A インタフェース障害通知回路
 300、400 クラスタ
 310B、410B 接続状態受信回路
 310C、410C コマンド生成発行回路
 320、420 システム記憶転送部
 340、440 システムコントローラ
 1000 マルチクラスタシステム

Claims (9)

  1.  プログラムを実行する複数のクラスタと、
     それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
     少なくとも1つのシステム記憶装置は、
     接続されているクラスタとの間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
     前記第1回路で検出された接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
     前記クラスタは、
     接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
     前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
    を有することを特徴とするマルチクラスタシステム。
  2.  前記システム記憶装置は、対応する情報処理装置との論理的な接続状態を示す接続フラグが設定される第5回路を更に備え、
     接続された情報処理装置との間の接続障害を前記障害検出部が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
     前記第5回路は、前記接続フラグが接続状態を示す状態に設定された場合、対応する情報処理装置を当該システム記憶装置から切り離すことを特徴とする、請求項1記載のマルチクラスタシステム。
  3.  前記クラスタは、
     接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかのクラスタとの間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、
     接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項1記載のマルチクラスタシステム。
  4.  プログラムを実行する複数のクラスタと、
     それぞれが前記複数のクラスタに接続された複数のシステム記憶装置と、を有し、
     少なくとも1つのクラスタは、
     接続されているシステム記憶装置との間に生じた接続障害を示す接続障害情報を含む接続情報を検出する第1回路と、
     前記第1回路で検出された第1接続情報を、前記システム記憶装置に接続された複数のクラスタに通知する第2回路と、を有し、
     前記クラスタは、
     接続されている複数のシステム記憶装置のそれぞれから接続情報を受信する第3回路と、
     前記第3回路で受信した各システム記憶装置からの接続情報に基づいて、前記システム記憶装置を切り離す処理を実行する第4回路と、
    を有することを特徴とするマルチクラスタシステム。
  5.  前記システム記憶装置は、対応する情報処理装置との論理的な接続状態を示す接続フラグが設定される第5回路を更に備え、
     接続された情報処理装置との間の接続障害を前記障害検出部が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
     前記第5回路は、前記接続フラグが接続状態を示す状態に設定された場合、対応する情報処理装置を当該システム記憶装置から切り離すことを特徴とする、請求項4記載のマルチクラスタシステム。
  6.  前記クラスタは、
     接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかのクラスタとの間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、
     接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項4記載のマルチクラスタシステム。
  7.  情報処理を行う複数の情報処理装置と、
     それぞれ前記複数の情報処理装置に接続され、接続された複数の情報処理装置によって共有される複数のシステム記憶装置とを有し、
     前記システム記憶装置は、
     接続された複数の情報処理装置のそれぞれとの間の接続障害の有無を検出するとともに、接続された情報処理装置と当該システム記憶装置との間の接続状態を示す接続情報を接続されている情報処理装置に送信する障害検出部と、
     前記障害検出部からの接続障害通知を受信し、接続されている情報処理装置への前記接続障害通知の転送を前記障害検出部に指示する障害通知部と、を備え、
     前記情報処理装置は、
     複数のシステム記憶装置が接続され、対応するシステム記憶装置から当該システム記憶装置と情報処理装置との間の接続情報を受信する障害検出部と、
     前記障害検出部が受信した各システム記憶装置からの接続情報に基づいて、障害が検出されたシステム記憶装置の切離し要否を判断する切離し処理部とを備える、情報処理システム。
  8.  前記システム記憶装置は、対応する情報処理装置との論理的な接続状態を示す接続フラグが設定される構成制御部を更に備え、
     接続された情報処理装置との間の接続障害を前記障害検出部が検出した場合、前記接続フラグを接続障害を示す状態に設定し、
     前記構成制御部は、前記接続フラグが接続状態を示す状態に設定された場合、対応する情報処理装置を当該システム記憶装置から切り離すことを特徴とする、請求項7記載の情報処理システム。
  9.  前記情報処理装置は、
     接続されているシステム記憶装置の少なくとも一方から、当該システム記憶装置といずれかの情報処理装置との間に接続障害が生じたことを示す接続情報を受信した場合、当該接続情報を送信したシステム記憶装置以外のシステム記憶装置と自身との間の接続状態を判別し、
    接続状態の判別結果に基づいて、当該接続情報を送信したシステム記憶装置に対して切り離しを指示する、請求項7記載の情報処理システム。
PCT/JP2010/002375 2010-03-31 2010-03-31 マルチクラスタシステム WO2011121666A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012507910A JP5488693B2 (ja) 2010-03-31 2010-03-31 マルチクラスタシステム
PCT/JP2010/002375 WO2011121666A1 (ja) 2010-03-31 2010-03-31 マルチクラスタシステム
EP10848848A EP2555116A1 (en) 2010-03-31 2010-03-31 Multi-cluster system
US13/602,804 US20120331334A1 (en) 2010-03-31 2012-09-04 Multi-cluster system and information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2010/002375 WO2011121666A1 (ja) 2010-03-31 2010-03-31 マルチクラスタシステム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/602,804 Continuation US20120331334A1 (en) 2010-03-31 2012-09-04 Multi-cluster system and information processing system

Publications (1)

Publication Number Publication Date
WO2011121666A1 true WO2011121666A1 (ja) 2011-10-06

Family

ID=44711463

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/002375 WO2011121666A1 (ja) 2010-03-31 2010-03-31 マルチクラスタシステム

Country Status (4)

Country Link
US (1) US20120331334A1 (ja)
EP (1) EP2555116A1 (ja)
JP (1) JP5488693B2 (ja)
WO (1) WO2011121666A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019010512A (ja) * 2017-06-30 2019-01-24 バイオセンス・ウエブスター・(イスラエル)・リミテッドBiosense Webster (Israel), Ltd. システムウォッチドッグ及び診断のためのネットワークスニファ

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5870495A (ja) * 1981-10-22 1983-04-26 Nec Corp 多重化記憶装置の制御装置
JPH0423149A (ja) 1990-05-18 1992-01-27 Fujitsu Ltd 二重化データ保全装置
JPH0546580A (ja) 1991-08-21 1993-02-26 Fujitsu Ltd 拡張記憶の高信頼性データ更新方式
JP2941387B2 (ja) * 1990-08-31 1999-08-25 富士通株式会社 多重化装置の一致化制御方式

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0457308B1 (en) * 1990-05-18 1997-01-22 Fujitsu Limited Data processing system having an input/output path disconnecting mechanism and method for controlling the data processing system
US7739541B1 (en) * 2003-07-25 2010-06-15 Symantec Operating Corporation System and method for resolving cluster partitions in out-of-band storage virtualization environments
JP4387968B2 (ja) * 2005-03-28 2009-12-24 富士通株式会社 障害検出装置および障害検出方法
US7913117B2 (en) * 2007-08-10 2011-03-22 International Business Machines Corporation Providing removable storage management services using removable storage error information
JP4982304B2 (ja) * 2007-09-04 2012-07-25 株式会社日立製作所 電源障害の発生を把握するストレージシステム
JP4738438B2 (ja) * 2008-04-17 2011-08-03 株式会社日立製作所 外部接続ストレージシステムのパス管理及び障害箇所検出方法
US8380951B1 (en) * 2008-10-01 2013-02-19 Symantec Corporation Dynamically updating backup configuration information for a storage cluster
US8392496B2 (en) * 2008-12-19 2013-03-05 Watchguard Technologies, Inc. Cluster architecture for network security processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5870495A (ja) * 1981-10-22 1983-04-26 Nec Corp 多重化記憶装置の制御装置
JPH0423149A (ja) 1990-05-18 1992-01-27 Fujitsu Ltd 二重化データ保全装置
JP2941387B2 (ja) * 1990-08-31 1999-08-25 富士通株式会社 多重化装置の一致化制御方式
JPH0546580A (ja) 1991-08-21 1993-02-26 Fujitsu Ltd 拡張記憶の高信頼性データ更新方式

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019010512A (ja) * 2017-06-30 2019-01-24 バイオセンス・ウエブスター・(イスラエル)・リミテッドBiosense Webster (Israel), Ltd. システムウォッチドッグ及び診断のためのネットワークスニファ
JP7102259B2 (ja) 2017-06-30 2022-07-19 バイオセンス・ウエブスター・(イスラエル)・リミテッド システムウォッチドッグ及び診断のためのネットワークスニファ

Also Published As

Publication number Publication date
JP5488693B2 (ja) 2014-05-14
EP2555116A1 (en) 2013-02-06
JPWO2011121666A1 (ja) 2013-07-04
US20120331334A1 (en) 2012-12-27

Similar Documents

Publication Publication Date Title
US9189316B2 (en) Managing failover in clustered systems, after determining that a node has authority to make a decision on behalf of a sub-cluster
US6260158B1 (en) System and method for fail-over data transport
KR101231558B1 (ko) 마이크로프로세서에서의 전압 및 주파수의 신뢰성있는 설정
US20080263544A1 (en) Computer system and communication control method
JP2013535745A (ja) 高可用性仮想機械環境におけるアプリケーションの高可用性の提供
JP2015153075A (ja) 伝送装置および制御ユニット
JP2004152298A (ja) バスを機能強化する方法および装置
CN103718535A (zh) 硬件故障的缓解
US10102088B2 (en) Cluster system, server device, cluster system management method, and computer-readable recording medium
US20080313426A1 (en) Information Processing Apparatus and Information Processing Method
JP4772920B2 (ja) 試験装置および送信装置
US9043283B2 (en) Opportunistic database duplex operations
US10417101B2 (en) Fault monitoring device, virtual network system, and fault monitoring method
JP5488693B2 (ja) マルチクラスタシステム
JP2007280313A (ja) 冗長化システム
JP6134720B2 (ja) 接続方法
TW201201013A (en) Method and multiple computer system with a failover support to manage shared resources
JP5470884B2 (ja) マルチノードシステム、異常処理方法、スイッチ、ノード及びプログラム
US10365618B2 (en) Method for operating a redundant automation system
US8639967B2 (en) Controlling apparatus, method for controlling apparatus and information processing apparatus
JP2011253285A (ja) 診断システム、診断装置及び診断プログラム
US20140025862A1 (en) Server system and dynamic maintenance method for crossbar board
JP2009003613A (ja) バス障害検出方法及びバスシステム
JP7371260B2 (ja) 電子機器、及び接続検査方法
KR101615577B1 (ko) 클러스터 시스템에서 클러스터를 처리하기 위한 방법과 장치 및 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10848848

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2012507910

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2010848848

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE