WO2011036727A1 - メモリシステム及びメモリシステムの制御方法 - Google Patents
メモリシステム及びメモリシステムの制御方法 Download PDFInfo
- Publication number
- WO2011036727A1 WO2011036727A1 PCT/JP2009/004886 JP2009004886W WO2011036727A1 WO 2011036727 A1 WO2011036727 A1 WO 2011036727A1 JP 2009004886 W JP2009004886 W JP 2009004886W WO 2011036727 A1 WO2011036727 A1 WO 2011036727A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- data
- memory
- crossbar
- selector
- controller
- Prior art date
Links
Images
Classifications
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1666—Error detection or correction of the data by redundancy in hardware where the redundant component is memory or memory area
 
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2007—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
 
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
 
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2017—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where memory access, memory control or I/O control functionality is redundant
 
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/85—Active fault masking without idle spares
 
Definitions
- the present invention relates to a memory system and a memory system control method.
- the memory system has a central processing unit, a memory, a system controller having a system controller and a memory controller, and a data crossbar and an address crossbar for connecting a plurality of system boards.
- a memory and a memory controller are duplicated in a system board.
- the memory controllers duplicated in the system board are connected to the memory controllers of other system boards by different data crossbars.
- the duplicated memory stores the same data, thereby duplicating and storing the data.
- duplexed memory controller In normal operation, when the duplexed memory controller receives a data read request from another system board, it reads the data according to the request from the memory connected to each memory controller. Each memory controller transfers the read data to the memory controller of another system board via the data crossbar.
- the memory controller connected to the non-failed data crossbar reads the data, and performs a degeneration operation of transferring the read data to the memory controller of another system board.
- the data read out by the memory controller connected to the non-failed data crossbar cannot be corrected during the degeneration operation, there is a problem that the data transfer destination system board cannot use the data.
- An object of the present invention is to improve the reliability of transferred data when transferring duplicated data stored in a memory during degenerate operation.
- a memory system that can be connected to other devices via a data crossbar and stores data is duplicated with a first memory that stores data and the first memory, and stores data Data is written to or read from the second memory and the first memory, connected to another device via the first data crossbar, and data to be written to or read from the first memory is sent to the other device.
- the first memory controller that transmits / receives data to / from the second memory, writes / reads data to / from the second memory, connects to the other device via the second data crossbar, and transmits data to / from the second memory.
- a second memory controller that transmits and receives to and from the other device, and detects data transmission and reception via the first data crossbar and the second data crossbar.
- a read request target from the other device from the first memory and the second memory The first memory controller and the second memory controller are instructed to read the data, and the error detection of the data read by the first memory controller and the second memory controller is performed, and no error is detected. And a system controller that outputs data subjected to error correction.
- the system controller reads data from the first memory and the second memory during the degenerate operation of the duplex data crossbar, and the data read from one of the memories cannot be error corrected. If the data read from the other memory does not include an error or can be corrected, the data is output. For this reason, when transferring data during the degenerate operation, the reliability of the transferred data can be improved.
- FIG. 3 is a first diagram illustrating an information processing apparatus. It is FIG. (2) explaining an information processing apparatus. It is a figure explaining the usefulness of this embodiment.
- the information processing apparatus 0 includes system boards 100A and 100B, an address crossbar 110A / 110B, and a data crossbar 112A / 112B.
- the address crossbar 110A / 110B and the data crossbar 112A / 112B connect a plurality of system boards.
- the address crossbar 110A / 110B transmits and receives addresses to and from the plurality of system boards 100A and the system board 100B.
- the data crossbar 112A / 112B transmits / receives data to / from the system board 100A and the system board 100B.
- the data crossbars 112A / 112B are directly connected to a memory controller included in the system board so as to increase the memory access speed.
- the system board 100A and the system board 100B each have a central processing unit (CPU: Central Processing Unit) 102, a system controller 104, a memory controller 106, and a memory 108.
- the memory controller 106 and the memory 108 are duplicated.
- the memory controller 106 reads / writes data from / to the memory 108.
- Memory controllers duplicated in the same system board are connected to different crossbars. The same data is written in each of the duplicated memories 108, and the data is duplicated.
- the memory 108 is, for example, a dual in-line memory module (DIMM: Dual Inline Memory Module).
- DIMM Dual Inline Memory Module
- the CPU 102 processes data.
- the system controller 104 synchronously controls the duplicated memory controller 106.
- Each memory controller 106 and memory 108 operate synchronously, but the memory controllers themselves do not synchronize with each other's movements, but always with instructions from some system controller 104. Are synchronized.
- an instruction from the system controller 104 of another system board does not reach one side of the duplex, and the memory controller 106 and the memory 108 cannot be synchronized. For this reason, the memory system that has not failed must be degraded.
- only copying the contents of one of the memories will cause the two memories to perform separate read and write operations and not a synchronous operation.
- system board 100A and the system board 100B will be described with reference to FIG. Since the configuration of the system board 100A is the same as that of the system board 100B, only the system board 100A will be described here.
- the two memory controllers 106 included in the system board 100A described with reference to FIG. 1 will be described separately from the memory controller 106A and the memory controller 106B.
- the memory controller 106A includes a data cross bar queue (DXIQ: Data Xbar In Queue) 98A, a data cross bar queue (DXOQ: Data Xbar Out Queue) 99A, a selector 88A, a selector 89A, a memory write queue (MWQ: Memory Write Que). , A memory read queue (MRQ: Memory Read Queue) 95A, a decoder 120A, a data transmitting / receiving unit 118A, a command issuing unit 132A, and a scrub control slave circuit 122A.
- DXIQ Data Xbar In Queue
- DXOQ Data Xbar Out Queue
- MWQ Memory Write Que
- DXIQ 98A is a queue for storing data.
- the DXIQ 98A stores data transmitted from another system board via the signal line 1121A.
- the DXIQ 98A outputs the stored data to the selector 88A and the selector 126.
- the selector 88A selects an input-side path connected to the selector 88A, and outputs data input from the selected path.
- the selector 88A selects the path from the DXIQ 98A
- the selector 88A outputs the data output from the DXIQ 98A to the MWQ 96A.
- the MWQ 96A is a queue that stores data to be written to the memory and / or commands / addresses related to memory access.
- the MWQ 96A outputs the data output from the selector 88A to the decoder 120A.
- the selector 88A also appropriately selects an address and command output from another system board via the signal line connected to the address crossbar and the selector 125 included in the system controller 104, and outputs the selected address and command to the MWQ 96A.
- the MWQ 96A outputs the address and command output from the selector 88A to the decoder 120A.
- the decoder 120A decodes the data output from the selector 88A.
- the decoder 120A outputs the command and address to the command issuing unit 132A.
- the decoder 120A outputs the data to the data transmitting / receiving unit 118A.
- the command issuing unit 132A has a function of outputting the command decoded by the decoder 120A to the memory 108A.
- the command issuing unit 132A outputs a write command to the memory 108A based on the data output from the decoder 120A.
- the data transmitter / receiver 118A has a function of transmitting / receiving data to / from the memory 108A. When a write command is issued from the command issuing unit 132A, the data transmitting / receiving unit 118A outputs the data to the memory 108A.
- the memory 108A stores data.
- the memory 108A receives the write command output from the command issuing unit 132A
- the memory 108A writes the data output from the data transmitting / receiving unit 118A to the address output from the command issuing unit 132A.
- the decoder 120A When the received command is a read command, the decoder 120A outputs the read command and address to the command issuing unit 132A.
- the command issuing unit 132A outputs the read command and address output from the decoder 120A to the memory 108A.
- the memory 108A When the memory 108A receives the read command output from the command issuing unit 132A, the memory 108A outputs the data stored at the address output from the command issuing unit 132A to the data transmitting / receiving unit 118A.
- the data transmitter / receiver 118A receives the data output from the memory 108A when the read command is executed.
- the data transmitter / receiver 118A outputs the data output from the memory 108A to the MRQ 95A.
- the MRQ 95A outputs the data output from the data transmitting / receiving unit 118A to the scrub control slave circuit 122A, the selector 89A, and the selector 126 included in the system controller 104.
- the selector 126 will be described later.
- the scrub control slave circuit 122A has a function of detecting an error in the received data.
- the scrub control slave circuit 122A receives the data output from the MRQ 95A.
- the scrub control slave circuit 122A detects an error in the received data using an error correcting code (ECC).
- ECC error correcting code
- the scrub control slave circuit 122A outputs a signal indicating that the data error is detected to the scrub control master circuit 130.
- ECC error correcting code
- the selector 89A normally outputs the data output from the MRQ 95A to the DXOQ 99A.
- DXOQ99A stores the data output by selector 89A.
- the DXOQ 99A outputs the stored data to another system board via the output data crossbar 112B.
- the system controller 104 includes a selector 125, a selector 126, a selector 127, a secretor 128, and a scrub control master circuit 130.
- the selector 125 outputs the address and command received from another system board via the address crossbar 110 or the address and command output by the CPU 102 to the selector 88A of the memory controller 106A and the selector 88B of the memory controller 106B.
- the selector 126 selects either data output from the DXIQ 98A of the memory controller 106A or the MRQ 95A of the memory controller 106A, and outputs the selected data to the selector 128.
- the selector 127 selects either the data output from the DXIQ 98B of the memory controller 106B or the MRQ 95B of the memory controller 106B and outputs the selected data to the selector 128.
- the selector 128 performs error detection of data output from the selector 126 and the selector 127 using the ECC.
- the selector 128 selects the data for which no error has been detected and outputs it to the CPU 102 and the scrub control master circuit 130.
- the signal line 1111A and the signal line 1111B are connected to the selector 88A of the memory controller 106A.
- the signal line 1111A is connected to the correctable error detector 1091A of the data crossbar 112A.
- the signal line 1111B is connected to the correctable error detector 1092A of the data crossbar 112B.
- the correctable error detection units 1091A / 1092A will be described later with reference to FIG.
- the selector 88A invalidates the path from the DXIQ 98A to the selector 88A when no signal is input via the signal line 1111A from the data crossbar connected to the memory controller on which the selector 88A is mounted.
- the signal line 1111A and the signal line 1111B are also connected to the scrub control master circuit 130 of the system controller 104.
- the scrub control master circuit 130 does not receive data or the like from the selector 128.
- the scrub control master circuit 130 receives data from the selector 128.
- data input from the data crossbar 112A through the memory controller 106A is sent to the scrub control master circuit 130 via the selector 126 and the selector 128. input.
- the scrub light operation will be described.
- the scrub write operation when the memory controller 106 reads data from the memory 108 and there is a correctable error in the read data, the data is read from the address of the memory 108 where the data has been written, and error correction is performed. In this operation, the data after error correction is written to the same address of the memory 108 again.
- a case where there is a correctable error in data read from the memory 108A by the memory controller 106A will be described.
- the scrub control slave circuit 122A of the memory controller 106A determines that there is an error in the data output from the MRQ 95A using ECC, the scrub control master circuit 130 provided in the system controller 104 notifies the scrub write request. Further, the scrub control slave circuit 122A of the memory controller 106A receives the address of the memory 108A in which data having an error is stored from the command issuing unit 132A of the memory controller 106A. The scrub control slave circuit 122A of the memory controller 106A outputs the address received from the command issuing unit 132 to the scrub control master circuit 130.
- the scrub control master circuit 130 When the scrub control master circuit 130 receives the scrub write request notification and address from the scrub control slave circuit 122A of the memory controller 106A, the scrub control master circuit 130 starts the scrubbing write.
- the scrub control master circuit 130 outputs the scrub write command and the address received from the scrub control slave circuit 122A of the memory controller 106A to the selector 88A of the memory controller 106A and the selector 88B of the memory controller 106B.
- the selector 88 of each memory controller 106 outputs the scrub write command and address output from the scrub control master circuit 130 to the MWQ 96.
- the MWQ 96 stores the scrub write command and address output from each selector 88.
- the MWQ 96 outputs the stored scrub write command and address to the decoder 120.
- the decoder 120 decodes the scrub write command and address output from the MWQ 96 and outputs the scrub write command and address to the command issuing unit 132.
- the command issuing unit 132 outputs the scrub write command and address output from the decoder 120 to the memory 108.
- the memory 108 When the memory 108 receives the scrub write command output from the command issuing unit 132, the memory 108 outputs the data stored at the address output from the command issuing unit 132 to the data transmitting / receiving unit 118.
- the data transmitter / receiver 118 receives the data output from the memory 108.
- the data transmitter / receiver 118A of the memory controller 106A outputs the data output from the memory 108A to the selector 126 via the MRQ 95A.
- the selector 126 outputs the data received from the data transmitting / receiving unit 118A to the selector 128.
- the same processing is performed such that the data transmitting / receiving unit 118B outputs data to the selector 127.
- the selector 128 performs error correction using ECC on the data from the memory controller 106A received from the selector 126 and the data from the memory controller 106B received from the selector 127.
- the selector 128 outputs the corrected data to the scrub control master circuit 130.
- the selector 128 selects and outputs normal data.
- the scrub control master circuit 130 receives the corrected data received from the selector 128 and the address and write command received from the scrub control slave circuit 122A of the memory controller 106A and the scrub control slave circuit 122B of the memory controller 106B. 88A and the selector 88B of the memory controller 106B.
- the write command is generated by the scrub control master circuit 130.
- each memory controller 106 outputs the data, address, and write command received from the scrub control master circuit 130 to the decoder 120 via the MWQ 96.
- the decoder 120 decodes the data received from the MWQ 96 and outputs the data to the data transmitting / receiving unit 118 and the address and write command to the command issuing unit 132.
- the command issuing unit 132 outputs the write command and address output from the decoder 120 to the memory 108.
- the data transmission / reception unit 118 outputs the data output from the decoder 120 to the memory 108.
- the memory 108 When the memory 108 receives the write command output from the decoder 120, the memory 108 writes the data output from the data transmitting / receiving unit 118 to the address output from the decoder 120. Similar processing is performed in the memory controller 106B. The scrub light operation is complete. This operation corrects the data causing the error.
- the scrub control master circuit 130 broadcasts data to the selector 89A of the memory controller 106A and the selector 89B of the memory controller 106B. Then, data is output from the selector 89A of the memory controller 106A to another system board via the signal line 1121B.
- the data is not sent to the DXOQ 99B because there is no signal input from the signal line 1111B and the selector 89B does not select the path of the DXOQ 99B.
- write data output from other system boards is input to the scrub control master circuit 130 via the signal line 1121A, DXIQ 98A, selector 126, and selector 128 through the data crossbar 112A that has not failed.
- the data crossbar 112A includes an uncorrectable error detection unit 1091A and an uncorrectable error detection unit 1091B.
- the data crossbar 112B includes an uncorrectable error detector 1092A and an uncorrectable error detector 1092B.
- the uncorrectable error detection unit 1091A uses ECC to detect whether there is an uncorrectable error in the data flowing through the signal line 1121A. If there is no uncorrectable error in the data, the uncorrectable error detector 1091A inputs the alive signal to the selector 88A of the memory controller 106A and the scrub control master circuit 130 in the system controller 104 via the signal line 1111A. To do.
- the alive signal is a signal for notifying the system board 100A that the data crossbar 112A is operating normally.
- the uncorrectable error detection unit 1091A does not output an alive signal via the signal line 1111A.
- the selector 88A and the scrub control master circuit 130 of the memory controller 106A can switch paths depending on whether or not an alive signal is input from the uncorrectable error detection unit 1091A.
- the uncorrectable error detection unit 1092A detects whether or not there is an uncorrectable error in the data flowing through the signal line 1122A using the ECC. If there is no uncorrectable error in the data, the uncorrectable error detector 1092A inputs the alive signal to the selector 88B and the scrub control master circuit 130 of the memory controller 106B via the signal line 1111B. On the other hand, when there is an uncorrectable error, the uncorrectable error detector 1092A does not input the alive signal to the selector 88B and the scrub control master circuit 130 via the signal line 1111B. The selector 88B and the scrub control master circuit 130 of the memory controller 106B can switch paths depending on whether or not an alive signal is input from the uncorrectable error detection unit 109B.
- the uncorrectable error detector 1091B also detects whether there is an uncorrectable error in the data flowing through the signal line 1121B, and determines whether to input an alive signal via the signal line 1112A.
- the uncorrectable error detector 1092B also detects whether there is an uncorrectable error in the data flowing through the signal line 1122B, and determines whether to input an alive signal via the signal line 1112B.
- the DXIQ 98A stores data received from other system boards via the signal line 1121A.
- the DXIQ 98A outputs the stored data to the selector 126.
- Each element described here is an element on the 106A side.
- the selector 126 outputs the data output from the DXIQ 98A to the selector 128.
- the selector 128 outputs the data output from the selector 126 to the scrub control master circuit 130. Since the memory controller 106B does not receive data from another system board, no data is input to the selector 128 via the selector 127.
- the scrub control master circuit 130 outputs the data output from the selector 128 to the selector 88A of the memory controller 106A and the selector 88B of the memory controller 106B. Further, the selector 125 outputs the write command and address received from the other system board via the address crossbar 110A or 110B to the selector 88A of the memory controller 106A and the selector 88B of the memory controller 106B. Since the memory controller 106A and the memory controller 106B perform the same processing, the processing of the memory controller 106A will be described in this embodiment, and the description of the processing of the memory controller 106B will be omitted.
- the selector 88A outputs the data received from the scrub control master circuit 130 and the write command and address received from the selector 125 to the MWQ 96A.
- the MWQ 96A outputs the data, write command, and address output from the selector 88A to the decoder 120A.
- the decoder 120A decodes the data, write command, and address output from the MWQ 96A.
- the decoder 120A outputs the write command and the address to the command issuing unit 132A.
- the decoder 120A outputs the data to the data transmission / reception unit 118A.
- the command issuing unit 132A outputs the write command and address output from the decoder 120A to the memory 108A.
- the data transmitting / receiving unit 118A outputs the data output from the decoder 120A to the memory 108A.
- the memory 108A When the memory 108A receives the write command output from the decoder 120A, the memory 108A writes the data output from the data transmitting / receiving unit 118A to the address output from the decoder 120A. Data received from only one data crossbar can be written to both memories 108 by the system board 104, thereby enabling duplication.
- Each decoder 120 outputs a read command and an address to the command issuing unit 132.
- Each command issuing unit 132 outputs the read command and address output from the decoder 120 to the memory 108.
- each memory 108 When each memory 108 receives the read command output from the decoder 120, it outputs the data stored at the address output from the decoder 120 to the data transmitter / receiver 118.
- Each data transmitting / receiving unit 118 receives data output from the memory 108.
- the data transmitting / receiving unit 118 outputs the data output from the memory 108 to the MRQ 95.
- the MRQ 95A of the memory controller 106A outputs the data output from the data transmitter / receiver 118 to the selector 126.
- the MRQ 95B of the memory controller 106B outputs data to the selector 127.
- the selector 126 outputs the data output from the MRQ 95A to the selector 128.
- the selector 127 outputs the data output from the MRQ 95B of the memory controller 106B to the selector 128.
- the selector 128 performs error detection of data output from the selector 126 and the selector 127 using ECC.
- the selector 128 selects data for which no error has been detected and outputs it to the CPU 102.
- CPU 102 receives the data output from selector 128. When outputting the data to another system controller, the CPU 102 outputs the data to the selector 89A of the memory controller 106A via the selector 125. The selector 89A outputs the data output from the CPU 102 to the DXOQ 99A. DXOQ99A stores the data output by selector 89A. The DXOQ 99A outputs the stored data to another system board via the signal line 1121B.
- step S101 the system controller 104 determines whether an alive signal is received from the signal line 1111A and the signal line 1111B.
- the process proceeds to step S102.
- the alive signal is not received from either the signal line 1111A or the signal line 1111B, the process proceeds to step S103.
- step S102 the system controller 104 determines whether an alive signal is received from one of the signal lines 1111A and 1111B. When the alive signal is received from one of the signal line 1111A and the signal line 1111B, the process proceeds to step S104. On the other hand, when the alive signal is not received from any one of the signal lines 1111A and 1111B, the process proceeds to step S105, and the system controller 104 determines that the system is down. The process ends.
- step S104 the system controller 104 determines whether or not a memory read access has been received from another system board via the address crossbar 110. When the system controller 104 receives a memory read access from another system board, the process proceeds to step S106. On the other hand, if the system controller 104 has not received a memory read access from another system board, the process proceeds to step S103.
- step S106 the system controller 104 broadcasts the received read command to each of the duplicated memory controllers. The process proceeds to step S103.
- step S103 the system controller 104 determines whether or not there is a scrub write request notification from the scrub control slave circuit 122. If there is a scrub write request notification from the scrub control slave circuit 122, the process proceeds to step S107. On the other hand, when no scrub write request is notified from the scrub control slave circuit 122, the process ends.
- step S107 the system controller 104 outputs a scrub write command to each of the duplicated memory controllers. The process ends.
- step S201 the memory controller 106A receives the data read from the memory 108A by the data transmitting / receiving unit 118A via the MRQ 95A. The process proceeds to step S202.
- step S202 the memory controller 106A determines whether there is an error in the received data using the ECC. If there is an error in the received data, the process proceeds to step S203. On the other hand, if there is no error in the received data, the process ends.
- step S203 the memory controller 106A outputs a scrub request to the scrub control master circuit 130. The process ends.
- each of the memories 108 in which the system controller 104 of the system board 100A is duplicated Read data from. Therefore, even if there is an uncorrectable error in one of the read data, if the other data is normal data or data with a correctable error exists By using those data, it is possible to prevent the system from going down.
- the selector 88 and the selector 89 of the memory controller 106 are added with a function of receiving an Alive Down signal and changing the path.
- the scrub control master circuit 130 is provided with a return path from the memory controller 106.
- the selector 128 performs data return from the memory controller 106 to the scrub control master circuit 130.
- a memory access conversion function is added to the scrub control master circuit 130. Memory write via the return path is converted to memory write 2, and memory read via the return path is converted to memory read 2. This conversion is effective when an Alive Down signal is received.
- the conversion result command can be issued to the scrub control master circuit 130.
- the command issuing unit in the memory controller 106 is provided with a function for decoding the memory write 2 and the memory read 2. Normally, memory access via the data crossbar is performed directly from the memory controller to the memory. When degenerating only the data crossbar and trying to effectively use the memory system, it is necessary to make the degenerated data crossbar appear to be operating.
- the object to appear is a memory controller.
- 0 information processing devices 88A, 88B, 89A, 89B, 125, 126, 127, 128 selectors 95A, 95B memory read queues 96A, 96B memory write queues 98A, 98B data cross-bine queues 99A, 99B data cross-bout queues 100A, 100B Board 102
- CPU 104 System controller 106, 106A, 106B, 106C, 106D Memory controller 108, 108A, 108B, 108C, 108D Memory 1091A, 1091B, 1092A, 1092B Uncorrectable error detector 110A, 110B Address crossbar 1111A, 1111B, 1112A, 1112B, 1121A, 1121B, 1122A, 1122B Signal line 112, 112A, 112B Data crossbar 118, 118A, 118B Data transceiver 120, 120A, 120B Decoder 122, 122A, 122B Scrub control slave circuit 130 Scrub control master circuit 132
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multi Processors (AREA)
- Detection And Correction Of Errors (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
- Hardware Redundancy (AREA)
Abstract
 データクロスバを介して他装置に接続可能であり、データを記憶するメモリシステムは、二重化されたデータクロスバの縮退運転時には、システムコントローラが第1メモリ及び第2メモリからデータを読み出し、一方のメモリから読み出したデータが誤り訂正不可能であっても、他方のメモリから読み出したデータがエラーを含んでいない又は誤り訂正可能であれば、当該データを出力する。このため、縮退運転時にデータを転送する際、転送データの信頼性を向上させることができる。
  Description
 本発明は、メモリシステム及びメモリシステムの制御方法に関する。
    
 メモリシステムは、中央処理装置、メモリ、システムコントローラ及びメモリコントローラを有するシステムボードと、複数のシステムボードを接続するデータクロスバ及びアドレスクロスバを有する。メモリシステムにはシステムボード内でメモリ及びメモリコントローラが二重化されているものがある。システムボード内で二重化されたメモリコントローラはそれぞれ別のデータクロスバによって他のシステムボードのメモリコントローラに接続する。二重化されたメモリは同一のデータを格納することで、データを二重化して記憶する。
      
 通常動作時、二重化されたメモリコントローラは他のシステムボードからデータの読出し要求を受信すると、各メモリコントローラに接続するメモリから要求に応じたデータを読み出す。各メモリコントローラはそれぞれ読出したデータをデータクロスバを介して他のシステムボードのメモリコントローラに転送する。
      
 メモリシステムは、一方のデータクロスバが故障すると、故障していないデータクロスバに接続するメモリコントローラがデータを読み出し、他のシステムボードのメモリコントローラに読み出したデータを転送する縮退動作を行う。縮退動作時、故障していないデータクロスバに接続するメモリコントローラの読み出したデータがエラー訂正不可能である場合、データの転送先のシステムボードはデータを使用することができない問題があった。
      
 先行技術文献としては下記のものがある。
    
 本発明の課題は、縮退運転時にメモリに格納された二重化データを転送する際に、転送データの信頼性を向上させることである。
      
 上記課題を解決するために、データクロスバを介して他装置に接続可能であり、データを記憶するメモリシステムは、データを記憶する第1メモリと、前記第1メモリと二重化され、データを記憶する第2メモリと、該第1メモリに対してデータの書き込み又は読み出しを行い、他装置に第1データクロスバを介して接続し、該第1メモリの書き込み又は読み出しを行うデータを該他装置に対して送受信する第1メモリコントローラと、該第2メモリに対してデータの書き込み又は読み出しを行い、該他装置に第2データクロスバを介して接続し、該第2メモリの書き込み又は読み出しを行うデータを該他装置に対して送受信する第2メモリコントローラと、該第1データクロスバ及び該第2データクロスバを介したデータ送受信を検出し、該第1データクロスバ又は該第2データクロスバのいずれか一方のデータクロスバを介してデータの送受信ができないことを検出した場合、該第1メモリ及び該第2メモリから該他装置からの読み出し依頼対象のデータを読み出しを前記第1のメモリコントローラおよび前記第2のメモリコントローラに指示し、該第1のメモリコントローラ及び前記第2のメモリコントローラが読み出したデータの誤り検出を行い、誤りが検出されなかったデータ又は誤り訂正を行ったデータを出力するシステムコントローラとを有する。
      
 本実施形態の一側面によれば、二重化されたデータクロスバの縮退運転時には、システムコントローラが第1メモリ及び第2メモリからデータを読み出し、一方のメモリから読み出したデータが誤り訂正不可能であっても、他方のメモリから読み出したデータがエラーを含んでいない又は誤り訂正可能であれば、当該データを出力する。このため、縮退運転時にデータを転送する際、転送データの信頼性を向上させることができる。
      
 図1を用いて、本実施形態における情報処理装置について説明する。以下、共通の要素に対する説明を行う場合は、例えば、符号を「102」や「108」と総称し、共通符号で説明する。情報処理装置0は、システムボード100A及び100B、アドレスクロスバ110A/110B及びデータクロスバ112A/112Bを有する。アドレスクロスバ110A/110B及びデータクロスバ112A/112Bは複数のシステムボードを接続する。アドレスクロスバ110A/110Bは複数のシステムボード100A及びシステムボード100Bとの間でアドレスの送受信を行う。データクロスバ112A/112Bはシステムボード100A及びシステムボード100Bとの間でデータの送受信を行う。データクロスバ112A/112Bはシステムボードが有するメモリコントローラに直接接続され、メモリアクセスの高速化が図られている。
      
 システムボード100A及びシステムボード100Bはそれぞれ、中央処理装置(CPU:Central Processing Unit)102、システムコントローラ104、メモリコントローラ106及びメモリ108を有する。システムボード100内では、メモリコントローラ106及びメモリ108はそれぞれ二重化されている。メモリコントローラ106は、メモリ108に対してデータの読み書きを行う。同一システムボード内で二重化されたメモリコントローラは、各々異なるクロスバに接続されている。二重化されたそれぞれのメモリ108には、同一のデータが書き込まれ、データの二重化が図られている。メモリ108は、例えば、デュアル・インライン・メモリ・モジュール(DIMM:Dual Inline Memory Module)である。CPU102は、データの処理を行う。システムコントローラ104は、二重化されたメモリコントローラ106を同期制御する。
      
 各メモリコントローラ106とメモリ108は同期して動作しているが、メモリコントローラ自体がお互いの動きを見て同期をとっているわけではなく、常に、どこかのシステムコントローラ104からの指示を以って、同期をとっている。データクロスバ112A/112Bに故障が発生した場合、他のシステムボードのシステムコントローラ104からの指示が、二重化の片側に届かなくなる為、メモリコントローラ106とメモリ108を同期できなくなる。この為、故障していないメモリシステムも含めて縮退しなくてはならない。活用可能なメモリシステムを有効活用する為に、片方のメモリの内容をコピーするだけでは、2つのメモリがリードとライトの別々の動きとなり、同期動作とならない。
      
 さらに、図2を用いてシステムボード100A及びシステムボード100Bの詳細について説明する。システムボード100Aの構成は、システムボード100Bの構成と同一であるため、ここではシステムボード100Aについて説明する。また、図1を用いて説明したシステムボード100Aが有する2つのメモリコントローラ106をそれぞれメモリコントローラ106A、メモリコントローラ106Bと区別して説明する。
      
 メモリコントローラ106Aは、データクロスバインキュー(DXIQ:Data Xbar In Queue)98A、データクロスバアウトキュー(DXOQ:Data Xbar Out Queue)99A、セレクタ88A、セレクタ89A、メモリライトキュー(MWQ:Memory Write Queue)96A、メモリリードキュー(MRQ:Memory Read Queue)95A、デコーダ120A、データ送受信部118A、コマンド発行部132A及びスクラブコントロールスレーブ回路122Aを有する。
      
 DXIQ98Aは、データを格納するキューである。DXIQ98Aは、信号線1121Aを介して他のシステムボードから送信されるデータを格納する。DXIQ98Aは、格納したデータをセレクタ88A及びセレクタ126に出力する。セレクタ88Aは、セレクタ88Aに接続される入力側のパスを選択して、選択したパスから入力するデータを出力する。セレクタ88Aは、DXIQ98Aからのパスを選択した場合、DXIQ98Aが出力したデータをMWQ96Aに出力する。MWQ96Aは、メモリに書き込むデータおよび/あるいはメモリアクセスに関連するコマンド/アドレスを格納するキューである。MWQ96Aは、セレクタ88Aが出力したデータをデコーダ120Aに出力する。また、セレクタ88Aは、アドレスクロスバに接続される信号線およびシステムコントローラ104が有するセレクタ125を介して他のシステムボードから出力されたアドレス及びコマンドを適宜選択して、MWQ96Aに出力する。MWQ96Aは、セレクタ88Aが出力したアドレス及びコマンドをデコーダ120Aに出力する。
      
 デコーダ120Aは、セレクタ88Aが出力したデータ等をデコードする。デコーダ120Aは、入力したコマンドがライトコマンドである場合、当該コマンド及びアドレスをコマンド発行部132Aに出力する。また、デコーダ120Aは、データをデータ送受信部118Aに出力する。
      
 コマンド発行部132Aは、デコーダ120Aがデコードしたコマンドをメモリ108Aに出力する機能を有する。コマンド発行部132Aは、デコーダ120Aが出力したデータに基づいてライトコマンドをメモリ108Aに出力する。データ送受信部118Aはメモリ108Aとの間でデータの送受信を行う機能を有する。コマンド発行部132Aからライトコマンドが発行された場合、データ送受信部118Aはデータをメモリ108Aに出力する。
      
 メモリ108Aは、データを記憶する。メモリ108Aは、コマンド発行部132Aから出力されたライトコマンドを受信すると、コマンド発行部132Aから出力されたアドレスに、データ送受信部118Aから出力されたデータを書き込む。
      
 また、他のシステムボードによるリードアクセスに対するデータ読み出し時には、信号線1121Aを介してデータはメモリコントローラ106Aに入力されず、アドレスクロスバ110を介して、他のシステムボードからのアドレス及びリードコマンドがセクレタ125等を介して、デコーダ120Aに入力する。
      
 デコーダ120Aは、受信したコマンドがリードコマンドである場合、当該リードコマンド及びアドレスをコマンド発行部132Aに出力する。コマンド発行部132Aは、デコーダ120Aが出力したリードコマンド及びアドレスをメモリ108Aに出力する。
      
 メモリ108Aは、コマンド発行部132Aから出力されたリードコマンドを受信すると、コマンド発行部132Aから出力されたアドレスに格納されているデータをデータ送受信部118Aに出力する。
      
 データ送受信部118Aは、リードコマンド実行時にメモリ108Aから出力されたデータを受信する。データ送受信部118Aは、メモリ108Aから出力されたデータをMRQ95Aに出力する。MRQ95Aは、データ送受信部118Aが出力したデータをスクラブコントロールスレーブ回路122A、セレクタ89A及びシステムコントローラ104が有するセレクタ126に出力する。セレクタ126については後述する。
      
 スクラブコントロールスレーブ回路122Aは、受信したデータの誤りを検出する機能を有する。スクラブコントロールスレーブ回路122Aは、MRQ95Aが出力したデータを受信する。スクラブコントロールスレーブ回路122Aは、受信したデータの誤りを誤り訂正符号(ECC:Error Correcting Code)を用いて検出する。スクラブコントロールスレーブ回路122Aは、受信したデータの誤りを検出した場合、データの誤りを検出したことを表す信号をスクラブコントロールマスタ回路130に出力する。スクラブコントロールマスタ回路130については後述する。
      
 セレクタ89Aは、通常時はMRQ95Aが出力したデータをDXOQ99Aに出力する。DXOQ99Aは、セレクタ89Aが出力したデータを格納する。DXOQ99Aは、格納したデータを出力データクロスバ112Bを介して他のシステムボードに出力する。
      
 システムコントローラ104は、セレクタ125、セレクタ126、セレクタ127、セクレタ128及びスクラブコントロールマスタ回路130を有する。
      
 セレクタ125は、アドレスクロスバ110を介して他のシステムボードから受信したアドレス及びコマンド、またはCPU102が出力したアドレス及びコマンドを、メモリコントローラ106Aのセレクタ88A及びメモリコントローラ106Bのセレクタ88Bに出力する。
      
 セレクタ126は、メモリコントローラ106AのDXIQ98A又はメモリコントローラ106AのMRQ95Aが出力したデータのいずれかを選択して、セレクタ128に出力する。セレクタ127も同様に、メモリコントローラ106BのDXIQ98B又はメモリコントローラ106BのMRQ95Bが出力したデータのいずれかを選択して、セレクタ128に出力する。
      
 セレクタ128は、セレクタ126及びセレクタ127が出力したデータのエラー検出をECCを用いて行う。セレクタ128は、エラーが検出されなかった方のデータを選択して、CPU102およびスクラブコントロールマスタ回路130に出力する。
      
 メモリコントローラ106Aのセレクタ88Aには、信号線1111A及び信号線1111Bが接続される。信号線1111Aはデータクロスバ112Aの訂正可能エラー検出部1091Aに接続される。信号線1111Bはデータクロスバ112Bの訂正可能エラー検出部1092Aに接続される。なお、訂正可能エラー検出部1091A/1092Aについては図3を用いて後述する。
      
 セレクタ88Aは、セレクタ88Aが搭載されたメモリコントローラに接続されたデータクロスバから信号線1111Aを介して信号が入力しない場合、DXIQ98Aからセレクタ88Aのパスを無効化する。
      
 システムコントローラ104のスクラブコントロールマスタ回路130にも信号線1111A及び信号線1111Bが接続される。それぞれの信号線から信号が入力されている場合、スクラブコントロールマスタ回路130はセレクタ128からデータ等を受信しない。また、いずれか一方の信号線から信号がセレクタ88に入力されていない場合、スクラブコントロールマスタ回路130はセレクタ128からデータ等を受信する。
      
 図3に示したデータクロスバ112Bが故障し、メモリシステムが縮退運転を行っている場合は、メモリコントローラ106Aを通してデータクロスバ112Aから入力するデータはセレクタ126、セレクタ128を介してスクラブコントロールマスタ回路130に入力する。
      
 ここで、スクラブライト動作について説明する。スクラブライト動作は、メモリコントローラ106がメモリ108からデータを読み出し、読み出したデータに訂正可能なエラーが存在する場合に、当該データが書き込まれていたメモリ108のアドレスからデータを読み出し、誤り訂正を行い、再度メモリ108の同一アドレスに誤り訂正後のデータを書き込む動作である。本実施形態では、メモリコントローラ106Aがメモリ108Aから読み出したデータに、訂正可能なエラーが存在する場合について説明する。
      
 メモリコントローラ106Aのスクラブコントロールスレーブ回路122Aが、ECCを用いてMRQ95Aが出力したデータにエラーが存在すると判定した場合、システムコントローラ104に備えられたスクラブコントロールマスタ回路130にスクラブライトの要求を通知する。また、メモリコントローラ106Aのスクラブコントロールスレーブ回路122Aは、メモリコントローラ106Aのコマンド発行部132Aからエラーが存在するデータが記憶されていたメモリ108Aのアドレスを受信する。メモリコントローラ106Aのスクラブコントロールスレーブ回路122Aはコマンド発行部132から受信したアドレスをスクラブコントロールマスタ回路130に出力する。
      
 スクラブコントロールマスタ回路130は、メモリコントローラ106Aのスクラブコントロールスレーブ回路122Aからスクラブライトの要求の通知及びアドレスを受信すると、スラクラブライトを開始する。スクラブコントロールマスタ回路130は、メモリコントローラ106Aのセレクタ88A及びメモリコントローラ106Bのセレクタ88Bに、スクラブライトのコマンド及びメモリコントローラ106Aのスクラブコントロールスレーブ回路122Aから受信したアドレスを出力する。各メモリコントローラ106のセレクタ88は、スクラブコントロールマスタ回路130が出力したスクラブライトのコマンド及びアドレスをMWQ96に出力する。MWQ96は、各セレクタ88が出力したスクラブライトのコマンド及びアドレスを格納する。また、MWQ96は、格納したスクラブライトのコマンド及びアドレスをデコーダ120に出力する。
      
 デコーダ120は、MWQ96が出力したスクラブライトのコマンド及びアドレスをデコードし、スクラブライトのコマンド及びアドレスをコマンド発行部132に出力する。
      
 コマンド発行部132は、デコーダ120から出力されたスクラブライトのコマンド及びアドレスをメモリ108に出力する。
      
 メモリ108は、コマンド発行部132から出力されたスクラブライトのコマンドを受信すると、コマンド発行部132から出力されたアドレスに格納されているデータをデータ送受信部118に出力する。
      
 データ送受信部118は、メモリ108から出力されたデータを受信する。メモリコントローラ106Aのデータ送受信部118Aは、メモリ108Aから出力されたデータを、MRQ95Aを介してセレクタ126に出力する。セレクタ126は、データ送受信部118Aから受信したデータをセレクタ128に出力する。メモリコントローラ106Bにおいても、データ送受信部118Bがセレクタ127にデータを出力するなど、同様の処理が行われる。
      
 セレクタ128は、セレクタ126から受信したメモリコントローラ106Aからのデータ及びセレクタ127から受信したメモリコントローラ106Bからのデータに対してECCを用いて誤り訂正を行う。セレクタ128は訂正後のそれぞれのデータをスクラブコントロールマスタ回路130に出力する。セレクタ128は正常なデータを選択して出力する。
      
 スクラブコントロールマスタ回路130は、セレクタ128から受信した訂正後のデータと、メモリコントローラ106Aのスクラブコントロールスレーブ回路122A及びメモリコントローラ106Bのスクラブコントロールスレーブ回路122Bから受信したアドレス及びライトコマンドをメモリコントローラ106Aのセレクタ88A及びメモリコントローラ106Bのセレクタ88Bに出力する。なお、ライトコマンドは、スクラブコントロールマスタ回路130によって生成される。
      
 各メモリコントローラ106のセレクタ88は、スクラブコントロールマスタ回路130から受信したデータ、アドレス、ライトコマンドを、MWQ96を介してデコーダ120に出力する。デコーダ120は、MWQ96から受信したデータ等をデコードし、データをデータ送受信部118に、アドレス及びライトコマンドをコマンド発行部132に出力する。
      
 コマンド発行部132は、デコーダ120から出力されたライトコマンド及びアドレスをメモリ108に出力する。また、データ送受信部118は、デコーダ120から出力されたデータをメモリ108に出力する。
      
 メモリ108は、デコーダ120から出力されたライトコマンドを受信すると、データ送受信部118から出力されたデータをデコーダ120から出力されたアドレスに書き込む。メモリコントローラ106Bにおいても同様の処理が行われる。スクラブライト動作は完了する。この動作によりエラーを生じたデータが修正される。
      
 続いて、メモリシステムの縮退運転時について説明する。本実施形態では、図3に示すデータクロスバ112Bが故障した場合について説明する。ここでは、メモリリード時について説明する。
      
 図3に示すデータクロスバ112Bが故障した場合、スクラブコントロールマスタ回路130には、信号線1111Bから信号が入力しないため、メモリ108Aから読み出されたデータは、直接DXOQ99Aには送出されず、一度セレクタ126、セレクタ128を経由して、スクラブコントロールマスタ回路130に送出される。ここで、スクラブコントロールマスタ回路130に、信号線1111Bから信号が入力しない場合、MRQ95Bからセレクタ89Bのパス選択が無効化される。
      
 スクラブコントロールマスタ回路130は、メモリコントローラ106Aのセレクタ89A及びメモリコントローラ106Bのセレクタ89Bにデータのブロードキャストを行う。そして、メモリコントローラ106Aのセレクタ89Aから、信号線1121Bを介して他のシステムボードにデータが出力される。なお、ここで、メモリコントローラ106Bにおいて、データがDXOQ99Bに送出されないのは、信号線1111Bからの信号入力がないため、セレクタ89BがDXOQ99Bのパスを選択しないためである。
      
 また、他のシステムボードから出力されるライトデータは、故障していないデータクロスバ112Aを通して、信号線1121A、DXIQ98A、セレクタ126、セレクタ128を介してスクラブコントロールマスタ回路130に入力する。
      
 ここで、図3を用いてデータクロスバの故障の検出について説明する。なお、図1及び図2を用いて説明したものについては同一番号を付し、その説明を省略する。
      
 データクロスバ112Aは、訂正不可能エラー検出部1091A及び訂正不可能エラー検出部1091Bを有する。データクロスバ112Bは、訂正不可能エラー検出部1092A及び訂正不可能エラー検出部1092Bを有する。訂正不可能エラー検出部1091Aは、ECCを用いて、信号線1121Aを流れるデータに訂正不可能なエラーが存在するか否かを検出する。訂正不可能なエラーがデータに存在しない場合、訂正不可能エラー検出部1091Aは、アライブ信号を信号線1111Aを介して、メモリコントローラ106Aのセレクタ88A及びシステムコントローラ104内のスクラブコントロールマスタ回路130に入力する。アライブ信号とは、データクロスバ112Aが正常に稼働していることをシステムボード100Aに通知するための信号である。一方、訂正不可能なエラーがデータに存在する場合、訂正不可能エラー検出部1091Aは、信号線1111Aを介してアライブ信号を出力しない。メモリコントローラ106Aのセレクタ88A及びスクラブコントロールマスタ回路130は、訂正不可能エラー検出部1091Aからアライブ信号の入力があるか否かに応じてパスを切り換えることができる。
      
 同様に、訂正不可能エラー検出部1092Aは、ECCを用いて、信号線1122Aを流れるデータに訂正不可能なエラーが存在するか否かを検出する。訂正不可能なエラーがデータに存在しない場合、訂正不可能エラー検出部1092Aは、アライブ信号を信号線1111Bを介して、メモリコントローラ106Bのセレクタ88B及びスクラブコントロールマスタ回路130に入力する。一方、訂正不可能なエラーが存在する場合、訂正不可能エラー検出部1092Aは、アライブ信号を信号線1111Bを介して、セレクタ88B及びスクラブコントロールマスタ回路130に入力しない。メモリコントローラ106Bのセレクタ88B及びスクラブコントロールマスタ回路130は、訂正不可能エラー検出部109Bからアライブ信号の入力があるか否かに応じてパスを切り換えることができる。
      
 訂正不可能エラー検出部1091Bも信号線1121Bを流れるデータに訂正不可能なエラーが存在するか否かを検出し、アライブ信号を信号線1112Aを介して入力するか否かを決定する。訂正不可能エラー検出部1092Bも信号線1122Bを流れるデータに訂正不可能なエラーが存在するか否かを検出し、アライブ信号を信号線1112Bを介して入力するか否かを決定する。
      
 再び、図2を用いてまずは、データ書き込み時について説明する。ここでは、メモリコントローラ106Bに接続されたデータクロスバが故障している状況について説明する。DXIQ98Aは他のシステムボードから信号線1121Aを介して受信したデータを格納する。DXIQ98Aは格納したデータをセレクタ126に出力する。なお、ここで説明している各要素は、106A側の要素である。セレクタ126は、DXIQ98Aが出力したデータをセレクタ128に出力する。セレクタ128は、セレクタ126が出力したデータをスクラブコントロールマスタ回路130に出力する。メモリコントローラ106Bは他システムボードからデータを受信しないので、セレクタ128にはセレクタ127を介してデータは入力しない。
      
 スクラブコントロールマスタ回路130は、セレクタ128が出力したデータをメモリコントローラ106Aのセレクタ88A及びメモリコントローラ106Bのセレクタ88Bに出力する。また、セレクタ125は、他のシステムボードからアドレスクロスバ110Aまたは110Bを介して受信したライトコマンド及びアドレスを、メモリコントローラ106Aのセレクタ88A及びメモリコントローラ106Bのセレクタ88Bに出力する。メモリコントローラ106A、メモリコントローラ106Bも同様の処理を行うので、本実施形態ではメモリコントローラ106Aの処理について説明し、メモリコントローラ106Bの処理の説明は省略する。
      
 セレクタ88Aは、スクラブコントロールマスタ回路130から受信したデータ及びセレクタ125から受信したライトコマンド及びアドレスをMWQ96Aに出力する。MWQ96Aは、セレクタ88Aが出力したデータ、ライトコマンド及びアドレスをデコーダ120Aに出力する。
      
 デコーダ120Aは、MWQ96Aが出力したデータ、ライトコマンド及びアドレスをデコードする。デコーダ120Aは、ライトコマンド及び当該アドレスをコマンド発行部132Aに出力する。デコーダ120Aは、データをデータ送受信部118Aに出力する。
      
 コマンド発行部132Aは、デコーダ120Aから出力されたライトコマンド及びアドレスをメモリ108Aに出力する。データ送受信部118Aは、デコーダ120Aから出力されたデータをメモリ108Aに出力する。
      
 メモリ108Aは、デコーダ120Aから出力されたライトコマンドを受信すると、デコーダ120Aから出力されたアドレスにデータ送受信部118Aから出力されたデータを書き込む。システムボード104により、一方のデータクロスバのみから受信したデータを双方のメモリ108に書き込むことができ、これによって二重化が可能になる。
      
 続いて、データ読み出し時について説明する。ここでは、メモリコントローラ106Bに接続されたデータクロスバ112Bが故障している状況について説明する。データ読み出し時には、アドレスクロスバ110を介した他システムボードからのアドレス及びリードコマンド、もしくは、CPU102からのアドレス及びリードコマンドがセクレタ125等を介して、各メモリコントローラのデコーダ120に入力する。
      
 各デコーダ120は、リードコマンド及びアドレスをコマンド発行部132に出力する。各コマンド発行部132は、デコーダ120から出力されたリードコマンド及びアドレスをメモリ108に出力する。
      
 各メモリ108は、デコーダ120から出力されたリードコマンドを受信すると、デコーダ120から出力されたアドレスに格納されているデータをデータ送受信部118に出力する。
      
 各データ送受信部118は、メモリ108から出力されたデータを受信する。データ送受信部118は、メモリ108から出力されたデータをMRQ95に出力する。メモリコントローラ106AのMRQ95Aは、データ送受信部118が出力したデータをセレクタ126に出力する。メモリコントローラ106BのMRQ95Bも、同様にデータをセレクタ127に出力する。
      
 セレクタ126はMRQ95Aが出力したデータをセレクタ128に出力する。セレクタ127も同様にメモリコントローラ106BのMRQ95Bが出力したデータをセレクタ128に出力する。
      
 セレクタ128は、ECCを用いて、セレクタ126及びセレクタ127が出力したデータのエラー検出を行う。セレクタ128は、エラーが検出されなかったデータを選択して、CPU102に出力する。
      
 CPU102は、セレクタ128が出力したデータを受信する。CPU102は、当該データを他のシステムコントローラに出力する場合、当該データをメモリコントローラ106Aのセレクタ89Aにセレクタ125を介して出力する。セレクタ89AはCPU102が出力したデータをDXOQ99Aに出力する。DXOQ99Aはセレクタ89Aが出力したデータを格納する。DXOQ99Aは、格納したデータを信号線1121Bを介して他のシステムボードに出力する。
      
 図4を用いて、システムコントローラ104の処理について説明する。ステップS101において、システムコントローラ104は、信号線1111A及び信号線1111Bからアライブ信号を受信しているか否かを判定する。信号線1111A及び信号線1111Bからアライブ信号を受信している場合、処理はステップS102へ移行する。一方、信号線1111A及び信号線1111Bのいずれか一方からアライブ信号を受信していない場合、処理はステップS103へ移行する。
      
 ステップS102において、システムコントローラ104は、信号線1111A及び信号線1111Bのいずれか一方の信号線からアライブ信号を受信しているか否かを判定する。信号線1111A及び信号線1111Bのいずれか一方の信号線からアライブ信号を受信している場合、処理はステップS104へ移行する。一方、信号線1111A及び信号線1111Bのいずれか一方の信号線からもアライブ信号を受信していない場合、処理はステップS105へ移行し、システムコントローラ104は、システムはダウンしていると判定する。処理は終了する。
      
 ステップS104において、システムコントローラ104は、他のシステムボードからアドレスクロスバ110を介してメモリリードアクセスを受信したか否かを判定する。システムコントローラ104が、他のシステムボードからメモリリードアクセスを受信した場合、処理はステップS106へ移行する。一方、システムコントローラ104が、他のシステムボードからメモリリードアクセスを受信していない場合、処理はステップS103へ移行する。
      
 ステップS106において、システムコントローラ104は、受信したリードコマンドを二重化されたメモリコントローラそれぞれにブロードキャストする。処理はステップS103へ移行する。
      
 ステップS103において、システムコントローラ104は、スクラブコントロールスレーブ回路122からスクラブライト要求の通知があるか否かを判定する。スクラブコントロールスレーブ回路122からスクラブライト要求の通知がある場合、処理はステップS107へ移行する。一方、スクラブコントロールスレーブ回路122からスクラブライト要求の通知がない場合、処理は終了する。
      
 ステップS107において、システムコントローラ104は、スクラブライト命令を二重化されたメモリコントローラそれぞれに出力する。処理は終了する。
      
 図5を用いて、メモリコントローラ106Aの処理について説明する。ステップS201において、メモリコントローラ106Aは、データ送受信部118Aがメモリ108Aから読み出したデータをMRQ95Aを介して受信する。処理はステップS202へ移行する。
      
 ステップS202において、メモリコントローラ106AはECCを用いて受信したデータにエラーが存在するか否かを判定する。受信したデータにエラーが存在する場合、処理はステップS203へ移行する。一方、受信したデータにエラーが存在しない場合、処理は終了する。
      
 ステップS203において、メモリコントローラ106Aは、スクラブコントロールマスタ回路130にスクラブ要求を出力する。処理は終了する。
      
 本実施形態の有用性について説明する。例えば、図6に表した情報処理装置を考える。データクロスバ112の一方が故障し、メモリシステムが縮退運転をしている場合、システムボード100Aの一方のメモリコントローラ106及びメモリ108は稼働を停止してしまうため、同一システムボード100A内で二重化されたメモリコントローラ及び二重化されたメモリは互いに同期動作をすることができなくなってしまう。
      
 また、例えば、図7に表した情報処理装置を考える。データクロスバ112の一方が故障し、メモリシステムが縮退運転をしている場合、システムボード100Aの稼働しているメモリコントローラ106がメモリ108から読み出したデータに訂正不可能なエラーが存在する場合、メモリシステムは停止してしまう。
      
 本実施形態によれば、図8に表したように、データクロスバ112の一方が故障し、メモリシステムが縮退運転をしている場合でも、システムボード100Aのシステムコントローラ104が二重化されたメモリ108それぞれからデータを読み出す。ゆえに、読み出したデータのいずれか一方のデータに訂正不可能なエラーが存在した場合であっても、他方のデータが正常なデータであったり、訂正可能なエラーが存在するデータであったりすれば、それらのデータを使うことによって、システムがダウンしてしまうことを防ぐことができる。
      
 本実施形態ではメモリコントローラ106のセレクタ88及びセレクタ89に、Alive Down信号を受け、経路を変更する機能を追加する。データクロスバ112の故障で縮退が発生した場合、メモリコントローラで処理を完了せず、システムコントローラ104のスクラブコントロールマスタ回路130経由で処理を行う。スクラブコントロールマスタ回路130に、メモリコントローラ106からの折り返しのパスを設ける。セレクタ128が、メモリコントローラ106からスクラブコントロールマスタ回路130へのデータ折り返しを行なっている。スクラブコントロールマスタ回路130にメモリアクセス変換機能を追加する。折りかえりパス経由のメモリライトはメモリライト2、折りかえりパス経由のメモリリードはメモリリード2に変換を行う。この変換は、Alive Down信号を受信したときに有効となる。スクラブコントロールマスタ回路130に上記の変換結果のコマンドを発行できるようにする。メモリコントローラ106内のコマンド発行部に、メモリライト2、メモリリード2をデコードする機能を設ける。通常は、データクロスバ経由のメモリアクセスは、メモリコントローラから直接メモリに行われる。データクロスバのみを縮退し、メモリシステムを有効活用しようとした場合、縮退しているデータクロスバ部を、あたかも動作しているように見せかける必要がある。見せかける対象はメモリコントローラである。
    
0 情報処理装置
88A、88B、89A、89B、125、126,127、128 セレクタ
95A、95B メモリリードキュー
96A、96B メモリライトキュー
98A、98B データクロスバインキュー
99A、99B データクロスバアウトキュー
100A、100B システムボード
102 CPU
104 システムコントローラ
106、106A、106B、106C、106D メモリコントローラ
108、108A、108B、108C、108D メモリ
1091A、1091B、1092A、1092B 訂正不可能エラー検出部
110A、110B アドレスクロスバ
1111A、1111B、1112A、1112B、1121A、1121B、1122A、1122B 信号線
112、112A、112B データクロスバ
118、118A、118B データ送受信部
120、120A、120B デコーダ
122、122A、122B スクラブコントロールスレーブ回路
130 スクラブコントロールマスタ回路
132、132A、132B コマンド発行部
    88A、88B、89A、89B、125、126,127、128 セレクタ
95A、95B メモリリードキュー
96A、96B メモリライトキュー
98A、98B データクロスバインキュー
99A、99B データクロスバアウトキュー
100A、100B システムボード
102 CPU
104 システムコントローラ
106、106A、106B、106C、106D メモリコントローラ
108、108A、108B、108C、108D メモリ
1091A、1091B、1092A、1092B 訂正不可能エラー検出部
110A、110B アドレスクロスバ
1111A、1111B、1112A、1112B、1121A、1121B、1122A、1122B 信号線
112、112A、112B データクロスバ
118、118A、118B データ送受信部
120、120A、120B デコーダ
122、122A、122B スクラブコントロールスレーブ回路
130 スクラブコントロールマスタ回路
132、132A、132B コマンド発行部
Claims (6)
-  データクロスバを介して他装置に接続可能であり、データを記憶するメモリシステムであって、
 データを記憶する第1メモリと、
 前記第1メモリと二重化され、データを記憶する第2メモリと、
 該第1メモリに対してデータの書き込み又は読み出しを行い、他装置に第1データクロスバを介して接続し、該第1メモリの書き込み又は読み出しを行うデータを該他装置に対して送受信する第1メモリコントローラと、
 該第2メモリに対してデータの書き込み又は読み出しを行い、該他装置に第2データクロスバを介して接続し、該第2メモリの書き込み又は読み出しを行うデータを該他装置に対して送受信する第2メモリコントローラと、
 該第1データクロスバ及び該第2データクロスバを介したデータ送受信を検出し、該第1データクロスバ又は該第2データクロスバのいずれか一方のデータクロスバを介してデータの送受信ができないことを検出した場合、該第1メモリ及び該第2メモリから該他装置からの読み出し依頼対象のデータを読み出しを前記第1のメモリコントローラおよび前記第2のメモリコントローラに指示し、該第1のメモリコントローラ及び前記第2のメモリコントローラが読み出したデータの誤り検出を行い、誤りが検出されなかったデータ又は誤り訂正を行ったデータを出力するシステムコントローラと、
 を有することを特徴とするメモリシステム。
-  該メモリシステムは、さらに、データを処理する処理部を有し、該システムコントローラは、該誤りが検出されなかったデータ又は該誤り訂正を行ったデータを該処理部に出力することを特徴とする請求項1記載のメモリシステム。
-  該処理部は、該システムコントローラが出力したデータをデータ送信可能なデータクロスバを介して該他装置に送信することを特徴とする請求項2記載のメモリシステム。
-  データクロスバを介して他装置に接続可能であり、データを記憶するメモリシステムの制御方法であって、
 該他装置に第1データクロスバを介して接続し、第1メモリに対してデータの書き込み又は読み出しを行う第1メモリコントローラが、該第1メモリの書き込み又は読み出しを行うデータを送受信し、
 該他装置に第2データクロスバを介して接続し、第2メモリに対してデータの書き込み又は読み出しを行う第2メモリコントローラが、該第2メモリの書き込み又は読み出しを行うデータを送受信し、
 該第1メモリコントローラ及び該第2メモリコントローラに接続するシステムコントローラが、該第1データクロスバ及び該第2データクロスバのデータ送受信を検出し、該第1データクロスバ又は該第2データクロスバのいずれか一方のデータクロスバでデータの送受信ができないことを検出した場合、該第1メモリ及び該第2メモリから該他装置からの読み出し依頼対象のデータを読み出し、該読み出したデータの誤り検出を行い、誤りが検出されなかったデータ又は誤り訂正を行ったデータを出力することを特徴とするメモリシステムの制御方法。
-  該メモリシステムは、さらに、データを処理する処理部を有し、該システムコントローラは、該誤りが検出されなかったデータ又は該誤り訂正を行ったデータを該処理部に出力することを特徴とする請求項4記載のメモリシステムの制御方法。
-  該処理部は、該システムコントローラが出力したデータをデータ送信可能なデータクロスバを介して該他装置に送信することを特徴とする請求項5記載のメモリシステムの制御方法。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| EP09849758.9A EP2482194B1 (en) | 2009-09-25 | 2009-09-25 | Memory system and memory system control method | 
| JP2011532809A JP5348248B2 (ja) | 2009-09-25 | 2009-09-25 | メモリシステム及びメモリシステムの制御方法 | 
| PCT/JP2009/004886 WO2011036727A1 (ja) | 2009-09-25 | 2009-09-25 | メモリシステム及びメモリシステムの制御方法 | 
| US13/418,432 US8667228B2 (en) | 2009-09-25 | 2012-03-13 | Memory system and method for controlling memory system | 
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| PCT/JP2009/004886 WO2011036727A1 (ja) | 2009-09-25 | 2009-09-25 | メモリシステム及びメモリシステムの制御方法 | 
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| US13/418,432 Continuation US8667228B2 (en) | 2009-09-25 | 2012-03-13 | Memory system and method for controlling memory system | 
Publications (1)
| Publication Number | Publication Date | 
|---|---|
| WO2011036727A1 true WO2011036727A1 (ja) | 2011-03-31 | 
Family
ID=43795500
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| PCT/JP2009/004886 WO2011036727A1 (ja) | 2009-09-25 | 2009-09-25 | メモリシステム及びメモリシステムの制御方法 | 
Country Status (4)
| Country | Link | 
|---|---|
| US (1) | US8667228B2 (ja) | 
| EP (1) | EP2482194B1 (ja) | 
| JP (1) | JP5348248B2 (ja) | 
| WO (1) | WO2011036727A1 (ja) | 
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US8973125B2 (en) | 2010-05-28 | 2015-03-03 | Alcatel Lucent | Application layer authentication in packet networks | 
Families Citing this family (38)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US8751755B2 (en) | 2007-12-27 | 2014-06-10 | Sandisk Enterprise Ip Llc | Mass storage controller volatile memory containing metadata related to flash memory storage | 
| US9699263B1 (en) | 2012-08-17 | 2017-07-04 | Sandisk Technologies Llc. | Automatic read and write acceleration of data accessed by virtual machines | 
| US9501398B2 (en) | 2012-12-26 | 2016-11-22 | Sandisk Technologies Llc | Persistent storage device with NVRAM for staging writes | 
| US9612948B2 (en) | 2012-12-27 | 2017-04-04 | Sandisk Technologies Llc | Reads and writes between a contiguous data block and noncontiguous sets of logical address blocks in a persistent storage device | 
| US9454420B1 (en) | 2012-12-31 | 2016-09-27 | Sandisk Technologies Llc | Method and system of reading threshold voltage equalization | 
| US9870830B1 (en) | 2013-03-14 | 2018-01-16 | Sandisk Technologies Llc | Optimal multilevel sensing for reading data from a storage medium | 
| US9367246B2 (en) | 2013-03-15 | 2016-06-14 | Sandisk Technologies Inc. | Performance optimization of data transfer for soft information generation | 
| US9524235B1 (en) | 2013-07-25 | 2016-12-20 | Sandisk Technologies Llc | Local hash value generation in non-volatile data storage systems | 
| US9384126B1 (en) | 2013-07-25 | 2016-07-05 | Sandisk Technologies Inc. | Methods and systems to avoid false negative results in bloom filters implemented in non-volatile data storage systems | 
| US9639463B1 (en) | 2013-08-26 | 2017-05-02 | Sandisk Technologies Llc | Heuristic aware garbage collection scheme in storage systems | 
| US9361221B1 (en) | 2013-08-26 | 2016-06-07 | Sandisk Technologies Inc. | Write amplification reduction through reliable writes during garbage collection | 
| US9442662B2 (en) | 2013-10-18 | 2016-09-13 | Sandisk Technologies Llc | Device and method for managing die groups | 
| US9298608B2 (en) | 2013-10-18 | 2016-03-29 | Sandisk Enterprise Ip Llc | Biasing for wear leveling in storage systems | 
| US9436831B2 (en) | 2013-10-30 | 2016-09-06 | Sandisk Technologies Llc | Secure erase in a memory device | 
| US9703816B2 (en) | 2013-11-19 | 2017-07-11 | Sandisk Technologies Llc | Method and system for forward reference logging in a persistent datastore | 
| US9520197B2 (en) | 2013-11-22 | 2016-12-13 | Sandisk Technologies Llc | Adaptive erase of a storage device | 
| US9520162B2 (en) | 2013-11-27 | 2016-12-13 | Sandisk Technologies Llc | DIMM device controller supervisor | 
| US9582058B2 (en) | 2013-11-29 | 2017-02-28 | Sandisk Technologies Llc | Power inrush management of storage devices | 
| US9703636B2 (en) * | 2014-03-01 | 2017-07-11 | Sandisk Technologies Llc | Firmware reversion trigger and control | 
| US9454448B2 (en) | 2014-03-19 | 2016-09-27 | Sandisk Technologies Llc | Fault testing in storage devices | 
| US9448876B2 (en) | 2014-03-19 | 2016-09-20 | Sandisk Technologies Llc | Fault detection and prediction in storage devices | 
| US9390814B2 (en) | 2014-03-19 | 2016-07-12 | Sandisk Technologies Llc | Fault detection and prediction for data storage elements | 
| US9626399B2 (en) | 2014-03-31 | 2017-04-18 | Sandisk Technologies Llc | Conditional updates for reducing frequency of data modification operations | 
| US9626400B2 (en) | 2014-03-31 | 2017-04-18 | Sandisk Technologies Llc | Compaction of information in tiered data structure | 
| US9390021B2 (en) | 2014-03-31 | 2016-07-12 | Sandisk Technologies Llc | Efficient cache utilization in a tiered data structure | 
| US9697267B2 (en) | 2014-04-03 | 2017-07-04 | Sandisk Technologies Llc | Methods and systems for performing efficient snapshots in tiered data structures | 
| US9558143B2 (en) | 2014-05-09 | 2017-01-31 | Micron Technology, Inc. | Interconnect systems and methods using hybrid memory cube links to send packetized data over different endpoints of a data handling device | 
| US10656840B2 (en) | 2014-05-30 | 2020-05-19 | Sandisk Technologies Llc | Real-time I/O pattern recognition to enhance performance and endurance of a storage device | 
| US10656842B2 (en) | 2014-05-30 | 2020-05-19 | Sandisk Technologies Llc | Using history of I/O sizes and I/O sequences to trigger coalesced writes in a non-volatile storage device | 
| US10146448B2 (en) | 2014-05-30 | 2018-12-04 | Sandisk Technologies Llc | Using history of I/O sequences to trigger cached read ahead in a non-volatile storage device | 
| US10114557B2 (en) | 2014-05-30 | 2018-10-30 | Sandisk Technologies Llc | Identification of hot regions to enhance performance and endurance of a non-volatile storage device | 
| US10372613B2 (en) | 2014-05-30 | 2019-08-06 | Sandisk Technologies Llc | Using sub-region I/O history to cache repeatedly accessed sub-regions in a non-volatile storage device | 
| US10162748B2 (en) | 2014-05-30 | 2018-12-25 | Sandisk Technologies Llc | Prioritizing garbage collection and block allocation based on I/O history for logical address regions | 
| US9703491B2 (en) | 2014-05-30 | 2017-07-11 | Sandisk Technologies Llc | Using history of unaligned writes to cache data and avoid read-modify-writes in a non-volatile storage device | 
| US9652381B2 (en) | 2014-06-19 | 2017-05-16 | Sandisk Technologies Llc | Sub-block garbage collection | 
| US9443601B2 (en) | 2014-09-08 | 2016-09-13 | Sandisk Technologies Llc | Holdup capacitor energy harvesting | 
| KR102435181B1 (ko) | 2015-11-16 | 2022-08-23 | 삼성전자주식회사 | 반도체 메모리 장치, 이를 포함하는 메모리 시스템 및 메모리 시스템의 동작 방법 | 
| KR102410022B1 (ko) * | 2017-11-24 | 2022-06-21 | 에스케이하이닉스 주식회사 | 에러스크럽방법 및 이를 이용한 반도체모듈 | 
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JPH0816484A (ja) * | 1994-06-27 | 1996-01-19 | Mitsubishi Electric Corp | 二重化メモリシステム | 
| JPH096737A (ja) | 1995-06-21 | 1997-01-10 | Hitachi Ltd | 並列計算機およびその多段結合網 | 
| JP2006039897A (ja) | 2004-07-27 | 2006-02-09 | Nec Corp | マルチノードシステム、ノード間クロスバスイッチ、ノード、スイッチプログラム及びノードプログラム | 
| JP2008046996A (ja) | 2006-08-18 | 2008-02-28 | Fujitsu Ltd | データ処理装置、モード管理装置、及びモード管理方法 | 
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US4438494A (en) * | 1981-08-25 | 1984-03-20 | Intel Corporation | Apparatus of fault-handling in a multiprocessing system | 
| US6370605B1 (en) * | 1999-03-04 | 2002-04-09 | Sun Microsystems, Inc. | Switch based scalable performance storage architecture | 
| JP2001256203A (ja) * | 2000-03-09 | 2001-09-21 | Nec Corp | 冗長構成クロスバスイッチシステム | 
| DE60119224T2 (de) * | 2000-06-19 | 2007-02-22 | Broadcom Corp., Irvine | Speicherverwaltungseinheit für eine Vermittlungsstelle | 
| US6684292B2 (en) * | 2001-09-28 | 2004-01-27 | Hewlett-Packard Development Company, L.P. | Memory module resync | 
| US7707351B2 (en) * | 2002-10-31 | 2010-04-27 | Ring Technology Enterprises Of Texas, Llc | Methods and systems for an identifier-based memory section | 
| JP4918824B2 (ja) * | 2006-08-18 | 2012-04-18 | 富士通株式会社 | メモリコントローラおよびメモリ制御方法 | 
- 
        2009
        - 2009-09-25 JP JP2011532809A patent/JP5348248B2/ja not_active Expired - Fee Related
- 2009-09-25 EP EP09849758.9A patent/EP2482194B1/en not_active Not-in-force
- 2009-09-25 WO PCT/JP2009/004886 patent/WO2011036727A1/ja active Application Filing
 
- 
        2012
        - 2012-03-13 US US13/418,432 patent/US8667228B2/en not_active Expired - Fee Related
 
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JPH0816484A (ja) * | 1994-06-27 | 1996-01-19 | Mitsubishi Electric Corp | 二重化メモリシステム | 
| JPH096737A (ja) | 1995-06-21 | 1997-01-10 | Hitachi Ltd | 並列計算機およびその多段結合網 | 
| JP2006039897A (ja) | 2004-07-27 | 2006-02-09 | Nec Corp | マルチノードシステム、ノード間クロスバスイッチ、ノード、スイッチプログラム及びノードプログラム | 
| JP2008046996A (ja) | 2006-08-18 | 2008-02-28 | Fujitsu Ltd | データ処理装置、モード管理装置、及びモード管理方法 | 
Non-Patent Citations (1)
| Title | 
|---|
| See also references of EP2482194A4 | 
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US8973125B2 (en) | 2010-05-28 | 2015-03-03 | Alcatel Lucent | Application layer authentication in packet networks | 
Also Published As
| Publication number | Publication date | 
|---|---|
| US8667228B2 (en) | 2014-03-04 | 
| EP2482194A4 (en) | 2013-01-02 | 
| JPWO2011036727A1 (ja) | 2013-02-14 | 
| EP2482194A1 (en) | 2012-08-01 | 
| EP2482194B1 (en) | 2013-12-25 | 
| US20120173826A1 (en) | 2012-07-05 | 
| JP5348248B2 (ja) | 2013-11-20 | 
Similar Documents
| Publication | Publication Date | Title | 
|---|---|---|
| JP5348248B2 (ja) | メモリシステム及びメモリシステムの制御方法 | |
| EP1984822B1 (en) | Memory transaction replay mechanism | |
| US20110043323A1 (en) | Fault monitoring circuit, semiconductor integrated circuit, and faulty part locating method | |
| JPH03182957A (ja) | 読み出しおよび書き込み用プロトコール | |
| US7624324B2 (en) | File control system and file control device | |
| JP4755050B2 (ja) | データ処理装置、モード管理装置、及びモード管理方法 | |
| US7328368B2 (en) | Dynamic interconnect width reduction to improve interconnect availability | |
| JP2006260139A (ja) | エラー検出訂正装置の制御方法、エラー検出訂正装置、情報処理システム、エラー検出訂正装置の制御プログラム、データ処理装置 | |
| JP3434735B2 (ja) | 情報処理システム及びそれに用いる障害処理方式 | |
| JP5145860B2 (ja) | メモリ二重化システム及び情報処理装置 | |
| JP6394727B1 (ja) | 制御装置、制御方法、及び、フォールトトレラント装置 | |
| JP4399792B2 (ja) | 二重化プロセッサシステム | |
| JPH0238969B2 (ja) | ||
| WO2008062511A1 (en) | Multiprocessor system | |
| JP2007164722A (ja) | Cpu二重化用ベースユニットおよびcpu二重化システム | |
| JP2007323190A (ja) | データ通信を行う計算制御システム及びその通信方法 | |
| US20090210610A1 (en) | Computer system, data relay device and control method for computer system | |
| JPH03127248A (ja) | 複合計算機システム | |
| JP5076348B2 (ja) | 共有メモリのアクセス方式 | |
| JP2010010897A (ja) | 多重化装置同期化処理装置及び多重化装置同期化処理方法 | |
| JPH0844636A (ja) | バスインタフェース装置及び同バスインタフェース装置を複数備えた情報処理システム | |
| JPH0486933A (ja) | データ転送制御回路 | |
| JPS59157759A (ja) | 二重化システム | |
| JPH04280352A (ja) | 並列計算機 | |
| JPH0367348A (ja) | 受信データメモリの面切換え制御方式 | 
Legal Events
| Date | Code | Title | Description | 
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application | Ref document number: 09849758 Country of ref document: EP Kind code of ref document: A1 | |
| WWE | Wipo information: entry into national phase | Ref document number: 2009849758 Country of ref document: EP | |
| NENP | Non-entry into the national phase | Ref country code: DE | |
| WWE | Wipo information: entry into national phase | Ref document number: 2011532809 Country of ref document: JP | 
 
        
         
        
         
        
         
        
         
        
         
        
         
        
        