WO2003075166A1 - Systeme de stockage et procede de transfert de donnees dans ledit systeme - Google Patents

Systeme de stockage et procede de transfert de donnees dans ledit systeme Download PDF

Info

Publication number
WO2003075166A1
WO2003075166A1 PCT/JP2002/002063 JP0202063W WO03075166A1 WO 2003075166 A1 WO2003075166 A1 WO 2003075166A1 JP 0202063 W JP0202063 W JP 0202063W WO 03075166 A1 WO03075166 A1 WO 03075166A1
Authority
WO
WIPO (PCT)
Prior art keywords
cache
data transfer
message
data
control device
Prior art date
Application number
PCT/JP2002/002063
Other languages
English (en)
French (fr)
Inventor
Kazuichi Oe
Takashi Watanabe
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to PCT/JP2002/002063 priority Critical patent/WO2003075166A1/ja
Priority to JP2003573537A priority patent/JP4235712B2/ja
Priority to EP02758854A priority patent/EP1498809B1/en
Priority to PCT/JP2002/008359 priority patent/WO2003075147A1/ja
Publication of WO2003075166A1 publication Critical patent/WO2003075166A1/ja
Priority to US10/932,059 priority patent/US20050038850A1/en
Priority to GBGB0420351.9A priority patent/GB0420351D0/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0658Controller construction arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Definitions

  • the present invention relates to a storage system and a data transfer method in the storage system, and particularly to an external input / output of a disk device or the like from a node device such as a personal computer (PC) or a workstation (WS: Work Station).
  • a node device such as a personal computer (PC) or a workstation (WS: Work Station).
  • PC personal computer
  • WS workstation
  • Fig. 15 shows an example of an existing storage system.
  • this system is connected to a node device 100 such as a PC (hereinafter, simply referred to as “node 100”) via an SCS I (Small Computer System Interface) bus 300.
  • a node device 100 such as a PC (hereinafter, simply referred to as “node 100”) via an SCS I (Small Computer System Interface) bus 300.
  • IZ ⁇ input / output
  • the node 100 is equipped with a CPU 101, a main memory (main memory) 102, an SCS I card 103, and the like.
  • the disk drive 200 includes a disk controller 201, a buffer 202, and a disk device 203.
  • a plurality of IZO devices 200 may be connected to the SCS I bus 300 in some cases.
  • another interface such as a fiber channel (FC) may be used to connect the node 100 (main memory 102) and the IZO device 200.
  • FC fiber channel
  • the I / O is performed from the node 100 using the SCS I protocol. It is necessary to start the disk controller 201 of the O device 200.
  • the file system 105 writes data to the disk device 203, conventionally, the following procedure is executed. That is, first, as shown in FIGS. 15 and 16, the file system 105 on the node 100 side requests a disk write request to the SCS I driver 106 (step Al). Both the file system 105 and the SCS I dryno 106 are usually incorporated as one function such as an operating system (OS), and the CPU 101 stores the file system data stored in the main memory 102. Each function is realized by reading and operating the driver data.
  • OS operating system
  • the SCS I dryno 106 that has received the above-described disk write request executes negotiations several times with the disk controller 201 of the target one-node device 200 to determine the data transfer rate on the SCS I bus 300, etc. Thus, after the connection is set (step A2), the data transfer is actually started and the disk controller 201 is requested to write the data (step A3).
  • the SCS I driver 106 temporarily releases the connection with the disk controller 201 when it takes time to write data to the disk device 203 in the I / O device 200.
  • the disk controller 201 In the I / O device 200, the disk controller 201 temporarily stores the data received from the node 100 via the SCS I bus 300 in the buffer 202 (step A4), and then writes the data to the disk device 203 (step A5).
  • the disk controller 201 issues an interrupt to the SCSI driver 106 and reports that the transfer (writing) is completed. Then, the SCS I driver 106 notifies the file system 105 of the completion of the transfer (step A9).
  • the disk controller 201 of the IZO device 200 needs to be started from the node 100 using a protocol such as SCS I or FC, and data transfer actually occurs. Is also complicated (it is necessary to negotiate several times between the node 100 and the disk controller 201), so that there is a problem that the latency is large.
  • both the SCS I and FC have been improved (up to 16 OMB / s).
  • the network (IB) is introduced as an internal network, it is possible to increase the transfer speed of the internal bus 104 at the node 100 to several gigabits / second (GB / s).
  • existing interface standards such as SCSI and FC currently have high latencies as described above, so their performance cannot be fully utilized.
  • the present invention has been made in view of such problems, and aims to reduce latency by decentralizing data transfer operations, and to fully utilize the performance of an IB network when a data transfer bandwidth (IB) is introduced. It is an object of the present invention to provide a storage system and a data transfer method in the storage system, which can secure the data rate. Disclosure of the invention
  • a storage system includes a storage device that stores data, a cache device that can cache data stored in the storage device, at least: A control device that controls access to the storage device and the cache device; and an internal network that connects the storage device, the cache device, and the control device so that they can communicate with each other.
  • a transfer instruction issuing means for issuing a data transfer instruction to the cache device or the storage device is provided.
  • the storage device or the cache device directly performs a conversation necessary for data transfer with the client device in accordance with the data transfer instruction from the control device, and directly executes data transfer with the client device. It is characterized by having direct transfer means to perform the transfer.
  • the client device issues an access request to the control device via the internal network (access request issuing step), and when the control device receives this access request, Then, the control device issues a data transfer instruction to the above-described cache device or storage device (a transfer instruction issuance). Then, the cache device or the storage device directly performs a conversation necessary for data transfer with the client device in accordance with the data transfer instruction from the control device, and directly transfers the data to and from the client device. Perform (direct transfer step). As a result, the latency of the storage system can be reduced, and the data throughput can be significantly improved.
  • control device generates a message for a conversation between the client device and the cache device or the storage device, transmits the message to the cache device together with the data transfer instruction, and outputs the message to the cache device or the storage device.
  • control device transmits message information necessary for generating a message for a conversation between the client device and the cache device or the storage device together with the data transfer instruction to the cache device or the storage device, and the cache device.
  • the above message may be generated in the storage or storage device based on the message information.
  • a confirmation message is issued from the cache device or the storage device to the control device via the internal network, and the control device transmits the confirmation message to the cache device or the storage device.
  • a response message indicating the completion of data transfer may be issued to the client device via the internal network by receiving a confirmation message from.
  • the control device When there are two or more cache devices, the control device generates a message necessary for a conversation between the client device and each of the above cache devices, and executes the above-mentioned data processing. -Send to each cache device together with the evening transfer instruction, and each cache device executes data transfer to and from the client device using the message generated by this control device. Either may send a response message indicating the completion of data transfer to the client device via the internal network. In this way, all cache devices do not need to transmit response messages to the client device, so that the number of messages exchanged via the internal network can be greatly reduced.
  • each cache device transmits a response message indicating the completion of data transfer to the client device via the internal network, and the client device receives the response message from each of these cache devices.
  • the data transfer can be completed.
  • the control device If there are two or more cache devices, the control device generates a message necessary for a conversation between the client device and one of the cache devices and sends the message to the cache device together with the data transfer instruction.
  • the destination cache device information is transmitted to the cache device, and the cache device performs data transfer with the client device using the message received from the control device.
  • the cache device that has received the data by transfer may copy the received data to another cache device specified by the above-mentioned data copy destination cache device information received from the control device. .
  • control device instructs one of the cache devices which caches the same data to transfer the data to the storage device, and the cache device receiving the instruction transmits the data to the internal network.
  • the data may be transferred to the storage device via the storage device, and the data which has been redundantly held with another cache device may be deleted to release its own memory area. In this way, the storage capacity of the cache device can be effectively used, and the storage capacity required for the cache device can be reduced.
  • FIG. 1 is a block diagram showing a configuration of a storage system as one embodiment of the present invention.
  • FIG. 2 is a functional block diagram showing a configuration of a main part of the control device shown in FIG.
  • FIG. 3 is a block diagram showing a configuration of a main part of the cache device shown in FIG.
  • FIG. 4 is a block diagram showing a configuration of a main part of the storage device shown in FIG.
  • FIG. 5 is a diagram for explaining the operation of the storage system shown in FIG. 1 (when the transfer target data exists in the cache device).
  • FIG. 6 is a diagram for explaining the operation of the storage system shown in FIG. 1 (when transfer target data exists in the storage device).
  • FIG. 7 is a diagram for explaining a first modification of the operation of the storage system shown in FIG.
  • FIG. 8 is a diagram for explaining a second modification of the operation of the storage system shown in FIG.
  • FIG. 9 is a view for explaining a third modification of the operation of the storage system shown in FIG.
  • FIG. 10 is a diagram for explaining a fourth modification of the operation of the storage system shown in FIG.
  • FIGS. 11 and 12 are diagrams for explaining Modification Example 5 of the operation of the storage system shown in FIG.
  • FIG. 13 is a view for explaining a modification 6 of the operation of the storage system shown in FIG.
  • FIG. 14 is a diagram for explaining a modification 7 of the operation of the storage system shown in FIG.
  • FIG. 15 is a diagram showing an example of an existing storage system.
  • FIG. 16 is a sequence diagram for explaining data transfer processing in the storage system shown in FIG. BEST MODE FOR CARRYING OUT THE INVENTION
  • FIG. 1 is a block diagram showing the configuration of a storage system according to an embodiment of the present invention.
  • the storage system 1 shown in FIG. 1 includes a control device (Control Machine) 2, a storage device 3, and a cache device 4. These devices 2, 3, and 4 are communicably connected to each other via an Infiniband (IB) network (IB switch) 5 as an internal network.
  • IB Infiniband
  • the control device 2 and the cache device 4 are configured as, for example, a network card for an IB network 5. Further, a LAN (Local Area Network) 6 constructed by one or more client devices (nodes) 7 is connected to the IB switch 5, and the client device 7 (hereinafter simply referred to as “LAN”) is connected via the LAN 6. Client 7) can access this system 1.
  • LAN Local Area Network
  • the storage device 3 includes, for example, a disk device (or a tape device) 31 for storing required data such as a file and the like, and this disk device. It has an interface card (network card) 32 that controls access to 31.
  • the interface card 32 also has a target channel adapter (TCA) that functions as an IB network controller. It has a Target Channel Adapter 33, a Protocol Transition Unit 34, and a SCSI interface 35 that functions as a disk controller.
  • TCA target channel adapter
  • TCA Target Channel Adapter
  • SCSI interface 35 SCSI interface 35 that functions as a disk controller.
  • the interface card 32 is provided as necessary according to the number of disk devices 31 to be mounted.
  • the protocol converter 34 interprets the message sent from the control device 2 via the IB network 5 and connects to the disk device 31 to be accessed according to the message content.
  • the protocol converter 34 interprets the message sent from the control device 2 via the IB network 5 and connects to the disk device 31 to be accessed according to the message content.
  • the IB network 5 By accessing the corresponding disk device 31 through the SCSI interface 35, and by sending the access result to the client 7 by RD MA (Remote Direct Memory Access) and returning a reply message (Reply Message), the IB network 5
  • RD MA Remote Direct Memory Access
  • reply message Reply Message
  • the protocol converter 34 receives the transfer instruction from the controller 2 and The conversation necessary for data transfer is directly performed with the client 7, and the client 7 directly functions as a direct transfer means for executing data transfer.
  • the cache device 4 can directly transfer data to and from the client 7 in accordance with an instruction from the control device 2, and in the present embodiment, as shown in FIGS.
  • a target channel adapter (TCA) 41 having a function as an internal network controller, a memory management unit 42, a protocol handler (Protocol Handler) 43, and a large capacity (for example, about 10 gigabytes)
  • a memory device 44 such as a RAM (hereinafter simply referred to as “memory 44”).
  • the above-mentioned memory management unit 42 determines which area (memory area) of the memory 44 in the cache apparatus 4 is a cache area where data of the disk apparatus 31 can be cached, and to which control apparatus 2
  • the protocol handler (protocol processing unit) 43 interprets the message sent from the control device 2 and accesses the memory 44 according to the message content. Then, by performing RDMA or returning a response message to the client 7, the necessary data transfer can be performed directly with the client 7.
  • the protocol handler 43 directly conducts a conversation necessary for data transfer with the client 7 in accordance with the transfer instruction from the control device 2, and directly performs data transfer with the client 7. It acts as a direct transfer means to execute.
  • the control device 2 is for centrally managing (controlling) access to the cache device 4 and the storage device 3.
  • a CPU Central Processing Unit
  • a memory 22 a chip
  • This is realized by implementing a system management process (program) as software or firmware on a workstation having a set 23 and a host channel adapter (HCA) 24.
  • HCA host channel adapter
  • This “system management process” determines where the file data entity is stored in the system 1 (storage device 3 or cache device 4). It manages the storage location (storage location) during the night, and also accepts requests from client devices (hereinafter simply referred to as “client J”) 7.
  • the DAFS protocol handler 21_1 performs DAFS protocol processing, receives a DAFS processing request sent from the client 7, and manages the corresponding data. It has a function to issue a transfer instruction (data transfer instruction) to the server.
  • the DAFS protocol handler 21_1 when the DAFS protocol handler 21_1 receives an access request sent via the IB network 5 from the client 7 that is accessible to the IB network 5, the DAFS protocol handler 21_1 sends the data to the cache device 4 or the storage device 3. It functions as a transfer instruction issuing means for issuing an overnight transfer instruction.
  • the internal protocol handler (internal protocol processing unit) 2 1-2 is for performing control such as flow control necessary for continuing communication within the system 1.
  • 2 1—3 manages information such as the network address and capacity of the storage device 3 (disk device 3 1) existing inside the system 1;
  • the cache area management unit 2 1—4 manages the cache device 4 It manages the storage area of the (memory 44), has information such as the network address and capacity of the cache device 4 (memory 44), and responds to requests from the virtual storage management unit 211.
  • the storage area is allocated accordingly.
  • the virtual storage management unit 21-5 manages where the data requested by the client 7 is stored in the system 1. In, this management is realized by maintaining the management tables (table format data) shown in Tables 1 and 2 below, for example.
  • Table 2 Map of virtual storage and real area of cache device
  • the management tables shown in Tables 1 and 2 show the storage image that the control device 2 shows to the client 7 side and the actual storage device 3 or cache device 4 for the storage image.
  • the management table shown in Table 1 shows the virtual storage and the actual storage (storage area (sector) of the disk device 31). It shows which virtual storage sector corresponds to which disk device 31 sector.
  • Table 2 is a management table for managing the data cached in the cache device 4 among the data managed by the management table shown in Table 1, for example,
  • the DAFS protocol handler 21-1 described above cooperates with the virtual storage management unit 21-5 to determine where necessary data exists based on the management tables shown in Tables 1 and 2 above. After searching and specifying, a data transfer instruction (hereinafter, simply referred to as “transfer instruction”) is issued to the corresponding component (quick device 4 or storage device 3).
  • transfer instruction a data transfer instruction
  • the DAFS protocol handler 2 1-1 first searches the cached data with reference to Table 2 above, and if the cache data exists, the cache device 4 holding the cached data. The transfer instruction is issued to the storage device 3, otherwise the transfer instruction is issued to the storage device 3.
  • the message transmitting / receiving section 21-6 generates the transfer instruction or a message such as RDMA (Remote Direct Memory Access) and sends it to the IB network 5, while transmitting the message to the IB network 5. It receives DAFS processing requests and messages such as confirmations (Acknowledgment) from the storage device 3 and the cache device 4.
  • RDMA Remote Direct Memory Access
  • a DAFS processing request (access request for file A: Request File A) is issued from a certain client 7 to the control device 2 via the IB network 5 (step S 1; access). Request issuing step).
  • the control device 2 when the access request is received by the message transmission / reception units 21-6, D
  • the AFS protocol handler 21-1 analyzes the received message and recognizes the contents (access request for file A).
  • the DAFS protocol handler 2 1-1 searches for the management table shown in Table 2 in cooperation with the virtual storage management section 2 1-4 and the requested file A is cached in the cache device 4. Check if there is.
  • the DAFS protocol handler 21-1 sends the file A to the client 7 (specified by an IP (Internet Protocol) address or the like) which has requested access.
  • a transfer instruction for the transfer is issued to the cache device 4 (step S2; transfer instruction issuance step).
  • the DAFS protocol handler 2 1-1 also generates messages (response message 51 and RDMA message 52) necessary for the cache device 4 to directly communicate with the client 7 and transfer data. Then, the message is transmitted to the cache device 4 together with the transfer instruction.
  • the 0 ⁇ 18 message 52 stores at least the storage location (memory address) of the file A on the cache device 4 side and the size information of the file A (sector range).
  • the protocol handler 43 When the cache device 4 receives the above transfer instruction from the control device 2, the protocol handler 43 analyzes the contents thereof, and as a result, recognizes that the file A is a transfer instruction to the client 7. Then, the protocol handler 43 reads the data of the specified size information from the storage position specified by the RDMA message 52 from the memory 44 in cooperation with the memory area management unit 42. Read the target file A.
  • the protocol handler 43 transfers the read file A directly to the client 7 via the IB network 5 by an RDMA message (step S3: direct transfer step) and receives it from the control device 2.
  • step S3 direct transfer step
  • step S4 direct transfer step
  • a client 7 sends a DAFS processing request (access request to file B: Request File 5) to control device 2 via IB network 5 to control device 2.
  • B) is issued (in step SI Do control device 2, when this transfer instruction is received by message transmitting / receiving section 21-6, DAFS protocol handler 21-11 analyzes the received message and Recognize the contents (access request for file B).
  • the DAFS protocol handler 21-1 searches the management table shown in Table 2 in cooperation with the virtual storage management unit 21-4, and determines whether the requested file A is cached in the cache device 4. Check. Here, assuming that the file B is not cached in the cache device 4, the DAFS protocol handler 21-1 further searches the management table shown in Table 1 in cooperation with the virtual storage management unit 21-4. Identify the storage device 3 (disk unit 31) that stores the requested file B.
  • the DAFS protocol handler 21-1 issues a transfer instruction for causing the specified storage device 3 to directly transfer the file B to the access requesting client 7 (specified by an IP (Internet Protocol) address or the like). Is issued to the cache device 4 (step S12).
  • IP Internet Protocol
  • the DAFS protocol handler 21-1 sends a message (response message 51, RDMA message 52, file B disk device 31) necessary for the storage device 3 to directly talk to the client 7 and transfer data.
  • the storage access information (message) 53) indicating the storage position is also generated, and the message is transmitted to the storage device 3 together with the transfer instruction.
  • the storage access information 53 stores information such as the position and size of the first sector of the file B in the disk device 31.
  • the protocol conversion unit 34 interprets the transfer instruction, and the SCS I interface 35 according to the instruction content, based on the storage access information 53, Then, the corresponding disk device 31 is accessed to read the file B specified by the information such as the position and size of the first sector from the disk device 31 (step S13).
  • the SCS I interface 35 sends the access result (file B) to the client 7 through the protocol converter 34 and the TCA 33 to send an RDMA message.
  • the message is transferred directly via the IB network 5 (step S14), and a response message is returned to the client 7 via the IB network 5 (step S15).
  • the cache device 4 having the large-capacity memory 44 is mounted inside the system,
  • the controller 2 intensively generates and issues the above-described transfer instruction, response message 51, and RDMA message 52, so that the data transfer control in the system 1 is simplified, and the maintenance is simplified. It is also advantageous in terms of aspects.
  • the response message 51 and the RDMA message 52 are created on the control device 2 side and passed to the cache device 4, but may be created on the cache device 4 side.
  • the control device 2 attaches the position information of the file A requested to access (memory address of the cache device 4 side) to the transfer instruction to the cache device 4. And sends it to the cache device 4 as it is (step S 2 ′).
  • the cache device 4 obtains a message (RD) necessary for a conversation with the client 7 from the information sent from the control device 2 in this way.
  • An MA message and a response message are generated independently by the protocol handler 43, and the requested file A is transferred to the client 7 (steps S3 ', S4') o
  • the response message 51 and the RDMA message 52 may be created on the storage device 3 side instead of the control device 2 side.
  • the controller 2 (DAFS protocol handler 21-1) Sends the storage access information 53 on the file B requested to be accessed to the storage device 3 as it is with the transfer instruction to the storage device 3 (step S 1 2 ′).
  • the file B is read from the disk device 31 based on the information 53 sent from the control device 2 to the client 3 (step S13), and the messages necessary for the conversation with the client 7 (R DMA message, response message, etc.) ) Is independently generated by the protocol converter 34, and the requested file B is transferred to the client 7 (steps S14 'and S15').
  • the processing load of the control device 2 can be distributed to the cache device 4 or the storage device 3. It is expected that the system 1 can be constructed inexpensively by suppressing the performance of the system and reducing the size and cost of the control device.
  • control device 2 sends only the transfer instruction for the file A with the RDMA message 52 to the cache device 4 and sends the The RDMA may be performed, and the other processing (generation and transmission of the response message 51) may be performed by the control device 2.
  • the controller 2 (DAFS protocol handler 21-1) receives an access request for the file A from the client 7 (step S1)
  • the DAFS protocol handler 211-1 is activated.
  • the cache device 4 generates an RDMA message 52 as a message necessary for performing a data transfer by directly talking with the client 7 and transmitting the message to the cache device 4 together with the transfer instruction of the file A. (Step S21).
  • at least the storage location (memory address) of file A on the cache device 4 side and the size information of file A (sector range) are stored in the RDMA message 52.
  • the protocol handler 43 analyzes the contents and cooperates with the memory area management unit 42 to execute the above RDMA message 5.
  • Target file A from the storage location specified by 2 Is read and transferred directly to the client 7 via the IB network 5 using an RDMA message (step S22).
  • the protocol handler 43 When the transfer is completed, the protocol handler 43 generates an acknowledgment message (Acknowledgement Message) addressed to the control device 2 and sends it to the control device 2 via the IB network 5 (step S23). In the control device 2 receiving the confirmation message, the DAF protocol handler 21-1 generates a response message 51 addressed to the client 7, and transmits the response message 51 to the client 7 via the IB network 5 (step S twenty four).
  • control device 2 sends only the transfer instruction for the file B with the RDMA message 52 and the storage access information 53 to the storage device 3. Then, the storage device 3 can perform RDM A for the client 7, and the other processes (generation and transmission of the response message 51) can be performed by the control device 2.
  • the DAF protocol handler 21-1 in the control device 2 transmits the received message.
  • the storage device 3 disk device 31 that stores the requested file B is identified in cooperation with the virtual storage management unit 21-4.
  • the DAFS protocol handler 21-1 attaches the RDMA message 52 and the storage access information 53 to the transfer instruction of the file B to the specified storage device 3, and transmits the storage device 3 to the storage device 3 (step S 21 ').
  • the storage access information 53 stores information such as the head sector position and size of the file B in the disk device 31.
  • the protocol conversion unit 34 interprets the transfer instruction, and the SCS I interface 35 responds to the storage access according to the message content.
  • the corresponding disk device 31 is accessed based on the information 53, and the file B specified by the information such as the head sector position and size is read from the disk device 31 (step S22 ').
  • the SCS I interface 35 directly transfers the access result (file B) to the client 7 through the protocol conversion unit 34 and the TCA 33 using the RDMA message via the IB network 5 (step S23 ').
  • the protocol conversion unit 34 Upon completion of this transfer, the protocol conversion unit 34 notifies the control device 2 of the fact via a IB network 5 via a confirmation message (step S24 '), and receives this notification (confirmation message).
  • the control device 2 generates a response message 51 addressed to the client 7 by the DAFS protocol handler 21-1 and transmits it to the client 7 via the IB network 5 (step S25 ').
  • the generation of the message necessary for conversation with the client 7 is partially assigned to the cache device 4 or the storage device 3. It is possible to distribute the processing load of the control device 2 to the cache device 4 or the storage device 3 as compared with the above.
  • an access request (write request) for file A is sent from client 7 to control device 2 via IB network 5 (step S31).
  • the DAFS protocol handler 21-1 upon receiving the above access request, analyzes the received message, and stores the requested file A in cooperation with the virtual storage management unit 21-4. Identify (select) the cache devices 4 A and 4 B to be used. Then, the DAFS protocol handler 21-1 generates messages (response message 51 and R DMA message 52) necessary for communication with the client 7 for each of the cache devices 4A and 4B, and transfers each of them. It is sent to the cache devices 4A and 4B attached to the instruction (step S32). In this case, each RDMA message 52 requires memory addresses and size information of the cache devices 4A and 4B to hold the file A.
  • the data is sent from the control device 2 as described above.
  • the protocol handler 43 analyzes the content, cooperates with the memory area management unit 42, and uses the R DMA message 52 received from the control unit 2 to transmit the IB network.
  • the file A is directly received from the client 7 via 5 and written to each memory 44 (step S33).
  • the protocol handler 43 of each of the cache devices 4A and 4B sends the response message 51 received from the control device 2 to the client 7 in response.
  • a response is returned (step S34), and the transfer (mirroring) is completed at the client 7 when all the cache devices 4A and 4B have received a response.
  • each of the cache devices 4 communicates with the client 7 in accordance with a transfer instruction from the control device 2 (messages required for data transfer). Data transmission and reception), and the actual data transfer and response processing are performed directly between the client 7 and the plurality of cache devices 4 without passing through the control device 2, thus reducing the latency of the system 1. In addition, reliability can be improved while improving data throughput.
  • the transfer may be completed at that time. In this case, it is not necessary for all the cache devices 4 to send a response message to the client 7, and therefore, sending both the response message 51 and the RDMA message 52 is partly. Only the RDMA message 52 may be sent to the remaining cache devices 4.
  • step S32 a transfer instruction with both the message 52 and the message 52 is transmitted (step S32), and a transfer command with only the RDMA message 52 attached to the cache device 4B (step S32).
  • step S 33 the RD MA for the file A from each of the cache devices 4 A and 4 B for the client 7 is performed (step S 33), and then the cache device 4 that has received the response message 51 from the control device 2 A only to client 7 In response, a response message 51 is transmitted (step S34).
  • the processing load of the control device 2 can be reduced, and the processing load of the cache device 4 can be reduced, although partly.
  • control device 2 does not issue a transfer instruction to all the cache devices 4, but issues a transfer instruction to only some of the cache devices 4, and the same cache device 4 transmits to the other cache devices 4.
  • Mirroring is realized by copying the data.
  • the DAFS protocol handler 21-1 in the control device 2 For example, the cache device 4A issues a transfer instruction for receiving the file A from the client 7 to the cache device 4A via the IB network 5 (step S42).
  • the DAFS protocol handler 21-1 generates a response message 51 and an RDMA message 52, and also generates address information 54 of the cache device 4B to which the file A is copied. Attached to the transfer instruction addressed to the cache device 4A. In this case as well, the RDMA message 52 needs the memory address of the cache device 4 and the size information of the file A.
  • the cache device 4A receiving the transfer instruction from the control device 2 receives the transfer of the file A from the client 7 by the RDMA message 52 generated on the control device 2 side (step S43), and the transfer is performed. Upon completion, a response is returned to the client 7 with a response message 53 received from the control device 2 (step S44).
  • the cache device 4A specifies the copy destination cache device 4B based on the address information 54 received from the control device 2, and stores the file A received from the client 7 in the memory 44 of the cache device 4B. (Step S44) o This copy can also be made by RDMA.
  • the control device 2 is a part of the cache devices 4 A and 4 B that hold the same file A redundantly (here, the cache device 4 A ) Is issued to the storage device 3 (step S5D0).
  • the transfer instruction includes the storage device 3 and the disk device 3 as the transfer destination. Information identifying 1 is attached.
  • the cache device 4A Upon receiving the transfer instruction, the cache device 4A transfers the file A to the disk device 31 of the storage device 3 by RDMA (step S52), and when the transfer is completed, controls the completion by a confirmation message.
  • the device 2 is notified (step S53), and the redundantly stored file A is deleted from the memory 44 to release the memory area (step 54).
  • control is performed such that redundant data with a low access frequency is evacuated from the cache device 4 to the storage device 3, and the redundant data with a high access frequency is preferentially left in the cache device 4. It becomes possible. Therefore, the memory capacity of the cache device 4 can be effectively utilized to the maximum, and the memory capacity required for the cache device 4 can be suppressed even when mirroring is performed.
  • the present invention is not limited to the above-described embodiment, and can be variously modified and implemented without departing from the gist of the present invention.
  • an access request from the client 7 via the IB network 5 is based on DAFS.
  • another protocol for example, SRP (SCSI RDMA Protocol)
  • SRP SCSI RDMA Protocol
  • a cache device (or a storage device) in a storage system directly performs a conversation necessary for data transfer with a client device in accordance with an instruction from a control device to transfer data.
  • the latency of the system can be reduced, and the data throughput can be greatly improved.
  • a high-speed and high-performance data center can be constructed, and its usefulness is extremely high. it is conceivable that.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)
  • Information Transfer Between Computers (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

明 細 書 ストレ一ジシステム及び同システムにおけるデータ転送方法 技術分野
本発明は、ストレージシステム及び同システムにおけるデ一夕転送方法に関し、 特に、 パーソナルコンピュータ (P C: Personal Computer) やワークステ一シ ヨン (WS : Work Station) 等のノード装置からディスク装置等の外部入出力装 置へのアクセス技術に関する。 背景技術
図 15に既存のストレ一ジシステムの一例を示す。 この図 15に示すように、 本システムは、 PC等のノード装置 100 (以下、単に、 「ノード 100」という) と、 SCS I (Small Computer System Interface) バス 300を介してこのノ —ド 100に接続された入出力 (IZ〇) 装置 200とをそなえており、 ノード 100には、 CPU101, 主記憶部 (メインメモリ) 102, SCS Iカード 103等が装備されており、 これらが内部バス 104を介して相互に通信可能に 接続されている。 また、 1 〇装置200には、 ディスクコントローラ 201, バッファ 202及びディスク装置 203が装備されている。
なお、 S C S Iバス 300には、 複数の I ZO装置 200が接続される場合も ある。 また、 ノード 100 (メインメモリ 102) と IZO装置 200との接続 には、 ファイバチャネル (F C : Fiber Channel) 等の他のインタフェースが用 いられる場合もある。
そして、 このようなシステムにおいて、 ノード 100 (メインメモリ 102) と IZO装置 200 (ディスク装置 203)との間でデータ転送を行なう場合は、 ノード 100側から S CS Iのプロトコルを使用して I/O装置 200のデイス クコントローラ 201を起動する必要がある。 例えば、 ファイルシステム 105 がディスク装置 203へデータの書き込みを行なう場合、 従来は、 以下のような 手順が実行されるようなつている。 即ち、 まず、 図 15及び図 16に示すように、 ノード 100側のファイルシス テム 105が、 SCS I ドライバ 106にディスク書き込み要求を依頼する (ス テツプ Al)。なお、上記のファイルシステム 105及び S CS I ドライノ 106 は、 いずれも、 通常は OS (オペレーティングシステム) 等の一機能として組み 込まれるもので、 CPU 101がメインメモリ 102に格納されているファイル システムデータ及びドライバデータを読み込んで動作することによってそれぞれ の機能が実現される。
さて、 上記のディスク書き込み要求を受けた SCS I ドライノ 106は、 対象 の 1ノ〇装置 200のディスクコントローラ 201と、 SCS Iバス 300上で のデータ転送レート決定等のためのネゴシエーションを数回実行することにより コネクションを設定した後(ステップ A 2)、実際にデータの転送を開始して当該 デ一夕の書き込みをディスクコントローラ 201に依頼する(ステップ A 3)。な お、 S CS I ドライバ 106は、 I /0装置 200内でのディスク装置 203へ のデータ書き込み処理に時間がかかる場合、 ディスクコントローラ 201とのコ ネクシヨンを一旦解除する。
I/O装置 200では、 ディスクコントローラ 201が、 SCS Iバス 300 を通じてノード 100から受け取ったデータを一旦バッファ 202に格納した後 (ステップ A4)、 ディスク装置 203へ書き込む (ステップ A 5)。 この I/O 装置 200での内部処理(データ書き込み)が終了すると(ステップ A6, A7)、 ディスクコントローラ 201は、 S C S I ドライバ 106に対して割り込みを上 げて転送(書き込み) が完了したことを報告し (ステップ A8)、 SCS I ドライ ノ 106は、 ファイルシステム 105に転送完了を通知する (ステップ A9)。 しかしながら、 このような従来のシステムでは、 ノード 100から SCS Iや FC等のプロトコルを使用して I ZO装置 200側のディスクコントローラ 20 1を起動する必要があり、 また、 実際にデータの転送が起きるまでの動作も繁雑 (ノード 100とディスクコントローラ 201との間で数回ネゴシエーションす る必要がある) なため、 レイテンシが大きいという課題がある。
また、 ノード 100と IZO装置 200との間の転送帯域 (転送レート) に関 しては、 SCS I, FC共に改善されてきた (〜16 OMB/s) が、 インフィニバ ンド (I B ) が内部ネットワークとして導入されると、 ノード 1 0 0側の内部バ ス 1 0 4の転送速度を数ギガビット /秒(GB/s) 程度まで引き上げることが可能 となる。 しかし、 現在の S C S Iや F C等の既存のインタフェース規格では、 上 述のごとくレイテンシが大きいため、 十分にその性能を活かすことができない。 本発明は、 このような課題に鑑み創案されたもので、 データ転送動作の分散化 を図ってレイテンシを削減するとともに、 I Bネットワークを導入した場合のそ の性能を十分に活かせるデータ転送帯域 (レート) を確保することのできる、 ス トレ一ジシステム及び同システムにおけるデータ転送方法を提供することを目的 とする。 発明の開示
上記の目的を達成するために、 本発明のストレ一ジシステムは、 データを記憶 するストレ一ジ装置と、 このストレ一ジ装置に記憶されているデータをキヤッシ ュしうるキャッシュ装置と、 少なくとも、 上記のストレ一ジ装置及びキャッシュ 装置に対するアクセスを制御する制御装置と、 上記のストレージ装置, キヤッシ ュ装置及び制御装置を相互に通信可能に接続する内部ネットワークとをそなえる とともに、 上記の制御装置が、 上記内部ネットワークにアクセス可能に接続され たクライアント装置から内部ネットワークを介して送られてくるアクセス要求を 受けると、 上記のキヤッシュ装置又はストレージ装置にデータ転送指示を発行す る転送指示発行手段をそなえ、 且つ、 少なくとも、 上記のデータ転送指示を受信 するストレージ装置又はキャッシュ装置が、 上記の制御装置からのデ一夕転送指 示に従って上記クライアント装置とデータ転送に必要な会話を直接行なって、 そ のクライアント装置との間で、 直接、 データ転送を実行する直接転送手段をそな えたことを特徴としている。
上述のごとく構成されたストレ一ジシステムでは、上記のクライアント装置が、 上記の内部ネットワークを介して制御装置にアクセス要求を発行し (アクセス要 求発行ステップ)、 このアクセス要求を制御装置が受けると、当該制御装置が上記 のキヤッシュ装置又はストレ一ジ装置にデータ転送指示を発行する (転送指示発 そして、 上記のキャッシュ装置又はストレージ装置は、 上記の制御装置からの データ転送指示に従ってクライアント装置とデータ転送に必要な会話を直接行な つて、 そのクライアント装置との間で、 直接、 デ一夕転送を実行する (直接転送 ステップ)。 これにより、ストレージシステムのレイテンシの削減を図ることがで きるとともに、 データスル一プットを大幅に向上することが可能となる。
ここで、 上記の制御装置は、 上述したクライアント装置とキャッシュ装置又は ストレージ装置との間の会話のためのメッセージを生成して上記データ転送指示 とともにキャッシュ装置に送信し、 キャッシュ装置又はストレ一ジ装置は、 この 制御装置で生成されたメッセージを用いて上述したクライアント装置との間のデ —夕転送を実行することができる。 このようにすれば、 メッセージ生成とデータ 転送指示の発行とを制御装置において集中管理できるので、 データ転送制御が単 純化される。
勿論、 制御装置は、 クライアント装置とキャッシュ装置又はストレージ装置と の間の会話のためのメッセージを生成するのに必要なメッセージ情報を上記デー 夕転送指示とともにキャッシュ装置又はストレージ装置に送信し、 キャッシュ装 置又はストレ一ジ装置において、 そのメッセージ情報に基づいて上記のメッセー ジを生成するようにしてもよい。 このようにすれば、 上記デ一夕転送に伴う制御 装置の処理負荷を軽減することができる。
なお、 上記のデ一タ転送が完了すると、 キャッシュ装置又はストレ一ジ装置か ら上記内部ネットワークを介して制御装置へ確認メッセ一ジを発行し、 制御装置 は、 このキャッシュ装置又はストレ一ジ装置から確認メッセージを受けることに より内部ネットワークを介してクライアント装置に対してデータ転送完了を表す 応答メッセージを発行するようにしてもよい。 このように、 制御装置においてク ライアント装置へ発行すべき応答メッセ一ジを生成するようにすれば、 制御装置 又はキヤッシュ装置もしくはストレ一ジ装置においてクライアント装置との会話 に必要な全てのメッセージを集中的に生成 ·発行する場合に比して、 各装置の処 理負荷を軽減することができる。
また、 キャッシュ装置が 2台以上存在する場合、 制御装置は、 クライアント装 置と上記の各キャッシュ装置との間の会話に必要なメッセージを生成して上記デ ―夕転送指示とともに各キャッシュ装置にそれぞれ送信し、各キャッシュ装置は、 それぞれ、 この制御装置で生成されたメッセ一ジを用いてクライアント装置との 間のデータ転送を実行した後、 各キャッシュ装置のいずれかがデータ転送の完了 を示す応答メッセ一ジを、 内部ネットヮ一クを介してクライアント装置へ送信す るようにしてもよい。 このようにすれば、 全てのキャッシュ装置が応答メッセ一 ジをクライアント装置へ送信する必要がないので、 内部ネッ卜ワーク経由でやり とりされるメッセージ数を大幅に削減することができる。
ただし、 勿論、 各キャッシュ装置がそれぞれデータ転送の完了を示す応答メッ セージを、 内部ネットワークを介してクライアント装置へ送信して、 クライアン ト装置側でこれらの各キャッシュ装置からの応答メッセージをそれぞれ受信する ことにより、 データ転送を完了とすることもできる。
また、 キャッシュ装置が 2台以上存在する場合、 制御装置は、 クライアント装 置と各キャッシュ装置のいずれかとの間の会話に必要なメッセ一ジを生成して上 記データ転送指示とともにそのキヤッシュ装置に送信するとともに、 データコピ —先キヤッシュ装置情報を当該キヤッシュ装置に送信し、そのキヤッシュ装置は、 制御装置から受信したメッセージを用いてクライアント装置との間のデータ転送 を実行し、 その後、 当該デ一夕転送によりデータを受信したキャッシュ装置が、 制御装置から受信した上記のデ一夕コピ一先キャッシュ装置情報により特定され る他のキャッシュ装置に、 受信したデ一夕をコピ一するようにしてもよい。
このようにすれば、 本システムにおいていわゆるミラーリングを実現すること ができるので、 本システムの信頼性を向上することができる。
さらに、 制御装置は、 同じデータをキャッシュしているキャッシュ装置のいず れかにそのデータをストレ一ジ装置へ転送するよう指示し、 この指示を受けたキ ャッシュ装置は、 当該データを内部ネットワーク経由でストレージ装置へ転送し て、 他のキャッシュ装置とで冗長に保持していたそのデータを削除して自己のメ モリ領域を解放するようにしてもよい。 このようにすれば、 キャッシュ装置の記 憶容量を有効活用することができるので、 キャッシュ装置に必要とされる記憶容 量を抑えることができる。 図面の簡単な説明
図 1は本発明の一実施形態としてのストレ一ジシステムの構成を示すプロック 図である。
図 2は図 1に示す制御装置の要部の構成を示す機能ブロック図である。
図 3は図 1に示すキヤッシュ装置の要部の構成を示すプロック図である。 図 4は図 1に示すストレージ装置の要部の構成を示すブロック図である。 図 5は図 1に示すストレ一ジシステムの動作 (転送対象データがキヤッシュ装 置に存在する場合) を説明するための図である。
図 6は図 1に示すストレ一ジシステムの動作 (転送対象データがストレージ装 置に存在する場合) を説明するための図である。
図 7は図 1に示すストレ一ジシステムの動作の変形例 1を説明するための図で ある。
図 8は図 1に示すストレ一ジシステムの動作の変形例 2を説明するための図で ある。
図 9は図 1に示すストレ一ジシステムの動作の変形例 3を説明するための図で ある。
図 1 0は図 1に示すストレージシステムの動作の変形例 4を説明するための図 である。
図 1 1及び図 1 2はいずれも図 1に示すス卜レ一ジシステムの動作の変形例 5 を説明するための図である。
図 1 3は図 1に示すストレ一ジシステムの動作の変形例 6を説明するための図 である。
図 1 4は図 1に示すストレ一ジシステムの動作の変形例 7を説明するための図 である。
図 1 5は既存のストレージシステムの一例を示す図である。
図 1 6は図 1 5に示すストレージシステムにおけるデータ転送処理を説明する ためのシーケンス図である。 発明を実施するための最良の形態 図 1は本発明の一実施形態としてのストレージシステムの構成を示すブロック 図で、 この図 1に示すストレージシステム 1は、 制御装置 (Control Machine) 2 , ストレージ装置 3, キャッシュ装置 4をそなえており、 これらの各装置 2, 3, 4が内部ネットワークとしての Infiniband ( I B ) ネットワーク (I Bスィ ツチ) 5を介して相互に通信可能に接続されている。
なお、 各装置 2, 3, 4は、 必要に応じて複数台設けられる。 また、 制御装置 2 , キャッシュ装置 4は、 例えば、 I Bネットワーク 5用のネットワークカード として構成される。 さらに、 I Bスィッチ 5には、 1台以上のクライアント装置 (ノード) 7で構築された L AN (Local Area Network) 6等が接続されており、 この L AN 6経由でクライアント装置 7 (以下、 単に 「クライアント 7」 と表記 する) は本システム 1にアクセスすることが可能になっている。
そして、 上記のストレージ装置 3は、 図 1及び図 4に示すように、 例えば、 フ アイルデ一夕等の所要のデータを記憶するディスク装置 (あるいは、 テープ装置 でもよい) 3 1と、 このディスク装置 3 1に対するアクセスを制御するインタフ エースカード (ネットワークカード) 3 2とをそなえており、 このイン夕フエ一 スカ一ド 3 2は、 さらに、 I Bネットワークコントローラとしての機能を有する ターゲットチャンネルアダプタ (T C A: Target Channel Adapter) 3 3, プロ 卜コル変換部 (Protocol Transition Unit) 3 4及びディスクコントローラとして の機能を有する S C S Iインタフェース 3 5を装備している。 なお、 このインタ フェースカード 3 2は、 実装されるディスク装置 3 1の数に応じて必要なだけ用 意される。
ここで、 上記のプロトコル変換部 3 4は、 I Bネットワーク 5経由で制御装置 2から送られてきたメッセ一ジを解釈し、 そのメッセージ内容に応じてアクセス すべきディスク装置 3 1が接続されている S C S Iインタフェース 3 5を通じて 該当ディスク装置 3 1にアクセスしたり、 そのアクセス結果をクライアント 7側 に R D MA (Remote Direct Memory Access)し応答メッセージ(Reply Message) を返したりすることによって、 I Bネットワーク 5経由でダイレクトにクライア ント 7との間で必要なデータ転送を行なえるものである。
つまり、 このプロトコル変換部 3 4は、 制御装置 2からの転送指示に従ってク ライアント 7とデータ転送に必要な会話を直接行なって、 そのクライアント 7と の間で、 直接、 データ転送を実行する直接転送手段としての機能を果たすのであ る。
次に、 上記のキャッシュ装置 4は、 制御装置 2からの指示に従ってクライアン ト 7との間でダイレクトにデータ転送を行なうことができるもので、 本実施形態 では、 図 1及び図 3に示すように、 例えば、 内部ネットワークコントローラとし ての機能を有するターゲットチャンネルアダプタ (T C A: Target Channel Adapter) 4 1, メモリ管理部 4 2 , プロトコルハンドラ (Protocol Handler) 4 3及び大容量 (例えば、 1 0ギガバイト程度) の R AM等のメモリデバイス 4 4 (以下、 単に 「メモリ 4 4」 と表記する) をそなえて構成されている。
ここで、 上記のメモリ管理部 4 2は、'キャッシュ装置 4内のメモリ 4 4のどの 領域 (メモリ領域) を、 ディスク装置 3 1のデータをキャッシュしうるキヤッシ ュ領域として、 どの制御装置 2に割り当てたのかを管理するものであり、 プロト コルハンドラ (プロトコル処理部) 4 3は、 制御装置 2から送られてきたメッセ ージを解釈し、 そのメッセ一ジ内容に応じてメモリ 4 4にアクセスして、 クライ アン卜 7側に R D M Aしたり応答メッセージを返したりすることによつて、 クラ イアント 7との間でダイレクトに必要なデ一夕の転送を行なえるものである。 つまり、 キャッシュ装置 4では、 このプロトコルハンドラ 4 3が、 制御装置 2 からの転送指示に従ってクライアント 7とデータ転送に必要な会話を直接行なつ て、 そのクライアント 7との間で、 直接、 データ転送を実行する直接転送手段と しての機能を果たすのである。
そして、 上記の制御装置 2は、 上記のキャッシュ装置 4及びストレージ装置 3 に対するアクセスを集中的に管理 (制御) するためのもので、 例えば、 C P U (Central Processing Unit) 2 1, メモリ 2 2 , チップセット 2 3 , ホス卜チヤ ンネルアダプタ (H C A : Host Channel Adapter) 2 4等を有するワークステ一 シヨンに、 システム管理プロセス (プログラム) をソフトウェアやファームゥェ ァ等として実装することによって実現される。
この 「システム管理プロセス」 は、 ファイルデータの実体が本システム 1内部 (ストレ一ジ装置 3又はキャッシュ装置 4 ) のどこに保存されているのかという デ一夕の保存場所 (記憶位置) を管理するもので、 クライアント装置 (以下、 単 に 「クライアント J という) 7からのリクエストの受け付けも行なうようになつ ている。
具体的に、 本制御装置 2は、 例えばメモリ 2 2に記憶された上記の 「システム 管理プロセス」 を C P U 2 1が読み取って動作することにより、 例えば図 2に示 すように、 D A F Sプロトコルハンドラ (Direct Access File System Protocol Handler) 2 1— 1 , 内部プロトコルハンドラ (Internal Protocol Handler) 2 1 - 2 , 実ストレ一ジ領域管理部 (Real Storage Manager) 2 1— 3 , キヤッシ ュ領域管理部 (Cache Machine Memory Manager) 2 1—4 , 仮想ストレージ 管理部 (Virtual Storage Manager) 2 1— 5, メッセージ送受信部 (Message Transition Unit) 2 1一 6等としての機能が発揮されるようになっている。
ここで、 D A F Sプロトコルハンドラ 2 1 _ 1は、 D A F Sプロトコル処理を 行なうもので、 クライアント 7から送られてくる D A F S処理要求を受け付け、 該当するデ一タを管理しているキャッシュ装置 4又はストレージ装置 3に転送命 令 (データ転送指示) を発行する機能を有している。
つまり、 この D A F Sプロトコルハンドラ 2 1 _ 1は、 I Bネットワーク 5に アクセス可能に接続されたクライアント 7から I Bネットワーク 5を介して送ら れてくるアクセス要求を受けると、 キャッシュ装置 4又はストレージ装置 3にデ 一夕転送指示を発行する転送指示発行手段としての機能を果たすのである。
また、 内部プロトコルハンドラ (内部プロトコル処理部) 2 1— 2は、 システ ム 1内で通信を継続するために必要なフローコントロール等の制御を行なうため のものであり、 実ストレ一ジ領域管理部 2 1— 3は、 システム 1内部に存在する ストレージ装置 3 (ディスク装置 3 1 ) のネットワークアドレスや容量などの情 報を管理するものであり、 キャッシュ領域管理部 2 1— 4は、 キャッシュ装置 4 (メモリ 4 4 ) の記憶領域を管理するもので、 キャッシュ装置 4 (メモリ 4 4 ) のネットワークアドレスや容量などの情報を有しており、 仮想ストレ一ジ管理部 2 1一 5からの要求に応じて記憶領域の割り当てを行なうようになっている。 さらに、 仮想ストレージ管理部 2 1— 5は、 クライアント 7から要求されたデ —夕がシステム 1内部のどこに保存されているかを管理するもので、 本実施形態 では、 例えば下記の表 1及び表 2に示すような管理テ一ブル (テーブル形式のデ 一夕) を保持することにより、 かかる管理を実現している。 表 1 仮想ストレ一ジとストレージ装置の実領域とのマップ
Figure imgf000012_0001
表 2 仮想ストレージとキャッシュ装置の実領域とのマップ
Figure imgf000012_0002
これらの表 1及び表 2に示す管理テーブルは、 制御装置 2がクライアント 7側 にみせているストレージイメージと、 そのストレージィメ一ジに対して実際にど のストレ一ジ装置 3又はキヤッシュ装置 4にデータの実体が保存されているのか とを対応付けて管理するもので、 例えば表 1に示す管理テーブルは、 仮想ストレ —ジと実ストレ一ジ(ディスク装置 3 1の記憶領域(セクタ))とのマップを表し、 どの仮想ストレージのセクタがどのディスク装置 3 1のセクタに対応するのかを 表している。
なお、 仮想ストレージ ID=00は、 3つのディスク装置 3 1 (実ストレージ ID =00,01,02) のセクタ群 (0-999) をそれぞれ仮想セクタ群として順番に有する単 一の仮想ストレージとして管理している (換言すれば、 クライアント 7側からは 上記の 3つのディスク装置 3 1が 1つの仮想ディスクとしてみえる) ことを意味 している。 また、 仮想ストレージ ID=01は、 いわゆる 「ミラーリング」 の場合 を表しており、 仮想ストレージ ID=02は、 いわゆる 「ストライビング」 の場合 を表している。
これに対し、 表 2は、 表 1に示す管理テーブルにより管理されているデ一夕の うち、 キャッシュ装置 4にキャッシュされているデ一夕を管理するための管理テ —ブルであり、 例えば、 表 2の第 1行目は、 I Bアドレス = # 0により特定され るキャッシュ装置 4内のメモリ 4 4のメモリアドレス =10 に、 仮想ストレ一ジ ID = 00 で特定される仮想ストレ一ジ (3つのディスク装置 3 1により構成され ている) のうちの仮想セクタ =0 (実ストレージ ID=00 のセクタ =0) に記憶さ れているデータがキャッシュされていることを意味する。
そして、 上述した D A F Sプロトコルハンドラ 2 1— 1は、 本仮想ストレージ 管理部 2 1— 5と協同して上記の表 1及び表 2に示す管理テ一ブルに基づき必要 なデータがどこに存在するのかを検索 ·特定した後、該当するコンポーネント(キ ッシュ装置 4又はストレ一ジ装置 3 ) にデータ転送指示 (以下、 単に 「転送指 示」 という) を発行するようになっている。
即ち、 D A F Sプロトコルハンドラ 2 1— 1は、 まず、 上記の表 2を参照して キャッシュしているデータを探し、 キャッシュデ一夕が存在すれば、 当該キヤッ シュデータを保持しているキヤッシュ装置 4に転送指示を発行し、 そうでない場 合は、 ストレ一ジ装置 3に転送指示を発行することになるのである。
また、 メッセ一ジ送受信部 2 1— 6は、 上記転送指示や R D MA (Remote Direct Memory Access)などのメッセ一ジを生成して I Bネットワーク 5へ送出 する一方、 I Bネットワーク 5から転送される上記 D A F S処理要求やストレー ジ装置 3やキャッシュ装置 4からの確認 (Acknowledgment) などのメッセージ を受信するものである。
以下、 上述のごとく構成された本実施形態のストレージシステム 1の動作につ いて説明する。
( 1 ) 転送すべきデータがキャッシュ装置 4に存在する場合
図 5に示すように、 或るクライアント 7から制御装置 2に対して I Bネットヮ ーク経由 5で D A F S処理要求(ファイル Aに対するアクセス要求:Request File A) が発行されたとする (ステップ S 1 ;アクセス要求発行ステップ)。 制御装置 2では、 このアクセス要求がメッセージ送受信部 2 1— 6にて受信されると、 D A F Sプロトコルハンドラ 2 1 - 1が、受信メッセ一ジを解析して、その内容(フ アイル Aについてのアクセス要求) を認識する。
ついで、 D A F Sプロトコルハンドラ 2 1— 1は、 仮想ストレージ管理部 2 1 —4と協同して、 表 2に示す管理テ一ブルを検索して要求のあったファイル Aが キャッシュ装置 4にキャッシュされているか否かを確認する。 ここで、 ファイル Aがキャッシュ装置 4にキャッシュされているとすると、 D A F Sプロトコルハ ンドラ 2 1— 1は、 ファイル Aをアクセス要求元のクライアント 7 ( I P (Internet Protocol) アドレス等によって特定される) に転送してもらうための 転送指示をキャッシュ装置 4に対して発行する (ステップ S 2 ;転送指示発行ス テツプ)。
この際、 D A F Sプロトコルハンドラ 2 1— 1は、 キャッシュ装置 4がクライ アント 7と直接会話を行なってデータ転送を行なうのに必要なメッセ一ジ (応答 メッセージ 5 1や R D MAメッセージ 5 2 ) も生成して、 当該メッセ一ジを上記 転送指示とともにキャッシュ装置 4へ送信する。 なお、 0^1八メッセ一ジ5 2 には、 少なくとも、 キャッシュ装置 4側のファイル Aの格納位置 (メモリアドレ ス) とファイル Aのサイズ情報 (セクタ範囲) とが格納される。
キャッシュ装置 4は、 制御装置 2から上記の転送指示を受けると、 プロトコル ハンドラ 4 3が、 その内容を解析し、 その結果、 ファイル Aのクライアント 7へ の転送指示であることを認識する。 すると、 プロトコルハンドラ 4 3は、 メモリ 領域管理部 4 2と協同して、 上記の R D MAメッセージ 5 2により指定された格 納位置から指定サイズ情報分のデ一夕をメモリ 4 4から読み出すことによって目 的のファイル Aを読み出す。
ついで、 プロトコルハンドラ 4 3は、 読み出したファイル Aを R DM Aメッセ —ジにより I Bネットヮ一ク 5経由でクライアント 7にダイレクトに転送し (ス テツプ S 3:直接転送ステップ)、制御装置 2から受信した上記応答メッセ一ジ 5 2をクライアント 7に送出して (ステップ S 4 )、 ファイル Aの転送を完了する。
( 2 ) 転送すべきデータがストレ一ジ装置 3に存在する場合
図 6に示すように、 或るクライアント 7から制御装置 2に対して I Bネットヮ —ク経由 5で D A F S処理要求(ファイル Bに対するアクセス要求: Request File B) が発行されたとする (ステップ S I Do 制御装置 2では、 この転送指示がメ ッセージ送受信部 21—6にて受信されると、 DAFSプロトコルハンドラ 21 一 1が、 受信メッセージを解析して、 その内容 (ファイル Bについてのアクセス 要求) を認識する。
ついで、 DAFSプロトコルハンドラ 21— 1は、 仮想ストレージ管理部 21 一 4と協同して、 表 2に示す管理テーブルを検索して、 要求のあったファイル A がキャッシュ装置 4にキャッシュされているか否かを確認する。 ここで、 フアイ ル Bがキャッシュ装置 4にキャッシュされていないとすると、 DAFSプロトコ ルハンドラ 21—1は、 さらに、 仮想ストレージ管理部 21— 4と協同して、 表 1に示す管理テーブルを検索して、 要求のあったファイル Bを保存しているスト レージ装置 3 (ディスク装置 31) を特定する。
そして、 DAFSプロトコルハンドラ 21— 1は、 特定したストレ一ジ装置 3 からファイル Bをアクセス要求元のクライアント 7 (I P (Internet Protocol) ァドレス等によって特定される) に直接転送してもらうための転送指示をキヤッ シュ装置 4に対して発行する (ステップ S 12)。
この際、 DAFSプロトコルハンドラ 21— 1は、 ストレージ装置 3がクライ アント 7と直接会話を行なってデータ転送を行なうのに必要なメッセージ (応答 メッセージ 51や RDMAメッセージ 52, ファイル Bのディスク装置 31での 格納位置を示すストレ一ジアクセス情報 (メッセージ) 53) も生成して、 当該 メッセージを転送指示とともにストレ一ジ装置 3へ送信する。 なお、 ストレ一ジ アクセス情報 53には、ファイル Bのディスク装置 31における先頭セクタ位置, サイズなどの情報が格納される。
ストレージ装置 3は、 制御装置 2から上記の転送指示を受けると、 プロトコル 変換部 34が、 その転送指示を解釈し、 その指示内容に応じて SCS Iインタフ エース 35が、 上記ストレージアクセス情報 53に基づいて該当ディスク装置 3 1にアクセスして、 上記の先頭セクタ位置, サイズなどの情報により特定される ファイル Bをディスク装置 31から読み出す (ステップ S 13)。
そして、 SCS Iインタフェース 35は、そのアクセス結果 (ファイル B)を、 プロトコル変換部 34, TCA33を通じてクライアント 7側に RDMAメッセ —ジにより I Bネットワーク 5経由で直接転送し(ステップ S 14)、応答メッセ —ジを同じく I Bネットヮ一ク 5経由でクライアント 7に返す(ステップ S 15)。 以上のように、 本実施形態のス卜レージシステム 1によれば、 システム内部に 大容量のメモリ 44を有するキャッシュ装置 4を実装し、 クライアント 7からの
(アクセス要求) は制御装置 2で受け付けるが、 実際の転送処理及び 7への応答処理は実際にデ一タを保持しているキャッシュ装置 4 (又はストレ一ジ装置 3) が制御装置 2を経由せずに直接行なうので、 レイテン シの大幅削減と、 データスループッ卜の大幅向上 ( I Bネットワーク 5の性能を 十分に活かせる帯域の確保) とを図ることができる。
また、 上述した例では、 制御装置 2が上記の転送指示, 応答メッセージ 51, RDMAメッセージ 52を集中的に生成 ·発行するので、 本システム 1内でのデ 一夕転送制御が単純化され、 保守面でも有利である。
(3) 変形例 1
図 5により上述した例では、 応答メッセージ 51及び RDMAメッセージ 52 を制御装置 2側で作成してキャッシュ装置 4へ渡していたが、 それぞれをキヤッ シュ装置 4側で作成するようにしてもよい。
即ち、 図 7に示すように、制御装置 2 (DAFSプロトコルハンドラ 21_ 1) は、 アクセス要求のあったファイル Aの位置情報 (キャッシュ装置 4側のメモリ ァドレス) をキャッシュ装置 4への転送指示に添付してそのままキャッシュ装置 4に送付し (ステップ S 2' ) キャッシュ装置 4は、 このように制御装置 2側か ら送られてきた情報から、 クライアント 7側との会話に必要なメッセ一ジ ( R D MAメッセージ及び応答メッセージ等) をプロトコルハンドラ 43により独自に 生成し、 要求のあったファイル Aのクライアント 7への転送処理を行なうのであ る (ステップ S 3 ' , S 4' )o
(4) 変形例 2
同様に、 図 6により上述した例においても、 応答メッセージ 51及び RDMA メッセージ 52は、 制御装置 2側ではなく、 ストレ一ジ装置 3側で作成するよう にしてもよい。
即ち、 図 8に示すように、 制御装置 2 (DAFSプロトコルハンドラ 21-1) は、 アクセス要求のあったファイル Bについてのストレージアクセス情報 5 3を ストレージ装置 3への転送指示に添付してそのままストレージ装置 3に送付し (ステップ S 1 2 ' )、ストレージ装置 3は、 このように制御装置 2側から送られ てきた情報 5 3を基にディスク装置 3 1からファイル Bを読み出し (ステップ S 1 3 )、クライアント 7側との会話に必要なメッセージ(R DMAメッセージ及び 応答メッセージ等) をプロトコル変換部 3 4により独自に生成して、 要求のあつ たファイル Bのクライアント 7への転送処理を行なうのである (ステップ S 1 4 ', S 1 5 ' )。
以上の変形例 1及び変形例 2のようにすることで、 制御装置 2の処理負荷をキ ャッシュ装置 4又はストレ一ジ装置 3に分散することができるので、 例えば、 制 御装置 2に要求される性能を抑制して制御装置の小型化, 低コスト化を図って、 安価にシステム 1を構築できることが期待される。
( 5 ) 変形例 3
また、 図 5により前述した例において、 制御装置 2は、 キャッシュ装置 4に対 して、 R D MAメッセ一ジ 5 2を伴うファイル Aについての転送指示のみを送付 してキャッシュ装置 4にクライアント 7に対する R DMAを行なわせ、 それ以外 の処理 (応答メッセ一ジ 5 1の生成 ·送付) は制御装置 2が行なうようにするこ ともできる。
即ち、 図 9に示すように、 制御装置 2 (D A F Sプロトコルハンドラ 2 1— 1 ) は、 クライアント 7からファイル Aについてのアクセス要求を受けると (ステツ プ S 1 )、 D A F Sプロトコルハンドラ 2 1一 1力 キャッシュ装置 4がクライア ント 7と直接会話を行なってデータ転送を行なうのに必要なメッセージとして R D MAメッセ一ジ 5 2を生成して、 ファイル Aの転送指示とともにキャッシュ装 置 4に対して送信する (ステップ S 2 1 )。 なお、 この場合も、 R D MAメッセ一 ジ 5 2には、 少なくとも、 キャッシュ装置 4側のファイル Aの格納位置 (メモリ アドレス) とファイル Aのサイズ情報 (セクタ範囲) とが格納される。
そして、 キャッシュ装置 4は、 制御装置 2から上記の転送指示を受けると、 プ 口トコルハンドラ 4 3が、その内容を解析し、メモリ領域管理部 4 2と協同して、 上記の R DMAメッセージ 5 2により指定された格納位置から目的のファイル A を読み出し、 RDMAメッセージにより I Bネットワーク 5経由でクライアント 7にダイレクトに転送する (ステップ S 22)。
転送が終わると、 プロトコルハンドラ 43は、 制御装置 2宛の確認メッセージ (Acknowledgement Message) を生成して、 I Bネッ卜ワーク 5経由で制御装 置 2に送付する(ステップ S 23)。 この確認メッセージを受信した制御装置 2で は、 DAF Sプロトコルハンドラ 21— 1が、 クライアント 7宛の応答メッセ一 ジ 51を生成して、 I Bネットワーク 5経由でクライアント 7へ送信する (ステ ップ S 24)。
(6) 変形例 4
同様に、 図 6により前述した例においても、 制御装置 2は、 ストレ一ジ装置 3 に対して、 RDMAメッセ一ジ 52とストレージアクセス情報 53とを伴うファ ィル Bについての転送指示のみを送付してストレージ装置 3にクライアント 7に 対する RDM Aを行なわせ、 それ以外の処理(応答メッセ一ジ 51の生成 ·送付) は制御装置 2が行なうことも可能である。
即ち、 図 10に示すように、 クライアント 7から制御装置 2に対してファイル Bについてのアクセス要求があると (ステップ S 1 1)、 制御装置 2では、 DAF Sプロトコルハンドラ 21— 1が、 受信メッセ一ジを解析し、 仮想ストレ一ジ管 理部 21—4と協同して、 要求のあったファイル Bを保存しているストレージ装 置 3 (ディスク装置 31) を特定する。
そして、 DAFSプロトコルハンドラ 21— 1は、 特定したストレ一ジ装置 3 に対して、 RDMAメッセージ 52とストレージアクセス情報 53とをファイル Bの転送指示に添付してストレ一ジ装置 3へ送信する(ステップ S 21 ' )。なお、 この場合も、 ストレ一ジアクセス情報 53には、 ファイル Bのディスク装置 31 における先頭セクタ位置, サイズなどの情報が格納される。
ストレージ装置 3は、 制御装置 2から上記の転送指示を受けると、 プロトコル 変換部 34が、 その転送指示を解釈し、 そのメッセージ内容に応じて SCS Iィ ン夕フェース 35が、 上記ストレ一ジアクセス情報 53に基づいて該当ディスク 装置 31にアクセスして、 上記の先頭セクタ位置, サイズなどの情報により特定 されるファイル Bをディスク装置 31から読み出す (ステップ S 22' )。 そして、 SCS Iインタフェース 35は、そのアクセス結果 (ファイル B)を、 プロトコル変換部 34, TCA33を通じてクライアント 7側に RDMAメッセ ージにより I Bネットワーク 5経由で直接転送する(ステップ S 23' )。 この転 送が終わると、 プロトコル変換部 34は、 その旨を確認メッセージにより I Bネ ットワーク 5経由で制御装置 2に通知し (ステップ S 24' ), この通知(確認メ ッセージ) を受けることにより、 制御装置 2は、 DAFSプロトコルハンドラ 2 1- 1によってクライアント 7宛の応答メッセージ 51を生成して、 I Bネット ワーク 5経由でクライアント 7に送信する (ステップ S 25' )。
以上の変形例 3及び変形例 4のように、 クライアント 7との会話に必要なメッ セージの生成を部分的にキヤッシュ装置 4又はストレージ装置 3に分担させるこ とでも、 図 5及び図 6の場合に比して、 制御装置 2の処理負荷をキャッシュ装置 4又はストレージ装置 3に分散することが可能である。
(7) 変形例 5
次に、 ここでは、 本システム 1において、 データの信頼性向上を目的として、 複数のキャッシュ装置 4が同じデータを冗長に保持する(いわゆる、 「ミラーリン グ」) を行なう場合の転送処理について説明する。
図 11に示すように、 例えば、 クライアント 7から制御装置 2に対して I Bネ ットワーク 5経由でファイル Aについてのアクセス要求 (書き込み要求) があつ たとする (ステップ S 31)。
制御装置 2では、 上記のアクセス要求を受信すると、 DAFSプロトコルハン ドラ 21— 1が、 受信メッセージを解析し、 仮想ストレージ管理部 21— 4と協 同して、 要求のあったファイル Aを保存すべきキャッシュ装置 4 A及び 4 Bを特 定 (選択) する。 そして、 DAFSプロトコルハンドラ 21— 1は、 キャッシュ 装置 4 A及び 4 Bのそれぞれについて、 クライアント 7との通信に必要なメッセ —ジ (応答メッセージ 51や R DMAメッセージ 52) を生成し、 それぞれを転 送指示に添付してキャッシュ装置 4 A及び 4 Bに送付する(ステップ S 32)。な お、 この場合、 各 RDMAメッセージ 52には、 ファイル Aを保持すべきキヤッ シュ装置 4 A及び 4 B側のメモリアドレス, サイズ情報などが必要である。 キャッシュ装置 4 A及び 4 Bでは、 それぞれ、 上述のごとく制御装置 2から送 られてくる転送指示を受信すると、 プロトコルハンドラ 4 3が、 その内容を解析 し、 メモリ領域管理部 4 2と協同して、 制御装置 2から受信した R DMAメッセ ージ 5 2を用いて I Bネットワーク 5経由でファイル Aをクライアント 7からダ ィレクトに受信してそれぞれのメモリ 4 4に書き込む (ステップ S 3 3 )。
その後、 クライアント 7から各キャッシュ装置 4 A及び 4 Bに対する R DMA が終了すると、 各キャッシュ装置 4 A及び 4 Bのプロトコルハンドラ 4 3は、 制 御装置 2から受信した応答メッセージ 5 1によりクライアント 7に応答を返し (ステップ S 3 4 )、 クライアント 7側では、全てのキャッシュ装置 4 A及び 4 B からの応答があった時点で転送 (ミラ一リング) 完了とする。
以上のように、 本変形例によれば、 ミラーリングを行なう際にも、 各キヤッシ ュ装置 4が、 それぞれ、 制御装置 2からの転送指示に従ってクライアント 7との 間でデータ転送に必要な会話 (メッセージの送受) を行なって、 クライアント 7 と複数のキャッシュ装置 4との間で、 制御装置 2を経由せずに直接、 実際のデー 夕転送と応答処理とを行なうので、 本システム 1のレイテンシの削減及びデータ スループットの向上を図りながら、 信頼性の向上をも図ることができる。
なお、 上述した例において、 1つでも応答を返してきたキャッシュ装置 4 A又 は 4 Bがあれば、 その時点で転送完了としてもよい。 この場合は、 全てのキヤッ シュ装置 4が応答メッセージをクライアント 7に送付する必要はないことになる ので、 応答メッセ一ジ 5 1と R DMAメッセ一ジ 5 2の双方を送付するのは一部 のキャッシュ装置 4のみとし、 残りのキャッシュ装置 4には、 R D MAメッセ一 ジ 5 2のみを送付するようにしてもよい。
即ち、 例えば図 1 2に示すように、 クライアント 7からファイル Aについての アクセス要求を制御装置 2が受けると、 制御装置 2から一方のキャッシュ装置 4 Aには、 応答メッセージ 5 1と R D MAメッセ一ジ 5 2の双方を添付した転送指 示を送信し(ステップ S 3 2 )、残りのキャッシュ装置 4 Bには R DMAメッセ一 ジ 5 2のみを添付した転送指示を送信するのである (ステップ S 3 2 ' )。
これにより、 クライアント 7に対する各キャッシュ装置 4 A及び 4 Bからのフ アイル Aについての R D MAが行なわれた (ステップ S 3 3 ) 後、 制御装置 2か ら応答メッセージ 5 1を受信したキャッシュ装置 4 Aのみが、 クライアント 7に 対して応答メッセージ 51を送信することになる (ステップ S 34)。
以上のようにすることで、 制御装置 2の処理負荷を軽減することができるとと もに、 一部ではあるがキヤッシュ装置 4の処理負荷も軽減することができる。
(8) 変形例 6
次に、 ここでは、 「ミラ一リング」 時の転送処理の変形例について説明する。 こ の場合、 制御装置 2は、 全てのキャッシュ装置 4に対して転送指示を出さず、 一 部のキャッシュ装置 4に対してのみ転送指示を出し、 そのキャッシュ装置 4から 他のキャッシュ装置 4に同じデ一夕をコピーすることで、 ミラ一リングを実現す る。
即ち、 図 13に示すように、 クライアント 7から制御装置 2に対してファイル Aについてのアクセス要求 (書き込み要求)があったとすると(ステップ S 41)、 制御装置 2では、 DAFSプロトコルハンドラ 21— 1が、 例えば、 クライアン 卜 7からキャッシュ装置 4 Aがファイル Aを受け取るための転送指示を I Bネッ トワーク 5経由でキャッシュ装置 4 Aに発行する (ステップ S 42)。
この際、 DAFSプロトコルハンドラ 21— 1は、 応答メッセージ 51と RD MAメッセ一ジ 52とを生成するとともに、 ファイル Aのコピ一先であるキヤッ シュ装置 4 Bのァドレス情報 54を生成し、 これらを上記キャッシュ装置 4 A宛 の転送指示に添付する。 なお、 この場合も、 RDMAメッセージ 52には、 キヤ ッシュ装置 4側のメモリアドレスやファイル Aのサイズ情報が必要である。
そして、 制御装置 2から上記転送指示を受け取ったキャッシュ装置 4 Aは、 制 御装置 2側で生成された RDMAメッセージ 52によりクライアント 7からのフ アイル Aの転送を受け(ステップ S 43)、転送が完了すると制御装置 2から受け 取った応答メッセージ 53によりクライアント 7に応答を返す(ステップ S 44)。 この際、 キャッシュ装置 4Aは、 制御装置 2から受信した上記のアドレス情報 5 4に基づいてコピー先のキャッシュ装置 4 Bを特定し、 そのキャッシュ装置 4 B のメモリ 44にクライアント 7から受信したファイル Aをコピーする (ステップ S 44)o なお、 このコピーも RDMAにより行なうことができる。
以上のようにすることで、 システム 1内でやりとりされるメッセージ数が削減 されるので、 システム 1の信頼性を向上させるための 「ミラーリング」 を、 シス テム 1のデ一夕スループット低下を招くことなく実現することができる。
( 9 ) 変形例 7
図 1 1〜図 1 3により上述したように、 複数のキャッシュ装置 4で 「ミラーリ ング」 を行なう場合は、 或る時期に、 一部のキャッシュ装置 4で冗長に保持して いるデ一夕をストレ一ジ装置 3に移して、 キャッシュ装置 4のメモリ 4 4のメモ リ領域を解放することもできる。
即ち、 例えば図 1 4に示すように、 制御装置 2は、 或る時期に、 同じファイル Aを冗長に保持しているキャッシュ装置 4 A及び 4 Bの一部 (ここでは、 キヤッ シュ装置 4 A) に対して、 ファイル Aのストレ一ジ装置 3への転送指示を発行す る (ステップ S 5 D o 勿論、 この際、 上記転送指示には、 転送先であるストレー ジ装置 3及びディスク装置 3 1を特定する情報が添付される。
この転送指示を受けたキャッシュ装置 4 Aは、 R DMAによりファイル Aをス トレージ装置 3のディスク装置 3 1に転送し(ステップ S 5 2 )、転送が完了する と、その旨を確認メッセージにより制御装置 2に通知し (ステップ S 5 3 )、冗長 に保存していたファイル Aをメモリ 4 4から削除してメモリ領域を解放する (ス テツプ 5 4 )。
このようにすることで、 例えば、 アクセス頻度の少ない冗長データはキヤッシ ュ装置 4からストレ一ジ装置 3へ退避させて、 アクセス頻度の高い冗長データを 優先的にキャッシュ装置 4に残すような制御が可能となる。 したがって、 キヤッ シュ装置 4のメモリ容量を最大限に有効活用することができ、 ミラ一リングを行 なう場合でも、 キャッシュ装置 4に必要なメモリ容量を抑制することができる。
( 1 0 ) その他
なお、 本発明は上述した実施形態に限定されるものではなく、 本発明の趣旨を 逸脱しない範囲で種々変形して実施することができることはいうまでもない。 例えば、 上述した実施形態では、 クライアント 7からの I Bネットワーク 5経 由のアクセス要求が D A F Sに基づくことを前提としているが、 他のプロトコル 〔例えば、 S R P (SCSI RDMA Protocol) ] に基づくものでも、 上記と同様の作 用効果を得ることができる。
また、 I Bネットワーク 5内でやりとりされる各種メッセージのフォーマツト については適宜変更可能である。 産業上の利用可能性
以上のように、 本発明によれば、 ストレージシステム内のキャッシュ装置 (又 はストレ一ジ装置) が、 制御装置からの指示に従ってクライアント装置とデ一夕 転送に必要な会話を直接行なってデータ転送を直接行なうので、 システムのレイ テンシを削減できるとともに、 そのデータスループットを大幅に向上することが でき、 例えば、 高速且つ高性能なデータセンター等を構築することができ、 その 有用性は極めて高いものと考えられる。

Claims

請 求 の 範 囲
1. データを記憶するストレ一ジ装置 (3) と、
該ストレ一ジ装置 (3) に記憶されている該デ一夕をキャッシュしうるキヤッ シュ装置 (4) と、
少なくとも、 上記のストレージ装置 (3) 及びキャッシュ装置 (4) に対する アクセスを制御する制御装置 (2) と、
上記のストレージ装置 (3), キャッシュ装置 (4) 及び制御装置 (2) を相互 に通信可能に接続する内部ネットワーク (5) とをそなえるとともに、
該制御装置 (2) が、
該内部ネットワーク (5) にアクセス可能に接続されたクライアント装置(7) から該内部ネットワーク (5) を介して送られてくるアクセス要求を受けると、 該キャッシュ装置 (4) 又は該ストレ一ジ装置 (3) にデータ転送指示を発行す る転送指示発行手段 (21— 1) をそなえ、 且つ、
少なくとも、 該データ転送指示を受信する該ストレージ装置 (3) 又はキヤッ シュ装置 (4) が、
該制御装置 (2) からの該デ一夕転送指示に従って該クライアント装置 (7) とデータ転送に必要な会話を直接行なって、該クライアント装置(7)との間で、 直接、 データ転送を実行する直接転送手段 (34又は 43) をそなえたことを特 徴とする、 ストレージシステム。
2. デ一夕を記憶するストレ一ジ装置 (3) と、 該ストレ一ジ装置 (3) に記 憶されている該データをキャッシュしうるキャッシュ装置 (4) と、 少なくとも 上記のストレ一ジ装置 (3) 及びキャッシュ装置 (4) に対するアクセスを制御 する制御装置 (2) と、 上記のストレージ装置 (3), キャッシュ装置 (4) 及び 制御装置 (2) を相互に通信可能に接続する内部ネットワーク (5) とをそなえ たストレージシステムにおけるデ一夕転送方法であって、
該内部ネットワーク (5) にアクセス可能に接続されたクライアント装置(7) が、 該内部ネットワーク (5) を介して該制御装置 (2) にアクセス要求を発行 するアクセス要求発行ステップ (S 1) と、
該制御装置 (2) が、 該アクセス要求を受けると、 該キャッシュ装置 (4) 又 は該ストレ一ジ装置( 3 )にデータ転送指示を発行する転送指示発行ステツプ(S 2) と、 .
該キャッシュ装置 (4) 又は該ストレ一ジ装置 (3) が、 該制御装置 (2) か らの該データ転送指示に従って該クライアント装置 (7) とデータ転送に必要な 会話を直接行なって、 該クライアント装置 (7) との間で、 直接、 データ転送を 実行する直接転送ステップ (S 3) とをそなえたこと特徴とする、 ストレ一ジシ ステムにおけるデータ転送方法。
3. 該転送指示発行ステップ (S 2) において、 該制御装置 (2) が、 該クラ イアント装置 (7) と該キャッシュ装置 (4) との間の該会話のためのメッセ一 ジを生成して該デ一夕転送指示とともに該キャッシュ装置 (4) に送信し、 該デ一夕転送ステップ (S 3) において、 該キャッシュ装置 (4) が、 該制御 装置 (2) で生成された該メッセ一ジを用いて該クライアント装置 (7) との間 のデータ転送を実行することを特徴とする、 請求の範囲第 2項に記載のストレ一 ジシステムにおけるデータ転送方法。
4. 該転送指示発行ステップ (S 2) において、 該制御装置 (2) が、 該クラ イアント装置 (7) と該ストレージ装置 (3) との間の該会話のためのメッセ一 ジを生成して該データ転送指示とともに該ストレ一ジ装置 (3) に送信し、 該直接転送ステップ (S 3) において、 該ストレ一ジ装置 (3) が、 該制御装 置 (2) で生成された該メッセージを用いて該クライアント装置 (7) との間の データ転送を実行することを特徴とする、 請求の範囲第 2項に記載のストレ一ジ システムにおけるデータ転送方法。
5. 該転送指示発行ステップ (S 3) において、 該制御装置 (2) が、 該クラ イアント装置 (7) と該キャッシュ装置 (4) との間の該会話のためのメッセ一 ジを生成するのに必要なメッセージ情報を該データ転送指示とともに該キヤッシ ュ装置 (4) に送信し、
該直接転送ステップ (S 3) において、 該キャッシュ装置 (4) が、 該制御装 置(2)から送信されてきた該メッセ一ジ情報に基づいて該メッセージを生成し、 当該メッセージを用いて該クライアント装置 (7) との間のデ一夕転送を実行す ることを特徴とする、 請求の範囲第 2項に記載のストレ一ジシステムにおけるデ 一夕転送方法。
6. 該転送指示発行ステップ (S 2) において、 該制御装置 (2) が、 該クラ イアント装置 (7) と該ストレ一ジ装置 (3) との間の該会話のためのメッセ一 ジを生成するのに必要なメッセージ情報を該デー夕転送指示とともに該キヤッシ ュ装置 (4) に送信し、
該直接転送ステップ (S 3) において、 該ストレ一ジ装置 (3) が、 該制御装 置(2)から送信されてきた該メッセージ情報に基づいて該メッセージを生成し、 当該メッセージを用いて該クライアント装置 (7) との間のデ一夕転送を実行す ることを特徴とする、 請求の範囲第 2項に記載のストレージシステムにおけるデ —タ転送方法。
7. 該直接転送ステップ (S 3) によるデータ転送が完了すると、 該キヤッシ ュ装置 (4) が該内部ネットワーク (5) を介して該制御装置 (2) へ確認メッ セージを発行し、
該制御装置 (2) が、 該キャッシュ装置 (4) から該確認メッセージを受ける ことにより該内部ネットワーク (5) を介して該クライアント装置 (7) に対し てデータ転送完了を表す応答メッセ一ジを発行することを特徴とする、 請求の範 囲第 3項又は第 5項に記載のストレ一ジシステムにおけるデ一夕転送方法。
8. 該直接転送ステップ (S 3) によるデータ転送が完了すると、 該ストレー ジ装置 (3) が該内部ネットワーク (5) を介して該制御装置 (2) へ確認メッ セージを発行し、
該制御装置 (2) が、 該ストレ一ジ装置 (3) から該確認メッセージを受ける ことにより該内部ネットワーク (5) を介して該クライアント装置 (7) に対し てデ一夕転送完了を表す応答メッセージを発行することを特徴とする、 請求の範 囲第 4項又は第 6項に記載のストレ一ジシステムにおけるデ一夕転送方法。
9. 該キャッシュ装置 (4) が 2台以上存在する場合に、
該転送指示発行ステップ (S 2) において、 該制御装置 (2) が、 該クライア ン卜装置 (7) と上記の各キャッシュ装置 (4八及び4;6) との間の該会話に必 要なメッセ一ジを生成して該デ一夕転送指示とともに該キャッシュ装置 (4) に それぞれ送信し、
該直接転送ステップ(S 3) において、該キャッシュ装置(4 A及び 4 B)が、 それぞれ、 該制御装置 (2) で生成された該メッセージを用いて該クライアント 装置 (7) との間のデータ転送を実行し、
その後、 該キャッシュ装置 (4八及び4 ) のいずれかが該データ転送の完了 を示す応答メッセージを、 該内部ネットワーク (5) を介して該クライアント装 置 (7) へ送信することを特徴とする、 請求の範囲第 2項に記載のストレージシ ステムにおけるデータ転送方法。
10. 該キャッシュ装置 (4) が 2台以上存在する場合に、
該転送指示発行ステップ (S 2) において、 該制御装置 (2) が、 該クライア ント装置 (7) と上記の各キャッシュ装置 (4A及び 4B) との間の該会話に必 要なメッセージを生成して該デー夕転送依頼とともに該キャッシュ装置 ( 4 A及 び 4B) にそれぞれ送信し、
該直接転送ステップ(S 3) において、該キャッシュ装置(4A及び 4B)が、 それぞれ、 該制御装置 (2) で生成された該メッセージを用いて該クライアント 装置 (7) との間のデータ転送を実行し、
その後、 上記の各キャッシュ装置 (4 A及び 4 B) がそれぞれ該デ一夕転送の 完了を示す応答メッセージを、 該内部ネットワーク (5) を介して該クライアン 卜装置 (7) へ送信し、
該クライアント装置 (7) は、 上記の各キャッシュ装置 (4八及び48) から の該応答メッセージを受信することにより、 該デ一夕転送を完了とすることを特 徵とする、 請求の範囲第 2項に記載のストレージシステムにおけるデータ転送方 法。
11. 該キャッシュ装置 (4) が 2台以上存在する場合に、
該転送指示発行ステップ (S 2) において、 該制御装置 (2) が、 該クライア ント装置 (7) と該キャッシュ装置 (4A及び 4B) のいずれかとの間の該会話 に必要なメッセージを生成して該データ転送指示とともに該キャッシュ装置(4) にそれぞれ送信するとともに、 データコピー先キヤッシュ装置情報を当該キヤッ シュ装置 (4A) に送信し、
該直接転送ステップ (S 3) において、 該キャッシュ装置 (4A) が、 該制御 装置 (2) から受信した該メッセージを用いて該クライアント装置 (7) との間 のデータ転送を実行し、
その後、 該キャッシュ装置 (4A) が、 該制御装置 (2) から受信した該デ一 タコピ一先キヤッシュ装置情報により特定される他のキヤッシュ装置(4 B)に、 受信した該デ一夕をコピーすることを特徴とする、 請求の範囲第 2項に記載のス トレージシステムにおけるデータ転送方法。
12. 該制御装置 (2) が、 同じデータをキャッシュしているキャッシュ装置 (4 A及び 4 B) のいずれかに当該データを該ストレージ装置 (3) へ転送する よう指示し、
該指示を受けたキャッシュ装置( 4 A)は、該デー夕を該内部ネットワーク( 5 ) 経由で該ストレージ装置 (3) へ転送して、 他のキャッシュ装置 (4B) とで冗 長に保持していた該データを削除して自己のメモリ領域を解放することを特徴と する、 請求の範囲第 9項〜第 11項のいずれか 1項に記載のストレージシステム におけるデ一夕転送方法。
PCT/JP2002/002063 2002-03-06 2002-03-06 Systeme de stockage et procede de transfert de donnees dans ledit systeme WO2003075166A1 (fr)

Priority Applications (6)

Application Number Priority Date Filing Date Title
PCT/JP2002/002063 WO2003075166A1 (fr) 2002-03-06 2002-03-06 Systeme de stockage et procede de transfert de donnees dans ledit systeme
JP2003573537A JP4235712B2 (ja) 2002-03-06 2002-08-20 ストレージシステムにおけるデータ転送方法
EP02758854A EP1498809B1 (en) 2002-03-06 2002-08-20 Storage system and data transfer method for the system
PCT/JP2002/008359 WO2003075147A1 (fr) 2002-03-06 2002-08-20 Systeme memoire et procede et transfert de donnees pour un tel systeme
US10/932,059 US20050038850A1 (en) 2002-03-06 2004-09-02 Storage system, and data transfer method for use in the system
GBGB0420351.9A GB0420351D0 (en) 2002-03-06 2004-09-13 Storage system and data transfer method for the system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2002/002063 WO2003075166A1 (fr) 2002-03-06 2002-03-06 Systeme de stockage et procede de transfert de donnees dans ledit systeme

Publications (1)

Publication Number Publication Date
WO2003075166A1 true WO2003075166A1 (fr) 2003-09-12

Family

ID=27773232

Family Applications (2)

Application Number Title Priority Date Filing Date
PCT/JP2002/002063 WO2003075166A1 (fr) 2002-03-06 2002-03-06 Systeme de stockage et procede de transfert de donnees dans ledit systeme
PCT/JP2002/008359 WO2003075147A1 (fr) 2002-03-06 2002-08-20 Systeme memoire et procede et transfert de donnees pour un tel systeme

Family Applications After (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/008359 WO2003075147A1 (fr) 2002-03-06 2002-08-20 Systeme memoire et procede et transfert de donnees pour un tel systeme

Country Status (5)

Country Link
US (1) US20050038850A1 (ja)
EP (1) EP1498809B1 (ja)
JP (1) JP4235712B2 (ja)
GB (1) GB0420351D0 (ja)
WO (2) WO2003075166A1 (ja)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185118A (ja) * 2004-12-27 2006-07-13 Tb Tech Co Ltd ストレージ管理
CN100342352C (zh) * 2005-03-14 2007-10-10 北京邦诺存储科技有限公司 一种可扩充的高速存储网络缓存系统
WO2006116203A1 (en) 2005-04-25 2006-11-02 Network Appliance, Inc. System and method for caching network file systems
JP2008009829A (ja) 2006-06-30 2008-01-17 Fujitsu Ltd ストレージ制御プログラム、ストレージ制御装置、ストレージ制御方法
US8099452B2 (en) * 2006-09-05 2012-01-17 Microsoft Corporation Event stream conditioning
JP2010102479A (ja) * 2008-10-23 2010-05-06 Hitachi Ltd 計算機システム、ストレージ装置及びデータ更新方法
JP5428374B2 (ja) * 2009-02-17 2014-02-26 日本電気株式会社 分散データ収集システム及び分散データ収集方法
TWI371686B (en) * 2009-04-02 2012-09-01 Lsi Corp System and method to reduce drive overhead using a mirrored cache volume in a storage array
NL2005918C2 (en) * 2010-12-23 2012-06-27 Geobrand B V Method and system for executing an application on a pda terminal.
US8996800B2 (en) * 2011-07-07 2015-03-31 Atlantis Computing, Inc. Deduplication of virtual machine files in a virtualized desktop environment
US9277010B2 (en) 2012-12-21 2016-03-01 Atlantis Computing, Inc. Systems and apparatuses for aggregating nodes to form an aggregated virtual storage for a virtualized desktop environment
US9069472B2 (en) 2012-12-21 2015-06-30 Atlantis Computing, Inc. Method for dispersing and collating I/O's from virtual machines for parallelization of I/O access and redundancy of storing virtual machine data
US9250946B2 (en) 2013-02-12 2016-02-02 Atlantis Computing, Inc. Efficient provisioning of cloned virtual machine images using deduplication metadata
US9471590B2 (en) 2013-02-12 2016-10-18 Atlantis Computing, Inc. Method and apparatus for replicating virtual machine images using deduplication metadata
US9372865B2 (en) 2013-02-12 2016-06-21 Atlantis Computing, Inc. Deduplication metadata access in deduplication file system
US10237347B2 (en) 2015-06-08 2019-03-19 Excelero Storage Ltd. System and method for providing a client device seamless access to a plurality of remote storage devices presented as a virtual device
US10979503B2 (en) 2014-07-30 2021-04-13 Excelero Storage Ltd. System and method for improved storage access in multi core system
US10936200B2 (en) 2014-07-30 2021-03-02 Excelero Storage Ltd. System and method for improved RDMA techniques for multi-host network interface controllers
JP2018502385A (ja) 2014-12-08 2018-01-25 アンブラ テクノロジーズ リミテッドUmbra Technologies Ltd. 遠隔ネットワークリージョンからのコンテンツ検索のためのシステム及び方法
CN113225369A (zh) 2015-01-06 2021-08-06 安博科技有限公司 用于中立应用程序编程接口的系统和方法
US10630505B2 (en) 2015-01-28 2020-04-21 Umbra Technologies Ltd. System and method for a global virtual network
CN114079669A (zh) 2015-04-07 2022-02-22 安博科技有限公司 用于提供全局虚拟网络(gvn)的系统和方法
US11558347B2 (en) 2015-06-11 2023-01-17 Umbra Technologies Ltd. System and method for network tapestry multiprotocol integration
CN114726847A (zh) * 2015-12-11 2022-07-08 安博科技有限公司 用于网络挂毯和瞬间粒度上的信息弹弓的系统和方法
EP3449397B1 (en) 2016-04-26 2022-12-07 Umbra Technologies Ltd. Sling-routing logic and load balancing
US10564986B2 (en) * 2016-12-22 2020-02-18 Intel Corporation Methods and apparatus to suspend and resume computing systems
JP7347157B2 (ja) 2019-11-22 2023-09-20 富士通株式会社 情報処理システム、ストレージ制御プログラム、及び、ストレージ制御装置
US11392306B2 (en) * 2020-05-01 2022-07-19 EMC IP Holding Company LLC Using storage system memory as host memory

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5734859A (en) * 1993-10-14 1998-03-31 Fujitsu Limited Disk cache apparatus having selectable performance modes
US6092170A (en) * 1996-11-29 2000-07-18 Mitsubishi Denki Kabushiki Kaisha Data transfer apparatus between devices
JP2001175582A (ja) * 1999-12-15 2001-06-29 Hitachi Ltd ディスク制御装置
JP2001184294A (ja) * 1999-12-24 2001-07-06 Hitachi Ltd ファイルアクセス方法とこれを用いた情報処理システム
JP2002023960A (ja) * 2000-06-30 2002-01-25 Toshiba Corp ディスク装置及び同装置を複数備えた計算機システム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05308366A (ja) * 1992-05-06 1993-11-19 Ricoh Co Ltd Lanにおけるキャッシュシステム
US5463772A (en) * 1993-04-23 1995-10-31 Hewlett-Packard Company Transparent peripheral file systems with on-board compression, decompression, and space management
US6219693B1 (en) * 1997-11-04 2001-04-17 Adaptec, Inc. File array storage architecture having file system distributed across a data processing platform
JP4192416B2 (ja) * 2000-06-08 2008-12-10 株式会社日立製作所 計算機システムおよびそのデータ転送方法
US6804673B2 (en) * 2001-04-19 2004-10-12 Fujitsu Limited Access assurance for remote memory access over network

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5734859A (en) * 1993-10-14 1998-03-31 Fujitsu Limited Disk cache apparatus having selectable performance modes
US6092170A (en) * 1996-11-29 2000-07-18 Mitsubishi Denki Kabushiki Kaisha Data transfer apparatus between devices
JP2001175582A (ja) * 1999-12-15 2001-06-29 Hitachi Ltd ディスク制御装置
JP2001184294A (ja) * 1999-12-24 2001-07-06 Hitachi Ltd ファイルアクセス方法とこれを用いた情報処理システム
JP2002023960A (ja) * 2000-06-30 2002-01-25 Toshiba Corp ディスク装置及び同装置を複数備えた計算機システム

Also Published As

Publication number Publication date
WO2003075147A1 (fr) 2003-09-12
EP1498809B1 (en) 2008-06-18
EP1498809A4 (en) 2007-05-23
JP4235712B2 (ja) 2009-03-11
EP1498809A1 (en) 2005-01-19
US20050038850A1 (en) 2005-02-17
GB0420351D0 (en) 2004-10-13
JPWO2003075147A1 (ja) 2005-06-30

Similar Documents

Publication Publication Date Title
WO2003075166A1 (fr) Systeme de stockage et procede de transfert de donnees dans ledit systeme
US10838665B2 (en) Method, device, and system for buffering data for read/write commands in NVME over fabric architecture
US9513825B2 (en) Storage system having a channel control function using a plurality of processors
JP4303688B2 (ja) データアクセス応答システムおよびデータアクセス応答システムへのアクセス方法
US7209986B2 (en) Method for controlling storage system, and storage control apparatus
US7340551B2 (en) Bridge permitting access by multiple hosts to a single ported storage drive
WO2013170731A1 (zh) 将数据写入存储设备的方法与存储设备
JP2002149592A (ja) ネットワーク上でのpciブリッジ
JPH02103649A (ja) 制御装置および情報処理システム
JP2021128802A (ja) 情報処理システム、ストレージシステム及びデータ転送方法
JP4100256B2 (ja) 通信方法および情報処理装置
US7774514B2 (en) Method of transmitting data between storage virtualization controllers and storage virtualization controller designed to implement the method
WO2013152593A1 (zh) 数据处理方法及装置
JP2009175824A (ja) メインフレーム用記憶制御装置及びメインフレーム用ボリュームの仮想化方法
JP2003044421A (ja) 仮想ストレージシステム及び同システムに使用されるスイッチングノード
KR100449806B1 (ko) 네트워크를 통해 스트리밍 데이터를 고속으로 송수신하기위한 네트워크-스토리지 연결 장치
JP5102917B2 (ja) ストレージ装置及びアクセス命令送信方法
JP2005157867A (ja) 記憶システム、記憶制御装置及び記憶制御装置を用いたデータ中継方法
JP4439798B2 (ja) ディスクアレイ装置の制御方法、及びディスクアレイ装置
WO2003065195A1 (fr) Systeme de stockage, programme de commande de stockage, procede de commande de stockage
US11474751B2 (en) Storage apparatus and data processing method therefor
US11880570B1 (en) Storage system, data transmission method, and network interface
TWI829080B (zh) 具有雙儲存虛擬化控制器之資料儲存系統架構及其資料存取方法
CN110347535B (zh) 一种提升双控制器写性能的方法
JP2005346426A (ja) データ共有ディスク装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP