WO2014155654A1 - Information processing device, and information processing device replacement assistance system and replacement assistance method - Google Patents
Information processing device, and information processing device replacement assistance system and replacement assistance method Download PDFInfo
- Publication number
- WO2014155654A1 WO2014155654A1 PCT/JP2013/059466 JP2013059466W WO2014155654A1 WO 2014155654 A1 WO2014155654 A1 WO 2014155654A1 JP 2013059466 W JP2013059466 W JP 2013059466W WO 2014155654 A1 WO2014155654 A1 WO 2014155654A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- information processing
- file
- processing apparatus
- management table
- storage
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
- G06F3/0607—Improving or facilitating administration, e.g. storage management by facilitating the process of upgrading existing storage systems, e.g. for improving compatibility between host and storage device
Definitions
- the present invention relates to an information processing apparatus, an information processing apparatus replacement support system, and a replacement method, and more particularly to an information processing apparatus that includes a storage and is used as a distributed cloud that provides an application via a network.
- the present invention relates to a support system and method for exchanging devices.
- Information processing devices that require high availability, such as servers, have a redundant system configuration and perform regular maintenance in preparation for failures or failures due to external factors.
- One of the maintenance tasks is the work of replacing a failed part or the entire device. Since the storage composed of hard disks has a mechanical mechanism, the failure occurrence rate is high, and various technologies for increasing availability such as RAID (Redundant Arrays of Independent Disks) are known. Therefore, the storage hard disk is replaced relatively frequently, and the entire apparatus may be replaced in addition to RAID reconfiguration in units of parts. In the exchange of a device having a storage, it is necessary to copy the storage data in the device to the storage of the new device.
- Storage copy methods can be roughly divided into two methods. One is a method of copying at a remote location, and the other is a method of bringing a new device to a customer and copying it.
- Patent Document 1 An example of a method of copying at a remote location is shown in Patent Document 1.
- the storage system includes a primary storage system at a user site, a secondary storage system via a network, and a replacement storage system at another site via the network.
- the user site shuts down, copy from the primary storage to the secondary storage, make the contents identical, and if the primary storage failure is found, copy the secondary storage data to the replacement storage in another location How to do is shown.
- By copying all normal shutdown disk images to the replacement storage remotely for example, when a failure occurs in the primary storage, an alternative storage is prepared at night, and the primary storage is replaced the next morning. Yes.
- Patent Document 2 An example of a method of copying at a customer site is shown in Patent Document 2.
- the new device accesses the storage of the original device and continues the service, while the original device is in the background. Shows how to copy all of the storage to a new device.
- the replacement is completed by disconnecting the original device.
- the form of computing may be determined depending on the performance and cost of the external network.
- the external network is composed of a core network of the backbone network and an access network of the edge network. With the spread of optical fiber in the core network close to the data center side, the bandwidth of the backbone network increases, so the form of cloud computing is generally used for computing resources such as servers and storage via the network It came to be used.
- Cloud computing has a centralized architecture that concentrates data and processing in a data center (core data center: CDC). Virtualize large-scale computing resources and flexibly provide the necessary amount of resources as a resource pool. Furthermore, there is an advantage that maintenance cost can be reduced by centralized management.
- centralized cloud computing when a smartphone is used as an example of a mobile terminal, all data used by the smartphone is collected and processed in a data center.
- resources such as servers and storage are concentrated in one place, so that maintenance operation management can be concentrated in one place. For example, when replacing a single storage device or device, the maintenance staff does not need to move because there is only one base.
- the above two storage copy methods that is, remote copy or customer copy
- the remote copy method has a network delay due to a long distance via a public line
- the copy method at the customer site uses a closed network and has no network delay compared to an old machine. .
- copying at a customer site is common. This is because a closed network has two advantages: high security and no additional network delay added to service responsiveness.
- the replacement method for copying at the customer site starts after the information processing device is installed, so if the storage capacity is large, the copy time is long and the delivery person installs it. There is a problem that an old device cannot be taken home in a short time later. As a result, it is necessary to visit the customer twice for installation and withdrawal, and the maintenance costs associated with delivery are high in places with poor transportation.
- the information processing apparatus is placed in the restricted access area at the customer site, it is assumed that the customer is present during the exchange, and the burden on the customer site cannot be ignored.
- the method of copying at a remote place has the advantage that the stay at the customer site is short and the installation and withdrawal can be performed once because parts or information processing devices for which storage copying has been completed in advance are delivered. .
- the storage contents are old in time and the storage contents are restored to the old storage time. There is a problem that the service cannot be performed.
- An object of the present invention is to provide an exchange method that ensures both service responsiveness and continuity, and that the service never stops, and a system that realizes it.
- an information processing apparatus is an information processing apparatus used as a distributed cloud that provides an application via a network, and includes at least one piece of information having a controller and a storage.
- a processing unit, and the storage includes a file system having a primary file and a secondary file of a pair in file units or directory units
- the controller includes a file system management unit that manages the file system,
- the file system management unit has a redundancy management table, an update management table, an online exchange trigger unit, and an offline exchange trigger unit, and manages the correspondence between primary files and secondary files by the redundancy management table.
- the file system management unit includes information on update of the file after the offline exchange trigger is set based on the information of the update management table in accordance with the set of online exchange trigger in the online exchange trigger unit. And having the function of copying only the primary file of the updated file of the file system of the one information processing unit to the other information processing unit for replacement.
- the storage is copied in advance on the network at a remote location, After transporting the device to the device installation location, the replacement time at the device installation location is reduced by copying only some primary files without copying all the storage differences between the old and new devices during the transport to the new device.
- the apparatus can be replaced without stopping the application.
- FIG. 5 is a diagram illustrating a relationship between old and new ⁇ DCs corresponding to FIG. 4. It is a table which shows the necessity of file copy when the information processing apparatus arrives at the spot.
- a plurality of small data centers installed in the vicinity of the terminal and the central data center process the data.
- Adopt a wide-area distributed cloud.
- storage units and devices are distributed, and when replacing, it is necessary for the delivery staff or maintenance staff to deliver to the installation locations of the micro DCs that are distant from each other and replace them. is there.
- a place where the micro DC is arranged in the vicinity of the terminal is particularly referred to as “on-site”.
- the point of the present invention is that when exchanging the information processing apparatus, a large part of the storage of the old apparatus is copied in advance to the storage of the new apparatus in the data center in advance by remote copy, and the old apparatus is based on the information in the update management table in the field. Is to copy only a part of it to the storage of the new device. In other words, the storage copy at the time of device replacement is made in two stages, and the second copy is made by copying only a part, thereby realizing a reduction in work time at the site. For example, only a part of the difference between the primary storage and the alternative storage generated when the storage of the new device is transported to the customer is copied on site. It also ensures continuity of service to users.
- the primary file and the secondary file of the first information processing apparatus are The first copy procedure for copying to the second information processing device, the start procedure indicating the start of the update management table after the first copy procedure, and the update management table of the first information processing device are dirty and redundantly managed.
- the second copy procedure to copy the file whose table is primary to the second computer And after the replacement from the first information processing device to the second information processing device, the update information table of the first information processing device is dirty and the redundancy management table is the secondary file.
- a third copy procedure for copying from the primary file of the processing apparatus As another system configuration example, the information processing apparatus has a storage copy priority table defined by the first information processing apparatus instead of the update management table, and is stored in the second copy procedure. Referring to the copy priority table, change the copy order.
- the information processing apparatus when a file is written to the primary, the file is written to the secondary, the redundancy management table that manages the correspondence between the primary and secondary in units of files, and the file in units of files
- the information processing apparatus includes an information processing unit including a CPU and a storage, and a plurality of information processing units
- a second computer having a secondary file of the first information processing unit when a failure occurs in the first information processing unit and the first information processing unit is not used.
- Redundancy management table of second information processing unit in information processing unit The procedure for changing the secondary bit to the primary bit, the procedure for registering the secondary file in the redundancy management table of the third information processing unit after starting the update of the primary file in the second information processing unit, and the second information A procedure for copying the secondary file from the primary file of the processing unit to the third information processing unit;
- an exchange support system for supporting exchange of information processing apparatuses in a distributed cloud environment will be described. That is, it is a form of a wide-area distributed cloud in which a plurality of small data centers (micro DCs) installed in the vicinity of a terminal and a central data center (CDC) process data in cooperation.
- micro DCs small data centers
- CDC central data center
- FIG. 1A and FIG. 1B show the main part of an exchange support system for supporting exchange of information processing apparatuses in a distributed cloud environment according to the first embodiment.
- FIG. 1A is an example of a configuration diagram of a ⁇ DC capable of speeding up replacement of an information processing apparatus according to the first embodiment of the present invention.
- the micro DC ( ⁇ DC) of this embodiment has a mechanism / function for reducing storage copy by paying attention to redundancy in order to perform the minimum necessary copy in the field.
- 100 is ⁇ DC1 before replacement installed in the field
- 200 is replacement ⁇ DC2, and both have the same function.
- the new ⁇ DC2 for replacement may have a new function in addition to the functions such as ⁇ DC1.
- ⁇ DC1 and ⁇ DC2 are connected by a network 300.
- the ⁇ DC1 (100) includes a controller (CTR) 120 using a server or the like, a storage (STR) 130, and a router (RTR) 140.
- CTR controller
- STR storage
- RTR router
- a functional unit having a controller (CTR) and a storage is referred to as an information processing unit (UNT) 110.
- the information processing units 110 may be physically configured on the same base or may be configured on different bases.
- the controller (CTR) 120 includes a memory (MEM) 121, a CPU 124, a network interface (NIC) 125 that communicates with a router, and a host bus adapter (HBA) 126 that communicates with a storage.
- MEM memory
- NIC network interface
- HBA host bus adapter
- the memory 121 includes a file system management unit (FSM) 122 that manages a file system, and a buffer (BUF) 123 that temporarily holds inputs from sensors and portable terminals.
- the file system management unit (FSM) 122 associates each file with an I node (INODE).
- the ⁇ DC2 (200) is similarly configured by an information processing unit 210, CTR220, MEM221, CPU224, NIC225, HBA226, STR230, and RTR24.
- Storage 130, 230 may be built in CTR 120, 220 or may be installed independently.
- the interface of the storages 130 and 230 is not particularly limited to any of SATA (Serial Advanced Technology Attachment), SAS (Serial Attached SCSI), iSCSI (Internet SCSI), and Fiber Channel (FC).
- the device may be either HDD or SSD.
- the storages 130 and 230 are provided with a logical unit LU (Logical Unit) as one or a plurality of logical storage areas on a physical recording area. A plurality of files are provided in the LU.
- FIG. 1A shows an example in which there are six files in one LU 1 of the storage 130.
- the storage does not use RAID. This is because, when there are a plurality of storage units composed of small-capacity HDDs, providing each controller with a RAID controller increases the cost. Therefore, the ⁇ DC (100, 200) does not provide a RAID controller in each information processing unit, and the CPUs 124, 224 write data in two locations, primary and secondary.
- the write command is not limited, but, for example, Amazon S3 (Simple Storage Service) REST API is used.
- the unit of redundancy is made finer with respect to how the primary and secondary are provided.
- a sensor or mobile terminal moves, it connects to a nearby ⁇ DC at the destination, so that the connected micro DC changes for each user and application, and accordingly, a file or directory that is a component of the application
- file units primary and secondary in units
- a redundancy management table (RMT) 1222 that newly associates the file system management unit (FSM) 122 with the INODE 1221 and newly represents primary and secondary for each file.
- FSM file system management unit
- pairs of INODE 1 and 2, 3 and 4, 5 and 6 indicate primary (P) and secondary (S) files, respectively.
- the redundancy management table (RMT) 1222 indicates whether each file is primary or secondary, and which INODE 1221 is a pair.
- the primary and secondary are physically separate devices, and the reliability at the time of failure is improved. Therefore, the primary and secondary devices are used as separate devices for operation, but are not limited.
- an offline difference management table (ODMT) 1223 as an update management table, which is a feature technique of the present invention, an online exchange trigger (NTRG) unit 1224, an offline exchange trigger An (FTRG) unit 1225 is provided.
- NTRG online exchange trigger
- FTRG offline exchange trigger An
- FIG. 1B is a diagram showing a configuration of the controller (CTR) 120 in FIG. 1A.
- the CTR includes a ⁇ DC monitoring unit 1211, a redundancy management unit 1212, an application management unit 123, a ⁇ DC switching control unit 1214, and an offline management unit 1215 as main functions realized by executing a computer program on the CPU. I have.
- Reference numeral 127 denotes an interface.
- the ⁇ DC monitoring unit 1211 monitors the state of each ⁇ DC. When the number of failure occurrences of a node exceeds a certain number, if it is determined that the ⁇ DC itself needs to be replaced, it makes a replacement request to the maintenance station.
- the ⁇ DC has a redundant configuration internally, and continues service by degenerating even when a node failure occurs.
- the redundancy management unit 1212 manages the redundant configuration of the ⁇ DC.
- the application management unit 123 manages an application executed in its own ⁇ DC as a service for a nearby terminal.
- the ⁇ DC switching control unit 1214 performs control when replacing the old and new ⁇ DC.
- the offline management unit 1215 performs control when the ⁇ DC is offline when the ⁇ DC is replaced.
- the first embodiment of the present invention assumes a computing environment in which data is processed in the vicinity of a terminal as shown in FIG. That is, this example is a wide-area distributed cloud form in which a plurality of ⁇ DCs 100 and 200 installed in the vicinity of a terminal and a data center (CDC) 400 are connected by a network 300 and process data in cooperation.
- the CDC 400 includes an application manager (APMGM) 410, and each ⁇ DC 100, 200 processes data of a terminal 500 in the vicinity thereof.
- APIGM application manager
- the small data center (CDC) 400 has a network, a CTR, and a storage, and can also communicate with an external network, so that it has a small data center function.
- the ⁇ DCs 100 and 200 operate as application CTRs and provide applications via the network 300 from a mobile terminal 500 such as a smartphone. For this reason, it takes a service form as SaaS (Software as a Service).
- SaaS Software as a Service
- the data center includes an APMGM 410 and manages which application is distributed to which micro DC.
- the mobile terminal 500 inquires a priority list of ⁇ DCs to be connected from the data center, and connects to nearby ⁇ DCs according to the list. Not only is the response speed of the mobile terminal fast, but also reduces the communication cost because the data communication volume of the core network reaching the data center is reduced by processing as close as possible and sending metadata to the data center. Can do.
- FIG. 3 shows a conceptual diagram of information processing apparatus exchange in the distributed cloud environment in the first embodiment.
- This example stores a central data center (CDC) 400 that performs application deployment and ⁇ DC management, a micro DC 100A that is used in the vicinity of the terminal in the field 700, and a micro DC 100B that is used for replacement.
- Maintenance station 600 Each ⁇ DC has a redundant configuration, and even if a failure occurs on the one hand, processing can be continued on the other hand.
- transportation means such as a truck is used for the transportation means 900 of ⁇ DC between the maintenance station 600 and the site 700.
- the micro DC 100A in use is denoted as ⁇ DC 1 or ⁇ DC 1-Old
- the new micro DC 100B for replacement is denoted as ⁇ DC 2 or ⁇ DC 1-New.
- FIG. 4 is a time chart for explaining an example of the switching operation by the controller (CTR) 120 for exchanging the device ( ⁇ DC).
- the components for exchanging the equipment are ⁇ DC1-Old, which is a micro DC before the replacement at the site 700, ⁇ DC1-New, a new micro DC of the maintenance station 600 having functions and performance equivalent to this ⁇ DC1-Old, the center A data center (CDC) 400 of a mobile phone, and a terminal user (users) 500 such as a smartphone.
- ⁇ DC1-Old is a micro DC before the replacement at the site 700
- ⁇ DC1-New a new micro DC of the maintenance station 600 having functions and performance equivalent to this ⁇ DC1-Old
- the center A data center (CDC) 400 of a mobile phone the center A data center (CDC) 400 of a mobile phone
- CDC terminal user
- the micro DC There are several possible configurations of the micro DC, but the simplest form includes at least one node having a CTR (server) and storage, and an IP address as an identifier of the node.
- the IP address is notified to the data center (CDC) 400 as node information from the new ⁇ DC2 of the maintenance station 600 (time t0), and an exchange mode request is made with the exchange target ⁇ DC1.
- the old and new ⁇ DC1 and ⁇ DC2 are associated with each other.
- the storage of ⁇ DC1 is remotely copied to ⁇ DC2.
- the remote copy performs secure communication via the Internet by using a known technology such as VPN (Virtual Private Network).
- the offline exchange trigger (FTRG) unit 1225 sets an offline exchange trigger for difference detection from ⁇ DC2 to ⁇ DC1 (time t1).
- the ⁇ DC 1 records whether or not there has been writing to the storage in units of files.
- the replacement ⁇ DC 2 is physically transported to the site 700.
- ⁇ DC2 is transported using physical transportation such as trucks.
- the online exchange trigger (NTRG) unit 1224 sets the online exchange trigger to the ⁇ DC1 and stops the application of the ⁇ DC1. Then, only the dirty primary file that is a part of the files in which the difference is detected in the above (4) is copied from the ⁇ DC1 to the ⁇ DC2. By limiting the copy to a part, the copy time at the site 700 can be reduced. The copy target will be described later. Thereafter, the application of ⁇ DC2 is activated.
- the CDC 400 notifies the user 500 to change the connection destination from ⁇ DC1 to ⁇ DC2.
- the user 500 changes the connection destination to ⁇ DC2.
- the input is switched to ⁇ DC2, and the service is continued by processing sequentially from the input buffer (7).
- the present embodiment in order to replace the ⁇ DC periodically or at a fixed date and time, remote copy of the storage and deployment of the application to the same device are performed in advance at the maintenance station, and then to the site. Make a minimum storage copy after transportation and continue the service with a new ⁇ DC. Since the ⁇ DC for replacement is prepared and delivered in advance, it is only necessary to go to the site only once and the staying time is short. Regarding the file in which the difference is detected, the storage copy is performed twice, but the target of the storage copy differs between the first time and the second time, which is a feature of the first embodiment of the present invention.
- This embodiment has a mechanism for performing storage copy reduction by paying attention to redundancy in order to perform the minimum necessary copy at the site 700 and speed up the replacement of the apparatus.
- FIG. 5 is a diagram showing the relationship between old and new ⁇ DCs corresponding to FIG.
- the file 5 in the LU is copied from ⁇ DC1 to ⁇ DC2, but the file 6 in the LU is not copied. Since the file 6 has the same content as the file 5, the file 6 is generated by copying from the file 5 of the ⁇ DC 2 after exchanging the ⁇ DC 1 and the ⁇ DC 2. Since the offline difference management table (ODMT) 123 is a C-bit file (ODMT (1) and (2) in FIG. 5) is not updated, there is no need to copy the file.
- ODMT offline difference management table
- the primary and secondary of the redundancy management table (RMT) are added corresponding to the INODE of the new file.
- the D bit is set in the offline difference management table (ODMT) corresponding to the corresponding INODE.
- the online exchange trigger (NTRG) is set, only the primary file of the redundancy management table (RMT) among the new files is copied from ⁇ DC1 to ⁇ DC2.
- the secondary file is copied from the primary file in the ⁇ DC 2 after the exchange.
- the table 1300 in FIG. 6 indicates whether or not file copying is required upon arrival at the site.
- file 1 of case 1 has RMT as primary (P) and ODMT as Clean (0). In this case, when it arrives at the site, it is not copied to ⁇ DC2.
- file 2 of case 2 RMT is secondary (S) and ODMT is Clean (0), and in this case also, it is not copied to ⁇ DC2.
- the file 5 of case 3 is RMT is primary (P) and ODMT is Dirty (1). In this case, the file 5 is copied to the ⁇ DC 2 upon arrival at the site.
- the file 6 of the case 4 is RMT secondary (S) and ODMT Dirty (1). In this case, the file 6 is not copied to the ⁇ DC 2 upon arrival at the site. That is, only the file 5 of the case 3 needs to be copied at the site.
- each output of the online exchange trigger (NTRG) unit 1224 and the offline exchange trigger (FTRG) unit 1225 is in a format representing a state, it is necessary to see the change point on the software, but represents the trigger.
- the format, that is, 1 may be written to return to 0, and the implementation is not limited as long as the trigger can be determined.
- the copy service starts from ⁇ DC1 to ⁇ DC2, and at the same time, the application service stops and the input buffer (BUF) in the memory Session information and input data are stored.
- response processing is performed so that the user side does not hang up. For example, when the user is a smartphone, the session is maintained, and a message indicating that it is temporarily interrupted is responded as a Web screen so that input from the user is not performed. In the case where data is unilaterally transmitted to the CTR side such as a sensor, no response is required.
- the copy is made from the input buffer (BUF) of the ⁇ DC1 to the input buffer of the ⁇ DC2.
- the service to the user 500 is temporarily interrupted only for a short time associated with the switching between the old and new ⁇ DC, but the input from the user is accumulated in the buffer of the ⁇ DC1.
- the ⁇ DC2 processes the input from the buffer first after the storage and the buffer copy. As described above, after the user switches the connection to the ⁇ DC2, the application is resumed, and the input data is processed from the input buffer (BUF) of the ⁇ DC2, thereby continuing the application without losing the input data during the service interruption. can do.
- FIG. 7 shows a configuration example of the ⁇ DC (100A, 100B) according to the second embodiment of the present invention.
- a management table indicating the priority of storage copy which is an extension of the offline difference management table (ODMT) of the first embodiment, is used as the update management table. That is, in the second embodiment, a priority management table (PMT) 1226 is provided instead of the offline difference management table (ODMT).
- the storage copy priority is used to give priority to the storage copy at the time of replacement.
- the priority is a number from 1 to 8, but is not particularly limited.
- the priority is determined by the file system management unit. For example, the priority of a file that has not been accessed for a certain period of time or an older version file is lowered.
- the priority is set in units of files after the offline exchange trigger is set (time t1).
- the priority may be set in the field after the offline exchange trigger is set, or may be defined and automatically processed before the offline exchange trigger is set.
- an online exchange trigger is set in ⁇ DC1, and only the set high priority file is copied from ⁇ DC1 to ⁇ DC2.
- the copy time at the site 700 can be reduced by limiting the copy to a part.
- a low priority file is copied from ⁇ DC1 to ⁇ DC2 in the background.
- FIG. 9 shows a configuration example of the ⁇ DC 100 according to the third embodiment of the present invention.
- the information processing apparatus ⁇ DC100 includes an information processing unit 1 (UNT1) 110A and an information processing unit 2 (UNT2) 110B.
- Each unit has a controller (CTR) and a storage (STR), and the information processing apparatus And a common router (RTR) 140.
- CTR controller
- STR storage
- RTR common router
- the number of information processing units (UNT) is a redundant configuration of two files. Of the four files in each LU, files 1 and 3 have primary information processing unit 1 (UNT1) and secondary information processing unit 2 (UNT2), and files 2 and 4 have primary information processing unit 2 (UNT2) and secondary information. It is assumed that the information processing unit 1 (UNT1). Redundancy management tables (RMT) 1222A and 1222B are managed as information processing unit / I node pairs (information processing unit, I node) information for each file. For example, in the redundancy management table (RMT) 1222A of the information processing unit 1 (UNT1), since the other file is in the information processing unit 2 (UNT2), the information of the information processing unit in units of files is 2. The I node number is the same regardless of the information processing unit, but it may not be the same.
- this embodiment also has the advantage that the time for storage copy at the site at the time of replacement can be reduced and the service for the user can be continued without stopping the application.
- FSM fine-grained file system management unit
- present invention is not limited to device exchange, for example, in one information processing unit in an information processing device.
- a method that does not copy the secondary can also be applied to the operation when a failure occurs.
- FIG. 10 shows a configuration example of a ⁇ DC 100 including three information processing units (110A, 110B, 110C) according to the fourth embodiment of the present invention.
- the time chart of FIG. 11 shows the operation when a failure occurs.
- Each file in the LU is duplicated in another information processing unit in the ⁇ DC 100 as in the third embodiment.
- the redundancy management table (RMT) 1222 is updated and the service is immediately continued using the primary storage, and the secondary storage is copied in the background while the service is resumed.
- the primary file (P) and the secondary file (S) function normally in both the information processing unit 1 (110A) and the information processing unit 2 (110B). Shall.
- the information in the redundancy table (RMT) of information processing unit 2 (110B) is changed (S of I node 1 and I node 3 is changed to P). .
- the application executed by the information processing unit 1 may be changed to be executed by the information processing unit 2.
- the information processing unit 2 (110B) can immediately restart the application service ((3) and (4) in FIG. 11).
- the secondary (S) file may be copied to the new information processing unit 3 (110C), and the related application may be deployed in the background ((5) in FIG. 11).
- the information processing unit 1 and the information processing unit 2 are used. However, even if a plurality of information processing units have a relationship between primary and secondary of a file, they can be handled in the same manner.
- the service restart time can be shortened by managing primary and secondary in units of files and copying only some files in the event of a ⁇ DC replacement or failure based on information in the update management table.
- the ⁇ DC operation management middleware monitors the storage copy status at the time of replacement or failure, but it can be determined by observing this copy status that the secondary is not copied.
- ⁇ DC 1 before replacement 110 Information processing unit 120: Controller (CTR) 121 ... Memory (MEM) 122 ... File system management unit (FSM) 123 ... Buffer (BUF) 124: CPU 125 Network interface (NIC), 126 ... Host bus adapter (HBA), 130 ... Storage (STR), 140 ... Router (RTR), 200 ... ⁇ DC2 for replacement, 300 ... Network, 1223 ... Offline difference management table (ODMT), 1224 ... Online exchange trigger (NTRG) part, 1225 ... Offline exchange trigger (FTRG) part.
- CTR Controller
- MEM Memory
- FSM File system management unit
- BAF Buffer
- NIC Network interface
- HBA Host bus adapter
- HBA Host bus adapter
- STR Storage
- RTR Router
- 200 ... ⁇ DC2 for replacement, 300 ... Network, 1223 ... Offline difference management table (ODMT), 1224 ... Online exchange trigger (NTRG) part, 1225 ... Offline
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Provided is an information processing device for providing an application over a network as a distributed cloud, wherein the information processing device comprises a CPU, storage, and a router, is set so that primary and secondary are defined in file units therein, and is equipped with a redundancy management table which manages the correspondence between the primary and secondary files and an update management table which manages file update information. When the information processing device is to be replaced with a new information processing device, the storage of the information processing device in use is copied in advance over the network to a new information processing device at a remote location. Thereafter, file update management for the information processing device in use is commenced while the new information processing device is off the network and being transported, so that when the new replacement information processing device arrives at the remote location, only the primary files among the files that have been updated are copied to the new information processing device while the secondary files for the new information processing device are generated autonomously.
Description
本発明は、情報処理装置及び情報処理装置の交換支援システム並びに交換方法に係り、特に、ストレージを備え、ネットワークを介してアプリケーションを提供する分散型クラウドとして使用される情報処理装置において、当該情報処理装置を交換する際の支援システムや方法に関する。
The present invention relates to an information processing apparatus, an information processing apparatus replacement support system, and a replacement method, and more particularly to an information processing apparatus that includes a storage and is used as a distributed cloud that provides an application via a network. The present invention relates to a support system and method for exchanging devices.
サーバなど高可用性が求められる情報処理装置では、故障または外部要因での障害に備え、冗長なシステム構成をとり、定期的な保守を実施している。保守業務の一つに、故障部品、または装置全体を交換する作業がある。ハードディスクで構成されるストレージはメカ機構があるため、故障の発生率が高く、RAID(Redundant Arrays of Independent Disks)など様々な可用性を高める技術が知られている。このためストレージのハードディスクの交換は比較的頻繁に行なわれ、部品単位でのRAIDの再構成のほか、装置全体を交換することもある。ストレージを備える装置の交換では、装置内のストレージのデータを新しい装置のストレージにコピーする必要がある。
Information processing devices that require high availability, such as servers, have a redundant system configuration and perform regular maintenance in preparation for failures or failures due to external factors. One of the maintenance tasks is the work of replacing a failed part or the entire device. Since the storage composed of hard disks has a mechanical mechanism, the failure occurrence rate is high, and various technologies for increasing availability such as RAID (Redundant Arrays of Independent Disks) are known. Therefore, the storage hard disk is replaced relatively frequently, and the entire apparatus may be replaced in addition to RAID reconfiguration in units of parts. In the exchange of a device having a storage, it is necessary to copy the storage data in the device to the storage of the new device.
ストレージのコピー方法は2つに大別できる。一つは、遠隔地でコピーする方法、もう一つは、顧客先に新しい装置を持ち込みコピーする方法である。
Storage copy methods can be roughly divided into two methods. One is a method of copying at a remote location, and the other is a method of bringing a new device to a customer and copying it.
遠隔地でコピーする方法の一例が特許文献1に示される。特許文献1の発明によれば、ユーザサイトの正系のストレージ、ネットワークを介した副系のストレージ、更にネットワークを介した別拠点の交換用ストレージで構成される。ユーザサイトのシャットダウン時に正系のストレージから副系のストレージにコピーし内容を同一化しておき、正系のストレージの故障が判明すると、副系のストレージのデータを別の場所の交換用ストレージにコピーする方法が示されている。交換用のストレージに正常シャットダウンのディスクイメージをリモートで全てコピーすることで、例えば正系ストレージに障害が発生すると夜間中に代替ストレージを用意し、翌朝正系ストレージを交換するという使い方が示されている。
An example of a method of copying at a remote location is shown in Patent Document 1. According to the invention of Patent Document 1, the storage system includes a primary storage system at a user site, a secondary storage system via a network, and a replacement storage system at another site via the network. When the user site shuts down, copy from the primary storage to the secondary storage, make the contents identical, and if the primary storage failure is found, copy the secondary storage data to the replacement storage in another location How to do is shown. By copying all normal shutdown disk images to the replacement storage remotely, for example, when a failure occurs in the primary storage, an alternative storage is prepared at night, and the primary storage is replaced the next morning. Yes.
顧客先でコピーする方法の一例が特許文献2に示される。この特許文献2の発明では、ストレージコントローラが故障し、装置の交換が必要と判断された際に、新しい装置が元の装置のストレージにアクセスし、サービスを継続しつつ、バックグラウンドで元の装置のストレージを新しい装置に全てコピーする方法が示されている。新しい装置のストレージへのコピーが完了すると、元の装置を切り離すことで交換が完了する。
An example of a method of copying at a customer site is shown in Patent Document 2. In the invention of Patent Document 2, when it is determined that the storage controller has failed and the device needs to be replaced, the new device accesses the storage of the original device and continues the service, while the original device is in the background. Shows how to copy all of the storage to a new device. When copying of the new device to storage is complete, the replacement is completed by disconnecting the original device.
コンピューティングの形態は、外部ネットワークの性能やコストに依存して定められることがある。外部ネットワークは基幹ネットワークのコア網とエッジネットワークのアクセス網から構成される。データセンタ側に近いコア網の光ファイバの普及により、基幹ネットワークの帯域が増えることで、サーバやストレージ等のコンピューティングリソースに対してネットワークを介して利用する、クラウドコンピューティングという形態が一般的に使われるようになった。クラウドコンピューティングではデータセンタ(コアデータセンタ:CDC)にデータと処理を集中する集中型アーキテクチャの構成をとる。大規模なコンピューティングリソースを仮想化し、リソースプールとしてユーザが必要な量だけ柔軟に提供する。更に、集中管理により保守コストを削減することができるといった利点を有する。集中型のクラウドコンピューティングにおいて、携帯端末の一例としてスマートフォンを使用した場合、スマートフォンで使用するデータが全てデータセンタに集められ、処理される。集中型クラウドでは、サーバやストレージ等のリソースを一箇所に集中するため、保守運用管理を一箇所に集中することができる。例えば、ストレージ単体や装置を交換する場合も拠点は一箇所のため、保守員は移動する必要がない。
The form of computing may be determined depending on the performance and cost of the external network. The external network is composed of a core network of the backbone network and an access network of the edge network. With the spread of optical fiber in the core network close to the data center side, the bandwidth of the backbone network increases, so the form of cloud computing is generally used for computing resources such as servers and storage via the network It came to be used. Cloud computing has a centralized architecture that concentrates data and processing in a data center (core data center: CDC). Virtualize large-scale computing resources and flexibly provide the necessary amount of resources as a resource pool. Furthermore, there is an advantage that maintenance cost can be reduced by centralized management. In centralized cloud computing, when a smartphone is used as an example of a mobile terminal, all data used by the smartphone is collected and processed in a data center. In a centralized cloud, resources such as servers and storage are concentrated in one place, so that maintenance operation management can be concentrated in one place. For example, when replacing a single storage device or device, the maintenance staff does not need to move because there is only one base.
しかしながら、昨今、スマートフォンを始めとする携帯端末の高機能化や各種センサ機器の設置数の増加に伴い、データセンタへの通信が逼迫する事態となっている。また、Wifiルータなど広帯域の無線通信手段のインフラ整備が進み、携帯端末に近いエッジ側のアクセス網の広帯域化が進んでいる。そこで、データセンタにデータを集約せず、携帯端末の近傍で広く分散してデータを処理する分散型のクラウドコンピューティングも検討されている。
However, in recent years, communication with data centers has become tight as mobile terminals such as smartphones become more sophisticated and the number of sensor devices installed has increased. In addition, the infrastructure development of broadband wireless communication means such as a WiFi router is progressing, and the broadband access network on the edge side close to the portable terminal is progressing. Therefore, distributed cloud computing is being studied in which data is not concentrated in a data center but is widely distributed in the vicinity of mobile terminals to process data.
上記ストレージの二つのコピー方法、すなわち、遠隔地でのコピー若しくは顧客先でのコピーは、ネットワークにも差異がある。遠隔地でのコピー方法は、公衆回線を経由し、遠距離によるネットワーク遅延があるのに対し、顧客先でのコピー方法は、閉じたネットワークを利用し、古いマシンと比べ、ネットワークの遅延がない。このため、サービスを継続したままの交換方法としては、顧客先でのコピーが一般的である。なぜなら、閉じたネットワークはセキュリティが高いことと、サービスの応答性に余計なネットワーク遅延が追加されないという二つの利点を有するためである。
The above two storage copy methods, that is, remote copy or customer copy, have different networks. The remote copy method has a network delay due to a long distance via a public line, while the copy method at the customer site uses a closed network and has no network delay compared to an old machine. . For this reason, as a replacement method with continued service, copying at a customer site is common. This is because a closed network has two advantages: high security and no additional network delay added to service responsiveness.
分散クラウド環境下で情報処理装置の交換を行う場合において、顧客先でコピーする交換方法は、情報処理装置の設置後にコピーが始まるため、ストレージ容量が多い場合、コピー時間が長く、配達員が設置後に短時間で古い装置を持ち帰ることができない課題を有する。これにより、設置と撤収の2回顧客先を訪問する必要があり、交通の便の悪い場所では配達に伴う保守コストが大きい。また、顧客先で情報処理装置が立入り制限区域に置かれていると、交換中顧客が立ち会うことも想定され、顧客先の負担も無視できない。
When exchanging information processing devices in a distributed cloud environment, the replacement method for copying at the customer site starts after the information processing device is installed, so if the storage capacity is large, the copy time is long and the delivery person installs it. There is a problem that an old device cannot be taken home in a short time later. As a result, it is necessary to visit the customer twice for installation and withdrawal, and the maintenance costs associated with delivery are high in places with poor transportation. In addition, if the information processing apparatus is placed in the restricted access area at the customer site, it is assumed that the customer is present during the exchange, and the burden on the customer site cannot be ignored.
一方、遠隔地でコピーする方法は、予めストレージコピーを完了した部品、または情報処理装置を配達するため、顧客先での滞在時間が短く、設置と撤収を1回で行なうことができる利点を有する。しかし、正常時にシャットダウンしたスナップショットイメージを交換ストレージにコピーする方法では、ストレージ内容が時間的に古いことと、時間的に古いストレージの内容に戻るため、スナップショットの時刻から交換が完了する時刻までサービスを行うことが出来ないという課題がある。
On the other hand, the method of copying at a remote place has the advantage that the stay at the customer site is short and the installation and withdrawal can be performed once because parts or information processing devices for which storage copying has been completed in advance are delivered. . However, in the method of copying the snapshot image that was shut down normally to the replacement storage, the storage contents are old in time and the storage contents are restored to the old storage time. There is a problem that the service cannot be performed.
特許文献1及び特許文献2に記載の発明では、ストレージコピーはいずれも1段階で、全ての内容をコピーする。そのため、分散クラウド環境下で情報処理装置の交換を行うことを想定した場合、上記した顧客先でのコピー、遠隔地でのコピーの各課題を解消できない。
In the inventions described in Patent Document 1 and Patent Document 2, storage copying is performed in one stage, and all contents are copied. For this reason, when it is assumed that the information processing apparatus is exchanged in a distributed cloud environment, the above-described problems of copying at a customer site and copying at a remote place cannot be solved.
そこで、本発明では、情報処理装置の全体を交換する場合において、
(1)顧客先での滞在時間をできるだけ短くし、設置と撤収を1回で行なうこと、
(2)サービスの応答性、並びに継続性を確保し、サービスが停止することがないこと、の2つを両立する交換方式、並びにそれを実現するシステムを提供することを目的とする。 Therefore, in the present invention, when replacing the entire information processing apparatus,
(1) Make the stay at the customer site as short as possible and install and remove in one time.
(2) An object of the present invention is to provide an exchange method that ensures both service responsiveness and continuity, and that the service never stops, and a system that realizes it.
(1)顧客先での滞在時間をできるだけ短くし、設置と撤収を1回で行なうこと、
(2)サービスの応答性、並びに継続性を確保し、サービスが停止することがないこと、の2つを両立する交換方式、並びにそれを実現するシステムを提供することを目的とする。 Therefore, in the present invention, when replacing the entire information processing apparatus,
(1) Make the stay at the customer site as short as possible and install and remove in one time.
(2) An object of the present invention is to provide an exchange method that ensures both service responsiveness and continuity, and that the service never stops, and a system that realizes it.
本発明の代表的な構成の一例を挙げると、情報処理装置は、ネットワークを介してアプリケーションを提供する分散型クラウドとして使用される情報処理装置であって、コントローラとストレージとを有する少なくとも1つの情報処理ユニットを備え、前記ストレージは、ファイル単位若しくはディレクトリ単位で、ペアのプライマリファイルとセカンダリファイルとを有するファイルシステムを備え、前記コントローラは、前記ファイルシステムの管理を行うファイルシステム管理部を有し、該ファイルシステム管理部は、冗長化管理テーブルと、更新管理テーブルと、オンライン交換トリガ部と、オフライン交換トリガ部とを有し、前記冗長化管理テーブルにより、プライマリファイルとセカンダリファイルの対応関係を管理し、前記プライマリファイルに書込みがあったときに対応する前記セカンダリファイルに書込みを行い、前記更新管理テーブルは、前記オフライン交換トリガ部でオフライン交換トリガがセットされた後に、前記ファイルの更新に関する情報を管理する機能を有し、前記ファイルシステム管理部は、前記オンライン交換トリガ部でオンライン交換トリガのセットに伴い、前記更新管理テーブルの情報に基づき、前記オフライン交換トリガがセットされた後の前記ファイルの更新に関する情報に基づき、前記1つの情報処理ユニットの前記ファイルシステムの更新されたファイルの前記プライマリファイルのみを、交換用の他の前記情報処理ユニットへコピーする機能を有することを特徴とする。
As an example of a typical configuration of the present invention, an information processing apparatus is an information processing apparatus used as a distributed cloud that provides an application via a network, and includes at least one piece of information having a controller and a storage. A processing unit, and the storage includes a file system having a primary file and a secondary file of a pair in file units or directory units, and the controller includes a file system management unit that manages the file system, The file system management unit has a redundancy management table, an update management table, an online exchange trigger unit, and an offline exchange trigger unit, and manages the correspondence between primary files and secondary files by the redundancy management table. And said A function of writing information to the secondary file corresponding to a write to a primary file, and managing the information related to the update of the file after the offline exchange trigger is set in the offline exchange trigger unit. The file system management unit includes information on update of the file after the offline exchange trigger is set based on the information of the update management table in accordance with the set of online exchange trigger in the online exchange trigger unit. And having the function of copying only the primary file of the updated file of the file system of the one information processing unit to the other information processing unit for replacement.
本発明によれば、ネットワークを介してアプリケーションを提供する分散型クラウドとして使用される情報処理装置において、この情報処理装置の交換の際に、遠隔地で予めストレージをネットワーク上でコピーしておき、装置設置箇所へ装置を輸送後に、輸送中に生じた新旧の装置のストレージの差分を新しい装置に全てコピーせず、一部のプライマリファイルのみコピーすることで、装置設置場所での交換時間を削減することができ、しかも、アプリケーションを停止せずに装置の交換を実現する。
According to the present invention, in an information processing device used as a distributed cloud that provides an application via a network, when the information processing device is replaced, the storage is copied in advance on the network at a remote location, After transporting the device to the device installation location, the replacement time at the device installation location is reduced by copying only some primary files without copying all the storage differences between the old and new devices during the transport to the new device. Moreover, the apparatus can be replaced without stopping the application.
本発明では、データセンタにデータを集約せず、端末の近傍(現場)でデータを処理するために、端末の近傍に設置した複数の小型データセンタと中央のデータセンタが連携してデータを処理する広域分散クラウドを採用する。この分散型クラウドでは、ストレージ単体や装置は分散して配置され、交換の際は、機材の配達員または保守員が複数の距離的に離れたマイクロDCの設置場所へ届け、交換を行なう必要がある。ここで、本発明では端末の近傍でマイクロDCを配置する場所を特に“現場”と呼ぶことにする。
In the present invention, in order to process data near the terminal (site) without consolidating data in the data center, a plurality of small data centers installed in the vicinity of the terminal and the central data center process the data. Adopt a wide-area distributed cloud. In this decentralized cloud, storage units and devices are distributed, and when replacing, it is necessary for the delivery staff or maintenance staff to deliver to the installation locations of the micro DCs that are distant from each other and replace them. is there. Here, in the present invention, a place where the micro DC is arranged in the vicinity of the terminal is particularly referred to as “on-site”.
本発明のポイントは、情報処理装置の交換時に、予め遠隔地コピーで古い装置のストレージの大部分をデータセンタにおいて新しい装置のストレージへコピーしておき、現場では更新管理テーブルの情報に基づき古い装置の一部だけを新しい装置のストレージにコピーすることである。すなわち、装置の交換時のストレージコピーを2段階にすることと、2回目のコピーは一部のみコピーすることで、現場での作業時間の短縮を実現することである。例えば、新しい装置のストレージを顧客先へ輸送する際に発生した正系ストレージと代替ストレージの差分の一部だけを現場でコピーする。また、ユーザへのサービスの継続も確保する。
The point of the present invention is that when exchanging the information processing apparatus, a large part of the storage of the old apparatus is copied in advance to the storage of the new apparatus in the data center in advance by remote copy, and the old apparatus is based on the information in the update management table in the field. Is to copy only a part of it to the storage of the new device. In other words, the storage copy at the time of device replacement is made in two stages, and the second copy is made by copying only a part, thereby realizing a reduction in work time at the site. For example, only a part of the difference between the primary storage and the alternative storage generated when the storage of the new device is transported to the customer is copied on site. It also ensures continuity of service to users.
上記課題を解決するためのシステムとして、その具体的な構成の一例を挙げると、
プライマリファイルに書込みがあったときにセカンダリファイルに書込みを行い、ファイル単位でプライマリとセカンダリの対応関係を管理する冗長化管理テーブルと、ファイル単位でファイルの変更があったかどうかを管理する更新管理テーブルを有し、ネットワークを介してアプリケーションを提供する情報処理装置において、前記第一の情報処理装置から前記第二の情報処理装置へ交換する際に、第一の情報処理装置のプライマリファイルとセカンダリファイルを第二の情報処理装置へコピーする第一のコピー手順と、第一のコピー手順後に更新管理テーブルの開始を示す開始手順と、第一の情報処理装置の更新管理テーブルがダーティかつ、冗長化管理テーブルがプライマリのファイルを第二の計算機へコピーする第二のコピー手順を実施し、前記第一の情報処理装置から前記第二の情報処理装置への交換後に、第一の情報処理装置の更新管理テーブルがダーティかつ、冗長化管理テーブルがセカンダリのファイルを第二の情報処理装置のプライマリファイルからコピーする第三のコピー手順を有する。
また、別のシステム構成例として、前記情報処理装置であって、前記更新管理テーブルの代わりに第一の情報処理装置が定めるストレージコピーの優先度テーブルを有し、前記第二のコピー手順でストレージコピーの優先度テーブルを参照して、コピーの順番を変更する。 As an example of a specific configuration as a system for solving the above problems,
When the primary file is written, the secondary file is written, the redundancy management table that manages the correspondence between the primary and secondary files, and the update management table that manages whether the file has changed In an information processing apparatus that provides an application via a network, when exchanging from the first information processing apparatus to the second information processing apparatus, the primary file and the secondary file of the first information processing apparatus are The first copy procedure for copying to the second information processing device, the start procedure indicating the start of the update management table after the first copy procedure, and the update management table of the first information processing device are dirty and redundantly managed. The second copy procedure to copy the file whose table is primary to the second computer And after the replacement from the first information processing device to the second information processing device, the update information table of the first information processing device is dirty and the redundancy management table is the secondary file. A third copy procedure for copying from the primary file of the processing apparatus;
As another system configuration example, the information processing apparatus has a storage copy priority table defined by the first information processing apparatus instead of the update management table, and is stored in the second copy procedure. Referring to the copy priority table, change the copy order.
プライマリファイルに書込みがあったときにセカンダリファイルに書込みを行い、ファイル単位でプライマリとセカンダリの対応関係を管理する冗長化管理テーブルと、ファイル単位でファイルの変更があったかどうかを管理する更新管理テーブルを有し、ネットワークを介してアプリケーションを提供する情報処理装置において、前記第一の情報処理装置から前記第二の情報処理装置へ交換する際に、第一の情報処理装置のプライマリファイルとセカンダリファイルを第二の情報処理装置へコピーする第一のコピー手順と、第一のコピー手順後に更新管理テーブルの開始を示す開始手順と、第一の情報処理装置の更新管理テーブルがダーティかつ、冗長化管理テーブルがプライマリのファイルを第二の計算機へコピーする第二のコピー手順を実施し、前記第一の情報処理装置から前記第二の情報処理装置への交換後に、第一の情報処理装置の更新管理テーブルがダーティかつ、冗長化管理テーブルがセカンダリのファイルを第二の情報処理装置のプライマリファイルからコピーする第三のコピー手順を有する。
また、別のシステム構成例として、前記情報処理装置であって、前記更新管理テーブルの代わりに第一の情報処理装置が定めるストレージコピーの優先度テーブルを有し、前記第二のコピー手順でストレージコピーの優先度テーブルを参照して、コピーの順番を変更する。 As an example of a specific configuration as a system for solving the above problems,
When the primary file is written, the secondary file is written, the redundancy management table that manages the correspondence between the primary and secondary files, and the update management table that manages whether the file has changed In an information processing apparatus that provides an application via a network, when exchanging from the first information processing apparatus to the second information processing apparatus, the primary file and the secondary file of the first information processing apparatus are The first copy procedure for copying to the second information processing device, the start procedure indicating the start of the update management table after the first copy procedure, and the update management table of the first information processing device are dirty and redundantly managed. The second copy procedure to copy the file whose table is primary to the second computer And after the replacement from the first information processing device to the second information processing device, the update information table of the first information processing device is dirty and the redundancy management table is the secondary file. A third copy procedure for copying from the primary file of the processing apparatus;
As another system configuration example, the information processing apparatus has a storage copy priority table defined by the first information processing apparatus instead of the update management table, and is stored in the second copy procedure. Referring to the copy priority table, change the copy order.
更に、別のシステム構成例として、プライマリにファイルの書込みがあったときにセカンダリにファイルの書込みを行い、ファイル単位でプライマリとセカンダリの対応関係を管理する冗長化管理テーブルと、ファイル単位でファイルの変更があったかどうかを管理する更新管理テーブルを有し、ネットワークを介してアプリケーションを提供する情報処理装置において、前記情報処理装置は、CPUとストレージから構成される情報処理ユニットと、複数の情報処理ユニットから構成される計算機であって、第一の情報処理ユニットに障害が発生し、第一の情報処理ユニットが不使用となった際に、第一の情報処理ユニットのセカンダリファイルを有する第二の情報処理ユニットにおいて、第二の情報処理ユニットの冗長化管理テーブルのセカンダリビットをプライマリビットに変更する手順と第二の情報処理ユニットでプライマリファイルの更新を開始した後に、第三の情報処理ユニットの冗長化管理テーブルにセカンダリファイルを登録する手順と、第二の情報処理ユニットのプライマリファイルを第三の情報処理ユニットへセカンダリファイルをコピーする手順を有する。
Furthermore, as another system configuration example, when a file is written to the primary, the file is written to the secondary, the redundancy management table that manages the correspondence between the primary and secondary in units of files, and the file in units of files In an information processing apparatus having an update management table for managing whether there is a change and providing an application via a network, the information processing apparatus includes an information processing unit including a CPU and a storage, and a plurality of information processing units A second computer having a secondary file of the first information processing unit when a failure occurs in the first information processing unit and the first information processing unit is not used. Redundancy management table of second information processing unit in information processing unit The procedure for changing the secondary bit to the primary bit, the procedure for registering the secondary file in the redundancy management table of the third information processing unit after starting the update of the primary file in the second information processing unit, and the second information A procedure for copying the secondary file from the primary file of the processing unit to the third information processing unit;
以下、本発明を実施するための形態を図面に基づいて詳細に説明する。なお、発明を実施するための形態を説明するための全図において、同一の機能を有する要素には同一の名称、符号を付して、その繰り返しの説明を省略する。
Hereinafter, embodiments for carrying out the present invention will be described in detail with reference to the drawings. Note that components having the same function are denoted by the same names and reference symbols throughout the drawings for describing the embodiments for carrying out the invention, and the repetitive description thereof will be omitted.
本発明の第一の実施例として、分散クラウド環境下で情報処理装置の交換を支援する交換支援システムについて説明する。すなわち、端末の近傍に設置した複数の小型データセンタ(マイクロDC)と中央のデータセンタ(CDC)が連携してデータを処理する広域の分散クラウドの形態である。
As a first embodiment of the present invention, an exchange support system for supporting exchange of information processing apparatuses in a distributed cloud environment will be described. That is, it is a form of a wide-area distributed cloud in which a plurality of small data centers (micro DCs) installed in the vicinity of a terminal and a central data center (CDC) process data in cooperation.
第一の実施例に係る、分散クラウド環境下で情報処理装置の交換を支援する交換支援システムの要部を、図1A、図1Bに示す。
図1Aは、本発明の第一の実施例に係る、情報処理装置の交換の高速化が可能なμDCの構成図の例である。 FIG. 1A and FIG. 1B show the main part of an exchange support system for supporting exchange of information processing apparatuses in a distributed cloud environment according to the first embodiment.
FIG. 1A is an example of a configuration diagram of a μDC capable of speeding up replacement of an information processing apparatus according to the first embodiment of the present invention.
図1Aは、本発明の第一の実施例に係る、情報処理装置の交換の高速化が可能なμDCの構成図の例である。 FIG. 1A and FIG. 1B show the main part of an exchange support system for supporting exchange of information processing apparatuses in a distributed cloud environment according to the first embodiment.
FIG. 1A is an example of a configuration diagram of a μDC capable of speeding up replacement of an information processing apparatus according to the first embodiment of the present invention.
本実施例のマイクロDC(μDC)は、現場で必要最低限のコピーを行なうために、冗長性に着目してストレージコピーの削減を行なう機構・機能を有する。
The micro DC (μDC) of this embodiment has a mechanism / function for reducing storage copy by paying attention to redundancy in order to perform the minimum necessary copy in the field.
100は現場に設置された交換前のμDC1、200は交換用のμDC2であり、両者は同じ機能を有する。但し、交換用の新しいμDC2がμDC1と等々の機能に加えて新たな機能を有していても差し支えない。μDC1とμDC2はネットワーク300で接続される。
100 is μDC1 before replacement installed in the field, 200 is replacement μDC2, and both have the same function. However, the new μDC2 for replacement may have a new function in addition to the functions such as μDC1. μDC1 and μDC2 are connected by a network 300.
μDC1(100)は、サーバ等を用いたコントローラ(CTR)120、ストレージ(STR)130、ルータ(RTR)140で構成されている。以下では、コントローラ(CTR)とストレージを有する機能単位を情報処理ユニット(UNT)110と呼ぶ。但し、情報処理ユニット110は、物理的には同じ基盤上で構成してもよいし、異なる基盤上に構成してでもよい。コントローラ(CTR)120は、メモリ(MEM)121、CPU124、ルータとの通信を行うネットワークインターフェース(NIC)125、ストレージとの通信を行うホストバスアダプタ(HBA)126を有する。メモリ121の内部には、ファイルシステムの管理を行うファイルシステム管理部(FSM)122や、センサや携帯端末からの入力を一時保持するバッファ(BUF)123が含まれる。ファイルシステム管理部(FSM)122は、各ファイルをIノード(INODE)で対応づけている。
The μDC1 (100) includes a controller (CTR) 120 using a server or the like, a storage (STR) 130, and a router (RTR) 140. Hereinafter, a functional unit having a controller (CTR) and a storage is referred to as an information processing unit (UNT) 110. However, the information processing units 110 may be physically configured on the same base or may be configured on different bases. The controller (CTR) 120 includes a memory (MEM) 121, a CPU 124, a network interface (NIC) 125 that communicates with a router, and a host bus adapter (HBA) 126 that communicates with a storage. The memory 121 includes a file system management unit (FSM) 122 that manages a file system, and a buffer (BUF) 123 that temporarily holds inputs from sensors and portable terminals. The file system management unit (FSM) 122 associates each file with an I node (INODE).
μDC2(200)も、同様に、情報処理ユニット210、CTR220、MEM221、CPU224、NIC225、HBA226、STR230、RTR24で構成されている。
The μDC2 (200) is similarly configured by an information processing unit 210, CTR220, MEM221, CPU224, NIC225, HBA226, STR230, and RTR24.
ストレージ130、230は、CTR120、220に内蔵しても良く、独立して設置しても良い。ストレージ130、230のインターフェースはSATA(Serial Advanced Technology Attachment)、SAS(Serial Attached SCSI)、iSCSI(Internet SCSI)、ファイバチャネル(FC)のいずれかも特に限定されない。デバイスにおいてもHDD、SSDのいずれでもよい。ストレージ130、230は物理的な記録領域上に、1または複数の論理的な記憶領域として論理ユニットLU(Logical Unit)が設けられる。LU内には、複数のファイルが設けられる。図1Aでは、ストレージ130の一つのLU1内に6つのファイルが有る例を示している。
Storage 130, 230 may be built in CTR 120, 220 or may be installed independently. The interface of the storages 130 and 230 is not particularly limited to any of SATA (Serial Advanced Technology Attachment), SAS (Serial Attached SCSI), iSCSI (Internet SCSI), and Fiber Channel (FC). The device may be either HDD or SSD. The storages 130 and 230 are provided with a logical unit LU (Logical Unit) as one or a plurality of logical storage areas on a physical recording area. A plurality of files are provided in the LU. FIG. 1A shows an example in which there are six files in one LU 1 of the storage 130.
図1Aでは説明の簡略化のため、一つの情報処理ユニットとしたが、複数の情報処理ユニットでもよい。コスト削減のために、ストレージはRAIDを使用しない。小容量のHDDで構成されるストレージが複数ユニットあったときに、各情報処理ユニットにRAIDコントローラを設けるとコストが高くなるためである。そこで、μDC(100、200)は、各情報処理ユニットにRAIDコントローラを設けずに、CPU124、224でプライマリとセカンダリの2箇所に書込むことにする。書込みコマンドは限定されないが、例えば、Amazon S3(Simple Storage Service)のREST APIを用いる。
In FIG. 1A, for simplicity of explanation, one information processing unit is used, but a plurality of information processing units may be used. In order to reduce costs, the storage does not use RAID. This is because, when there are a plurality of storage units composed of small-capacity HDDs, providing each controller with a RAID controller increases the cost. Therefore, the μDC (100, 200) does not provide a RAID controller in each information processing unit, and the CPUs 124, 224 write data in two locations, primary and secondary. The write command is not limited, but, for example, Amazon S3 (Simple Storage Service) REST API is used.
本発明では、プライマリとセカンダリをどのように設けるかについて、冗長化の単位を細粒度とする。センサや携帯端末が移動した際に、移動先で近傍のμDCに接続するため、各ユーザ、アプリケーションごとに接続するマイクロDCが変わることから、それに対応して、アプリケーションの構成要素であるファイルまたはディレクトリ単位(以下、ファイル単位)でプライマリとセカンダリを設けることにした。
In the present invention, the unit of redundancy is made finer with respect to how the primary and secondary are provided. When a sensor or mobile terminal moves, it connects to a nearby μDC at the destination, so that the connected micro DC changes for each user and application, and accordingly, a file or directory that is a component of the application We decided to provide primary and secondary in units (hereinafter, file units).
図1Aでは、ファイル単位でのプライマリ、セカンダリの設定のため、ファイルシステム管理部(FSM)122に、INODE1221に紐付けて、ファイルごとに新たにプライマリとセカンダリを表す冗長化管理テーブル(RMT)1222を設ける。冗長化管理テーブル(RMT)1222の例としては、INODEが1と2、3と4、5と6のペアがそれぞれプライマリ(P)とセカンダリ(S)のファイルを示している。冗長化管理テーブル(RMT)1222では、各ファイルがプライマリ、セカンダリのいずれであるか、ペアがどのINODE1221かを示している。プライマリとセカンダリは物理的に別のデバイスである方が故障時の信頼度は向上するため、運用上は別デバイスで用いられるが、限定されない。
In FIG. 1A, in order to set primary and secondary in units of files, a redundancy management table (RMT) 1222 that newly associates the file system management unit (FSM) 122 with the INODE 1221 and newly represents primary and secondary for each file. Is provided. As an example of the redundancy management table (RMT) 1222, pairs of INODE 1 and 2, 3 and 4, 5 and 6 indicate primary (P) and secondary (S) files, respectively. The redundancy management table (RMT) 1222 indicates whether each file is primary or secondary, and which INODE 1221 is a pair. The primary and secondary are physically separate devices, and the reliability at the time of failure is improved. Therefore, the primary and secondary devices are used as separate devices for operation, but are not limited.
さらに、現場でのストレージコピーの削減を管理するために、本発明の特徴技術である更新管理テーブルとしてのオフライン差分管理テーブル(ODMT)1223、及び、オンライン交換トリガ(NTRG)部1224、オフライン交換トリガ(FTRG)部1225を設ける。
Further, in order to manage the reduction of storage copy in the field, an offline difference management table (ODMT) 1223 as an update management table, which is a feature technique of the present invention, an online exchange trigger (NTRG) unit 1224, an offline exchange trigger An (FTRG) unit 1225 is provided.
図1Bは、図1Aのコントローラ(CTR)120の構成を示す図である。CTRは、コンピュータプログラムをCPU上で実行することにより実現される主な機能として、μDC監視ユニット1211、冗長化管理ユニット1212、アプリケーション管理ユニット123、μDC切替制御ユニット1214、及び、オフライン管理ユニット1215を備えている。127はインターフェースである。μDC監視ユニット1211は、各μDCの状態を監視し、ノードの障害発生数が一定数を超えると、μDC自体の交換が必要と判定した場合には、メンテステーションに対して交換要求を行う。μDCは、内部で冗長構成をとり、ノードの障害発生時も縮退することで、サービスを継続する。このμDCの冗長構成を管理するのが、冗長化管理ユニット1212である。アプリケーション管理ユニット123は、近傍の端末に対するサービスとして、自身のμDCで実行されるアプリケーションの管理を行なう。μDC切替え制御ユニット1214は、新旧のμDCの交換時の制御を行う。オフライン管理ユニット1215は、μDCの交換時のμDCのオフライン時の制御を行う。
FIG. 1B is a diagram showing a configuration of the controller (CTR) 120 in FIG. 1A. The CTR includes a μDC monitoring unit 1211, a redundancy management unit 1212, an application management unit 123, a μDC switching control unit 1214, and an offline management unit 1215 as main functions realized by executing a computer program on the CPU. I have. Reference numeral 127 denotes an interface. The μDC monitoring unit 1211 monitors the state of each μDC. When the number of failure occurrences of a node exceeds a certain number, if it is determined that the μDC itself needs to be replaced, it makes a replacement request to the maintenance station. The μDC has a redundant configuration internally, and continues service by degenerating even when a node failure occurs. The redundancy management unit 1212 manages the redundant configuration of the μDC. The application management unit 123 manages an application executed in its own μDC as a service for a nearby terminal. The μDC switching control unit 1214 performs control when replacing the old and new μDC. The offline management unit 1215 performs control when the μDC is offline when the μDC is replaced.
本発明の第一の実施例では、図2に示すような、端末の近傍でデータを処理するコンピューティング環境を想定する。すなわち、この例は、端末の近傍に設置した複数のμDC100,200とデータセンタ(CDC)400とがネットワーク300で接続され、連携してデータを処理する広域の分散クラウドの形態である。CDC400は、アプリケーションマネージャ(APMGM)410を備え、各μDC100,200は、その近傍の端末500のデータを処理する。
The first embodiment of the present invention assumes a computing environment in which data is processed in the vicinity of a terminal as shown in FIG. That is, this example is a wide-area distributed cloud form in which a plurality of μDCs 100 and 200 installed in the vicinity of a terminal and a data center (CDC) 400 are connected by a network 300 and process data in cooperation. The CDC 400 includes an application manager (APMGM) 410, and each μDC 100, 200 processes data of a terminal 500 in the vicinity thereof.
小型のデータセンタ(CDC)400はネットワーク、CTR、ストレージを有し、外部ネットワークも通信可能であることから規模の小さいデータセンタの機能を有する。μDC100,200はアプリケーションCTRとして動作し、スマートフォン等の携帯端末500からネットワーク300経由でアプリケーションを提供する。このため、サース(SaaS:Software as a Service)としてのサービス形態をとる。携帯端末500の各ユーザが最も位置的に近傍のマイクロDCにアクセスできるようにするために、データセンタにはAPMGM410を備え、どのアプリケーションをどのマイクロDCへ配布するかを管理する。携帯端末500は、データセンタから接続すべきμDCの優先度リストを問い合わせ、そのリストに従って、近傍のμDCに接続する。携帯端末での応答速度が速いだけでなく、近傍でできるだけ処理を行い、データセンタへメタデータを送ることによって、データセンタに至るコア網のデータ通信量が減少するため、通信コストを削減することができる。
The small data center (CDC) 400 has a network, a CTR, and a storage, and can also communicate with an external network, so that it has a small data center function. The μDCs 100 and 200 operate as application CTRs and provide applications via the network 300 from a mobile terminal 500 such as a smartphone. For this reason, it takes a service form as SaaS (Software as a Service). In order to allow each user of the portable terminal 500 to access the nearest micro DC in the most location, the data center includes an APMGM 410 and manages which application is distributed to which micro DC. The mobile terminal 500 inquires a priority list of μDCs to be connected from the data center, and connects to nearby μDCs according to the list. Not only is the response speed of the mobile terminal fast, but also reduces the communication cost because the data communication volume of the core network reaching the data center is reduced by processing as close as possible and sending metadata to the data center. Can do.
図3に、第一の実施例における分散クラウド環境下での情報処理装置の交換の概念図を示す。
FIG. 3 shows a conceptual diagram of information processing apparatus exchange in the distributed cloud environment in the first embodiment.
この例は、アプリケーションのデプロイやμDCの管理を行なう中央のデータセンタ(CDC)400、現場700において端末の近傍でアプリケーションのサービスを行なう使用中のマイクロDC100A、及び、交換のためのマイクロDC100Bを保管するメンテステーション600から構成される。各μDC内は冗長な構成をとっており、一方で障害が発生しても、もう一方で処理が継続できる。ここでは、定期または決められた日時でのマイクロDC装置を交換する場合の例を示す。また、メンテステーション600と現場700との間のμDCの輸送手段900には例えばトラック等の交通機関が使用される。
This example stores a central data center (CDC) 400 that performs application deployment and μDC management, a micro DC 100A that is used in the vicinity of the terminal in the field 700, and a micro DC 100B that is used for replacement. Maintenance station 600. Each μDC has a redundant configuration, and even if a failure occurs on the one hand, processing can be continued on the other hand. Here, an example in the case of exchanging the micro DC device at a regular or predetermined date and time is shown. Further, transportation means such as a truck is used for the transportation means 900 of μDC between the maintenance station 600 and the site 700.
なお、交換される2つのμDCは、物理的には別のものであるが、機能的には同じものである。そのため、以下では、説明の便宜上、使用中のマイクロDC100AをμDC1若しくはμDC1-Old,交換用の新規のマイクロDC100BをμDC2若しくはμDC1-Newと表記する。
Note that the two μDCs to be exchanged are physically different but functionally the same. Therefore, in the following, for convenience of description, the micro DC 100A in use is denoted as μDC 1 or μDC 1-Old, and the new micro DC 100B for replacement is denoted as μDC 2 or μDC 1-New.
次に、図4に基づいて、第一の実施例に基づく、情報処理装置の交換の動作を説明する。図4は、装置(μDC)の交換の、コントローラ(CTR)120による切替え動作の例を説明するタイムチャートである。
Next, the operation of exchanging the information processing apparatus based on the first embodiment will be described with reference to FIG. FIG. 4 is a time chart for explaining an example of the switching operation by the controller (CTR) 120 for exchanging the device (μDC).
装置の交換を行うための構成要素は、現場700の交換前のマイクロDCであるμDC1-Old、このμDC1-Oldと同等の機能や性能を有するメンテステーション600の新規マイクロDCのμDC1-New、中央のデータセンタ(CDC)400、スマートフォンなどの端末ユーザ(users)500である。マイクロDCは幾つかの構成が考えられるが、最も単純な形態としては、CTR(サーバ)、ストレージを有するノードが少なくとも一つあり、ノードの識別子としてIPアドレスを有する。
The components for exchanging the equipment are μDC1-Old, which is a micro DC before the replacement at the site 700, μDC1-New, a new micro DC of the maintenance station 600 having functions and performance equivalent to this μDC1-Old, the center A data center (CDC) 400 of a mobile phone, and a terminal user (users) 500 such as a smartphone. There are several possible configurations of the micro DC, but the simplest form includes at least one node having a CTR (server) and storage, and an IP address as an identifier of the node.
以下、図4のタイムチャートに沿って説明する。なお、図4中、(1)~(9)は、装置交換のための主な処理を示している。
Hereinafter, description will be made along the time chart of FIG. In FIG. 4, (1) to (9) indicate main processes for device replacement.
(1)メンテステーション600の新規のμDC2からノード情報としてIPアドレスをデータセンタ(CDC)400に通知し(時刻t0)、交換対象μDC1と交換モード要求を行う。CDC400では、新旧のμDC1、μDC2のノード対応付けを行う。
(1) The IP address is notified to the data center (CDC) 400 as node information from the new μDC2 of the maintenance station 600 (time t0), and an exchange mode request is made with the exchange target μDC1. In the CDC 400, the old and new μDC1 and μDC2 are associated with each other.
ノード対応リストをCDCからμDC1とμDC2に通知する。
ノ ー ド Notify the node correspondence list from CDC to μDC1 and μDC2.
(2)メンテステーション600では、μDC1のストレージをμDC2へリモートコピーする。リモートコピーは、例えば、VPN(Virtual Private Network)等の公知の技術を用いることにより、インターネットを介してセキュアな通信を行う。
(2) In the maintenance station 600, the storage of μDC1 is remotely copied to μDC2. The remote copy performs secure communication via the Internet by using a known technology such as VPN (Virtual Private Network).
(3)CDC400から、μDC1のノードにデプロイされているのと同じアプリケーションをμDC2にデプロイする。
(3) From the CDC 400, deploy the same application deployed on the μDC1 node to the μDC2.
(4)アプリケーションデプロイ、並びにストレージコピーが完了したら、μDC2からμDC1に対して、オフライン交換トリガ(FTRG)部1225が差分検知のためのオフライン交換トリガをセットする(時刻t1)。μDC1は、オフライン交換トリガがセットされると、ファイル単位でストレージへの書き込みがあったか否かを記録する。そして、交換用のμDC2を現場700へ物理的に輸送する。μDC2はトラックなど物理的な交通機関を使って輸送する。
(4) When application deployment and storage copy are completed, the offline exchange trigger (FTRG) unit 1225 sets an offline exchange trigger for difference detection from μDC2 to μDC1 (time t1). When the off-line exchange trigger is set, the μDC 1 records whether or not there has been writing to the storage in units of files. Then, the replacement μDC 2 is physically transported to the site 700. μDC2 is transported using physical transportation such as trucks.
(5)現場700に到着(時刻t2)後、μDC2のノード情報(IPアドレス)をCDC400に通知し、CDC400ではμDC1とμDC2のノード対応付けを行う。
変更ないものはCビット(Clean:0)とする。 (5) After arriving at the site 700 (time t2), the node information (IP address) of μDC2 is notified to theCDC 400, and the CDC 400 performs node association between μDC1 and μDC2.
Those that do not change are C bits (Clean: 0).
変更ないものはCビット(Clean:0)とする。 (5) After arriving at the site 700 (time t2), the node information (IP address) of μDC2 is notified to the
Those that do not change are C bits (Clean: 0).
(6)オンライン交換トリガ(NTRG)部1224でμDC1へオンライン交換トリガをセットし、μDC1のアプリケーションを停止させる。そして、上記(4)で差分を検知したファイルのうち、一部であるダーティなプライマリファイルのみ、μDC1からμDC2へコピーする。コピーを一部に限定することにより、現場700でのコピー時間を削減することができる。なお、コピー対象に関しては、後述する。
その後、μDC2のアプリケーションを稼働させる。 (6) The online exchange trigger (NTRG)unit 1224 sets the online exchange trigger to the μDC1 and stops the application of the μDC1. Then, only the dirty primary file that is a part of the files in which the difference is detected in the above (4) is copied from the μDC1 to the μDC2. By limiting the copy to a part, the copy time at the site 700 can be reduced. The copy target will be described later.
Thereafter, the application of μDC2 is activated.
その後、μDC2のアプリケーションを稼働させる。 (6) The online exchange trigger (NTRG)
Thereafter, the application of μDC2 is activated.
(7)現場700でストレージ差分のコピー中は、μDC1への入力はバッファに蓄積される。
上記(6)のコピー後に入力バッファをμDC2にコピーし、現場のプライマリ装置をμDC2とし、ユーザ500へのサービスを開始する。交換完了に伴い(時刻t3)、CDC400へプライマリ装置をμDC2と通知する。このように、新旧のμDCの切り替えに伴う極短い時間だけ、ユーザ500へのサービスが一次中断される。 (7) While copying the storage difference at thesite 700, the input to the μDC1 is accumulated in the buffer.
After the copy of (6) above, the input buffer is copied to μDC2, the primary device at the site is set to μDC2, and the service to theuser 500 is started. Upon completion of the exchange (time t3), the primary device is notified to the CDC 400 as μDC2. In this way, the service to the user 500 is temporarily interrupted for a very short time associated with switching between the old and new μDCs.
上記(6)のコピー後に入力バッファをμDC2にコピーし、現場のプライマリ装置をμDC2とし、ユーザ500へのサービスを開始する。交換完了に伴い(時刻t3)、CDC400へプライマリ装置をμDC2と通知する。このように、新旧のμDCの切り替えに伴う極短い時間だけ、ユーザ500へのサービスが一次中断される。 (7) While copying the storage difference at the
After the copy of (6) above, the input buffer is copied to μDC2, the primary device at the site is set to μDC2, and the service to the
(8)CDC400からユーザ500へ、接続先をμDC1からμDC2に変更するよう通知する。ユーザ500は、接続先をμDC2に変更する。入力がμDC2へ切替わり、上記(7)の入力バッファから順番に処理することによって、サービスを継続する。
(8) The CDC 400 notifies the user 500 to change the connection destination from μDC1 to μDC2. The user 500 changes the connection destination to μDC2. The input is switched to μDC2, and the service is continued by processing sequentially from the input buffer (7).
(9)交換完了後、バックグランドで、ストレージの差分でかつ上記(6)でコピーされなかった残りの部分をコピーする。
(9) After the replacement is completed, copy the remaining part of the storage difference and not copied in (6) above in the background.
本実施例によれば、図4のフローに示すとおり、定期または決められた日時でμDCを交換するため、メンテステーションで予め同装置に対するストレージの遠隔コピーとアプリケーションのデプロイを行なっておき、現場へ輸送後に必要最低限のストレージコピーを行い、新しいμDCでサービスを継続する。事前に交換用のμDCの準備をしてから配達するため、現場には1回のみ行くだけでよく、滞在時間が短くて済む。差分を検知したファイルに関して、ストレージのコピーを2回行なうが、1回目と2回目でストレージのコピーする対象が異なるのが本発明の第一の実施例の特徴である。
According to the present embodiment, as shown in the flow of FIG. 4, in order to replace the μDC periodically or at a fixed date and time, remote copy of the storage and deployment of the application to the same device are performed in advance at the maintenance station, and then to the site. Make a minimum storage copy after transportation and continue the service with a new μDC. Since the μDC for replacement is prepared and delivered in advance, it is only necessary to go to the site only once and the staying time is short. Regarding the file in which the difference is detected, the storage copy is performed twice, but the target of the storage copy differs between the first time and the second time, which is a feature of the first embodiment of the present invention.
本実施例では、現場700で必要最低限のコピーを行ない、装置交換を高速化すべく、冗長性に着目してストレージコピーの削減を行なう機構を有する。
This embodiment has a mechanism for performing storage copy reduction by paying attention to redundancy in order to perform the minimum necessary copy at the site 700 and speed up the replacement of the apparatus.
ここで、マイクロDCの冗長化について説明する。図5は、図4に対応する、新旧のμDCの関係を示す図である。
Here, the redundancy of the micro DC will be described. FIG. 5 is a diagram showing the relationship between old and new μDCs corresponding to FIG.
図4の交換フローの(4)でμDC2をオフラインとし、μDC1のオフライン交換トリガ(FTRG)をセットすると、図5のμDC1のオフライン差分管理テーブル(ODMT)にμDC1で更新のあったファイルのみDビット(Dirty:1)がセットされ(図5のODMTの(3)、(4))、変更ないものはCビット(Clean:0)とする(図5のODMTの(1)、(2))。次に、メンテステーションから現場へμDC2を輸送する。μDC2が現場へし、図4の交換フローの(6)でμDC1のオンライン交換トリガ(NTRG)をセットすると、ファイルシステム管理部(FSM)のμDC2へコピーした後に、必要なファイルのコピーが行われる。
When the μDC2 is set offline in (4) of the exchange flow in FIG. 4 and the offline exchange trigger (FTRG) of the μDC1 is set, only the file updated in the μDC1 offline difference management table (ODMT) in FIG. (Dirty: 1) is set ((3) and (4) of the ODMT in FIG. 5), and the C bits (Clean: 0) are not changed (ODMT (1) and (2) in FIG. 5). . Next, μDC2 is transported from the maintenance station to the site. When the μDC2 goes to the site and the online exchange trigger (NTRG) of the μDC1 is set in (6) of the exchange flow in FIG. 4, the necessary files are copied after copying to the μDC2 of the file system management unit (FSM). .
図5において、オフライン差分管理テーブル(ODMT)がDビット、かつ冗長化管理テーブル(RMT)がPビットのファイル(図5のODMTの(3))のみ、μDC1からμDC2へコピーされる。オフライン差分管理テーブル(ODMT)がDビットかつ冗長化管理テーブル(RMT)がSビットのファイル(図5のODMTの(4))はコピーしない。
In FIG. 5, only the file having the D-bit offline difference management table (ODMT) and the P-bit redundancy management table (RMT) (ODMT (3) in FIG. 5) is copied from μDC1 to μDC2. A file whose offline difference management table (ODMT) is D bits and whose redundancy management table (RMT) is S bits (ODMT (4) in FIG. 5) is not copied.
図5の例では、LU内のファイル5はμDC1からμDC2へコピーするが、LU内のファイル6はコピーしない。ファイル6はファイル5と内容は同一であるため、μDC1とμDC2の交換後に、μDC2のファイル5からコピーしてファイル6を生成する。オフライン差分管理テーブル(ODMT)123がCビットのファイル(図5のODMTの(1)、(2))は更新がないため、ファイルコピーの必要がない。
In the example of FIG. 5, the file 5 in the LU is copied from μDC1 to μDC2, but the file 6 in the LU is not copied. Since the file 6 has the same content as the file 5, the file 6 is generated by copying from the file 5 of the μDC 2 after exchanging the μDC 1 and the μDC 2. Since the offline difference management table (ODMT) 123 is a C-bit file (ODMT (1) and (2) in FIG. 5) is not updated, there is no need to copy the file.
このように、μDC1のオフライン交換トリガ(FTRG)がセットされた後、新規にファイルが生成された場合は、新規ファイルのINODEに対応して、冗長化管理テーブル(RMT)のプライマリとセカンダリが追加され、該当INODEに対応してオフライン差分管理テーブル(ODMT)にDビットがセットされる。オンライン交換トリガ(NTRG)がセットされると、新規ファイルのうち、冗長化管理テーブル(RMT)のプライマリファイルのみμDC1からμDC2へコピーされる。セカンダリファイルは、交換後にμDC2内でプライマリファイルからコピーされる。
As described above, when a new file is generated after the offline exchange trigger (FTRG) of μDC1 is set, the primary and secondary of the redundancy management table (RMT) are added corresponding to the INODE of the new file. The D bit is set in the offline difference management table (ODMT) corresponding to the corresponding INODE. When the online exchange trigger (NTRG) is set, only the primary file of the redundancy management table (RMT) among the new files is copied from μDC1 to μDC2. The secondary file is copied from the primary file in the μDC 2 after the exchange.
図6のテーブル1300は、現場到着時におけるファイルコピーの要否を示している。図6において、ケース1のファイル1は、RMTがプライマリ(P)、ODMTがClean(0)で、この場合には、現場到着時、μDC2へコピーしない。ケース2のファイル2は、RMTがセカンダリ(S)、ODMTがClean(0)で、この場合も、μDC2へコピーしない。ケース3のファイル5は、RMTがプライマリ(P)、ODMTがDirty(1)で、この場合には、現場到着時、μDC2へコピーする。ケース4のファイル6は、RMTがセカンダリ(S)、ODMTがDirty(1)で、この場合には、現場到着時、μDC2へコピーしない。すなわち、現場では、ケース3のファイル5のみをコピーすれば良い。
The table 1300 in FIG. 6 indicates whether or not file copying is required upon arrival at the site. In FIG. 6, file 1 of case 1 has RMT as primary (P) and ODMT as Clean (0). In this case, when it arrives at the site, it is not copied to μDC2. In file 2 of case 2, RMT is secondary (S) and ODMT is Clean (0), and in this case also, it is not copied to μDC2. The file 5 of case 3 is RMT is primary (P) and ODMT is Dirty (1). In this case, the file 5 is copied to the μDC 2 upon arrival at the site. The file 6 of the case 4 is RMT secondary (S) and ODMT Dirty (1). In this case, the file 6 is not copied to the μDC 2 upon arrival at the site. That is, only the file 5 of the case 3 needs to be copied at the site.
図1Aでは、オンライン交換トリガ(NTRG)部1224とオフライン交換トリガ(FTRG)部1225の各出力は状態を表す形式となっているため、ソフトウェア上で変化点を見る必要があるが、トリガを表す形式、すなわち、1を書き込むと0に戻るようにしてもよく、トリガが判定できれば、実装は制限されない。
In FIG. 1A, since each output of the online exchange trigger (NTRG) unit 1224 and the offline exchange trigger (FTRG) unit 1225 is in a format representing a state, it is necessary to see the change point on the software, but represents the trigger. The format, that is, 1 may be written to return to 0, and the implementation is not limited as long as the trigger can be determined.
図4の交換フローの(6)でオンライン交換トリガ(NTRG)部1224でトリガがセットされると、μDC1からμDC2へコピーが始まると同時に、アプリケーションサービスはストップし、メモリ上の入力バッファ(BUF)にセッション情報と入力データが蓄積される。これに伴い、ユーザ側がハングアップしないための応答処理を行う。例えば、ユーザがスマートフォンのときは、セッションを維持し、一時的な中断であることを示すメッセージをWeb画面として応答し、ユーザからの入力が行われないようにする。センサなどCTR側へ一方的にデータを送信するケースでは、特に応答の必要はない。μDC2へストレージのコピーが終了した後、μDC1の入力バッファ(BUF)からμDC2の入力バッファへコピーする。新旧のμDCの切り替えに伴う短い時間だけ、ユーザ500へのサービスが一次中断されるが、ユーザからの入力はμDC1のバッファに蓄積される。μDC2は、ストレージ並びにバッファのコピーの後は、バッファから先に入力を処理する。このように、ユーザがμDC2へ接続を切替えた後、アプリケーションを再開し、μDC2の入力バッファ(BUF)から入力データを処理することで、サービス中断中の入力データをロストせずに、アプリケーションを継続することができる。
When the trigger is set by the online exchange trigger (NTRG) unit 1224 in (6) of the exchange flow in FIG. 4, the copy service starts from μDC1 to μDC2, and at the same time, the application service stops and the input buffer (BUF) in the memory Session information and input data are stored. Along with this, response processing is performed so that the user side does not hang up. For example, when the user is a smartphone, the session is maintained, and a message indicating that it is temporarily interrupted is responded as a Web screen so that input from the user is not performed. In the case where data is unilaterally transmitted to the CTR side such as a sensor, no response is required. After the storage copy to the μDC2 is completed, the copy is made from the input buffer (BUF) of the μDC1 to the input buffer of the μDC2. The service to the user 500 is temporarily interrupted only for a short time associated with the switching between the old and new μDC, but the input from the user is accumulated in the buffer of the μDC1. The μDC2 processes the input from the buffer first after the storage and the buffer copy. As described above, after the user switches the connection to the μDC2, the application is resumed, and the input data is processed from the input buffer (BUF) of the μDC2, thereby continuing the application without losing the input data during the service interruption. can do.
通常は、ファイルの更新があったとき、すなわち、オフライン差分管理テーブル(ODMT)にDirtyなファイルがあれば、全てコピーするのが自然である。ところが、本実施例では、Dirtyであってもセカンダリのファイルはプライマリから自律的に生成できるため、交換時のコピーを行なわない。これにより、交換時の現場でのストレージコピーに要する時間を大幅に削減し、保守員の現場での滞在時間や滞在回数を減らすことで、保守コストの削減を図ることができる利点がある。また、本実施例によれば、現場での作業時間が短縮されるため、μDCの交換時にユーザの入力データを保持することが容易となり、アプリケーションを停止せずユーザに対するサービスを継続できる利点がある。
Normally, when there is a file update, that is, if there is a dirty file in the offline difference management table (ODMT), it is natural to copy all the files. However, in this embodiment, even if it is Dirty, the secondary file can be generated autonomously from the primary, and therefore, copying at the time of replacement is not performed. As a result, there is an advantage that the time required for storage copy at the site at the time of replacement can be greatly reduced, and the maintenance cost can be reduced by reducing the stay time and the number of stays at the site. In addition, according to the present embodiment, since the work time at the site is shortened, it is easy to retain user input data when exchanging μDC, and there is an advantage that service for the user can be continued without stopping the application. .
次に、図7に、本発明の第2の実施例に係るμDC(100A,100B)の構成例を示す。この例では、更新管理テーブルとして、第一の実施例のオフライン差分管理テーブル(ODMT)を拡張した、ストレージコピーの優先度を示す管理テーブルを用いる。すなわち、第2の実施例では、オフライン差分管理テーブル(ODMT)の代わりに、優先度管理テーブル(PMT)1226を設ける。ストレージのコピーの優先度とは、交替の際、ストレージコピーを優先するのに使用する。図7では優先度が1から8の数字としているが、特に制限されない。優先度は、ファイルシステム管理部がポリシーを定める。例えば、一定期間アクセスがないファイルや古いバージョンのファイルなどの優先度を低くする。
Next, FIG. 7 shows a configuration example of the μDC (100A, 100B) according to the second embodiment of the present invention. In this example, a management table indicating the priority of storage copy, which is an extension of the offline difference management table (ODMT) of the first embodiment, is used as the update management table. That is, in the second embodiment, a priority management table (PMT) 1226 is provided instead of the offline difference management table (ODMT). The storage copy priority is used to give priority to the storage copy at the time of replacement. In FIG. 7, the priority is a number from 1 to 8, but is not particularly limited. The priority is determined by the file system management unit. For example, the priority of a file that has not been accessed for a certain period of time or an older version file is lowered.
以下、図8のタイムチャートに沿って第2の実施例の動作を説明する。図4のタイムチャートと異なるのは、オフライン交換トリガのセットした(時刻t1)後、ファイル単位で優先度を設定することにある。なお、優先度の設定は、オフライン交換トリガがセットされた後、現場で行っても良く、あるいは、オフライン交換トリガのセット前に、予め定義し自動的に処理されるようにすることもできる。さらに、μDC1へオンライン交換トリガをセットし、設定された優先度の高いファイルののみ、μDC1からμDC2へコピーする。
Hereinafter, the operation of the second embodiment will be described with reference to the time chart of FIG. The difference from the time chart of FIG. 4 is that the priority is set in units of files after the offline exchange trigger is set (time t1). The priority may be set in the field after the offline exchange trigger is set, or may be defined and automatically processed before the offline exchange trigger is set. Furthermore, an online exchange trigger is set in μDC1, and only the set high priority file is copied from μDC1 to μDC2.
この例でも、コピーを一部に限定することにより、現場700でのコピー時間を削減することができる。接続先をμDC1からμDC2に変更後、バックグランドで、低優先度のファイルをμDC1からμDC2へコピーする。
Also in this example, the copy time at the site 700 can be reduced by limiting the copy to a part. After changing the connection destination from μDC1 to μDC2, a low priority file is copied from μDC1 to μDC2 in the background.
すなわち、本実施例でも実施例1と同様に、交換時の現場でのストレージコピーの時間を削減することができると共に、アプリケーションを停止せずユーザに対するサービスを継続できる利点がある。
That is, in the present embodiment as well as the first embodiment, it is possible to reduce the time for storage copy at the site at the time of replacement, and there is an advantage that the service for the user can be continued without stopping the application.
第1の実施例や第2の実施例では、簡略化のために、各情報処理装置のμDCの情報処理ユニット数が1つの例の説明を行ったが、各情報処理装置の情報処理ユニット(UNT)数が複数の場合も対応できる。
図9に、本発明の第3の実施例に係るμDC100の構成例を示す。情報処理装置μDC100は、情報処理ユニット1(UNT1)110A、情報処理ユニット2(UNT2)110Bを備え、各ユニットは、各々、コントローラ(CTR)及びストレージ(STR)を有し、且つ、情報処理装置に共通のルータ(RTR)140を備えている。 In the first embodiment and the second embodiment, for the sake of simplification, an example in which the number of information processing units of μDC in each information processing apparatus is one has been described, but the information processing unit ( It is also possible to deal with a case where the number of UNT) is plural.
FIG. 9 shows a configuration example of theμDC 100 according to the third embodiment of the present invention. The information processing apparatus μDC100 includes an information processing unit 1 (UNT1) 110A and an information processing unit 2 (UNT2) 110B. Each unit has a controller (CTR) and a storage (STR), and the information processing apparatus And a common router (RTR) 140.
図9に、本発明の第3の実施例に係るμDC100の構成例を示す。情報処理装置μDC100は、情報処理ユニット1(UNT1)110A、情報処理ユニット2(UNT2)110Bを備え、各ユニットは、各々、コントローラ(CTR)及びストレージ(STR)を有し、且つ、情報処理装置に共通のルータ(RTR)140を備えている。 In the first embodiment and the second embodiment, for the sake of simplification, an example in which the number of information processing units of μDC in each information processing apparatus is one has been described, but the information processing unit ( It is also possible to deal with a case where the number of UNT) is plural.
FIG. 9 shows a configuration example of the
第3の実施例では、情報処理ユニット(UNT)の数が2つのファイルの冗長構成となっている。各LUの4つのファイルうち、ファイル1と3はプライマリが情報処理ユニット1(UNT1)でセカンダリが情報処理ユニット2(UNT2)、ファイル2と4はプライマリが情報処理ユニット2(UNT2)でセカンダリが情報処理ユニット1(UNT1)とする。冗長化管理テーブル(RMT)1222A、1222Bは、ファイルごとに情報処理ユニットとIノードのペアとして(情報処理ユニット、Iノード)の情報で管理する。例えば、情報処理ユニット1(UNT1)の冗長化管理テーブル(RMT)1222Aでは、もう一方のファイルが情報処理ユニット2(UNT2)にあるため、ファイル単位の情報処理ユニットの情報は2である。Iノード番号は情報処理ユニットが異なっても同じにしているが、同じでなくてもよい。
In the third embodiment, the number of information processing units (UNT) is a redundant configuration of two files. Of the four files in each LU, files 1 and 3 have primary information processing unit 1 (UNT1) and secondary information processing unit 2 (UNT2), and files 2 and 4 have primary information processing unit 2 (UNT2) and secondary information. It is assumed that the information processing unit 1 (UNT1). Redundancy management tables (RMT) 1222A and 1222B are managed as information processing unit / I node pairs (information processing unit, I node) information for each file. For example, in the redundancy management table (RMT) 1222A of the information processing unit 1 (UNT1), since the other file is in the information processing unit 2 (UNT2), the information of the information processing unit in units of files is 2. The I node number is the same regardless of the information processing unit, but it may not be the same.
本実施例でも、実施例1と同様に、交換時の現場でのストレージコピーの時間を削減することができると共に、アプリケーションを停止せずユーザに対するサービスを継続できる利点がある。
As in the first embodiment, this embodiment also has the advantage that the time for storage copy at the site at the time of replacement can be reduced and the service for the user can be continued without stopping the application.
これまで、ファイル単位での細粒度のファイルシステム管理部(FSM)での装置の交換の例を示したが、本発明は、装置交換以外、例えばある情報処理装置内の1つの情報処理ユニットに障害が発生したときの動作についても、セカンダリをコピーしない方法が適用できる。
Up to this point, an example of device exchange in the fine-grained file system management unit (FSM) in units of files has been shown. However, the present invention is not limited to device exchange, for example, in one information processing unit in an information processing device. A method that does not copy the secondary can also be applied to the operation when a failure occurs.
第4の実施例として、図10に、本発明の第4の実施例に係る3つの情報処理ユニット(110A、110B、110C)を備えたμDC100の構成例を示す。図11のタイムチャートに、障害が発生したときの動作を示す。
As a fourth embodiment, FIG. 10 shows a configuration example of a μDC 100 including three information processing units (110A, 110B, 110C) according to the fourth embodiment of the present invention. The time chart of FIG. 11 shows the operation when a failure occurs.
LUの各ファイルは第3の実施例と同じように、μDC100の内の別の情報処理ユニットに二重化されている。どちらか一方のファイルに障害が発生したときは、冗長化管理テーブル(RMT)1222を更新し、直ちにプライマリのストレージを用いてサービスを継続し、セカンダリのストレージはサービス再開中にバックグラウンドでコピーする。この例では、正常時、図11に示したように、情報処理ユニット1(110A)、情報処理ユニット2(110B)共に、プライマリファイル(P)とセカンダリファイル(S)が正常に機能しているものとする。
Each file in the LU is duplicated in another information processing unit in the μDC 100 as in the third embodiment. When a failure occurs in one of the files, the redundancy management table (RMT) 1222 is updated and the service is immediately continued using the primary storage, and the secondary storage is copied in the background while the service is resumed. . In this example, as shown in FIG. 11, in the normal state, the primary file (P) and the secondary file (S) function normally in both the information processing unit 1 (110A) and the information processing unit 2 (110B). Shall.
ここで、情報処理ユニット1(110A)に障害が発生し(図11の(1))、データセンタ(CDC)400に通知があったと仮定する。これにより、情報処理ユニット1(110A)の冗長化管理テーブル(RMT)1222によれば、Iノード2とIノード4のファイルに関しては、情報処理ユニット2(110B)にプライマリファイル(S)を有するため、アプリケーションサービス実行に影響はない。情報処理ユニット1のIノード1とIノード3のファイルに関しては、情報処理ユニット2のファイルは同じ内容をセカンダリファイル(S)として保存しているため、こちら(障害ノードのS)をプライマリ(P)に昇格させることでアプリケーションサービスを迅速に再開できる。具体的には、図11の(2)において、情報処理ユニット2(110B)の冗長化テーブル(RMT)の情報を変更する(Iノード1とIノード3のSを、いずれもPに変更)。そして、情報処理ユニット1で実行するアプリケーションを情報処理ユニット2で実行するよう変更すればよい。そして、サービス再開をデータセンタ(CDC)400に通知した後に、情報処理ユニット2(110B)でアプリケーションサービスを直ちに再開できる(図11の(3)、(4))。一方、新たな情報処理ユニット3(110C)にセカンダリ(S)のファイルをコピーし、関連するアプリケーションのデプロイをバックグラウンドで実施すればよい(図11の(5))。ここでは、単純化のため、情報処理ユニット1と情報処理ユニット2のみとしているが、複数の情報処理ユニットでファイルのプライマリとセカンダリの関係があっても同じように対応できる。
Here, it is assumed that a failure has occurred in the information processing unit 1 (110A) ((1) in FIG. 11) and the data center (CDC) 400 has been notified. Thereby, according to the redundancy management table (RMT) 1222 of the information processing unit 1 (110A), the information processing unit 2 (110B) has the primary file (S) for the files of the I node 2 and the I node 4. Therefore, application service execution is not affected. Regarding the files of the I node 1 and the I node 3 of the information processing unit 1, since the file of the information processing unit 2 stores the same contents as the secondary file (S), this (S of the failure node) is designated as the primary (P ) To quickly resume application services. Specifically, in (2) of FIG. 11, the information in the redundancy table (RMT) of information processing unit 2 (110B) is changed (S of I node 1 and I node 3 is changed to P). . Then, the application executed by the information processing unit 1 may be changed to be executed by the information processing unit 2. Then, after notifying the data center (CDC) 400 of the service restart, the information processing unit 2 (110B) can immediately restart the application service ((3) and (4) in FIG. 11). On the other hand, the secondary (S) file may be copied to the new information processing unit 3 (110C), and the related application may be deployed in the background ((5) in FIG. 11). Here, for the sake of simplicity, only the information processing unit 1 and the information processing unit 2 are used. However, even if a plurality of information processing units have a relationship between primary and secondary of a file, they can be handled in the same manner.
以上述べた通り、ファイル単位でプライマリ、セカンダリを管理し、更新管理テーブルの情報に基づいて、μDCの交換や障害時に一部のファイルのみをコピーすることで、サービス再開時間を短縮することができる。μDCの運用管理ミドルウェアにて、交換、または障害発生時にストレージのコピー状況を監視するが、セカンダリをコピーしないことは、このコピー状況を観測することにより判別できる。
As described above, the service restart time can be shortened by managing primary and secondary in units of files and copying only some files in the event of a μDC replacement or failure based on information in the update management table. . The μDC operation management middleware monitors the storage copy status at the time of replacement or failure, but it can be determined by observing this copy status that the secondary is not copied.
100…交換前のμDC1、110…情報処理ユニット、120…コントローラ(CTR)、121…メモリ(MEM)、122…ファイルシステム管理部(FSM)、123…バッファ(BUF)、124…CPU、125…ネットワークインターフェース(NIC)、126…ホストバスアダプタ(HBA)、130…ストレージ(STR)、140…ルータ(RTR)、200…交換用のμDC2、300…ネットワーク、1223…オフライン差分管理テーブル(ODMT)、1224…オンライン交換トリガ(NTRG)部、1225…オフライン交換トリガ(FTRG)部。
100: μDC 1 before replacement 110: Information processing unit 120: Controller (CTR) 121 ... Memory (MEM) 122 ... File system management unit (FSM) 123 ... Buffer (BUF) 124: CPU 125 Network interface (NIC), 126 ... Host bus adapter (HBA), 130 ... Storage (STR), 140 ... Router (RTR), 200 ... μDC2 for replacement, 300 ... Network, 1223 ... Offline difference management table (ODMT), 1224 ... Online exchange trigger (NTRG) part, 1225 ... Offline exchange trigger (FTRG) part.
Claims (15)
- ネットワークを介してアプリケーションを提供する分散型クラウドとして使用される情報処理装置であって、
コントローラとストレージとを有する少なくとも1つの情報処理ユニットを備え、
前記ストレージは、ファイル単位若しくはディレクトリ単位で、ペアのプライマリファイルとセカンダリファイルとを有するファイルシステムを備え、
前記コントローラは、
前記ファイルシステムの管理を行うファイルシステム管理部を有し、
該ファイルシステム管理部は、冗長化管理テーブルと、更新管理テーブルと、オンライン交換トリガ部と、オフライン交換トリガ部とを有し、
前記冗長化管理テーブルにより、プライマリファイルとセカンダリファイルの対応関係を管理し、前記プライマリファイルに書込みがあったときに対応する前記セカンダリファイルに書込みを行い、
前記更新管理テーブルは、前記オフライン交換トリガ部でオフライン交換トリガがセットされた後に、前記ファイルの更新に関する情報を管理する機能を有し、
前記ファイルシステム管理部は、
前記オンライン交換トリガ部でオンライン交換トリガのセットに伴い、前記更新管理テーブルの情報に基づき、前記オフライン交換トリガがセットされた後の前記ファイルの更新に関する情報に基づき、前記1つの情報処理ユニットの前記ファイルシステムの更新されたファイルの前記プライマリファイルのみを、交換用の他の前記情報処理ユニットへコピーする機能を有する
ことを特徴とする情報処理装置。 An information processing apparatus used as a distributed cloud that provides an application via a network,
Comprising at least one information processing unit having a controller and a storage;
The storage includes a file system having a primary file and a secondary file of a pair in file units or directory units,
The controller is
A file system management unit for managing the file system;
The file system management unit includes a redundancy management table, an update management table, an online exchange trigger unit, and an offline exchange trigger unit.
By managing the correspondence between the primary file and the secondary file by the redundancy management table, writing to the corresponding secondary file when writing to the primary file,
The update management table has a function of managing information related to the update of the file after an offline exchange trigger is set in the offline exchange trigger unit,
The file system management unit
With the online exchange trigger set in the online exchange trigger unit, based on the information in the update management table, based on the information on the update of the file after the offline exchange trigger is set, the one information processing unit An information processing apparatus having a function of copying only the primary file of an updated file in a file system to another information processing unit for replacement. - 請求項1において、
前記ファイルシステム管理部は、
前記更新されたファイルの前記プライマリファイル以外のファイルを、当該情報処理ユニットのストレージ内で自律的に生成する
ことを特徴とする情報処理装置。 In claim 1,
The file system management unit
An information processing apparatus that autonomously generates a file other than the primary file of the updated file in the storage of the information processing unit. - 請求項2において、
前記更新管理テーブルが、オフライン差分管理テーブルであり、
前記ファイルシステム管理部は、
前記オフライン交換トリガのセットに伴い、前記1つの情報処理ユニットと前記他の情報処理ユニットの前記ストレージの差分を検出して前記オフライン差分管理テーブルに記録し、
前記オンライン交換トリガのセットに伴い、前記ストレージの差分に関して、前記プライマリファイルのみを、他の前記情報処理ユニットへコピーする
ことを特徴とする情報処理装置。 In claim 2,
The update management table is an offline difference management table;
The file system management unit
Along with the set of the offline exchange trigger, the difference between the storages of the one information processing unit and the other information processing unit is detected and recorded in the offline difference management table,
In accordance with the set of online exchange triggers, only the primary file is copied to the other information processing unit with respect to the storage difference. - 請求項2において、
前記更新管理テーブルが、優先度テーブルであり、
前記ファイルシステム管理部は、
前記オンライン交換トリガのセットに伴い、前記優先度テーブルの情報に基づき、前記プライマリファイルのみを、他の前記情報処理ユニットへコピーする
ことを特徴とする情報処理装置。 In claim 2,
The update management table is a priority table;
The file system management unit
In accordance with the set of online exchange triggers, only the primary file is copied to another information processing unit based on information in the priority table. - 請求項4において、
前記優先度テーブルは、一定期間アクセスがないファイルや古いバージョンのファイルの優先度を低くする
ことを特徴とする情報処理装置。 In claim 4,
The information processing apparatus, wherein the priority table lowers the priority of a file that has not been accessed for a certain period of time or an old version of the file. - 請求項2において、
前記1つの情報処理ユニットと、前記他の前記情報処理ユニットが、1つの情報処理装置内に設けられている
ことを特徴とする情報処理装置。 In claim 2,
The information processing apparatus, wherein the one information processing unit and the other information processing unit are provided in one information processing apparatus. - 請求項2において、
前記1つの情報処理装置内に、第一の情報処理ユニット、第二の情報処理ユニット、及び、第三の情報処理ユニットを備え、
前記各情報処理ユニットは、
プライマリにファイルの書込みがあったときにセカンダリにファイルの書込みを行い、
前記第一の情報処理ユニットに障害が発生し、該第一の情報処理ユニットが不使用となった際に、
該第一の情報処理ユニットのセカンダリファイルを有する前記第二の情報処理ユニットにおいて、
該第二の情報処理ユニットの冗長化管理テーブルのセカンダリビットをプライマリビットに変更する手順と
該第二の情報処理ユニットでプライマリファイルの更新を開始した後に、
前記第三の情報処理ユニットの冗長化管理テーブルにセカンダリファイルを登録する手順と、
前記第二の情報処理ユニットのプライマリファイルを前記第三の情報処理ユニットへセカンダリファイルをコピーする手順を有する
ことを特徴とする情報処理装置。 In claim 2,
The one information processing device includes a first information processing unit, a second information processing unit, and a third information processing unit,
Each of the information processing units is
When a file is written to the primary, the file is written to the secondary.
When a failure occurs in the first information processing unit and the first information processing unit is not used,
In the second information processing unit having a secondary file of the first information processing unit,
A procedure for changing the secondary bit of the redundancy management table of the second information processing unit to the primary bit, and after starting the update of the primary file in the second information processing unit,
A procedure for registering a secondary file in the redundancy management table of the third information processing unit;
An information processing apparatus comprising: a procedure for copying a secondary file from a primary file of the second information processing unit to the third information processing unit. - ネットワークを介してアプリケーションを提供する分散型クラウドとして使用される情報処理装置の交換支援システムであって、
前記情報処理装置は、中央のデータセンタと連携してデータを処理する分散クラウド環境下の小型データセンタを構成する情報処理装置であり、
前記小型データセンタを構成する第一の情報処理装置を、該第一の情報処理装置と同じ機能を有する第二の情報処理装置へ交換する際に、
前記ネットワークを介して前記小型データセンタの前記第一の情報処理装置と前記中央のデータセンタの前記第二の情報処理装置とを接続し、前記第一の情報処理装置の前記ストレージのファイルを前記第二の情報処理装置のストレージにコピーし、
前記第二の情報処理装置を前記小型データセンタに輸送後に、該輸送中に生じた前記第一の情報処理装置と前記第二の情報処理装置のストレージの差分に関して、その一部のみを前記第二の情報処理装置にコピーして、前記交換を行い、
前記ストレージの差分の残りの部分に関しては、前記交換された前記第二の情報処理装置のストレージ内で自律的に生成する
ことを特徴とする情報処理装置の交換支援システム。 An information processing apparatus exchange support system used as a distributed cloud that provides applications via a network,
The information processing apparatus is an information processing apparatus constituting a small data center in a distributed cloud environment that processes data in cooperation with a central data center,
When exchanging the first information processing device constituting the small data center with a second information processing device having the same function as the first information processing device,
The first information processing device of the small data center and the second information processing device of the central data center are connected via the network, and the storage file of the first information processing device is Copy to the storage of the second information processing device,
After transporting the second information processing apparatus to the small data center, only a part of the storage difference between the first information processing apparatus and the second information processing apparatus generated during the transport is stored in the first information processing apparatus. Copy to the second information processing device, perform the exchange,
The remaining part of the difference between the storages is autonomously generated in the storage of the replaced second information processing apparatus. - 請求項8において、
前記第一の情報処理装置及び前記第二の情報処理装置は、
コントローラとストレージとを有する少なくとも1つの情報処理ユニットを備え、
前記ストレージは、ファイル単位若しくはディレクトリ単位で、ペアのプライマリファイルとセカンダリファイルとを有するファイルシステムを備え、
前記コントローラは、
前記ファイルシステムの管理を行うファイルシステム管理部を有し、
該ファイルシステム管理部は、冗長化管理テーブルと、更新管理テーブルと、オンライン交換トリガ部と、オフライン交換トリガ部とを有し、
前記冗長化管理テーブルにより、プライマリファイルとセカンダリファイルの対応関係を管理し、前記プライマリファイルに書込みがあったときに対応する前記セカンダリファイルに書込みを行い、
前記更新管理テーブルは、前記オフライン交換トリガ部でオフライン交換トリガがセットされた後に、前記第一の情報処理装置の前記ファイルの更新に関する情報を管理する機能を有し、
前記ファイルシステム管理部は、
前記オンライン交換トリガ部でオンライン交換トリガのセットに伴い、前記更新管理テーブルを参照し、前記オフライン交換トリガがセットされた後の前記ファイルの更新に関する情報に基づき、前記更新されたファイルのプライマリファイルのみを、前記第二の情報処理装置へコピーする機能を有する
ことを特徴とする情報処理装置の交換支援システム。 In claim 8,
The first information processing apparatus and the second information processing apparatus are:
Comprising at least one information processing unit having a controller and a storage;
The storage includes a file system having a primary file and a secondary file of a pair in file units or directory units,
The controller is
A file system management unit for managing the file system;
The file system management unit includes a redundancy management table, an update management table, an online exchange trigger unit, and an offline exchange trigger unit.
By managing the correspondence between the primary file and the secondary file by the redundancy management table, writing to the corresponding secondary file when writing to the primary file,
The update management table has a function of managing information related to the update of the file of the first information processing apparatus after an offline exchange trigger is set in the offline exchange trigger unit,
The file system management unit
When the online exchange trigger unit sets the online exchange trigger, the update management table is referred to and only the primary file of the updated file is based on the information about the update of the file after the offline exchange trigger is set. An information processing apparatus exchange support system having a function of copying the information to the second information processing apparatus. - 請求項9において、
前記更新管理テーブルが、オフライン差分管理テーブルであり、
前記オフライン交換トリガのセットに伴い前記オフライン差分管理テーブルへの記録を行い、
前記オンライン交換トリガのセットに伴い、前記第一の情報処理装置の前記オフライン差分管理テーブルがダーティ、かつ、前記冗長化管理テーブルがプライマリのファイルを、前記第二の計算機へコピーし、
前記交換後に、
前記第一の情報処理装置のオフライン差分管理テーブルがダーティかつ、前記冗長化管理テーブルがセカンダリのファイルを、前記第二の情報処理装置の前記プライマリファイルから該第二の情報処理装置にセカンダリファイルとしてコピーする
ことを特徴とする情報処理装置の交換支援システム。 In claim 9,
The update management table is an offline difference management table;
Recording to the offline difference management table with the set of the offline exchange trigger,
Along with the set of the online exchange trigger, the offline difference management table of the first information processing apparatus is dirty, and the redundancy management table is a primary file is copied to the second computer,
After the exchange,
A file in which the offline difference management table of the first information processing apparatus is dirty and the redundancy management table is a secondary file is transferred from the primary file of the second information processing apparatus to the second information processing apparatus as a secondary file. An information processing apparatus exchange support system characterized by copying. - 請求項9において、
前記更新管理テーブルが優先度テーブルであり、
前記オフライン交換トリガのセットに伴い、前記オフライン差分管理テーブルの機能を開始させ、
前記第一の情報処理装置の前記オフライン差分管理テーブルがダーティ、かつ、前記冗長化管理テーブルがプライマリのファイルを、前記第二の計算機へコピーし、
前記交換後に、前記ストレージの残りの部分を前記第二の情報処理装置内で自律的に生成する
ことを特徴とする情報処理装置の交換支援システム。 In claim 9,
The update management table is a priority table;
With the setting of the offline exchange trigger, start the function of the offline difference management table,
The offline difference management table of the first information processing apparatus is dirty, and the redundancy management table is a primary file is copied to the second computer,
An information processing apparatus replacement support system, wherein after the replacement, the remaining part of the storage is autonomously generated in the second information processing apparatus. - ネットワークを介してアプリケーションを提供する分散型クラウドとして使用される情報処理装置の交換を支援する方法であって、
前記各情報処理装置は、中央のデータセンタと連携してデータを処理する分散クラウド環境下の小型データセンタを構成する情報処理装置であり、
前記小型データセンタを構成する第一の情報処理装置を、該第一の情報処理装置と同じ機能を有する第二の情報処理装置へ交換する際に、
前記ネットワークを介して前記小型データセンタの前記第一の情報処理装置と前記中央のデータセンタの前記第二の情報処理装置とを接続し、前記第一の情報処理装置の前記ストレージのファイルを前記第二の情報処理装置のストレージにコピーし、
前記第二の情報処理装置を前記小型データセンタに輸送後に、該輸送中に生じた前記第一の情報処理装置と前記第二の情報処理装置のストレージの差分に関して、その一部のみを前記第二の情報処理装置にコピーして、前記交換を行い、
前記ストレージの差分の残りの部分に関しては、前記交換された前記第二の情報処理装置のストレージ内で自律的に生成する
ことを特徴とする情報処理装置の交換支援方法。 A method of supporting the exchange of information processing devices used as a distributed cloud that provides applications over a network,
Each of the information processing devices is an information processing device that constitutes a small data center in a distributed cloud environment that processes data in cooperation with a central data center,
When exchanging the first information processing device constituting the small data center with a second information processing device having the same function as the first information processing device,
The first information processing device of the small data center and the second information processing device of the central data center are connected via the network, and the storage file of the first information processing device is Copy to the storage of the second information processing device,
After transporting the second information processing apparatus to the small data center, only a part of the storage difference between the first information processing apparatus and the second information processing apparatus generated during the transport is stored in the first information processing apparatus. Copy to the second information processing device, perform the exchange,
The remaining part of the difference in the storage is autonomously generated in the storage of the replaced second information processing apparatus. - 請求項12において、
前記第一の情報処理装置及び前記第二の情報処理装置は、
コントローラとストレージとを有する少なくとも1つの情報処理ユニットを備え、
前記ストレージは、ファイル単位若しくはディレクトリ単位で、ペアのプライマリファイルとセカンダリファイルとを有するファイルシステムを備え、
前記コントローラは、前記ファイルシステムの管理を行うファイルシステム管理部を有し、
前記冗長化管理テーブルにより、前記ファイル単位で、プライマリとセカンダリの対応関係を管理し、前記輸送中に前記第一の情報処理装置の前記プライマリファイルに書込みがあったときに該第一の情報処理装置の前記セカンダリファイルに書込みを行い、
前記更新管理テーブルにより、前記輸送中の前記ファイルの更新の有無を管理し、
前記第一の情報処理装置から前記第二の前記情報処理装置へ交換する際に、
前記第一の情報処理装置の前記プライマリファイルと前記セカンダリファイルを、ネットワークを介して接続された前記第二の情報処理装置へコピーする第一のコピー手順を実行し、
前記第一のコピー手順の後に、前記ストレージの差分に関して、前記更新管理テーブルの情報に基づき、前記輸送中に更新の有った特定のファイルの前記プライマリファイルを、前記第二の計算機へコピーする第二のコピー手順を実行し、
前記交換後に、
前記ストレージの差分に関して、前記更新管理テーブルの情報に基づき、前記更新の有った前記プライマリファイル以外のファイルに関し、前記第二の情報処理装置のストレージ内でコピーする第三のコピー手順を実行して、前記ペアとなるプライマリファイルとセカンダリファイルを構築する
ことを特徴とする情報処理装置の交換支援方法。 In claim 12,
The first information processing apparatus and the second information processing apparatus are:
Comprising at least one information processing unit having a controller and a storage;
The storage includes a file system having a primary file and a secondary file of a pair in file units or directory units,
The controller has a file system management unit for managing the file system,
The redundancy management table manages the correspondence between primary and secondary in the file unit, and the first information processing is performed when the primary file of the first information processing apparatus is written during the transportation. Write to the secondary file of the device,
The update management table manages whether the file being updated is being updated,
When exchanging from the first information processing device to the second information processing device,
Performing a first copy procedure for copying the primary file and the secondary file of the first information processing apparatus to the second information processing apparatus connected via a network;
After the first copy procedure, the primary file of the specific file updated during the transportation is copied to the second computer based on the information in the update management table with respect to the storage difference. Perform the second copy procedure,
After the exchange,
Regarding the difference in storage, based on the information in the update management table, execute a third copy procedure for copying in the storage of the second information processing apparatus for files other than the updated primary file. An information processing apparatus replacement support method, wherein the paired primary file and secondary file are constructed. - 請求項13において、
前記更新管理テーブルが、オフライン差分管理テーブルであり、
前記第一のコピー手順後に、前記オフライン差分管理テーブルの機能を開始させ、
前記第一の情報処理装置の前記オフライン差分管理テーブルがダーティ、かつ、前記冗長化管理テーブルがプライマリのファイルを、前記第二の計算機へコピーする前記第二のコピー手順を実行し、
前記交換後に、
前記第一の情報処理装置のオフライン差分管理テーブルがダーティかつ、冗長化管理テーブルがセカンダリのファイルを、前記第二の情報処理装置の前記プライマリファイルから該第二の情報処理装置にセカンダリファイルとしてコピーする前記第三のコピー手順を実行する
ことを特徴とする情報処理装置の交換支援方法。 In claim 13,
The update management table is an offline difference management table;
After the first copy procedure, start the function of the offline difference management table,
The offline copy management table of the first information processing apparatus is dirty, and the redundancy management table is a primary file, and executes the second copy procedure for copying to the second computer,
After the exchange,
Copy the file whose offline difference management table of the first information processing apparatus is dirty and whose redundancy management table is secondary as the secondary file from the primary file of the second information processing apparatus to the second information processing apparatus An information processing apparatus replacement support method, wherein the third copy procedure is executed. - 請求項13において、
前記更新管理テーブルが優先度テーブルであり、
前記オフライン交換トリガのセットに伴い、前記オフライン差分管理テーブルの機能を開始させ、
前記第一の情報処理装置の前記オフライン差分管理テーブルがダーティ、かつ、前記冗長化管理テーブルがプライマリのファイルを、前記第二の計算機へコピーし、
前記交換後に、前記ストレージの残りの部分を、前記交換された前記第二の情報処理装置のストレージ内で前記ペアとなるプライマリファイルとセカンダリファイルを自律的に生成する
ことを特徴とする情報処理装置の交換支援方法。 In claim 13,
The update management table is a priority table;
With the setting of the offline exchange trigger, start the function of the offline difference management table,
The offline difference management table of the first information processing apparatus is dirty, and the redundancy management table is a primary file is copied to the second computer,
After the exchange, the remaining part of the storage is autonomously generated with the paired primary file and secondary file in the exchange of the second information processing apparatus. Exchange support method.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/059466 WO2014155654A1 (en) | 2013-03-29 | 2013-03-29 | Information processing device, and information processing device replacement assistance system and replacement assistance method |
JP2015507861A JP5947974B2 (en) | 2013-03-29 | 2013-03-29 | Information processing apparatus, information processing apparatus exchange support system, and exchange support method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/059466 WO2014155654A1 (en) | 2013-03-29 | 2013-03-29 | Information processing device, and information processing device replacement assistance system and replacement assistance method |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2014155654A1 true WO2014155654A1 (en) | 2014-10-02 |
Family
ID=51622719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2013/059466 WO2014155654A1 (en) | 2013-03-29 | 2013-03-29 | Information processing device, and information processing device replacement assistance system and replacement assistance method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5947974B2 (en) |
WO (1) | WO2014155654A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10424344B2 (en) | 2016-11-15 | 2019-09-24 | Fujitsu Limited | Method of controlling information processing apparatus |
US11150947B2 (en) | 2017-10-04 | 2021-10-19 | Toyota Jidosha Kabushiki Kaisha | Determining a deletion deadline for a staging environment |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001084179A (en) * | 1999-09-16 | 2001-03-30 | Nippon Digital Kenkyusho:Kk | Automatic backup system and recording medium recording automatic backup program |
JP2004021914A (en) * | 2002-06-20 | 2004-01-22 | Hitachi Ltd | Computer system and method for obtaining back up |
-
2013
- 2013-03-29 WO PCT/JP2013/059466 patent/WO2014155654A1/en active Application Filing
- 2013-03-29 JP JP2015507861A patent/JP5947974B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001084179A (en) * | 1999-09-16 | 2001-03-30 | Nippon Digital Kenkyusho:Kk | Automatic backup system and recording medium recording automatic backup program |
JP2004021914A (en) * | 2002-06-20 | 2004-01-22 | Hitachi Ltd | Computer system and method for obtaining back up |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10424344B2 (en) | 2016-11-15 | 2019-09-24 | Fujitsu Limited | Method of controlling information processing apparatus |
US10482926B2 (en) | 2016-11-15 | 2019-11-19 | Fujitsu Limited | Information processing apparatus |
US11150947B2 (en) | 2017-10-04 | 2021-10-19 | Toyota Jidosha Kabushiki Kaisha | Determining a deletion deadline for a staging environment |
Also Published As
Publication number | Publication date |
---|---|
JPWO2014155654A1 (en) | 2017-02-16 |
JP5947974B2 (en) | 2016-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9122653B2 (en) | Migrating virtual machines across sites | |
JP4282464B2 (en) | Remote copy system | |
JP5352115B2 (en) | Storage system and method for changing monitoring condition thereof | |
US8868819B2 (en) | Storage system group including scale-out storage system and management method therefor | |
JP2005018510A (en) | Data center system and its control method | |
JP2019101703A (en) | Storage system and control software arrangement method | |
JP5286212B2 (en) | Remote copy control method and system in storage cluster environment | |
US20140122816A1 (en) | Switching between mirrored volumes | |
US8032786B2 (en) | Information-processing equipment and system therefor with switching control for switchover operation | |
US10324801B2 (en) | Storage unit replacement using point-in-time snap copy | |
JP2005267327A (en) | Storage system | |
US9747180B1 (en) | Controlling virtual endpoint failover during administrative SCSI target port disable/enable | |
JP2007072571A (en) | Computer system, management computer and access path management method | |
WO2015162684A1 (en) | Data migration method of storage system | |
WO2012112308A1 (en) | Power failure management in components of storage area network | |
JP2006011874A (en) | System and method for supplying volume | |
JP2010067042A (en) | Computer switching method, computer switching program, and computer system | |
US8635391B2 (en) | Systems and methods for eliminating single points of failure for storage subsystems | |
KR20150111608A (en) | Method for duplication of virtualization server and Virtualization control apparatus thereof | |
US20190065064A1 (en) | Computer system and method for controlling storage apparatus | |
JP2006260240A (en) | Computer system, storage device, computer software and data migration method | |
JP6227771B2 (en) | System and method for managing logical volumes | |
JP5947974B2 (en) | Information processing apparatus, information processing apparatus exchange support system, and exchange support method | |
JP2009116474A (en) | Storage system and storage subsystem | |
JP5672075B2 (en) | Computer system, virtual environment migration method, and virtual environment migration program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 13880204 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2015507861 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 13880204 Country of ref document: EP Kind code of ref document: A1 |