WO2011138886A1 - Fault tolerant computer system and data access method - Google Patents

Fault tolerant computer system and data access method Download PDF

Info

Publication number
WO2011138886A1
WO2011138886A1 PCT/JP2011/058576 JP2011058576W WO2011138886A1 WO 2011138886 A1 WO2011138886 A1 WO 2011138886A1 JP 2011058576 W JP2011058576 W JP 2011058576W WO 2011138886 A1 WO2011138886 A1 WO 2011138886A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
processing
node
user
processing nodes
Prior art date
Application number
PCT/JP2011/058576
Other languages
French (fr)
Japanese (ja)
Inventor
山本 秀典
加藤 博光
足達 芳昭
Original Assignee
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社日立製作所 filed Critical 株式会社日立製作所
Publication of WO2011138886A1 publication Critical patent/WO2011138886A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits

Definitions

  • the present invention relates to a fault tolerant computer (Fault Tolerant Computer) system, which is composed of a plurality of independent nodes interconnected via a network, and allows the same processing to be executed in parallel in each of the nodes constituting the system.
  • the present invention relates to a tool used when a user performs work such as debugging and testing of an application program running on a fault tolerant computer system.
  • Patent Documents 1 to 3 disclose various techniques related to data access processing for a plurality of devices.
  • Patent Document 1 in order to edit a file on a remote workstation, the file is transferred / stored to the local workstation and then edited locally, and the edited file is transferred to the original remote workstation and stored.
  • a remote editor support apparatus and method is disclosed.
  • Patent Document 2 an area for storing own computer data and an area for storing partner computer data are prepared in a multiplexed computer, and when copying, data and mode information (control / standby / A method of using data between multiplexed computers is disclosed, in which the mode of the own computer and the partner computer is compared and the data in the mode designated in advance is adopted.
  • Patent Document 3 includes access authority information between terminals in a distributed file system including a plurality of terminal devices that manage files by storing files that collectively handle data under a directory that indicates the position of a hierarchical structure.
  • a distributed file sharing system and its file access control method are disclosed in which index information is shared and referred to during search and access to minimize processing time.
  • JP-A-9-231155 Japanese Patent Laid-Open No. 2003-162441 JP 2002-132530 A
  • a fault-tolerant computer which is composed of a plurality of independent nodes interconnected via a network, and the same processing is executed in parallel in each of the constituent nodes, a plurality of parallel processing is performed to guarantee the operation of the system.
  • Data used by applications for processing between nodes must always have the same contents. For this reason, when the user edits these data, it is necessary to be careful not to cause a difference in contents between nodes.
  • Patent Document 1 when referring to and editing the same data in a plurality of processing nodes constituting the fault tolerant computer system, it is necessary to operate each node and access the data. Work load increases. It can also cause human error.
  • Patent Document 2 when referring to and editing the same data in a plurality of processing nodes constituting a fault-tolerant computer system, it is necessary to individually access and operate a directory mapped to each node. , User workload increases. It can also cause human error.
  • data is identified between computers by duplication regardless of data contents, but when executed between processing nodes constituting a fault-tolerant computer system, it differs from data that should have the same contents.
  • An object of the present invention is to provide a data access method in a fault tolerant computer system for editing and the like.
  • the present invention has the following configuration. That is, a method in a fault tolerant computer system including a plurality of processing nodes connected via a network and a maintenance node that acquires, edits, and updates data in the plurality of processing nodes, the plurality of processing nodes being the same When the user refers to or edits the same data that the plurality of processing nodes have, the maintenance node performs the same data in the plurality of processing nodes, respectively.
  • the step of acquiring and saving from the processing node via the network and the maintenance node comparing the contents of the same data acquired from the plurality of processing nodes, and displaying the contents to the user via the user terminal based on the comparison result And pre-defined on the maintenance node via the user terminal A step in which a user edits data acquired from one processing node that matches a condition specified in advance in a processing node that is a table or an operating processing node, and the maintenance node is after the editing Transferring the data to the plurality of processing nodes, and overwriting and updating.
  • the load of operation by the user regardless of the complexity of the configuration of the system, software, etc. Is reduced and work efficiency is improved.
  • FIG. 1 shows the module structure of the processing node which is contained in a fault tolerant computer system and performs the process with respect to the request
  • the maintenance node that is included in the fault-tolerant computer system and performs processing such as data acquisition from the processing node, presentation to the user, editing, overwrite update of the edited data to the processing node, etc.
  • It is a flowchart which shows the flow of the process displayed on a user.
  • It is a flowchart which shows the flow of the process which overwrites and updates.
  • FIG. 1 is a diagram showing an outline of a data access method in a fault tolerant computer system.
  • Main components are a maintenance node 0211 that constitutes the fault-tolerant computer system 0201, and performs processing such as data acquisition from the processing node 0212, presentation to the user, editing, overwriting update of edited data to the processing node 0212, A plurality of processing nodes 0212 and a user terminal 0202 that execute processing in response to an external request in parallel.
  • the plurality of processing nodes 0212 execute the same processing at the same timing using the same data 0101 held in each node.
  • the contents of data used by the application for processing must be always the same among a plurality of nodes executed in parallel.
  • the data is collected from each processing node 0212 to the maintenance node 0211 (0121).
  • a copy of the corresponding data 0101 is generated at each processing node 0212, transmitted to the maintenance node 0211, and the data is stored on the maintenance node 0211 (0102).
  • the maintenance node 0211 compares the contents of the collected data 0102 (0122), and displays the data contents on the screen 0111 of the user terminal 0202 based on the contents comparison result (0112).
  • the contents of the data from all the processing nodes 0212 match as a result of the content comparison, it is designated in advance in the processing node 0212 which is a representative defined in advance or the processing node in operation. Only the content of data acquired from one processing node 0212 that matches the condition (matches all processing nodes) is displayed. If there is a difference in data content from at least one processing node 0212 as a result of the content comparison, the data content of a portion having a difference between the processing nodes 0212 is displayed.
  • the user edits the data 0101 on the processing node 0212 via the user terminal 0202
  • one data is selected from the data 0102 collected from each processing node 0212 in 0121 (0103), and the data 0103 is stored in the data 0103.
  • the user is allowed to edit using an editing tool.
  • the edited data 0103 is distributed from the maintenance node 0211 to each processing node 0212, and the contents of the corresponding data 0101 in each processing node 0212 are overwritten and updated (0123).
  • FIG. 2 is a diagram showing an overview of a fault-tolerant computer system that is configured by a plurality of independent nodes interconnected via a network (communication medium), and that the same processing is executed in parallel in each of the constituent nodes. It is.
  • the main components of the fault tolerant computer system 0201 are processing such as data acquisition from the processing node 0212, presentation to the user, editing, overwriting update of the edited data to the processing node 0212, which are interconnected via the LAN 0214.
  • a maintenance node 0211 that performs the above, two or more processing nodes 0212, a gateway server 0213 that connects to the wide area network 0203 and relays communication with an external system, and the like.
  • a user terminal 0202 connected to the maintenance node 0211 via the external network 0205 is used for information presentation for users, various operations, and the like.
  • the fault tolerant computer system 0201 receives a request from the external system 0204 that can communicate via the wide area network 0203, performs processing on the request, and returns a service result as a response to the external system 0204. provide.
  • the input message 0231 is received as a request from the external system 0204, and an output message 0241 storing the processing result for the request is transmitted to the external system 0204.
  • the gateway server 0213 that has received the input message 0231 as a request from the external system 0204 via the wide area network 0203 sends an input message to all the processing nodes 0212 in the system via the LAN 0214. Transfer as 0232 again. Here, almost all the processing nodes 0212 receive the message and broadcast the input message 0232 so that the processing for the message can be started. Each processing node 0212 that has received the input message 0232 executes processing for the input message 0232 and transmits an output message 0242 storing the processing result to the gateway server 0213 via the LAN 0214.
  • the gateway server 0213 that has received the output message 0242 from each processing node 0212 creates an output message 0241 as a response to the requesting external system 0204, and transmits the output message 0241 to the external system 0204.
  • the gateway server 0213 performs comparison and collation of data contents of one or more output messages 0242 received from each processing node 0212, correct / incorrect determination, etc., and sends correct message data to the requesting external system 0204 as an output message 0241.
  • Send In the comparison / collation and correctness / incorrectness determination of the data content of the output message 0242, the output message 0242 having the largest number of matching data contents is regarded as the correct message data, and one of the correct output messages 0242 is sent to the external system 0204.
  • Output message 0241 In the comparison / collation and correctness / incorrectness determination of the data content of the output message 0242, the output message 0242 having the largest number of matching data contents is regarded as the correct message data, and one of the correct output messages 0242 is sent to the external
  • the maintenance node 0211 does not execute any online processing executed in response to the request from the external system 0204.
  • a user who logs in to the maintenance node 0211 using the user terminal 0202 refers to and edits data in the processing node 0212, the data is acquired and stored from each processing node 0212, and each processing node 0212 of the data after editing is stored. Transfer to, overwrite update, etc.
  • the main hardware configuration of the maintenance node 0211 includes a processing device (CPU) 0221, a storage device (memory, hard disk) 0222, and a communication device 0223.
  • a software program for acquiring data from the processing node 0212 and storing the data in a designated area in the storage device 0222, for comparing the contents of the data acquired from the processing node 0212 and presenting it to the user A software program for performing screen display, a software program for editing data acquired and stored from the processing node 0212, and data edited by the user for transferring to the processing node 0212 for overwriting update
  • a software program, a software program for performing communication between the maintenance node 0211 and the processing node 0212 via the LAN 0214, and the like are stored, and these software programs are processed by the processing device 0221.
  • the communication device 0223 performs communication processing when the processing node 0212 acquires data, communication processing for inputting / outputting a screen for logging in from the user terminal 0202, and the like.
  • the processing device (CPU) 0221 reads a program necessary for processing from the storage device 0222 such as a hard disk and executes each processing. It also controls operations of the storage device 0222 and the communication device 0223. In addition, the processing of the maintenance node 0211 in the flowcharts and sequence diagrams described in the drawings to be described later is assumed to be executed by the processing device (CPU) 0221 unless otherwise specified.
  • the main hardware configuration of the processing node 0212 includes a processing device (CPU) 0224, a storage device (memory, hard disk) 0225, and a communication device 0226.
  • the storage device 0225 stores data necessary for executing a service provided to the external system 0204 by the fault tolerant computer system 0201, and a user program for executing processing for a request from the external system 0204 regarding the service.
  • Software program for performing communication between the communication or processing node 0212 and maintenance node 0211 between Eisaba 0213 is stored, these software programs are processed by the processing device 0224.
  • the communication device 0226 receives the input message 0232 from the gateway server 0213 and performs communication processing for transmitting the output message 0242 to the gateway server 0213.
  • processing device (CPU) 0224 reads a program necessary for processing from the storage device 0225 such as a hard disk, executes each processing, and controls operations of the storage device 0225 and the communication device 0226.
  • processing of the processing node 0212 in the flowcharts and sequence diagrams described in the drawings to be described later is assumed to be executed by the processing device (CPU) 0224 unless otherwise specified.
  • the main hardware configuration of the user terminal 0202 includes a processing device (CPU), a storage device (hard disk), and a communication device.
  • the storage device stores a software program for logging in to the maintenance node 0211, performing command operations, screen display, and the like, a software program for performing communication between the user terminal 0202 and the maintenance node 0211, and the like. Processed by the processing device.
  • the communication device performs communication processing for inputting / outputting a screen for login to the maintenance node 0211.
  • the processing device reads out a program necessary for processing from the storage device such as a hard disk and executes each processing. It also controls the operation of the storage device and the previous communication device. In addition, the processing of the user terminal 0202 in the flowcharts and sequence diagrams described in the drawings to be described later is executed by the processing device (CPU) unless otherwise specified.
  • FIG. 3 is a diagram showing an overall processing sequence between a plurality of nodes constituting the fault tolerant computer system when the data access method in the fault tolerant computer system is executed.
  • Main components are a user terminal 0202, a maintenance node 0211, a processing node 1 (0212a), a processing node 2 (0212b), and a processing node 3 (0212c) that constitute the fault-tolerant computer system 0201.
  • the user terminal 0202 logs in to the maintenance node 0211 by a user operation.
  • data to be accessed by the user is designated by the user's operation.
  • the processing node 1 (0212a) extracts the corresponding data in 0321, The corresponding data is transmitted to the maintenance node 0211.
  • the processing node 2 (0212b) extracts the corresponding data in 0331 and transmits the corresponding data to the maintenance node 0211.
  • the processing node 3 (0212c) when requesting the corresponding data designated by the user to the processing node 3 (0212c), the processing node 3 (0212c) extracts the corresponding data in 0341 and transmits the corresponding data to the maintenance node 0211. Thereafter, the same processing as 0311 to 0313 is performed on all the processing nodes 0212 constituting the fault tolerant computer system 0201, and the corresponding data designated by the user is acquired from all the processing nodes 0212.
  • the data acquired in 0311 to 0313 is stored in a storage area (hard disk or the like) in the maintenance node 0211.
  • the contents of the data acquired from the processing node 0211 are compared in 0311 to 0313.
  • the data content is displayed on the user terminal 0202. Details of the processing and display method in 0315 and 0316 will be described with reference to FIGS.
  • the user terminal 0202 starts data editing for the maintenance node 0211 by a user operation.
  • the editing tool is activated at 0317 and the corresponding data to be edited is opened. Thereafter, data editing work by the user is performed.
  • data editing for the maintenance node 0211 is terminated by the user's operation.
  • the processing node 0212 all processing nodes or individual processing nodes to be updated with respect to the corresponding data edited by the user is determined.
  • the data edited by the user is distributed to the processing node 0212 to be updated determined in 0318.
  • FIG. 4 is a diagram showing a module configuration of a maintenance node that is included in the fault tolerant computer system and performs processing such as data acquisition from the processing node, presentation to the user, editing, overwriting update of the edited data to the processing node, and the like. is there.
  • the maintenance node 0211 includes a data access management unit 0401 and a processing node 0212 that perform processing such as data acquisition from the processing node 0212, presentation to the user, management of editing by the user, and overwrite update of the edited data to the processing node 0212.
  • a hard disk 0402 for storing the acquired data and an editing tool 0403 for the user to edit the data are introduced.
  • the data access management unit 0401 is a software program executed by the processing device (CPU) 0221.
  • the main component of the data access management 0401 is data acquisition for acquiring data from the processing node 0212 via the data communication unit 0417 based on the designation from the user via the screen display unit 0415 and storing the data in the hard disk 0402.
  • a storage unit 0411 a data content comparison unit 0412 that compares data contents acquired by the data acquisition / storage unit 0411 from a plurality of processing nodes 0212, and an editing tool based on designation from the user via the screen display unit 0415
  • a data editing management unit 0413 that monitors activation and termination of 0403, a data distribution / update unit 0414 that distributes data edited by the user using the editing tool 0403 to the processing node 0212 and overwrites and updates the corresponding data, and communication Remote connection from user terminal 0202 via medium 0205
  • a screen display unit 0415 that provides a command input screen, an output result output screen of the data content comparison unit 0412, a screen of the editing tool 0403, and the like, and a screen for accepting a remote connection from the user terminal 0202 via
  • the profile information 0421 defines, for each data held by the processing node 0212, data attribute information, access authority, presence / absence of possession at other processing nodes, necessity / unnecessity of data content matching between processing nodes, and the like.
  • the data content comparison unit 0412, the data distribution / update unit 0414, and the like refer to these in each process. Details of the profile information 0421 will be described in FIG.
  • FIG. 5 is a diagram showing a module configuration of a processing node included in the fault-tolerant computer system and executing processing for an external request.
  • the processing node 0212 includes a data access management unit 0501 that performs processing such as acquisition of designated data and transmission to the maintenance node 0211, a user program 0502 that performs various processing in response to requests from the external system 0204, and middleware 0503.
  • a hard disk 0504 and a memory 0505 which are storage destinations of data to be referenced and updated by the user program 0502, middleware 0503, are introduced.
  • the data access management unit 0501 is a software program executed by the processing device (CPU) 0224.
  • the main component of the data access management unit 0501 receives a data acquisition request from the maintenance node 0211 via the data communication unit 0513, extracts the relevant data from the hard disk 0504 or the memory 0505, and sends the relevant data to the maintenance node 0211.
  • Data management unit 0501 that receives a data overwrite update request from the maintenance node 0211 and performs overwrite update on the corresponding data, and processing to the original data transmitted by the data management unit 0501 to the maintenance node 0211
  • a data update monitoring unit 0512 that monitors updates by a program or the like in the node 0211 and a data communication unit 0513 that performs communication with the maintenance node 0211 or the like in the system via the communication medium 0214.
  • FIG. 6 is a maintenance node that is included in the fault tolerant computer system and performs processing such as data acquisition from the processing node, presentation to the user, editing, overwriting update of the edited data to the processing node, and the like from the processing node. It is a flowchart which shows the flow of the process which displays the acquired data to a user.
  • a data path of data to be accessed is acquired from an operation by the user via the user terminal 0202.
  • data corresponding to the data path acquired in 0601 is requested to the processing node 0212 and acquired.
  • the data acquired from the processing node 0212 in 0602 is stored in a storage area (such as a hard disk) in the maintenance node 0211.
  • the processing of 0602 and 0603 is repeated. If the data acquisition from all the processing nodes 0212 has been completed in 0604, the contents of the same data acquired from the processing nodes 0212 in 0602 to 0604 are compared in 0605.
  • a general tool such as “diff” may be used to compare the data contents.
  • the profile information of the corresponding data is referred to in 0607.
  • the “content match” section of the profile information of the corresponding data indicates that the contents should not match between the processing nodes 0212 (NO)
  • a warning to the user Although it is not allowed to be displayed, it is displayed that it matches.
  • the contents of data acquired from one processing node 0212 that matches the condition specified in advance in the representative processing node 0212 defined in advance or the processing node in operation (matches with all processing nodes). indicate.
  • the profile information of the corresponding data is referred to in 0611.
  • the item “content match” in the profile information of the corresponding data indicates that the content needs to match between the processing nodes 0212 (YES)
  • a warning to the user in 0613. Displayed to indicate that they do not match even though they are necessary.
  • the data contents of a portion having a difference between the processing nodes 0212 are displayed. Details of the display method here are shown in FIG. 10B.
  • FIG. 7 is a fault-tolerant computer system that is edited by a user at a maintenance node that performs processing such as data acquisition from a processing node, presentation to a user, editing, and overwrite update of edited data to a processing node.
  • 6 is a flowchart showing a flow of processing for overwriting and updating updated data in a processing node.
  • an instruction to start editing of data is received from an operation by the user via the user terminal 0202.
  • the representative defined in advance in 0703 Data acquired from one processing node 0212 that matches a condition specified in advance in the processing node 0212 or an active processing node is determined as data to be edited.
  • the data contents from at least one processing node 0212 as a result of comparing the data contents acquired from the processing node 0212 as shown in FIG.
  • the processing node 0212 selected by the user in 0704 Is determined as data to be edited (here, a screen display for allowing the user to select a processing node as a data acquisition source is performed).
  • the editing tool is activated and the data determined in 0703 or 0704 is opened.
  • the editing tool is defined in advance for each type of data to be edited. For example, if it is a text file etc., it is a text editor etc.
  • 0706 the end of the editing tool started in 0705 is monitored. If the end is not detected, update of the corresponding data is detected on the processing node 0212 side in 0707, and the updated data is transmitted to the maintenance node 0211.
  • the processing node 0212 is presented with a selection as to whether or not to replace it with the updated data, and the data replacement is executed or not executed according to the user's selection. I do. Thereafter, the processing returns to 0706. In 0707, if the processing node 0212 has not detected the update of the corresponding data, the processing returns to 0706. In 0706, the end of the editing tool activated in 0705 is monitored. If the end is detected, in 0709, the user is made to select the processing node 0212 that is the overwrite update destination of the edited data.
  • the profile information of the corresponding data is referred to in 0710.
  • the “content match” section of the profile information of the corresponding data indicates that the content needs to be matched between the processing nodes 0212 (YES)
  • the user is sent to all the processing nodes 0212. Update the edited data by overwriting.
  • FIG. 8 is a diagram of a fault-tolerant computer system that manages data in a maintenance node that performs processing such as data acquisition from a processing node, presentation to a user, editing, overwriting and updating of edited data in a processing node. It is a figure which shows the format of the profile information which defined attribute information, access authority, the presence or absence of possession in another processing node, the necessity of data content matching between processing nodes, etc.
  • Main components of profile information are a type 0801, a data path 0802, an access authority 0803, an access content 0804, another node possession 0805, and a content match 0806. Setting values corresponding to these items are specified for each data.
  • the type 0801 describes the type of data.
  • the data path 0802 describes information for specifying the location of data. For example, if the type 0801 is a file, the file path is described, and if the type 0801 is memory data, the address and size are described.
  • the access authority 0803 describes the authority of the user who is permitted to access the corresponding data.
  • the access content 0804 describes the access content that can be executed by the user permitted by the access authority 0803. In the example of the figure, “R” (reading is possible), “W” (writing is possible), and the like are described.
  • In other node possession 0805 whether or not the relevant data is possessed by other processing node 0212 is described (YES / NO).
  • the content match 0806 describes whether the data content needs to be matched between the processing nodes 0212 or not (YES / NO) when the corresponding data is held in other processing nodes 0212. To do.
  • the profile information is created for each processing node 0212 in the form of a file, etc., and is stored and managed by the maintenance node 0211.
  • the content data of the same data acquired from a plurality of processing nodes 0212 and the data edited by the user are displayed. It is referred to when executing processing such as overwriting update for a plurality of processing nodes 0212.
  • the profile information is created in advance by the administrator or user of the fault tolerant computer system and is updated as appropriate.
  • FIG. 9 is a flowchart showing the flow of processing that is included in the fault-tolerant computer system and performs data acquisition, update monitoring of data to be edited, data overwrite update, and the like in a processing node that executes processing in response to an external request. is there.
  • a data acquisition request is received from the maintenance node 0211.
  • data corresponding to the request in 0901 is acquired in the processing node 0212 and transmitted to the maintenance node 0211.
  • the corresponding data acquired in 0902 is duplicated, and the duplicated data is stored in a temporary storage area (a temporary use directory in the hard disk, etc.).
  • monitoring of update by the program in the processing node 0212 or monitoring of update of the corresponding data by another user is started for the data requested by the maintenance node 0211.
  • the corresponding data after the update is transmitted to the maintenance node 0211 together with an update notification in 0906. Thereafter, the processing returns to 0905.
  • FIG. 10A is a diagram showing a screen display example when the data contents match between the processing nodes for presenting the data acquired from the processing nodes to the user.
  • the screen display 1001 is displayed when the contents of the data from all the processing nodes 0212 match as a result of comparing the contents of the same data acquired from the plurality of processing nodes 0212 shown in FIG.
  • the data on the processing node 0212 is displayed as an output result for the command operation of the designated user.
  • attribute information (type and name) of the acquired data and a content comparison result (data from all processing nodes 0212 match in the example in the figure) are displayed.
  • the contents of the acquired data are displayed as they are.
  • FIG. 10B is a diagram illustrating a screen display example when there is a difference in data contents between processing nodes for presenting data acquired from the processing nodes to a user.
  • the screen display 1002 shows a case where there is a difference in data contents from at least one processing node 0212 as a result of comparing the contents for the same data acquired from a plurality of processing nodes 0212 shown in FIG.
  • the data on the processing node 0212 is displayed as an output result for the command operation of the designated user.
  • attribute information (type and name) of the acquired data and a content comparison result (in the example of the figure, there is a difference in data from one processing node 0212) are displayed.
  • the data content of a portion having a difference between the one processing node 0212 having the difference and the other processing node 0212 is displayed in a comparison format.
  • the data access method in the fault-tolerant computer system according to the present invention can be used particularly when the user performs work such as debugging and testing of an application program running on the fault-tolerant computer system 0201.
  • the method according to the prior art accesses one processing node 0212 at a time and accesses the same file with the same contents. It was necessary to carry out updates. In addition, it is necessary for the user to check whether the contents of the corresponding files in all the processing nodes 0212 are the same. If there is a difference in the contents of the corresponding file between the processing nodes 0212, the application program may operate differently between the processing nodes 0212, and the fault-tolerant computer system 0201 becomes in an abnormal state, and the test and debugging may not be performed correctly. is there.
  • the user only has to open the file once and update the contents. Are guaranteed to match. Furthermore, updating of node-specific information such as an IP address is restricted so that all processing nodes 0212 do not have the same content. Therefore, even if the user updates the file, the application program does not operate differently between the processing nodes 0212 as described above.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

Provided in a fault tolerant computer system is a method for a user to conduct command execution or data editing with respect to a node that constitutes the system, without being conscious of the system configuration or data arrangement. When the user is to refer to or edit the same data that a plurality of processing nodes constituting the fault tolerant computer system possess, the applicable data is collected from each of the processing nodes into a maintenance node, the content thereof are compared, and the content is displayed on the basis of the result of the comparison. When the user edits the data, the maintenance node transmits the edited data to the plurality of processing nodes, and overwrites and updates the data all at once.

Description

フォールトトレラントコンピュータシステム、およびデータアクセス方法Fault tolerant computer system and data access method
 本発明は、ネットワークを介して相互接続した、複数の独立したノードにより構成され、構成する各ノードにおいて同じ処理を並列実行させることを特徴とするフォールトトレラントコンピュータ(Fault Tolerant Computer)システムに関し、特にエンドユーザがフォールトトレラントコンピュータシステム上で稼動するアプリケーションプログラムのデバッグ、テスト等の作業を行う際に用いるツールに関する。 The present invention relates to a fault tolerant computer (Fault Tolerant Computer) system, which is composed of a plurality of independent nodes interconnected via a network, and allows the same processing to be executed in parallel in each of the nodes constituting the system. The present invention relates to a tool used when a user performs work such as debugging and testing of an application program running on a fault tolerant computer system.
 特許文献1から3には、複数の装置に対するデータアクセス処理に関連する各種技術が開示されている。 Patent Documents 1 to 3 disclose various techniques related to data access processing for a plurality of devices.
 特許文献1には、リモートワークステーション上のファイルを編集するため、ローカルワークステーションまで該当ファイルを転送・格納してからローカルに編集し、編集後のファイルは元のリモートワークステーションに転送し、格納するという、リモートエディタ支援装置および方法が開示されている。 In Patent Document 1, in order to edit a file on a remote workstation, the file is transferred / stored to the local workstation and then edited locally, and the edited file is transferred to the original remote workstation and stored. A remote editor support apparatus and method is disclosed.
 特許文献2には、多重化計算機において、自計算機データを格納する領域と相手計算機データを格納する領域とを用意し、複製する際には相手計算機からデータと計算機のモード情報(制御/待機/停止)を受信して保存し、自計算機及び相手計算機のモードを比較し、あらかじめ指定されたモードの方のデータを採用するという、多重化計算機間のデータ利用方法が開示されている。 In Patent Document 2, an area for storing own computer data and an area for storing partner computer data are prepared in a multiplexed computer, and when copying, data and mode information (control / standby / A method of using data between multiplexed computers is disclosed, in which the mode of the own computer and the partner computer is compared and the data in the mode designated in advance is adopted.
 特許文献3には、データをまとめて扱うファイルを階層構造の位置を示すディレクトリの下に格納してファイル管理する複数の端末装置で構成される分散ファイルシステムにおいて、端末間でアクセス権限情報を含むインデックス情報を共有し、検索及びアクセス時に参照して処理時間を最小化するという、分散ファイル共有システムおよびそのファイルアクセス制御方法が開示されている。 Patent Document 3 includes access authority information between terminals in a distributed file system including a plurality of terminal devices that manage files by storing files that collectively handle data under a directory that indicates the position of a hierarchical structure. A distributed file sharing system and its file access control method are disclosed in which index information is shared and referred to during search and access to minimize processing time.
特開平9-231155号公報JP-A-9-231155 特開2003-162441号公報Japanese Patent Laid-Open No. 2003-162441 特開2002-132530号公報JP 2002-132530 A
 ネットワークを介して相互接続した、複数の独立したノードにより構成され、構成する各ノードにおいて同じ処理を並列実行させることを特徴とするフォールトトレラントコンピュータでは、システムの動作保証のために、並列処理する複数ノード間でアプリケーションが処理に用いるデータは常に同一内容である必要がある。このため、ユーザがこれらのデータを編集する場合には、ノード間で内容に差異が生じないように注意する必要がある。 In a fault-tolerant computer, which is composed of a plurality of independent nodes interconnected via a network, and the same processing is executed in parallel in each of the constituent nodes, a plurality of parallel processing is performed to guarantee the operation of the system. Data used by applications for processing between nodes must always have the same contents. For this reason, when the user edits these data, it is necessary to be careful not to cause a difference in contents between nodes.
 しかしながら、例えば特許文献1に開示された技術では、フォールトトレラントコンピュータシステムを構成する複数の処理ノードにおける同一データを参照及び編集する場合、ノード毎に操作し、データにアクセスする必要があるため、ユーザの作業負荷が増加する。また人為的ミスが発生する原因となり得る。例えば特許文献2に開示された技術では、フォールトトレラントコンピュータシステムを構成する複数の処理ノードにおける同一データを参照及び編集する場合、各ノードにマッピングされるディレクトリに個別にアクセスし操作する必要があるため、ユーザの作業負荷が増加する。また人為的ミスが発生する原因となり得る。例えば特許文献3に開示された技術では、データ内容に関わらず複製により計算機間で同一化しているが、フォールトトレラントコンピュータシステムを構成する処理ノード間で実施する場合、同一内容であるべきデータと異なる内容であるデータ(ログ、IPアドレス等のノード固有情報、等)とを区別する必要がある。
本発明は、上述した課題を考慮したものであって、デバッグ、テスト等の作業において、ユーザがシステムの構成やデータ配置等を意識せずに、システムを構成するノードに対してコマンド実行やデータ編集等を行うための、フォールトトレラントコンピュータシステムにおけるデータアクセス方法を提供することを目的とする。
However, in the technique disclosed in Patent Document 1, for example, when referring to and editing the same data in a plurality of processing nodes constituting the fault tolerant computer system, it is necessary to operate each node and access the data. Work load increases. It can also cause human error. For example, in the technique disclosed in Patent Document 2, when referring to and editing the same data in a plurality of processing nodes constituting a fault-tolerant computer system, it is necessary to individually access and operate a directory mapped to each node. , User workload increases. It can also cause human error. For example, in the technique disclosed in Patent Document 3, data is identified between computers by duplication regardless of data contents, but when executed between processing nodes constituting a fault-tolerant computer system, it differs from data that should have the same contents. It is necessary to distinguish data (logs, node-specific information such as IP addresses, etc.) that is the contents.
The present invention takes the above-described problems into consideration, and in the operations such as debugging and testing, the user executes command and data on the nodes constituting the system without being aware of the system configuration and data arrangement. An object of the present invention is to provide a data access method in a fault tolerant computer system for editing and the like.
 上記課題を解決するため、本発明は以下の構成を備える。即ち、ネットワークを介して接続された複数の処理ノードと前記複数の処理ノードにおけるデータを取得、編集、更新する保守ノードとを備えるフォールトトレラントコンピュータシステムにおける方法であって、前記複数の処理ノードが同一のデータを用いて同一の処理を並列して実行するステップと、前記複数の処理ノードが有する同一のデータをユーザが参照または編集する場合、前記保守ノードが、複数の処理ノードにおける同一データを各処理ノードからネットワークを介して取得し保存するステップと、前記保守ノードが、前記複数の処理ノードから取得した同一データの内容を比較し、比較結果に基づきユーザに対してユーザ端末を介して内容表示を行うステップと、ユーザ端末を介して保守ノード上で事前に定義されている代表となる処理ノードもしくは稼働中の処理ノードの中で事前に指定された条件に合致する1つの処理ノードからの取得したデータを対象としてユーザが編集を行うステップと、前記保守ノードは前記編集後のデータを前記複数の処理ノードに転送し、上書き更新するステップと、を有する。 In order to solve the above problems, the present invention has the following configuration. That is, a method in a fault tolerant computer system including a plurality of processing nodes connected via a network and a maintenance node that acquires, edits, and updates data in the plurality of processing nodes, the plurality of processing nodes being the same When the user refers to or edits the same data that the plurality of processing nodes have, the maintenance node performs the same data in the plurality of processing nodes, respectively. The step of acquiring and saving from the processing node via the network and the maintenance node comparing the contents of the same data acquired from the plurality of processing nodes, and displaying the contents to the user via the user terminal based on the comparison result And pre-defined on the maintenance node via the user terminal A step in which a user edits data acquired from one processing node that matches a condition specified in advance in a processing node that is a table or an operating processing node, and the maintenance node is after the editing Transferring the data to the plurality of processing nodes, and overwriting and updating.
 本発明によれば、ユーザがアプリケーションプログラムのデバッグ、テスト等を実施する際に、システムやソフトウェア等の構成の複雑さに関わらず、またこれらに関する十分な知識が無くとも、ユーザによる操作等の負荷が軽減され、作業効率が向上する。 According to the present invention, when a user performs debugging, testing, or the like of an application program, the load of operation by the user regardless of the complexity of the configuration of the system, software, etc. Is reduced and work efficiency is improved.
フォールトトレラントコンピュータシステムにおけるデータアクセス方法の概要を示す図である。It is a figure which shows the outline | summary of the data access method in a fault tolerant computer system. ネットワーク(通信媒体)を介して相互接続された複数の独立したノードにより構成され、構成する各ノードにおいて同じ処理を並列実行させることを特徴とするフォールトトレラントコンピュータシステムの概要を示す図である。It is a figure which shows the outline | summary of the fault tolerant computer system comprised by the some independent node mutually connected via the network (communication medium), and performing the same process in parallel in each node which comprises. フォールトトレラントコンピュータシステムにおけるデータアクセス方法を実施する際の、フォールトトレラントコンピュータシステムを構成する複数のノード間での全体処理シーケンスを示す図である。It is a figure which shows the whole process sequence between several nodes which comprise a fault tolerant computer system at the time of enforcing the data access method in a fault tolerant computer system. フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードのモジュール構成を示す図である。It is a figure which shows the module structure of the maintenance node which is contained in a fault tolerant computer system and performs processing, such as data acquisition from a processing node, presentation to a user, edit, overwrite update of the edited data to a processing node. フォールトトレラントコンピュータシステムに含まれ、外部からの要求に対する処理等を実行する処理ノードのモジュール構成を示す図である。It is a figure which shows the module structure of the processing node which is contained in a fault tolerant computer system and performs the process with respect to the request | requirement from the outside. フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードにて、処理ノードからの取得したデータをユーザに表示する処理の流れを示すフローチャートである。The maintenance node that is included in the fault-tolerant computer system and performs processing such as data acquisition from the processing node, presentation to the user, editing, overwrite update of the edited data to the processing node, etc. It is a flowchart which shows the flow of the process displayed on a user. フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードにおいて、ユーザにより編集されたデータを処理ノードへ上書き更新する処理の流れを示すフローチャートである。A maintenance node that is included in a fault-tolerant computer system and performs processing such as data acquisition from processing nodes, presentation to the user, editing, overwrite update of edited data to processing nodes, etc. It is a flowchart which shows the flow of the process which overwrites and updates. フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードにおいて管理される、データの属性情報、アクセス権限、他の処理ノードでの保有の有無、処理ノード間でのデータ内容一致の要否、等を定義したプロファイル情報の書式を示す図である。Data attribute information and access that is included in the fault-tolerant computer system and managed in the maintenance node that performs processing such as data acquisition from the processing node, presentation to the user, editing, overwriting and updating of edited data to the processing node It is a figure which shows the format of the profile information which defined authority, the presence or absence of possession in another processing node, the necessity of data content matching between processing nodes, etc. フォールトトレラントコンピュータシステムに含まれ、外部からの要求に対する処理等を実行する処理ノードにおいて、データ取得、編集対象データの更新監視、データ上書き更新を行う処理の流れを示すフローチャートである。It is a flowchart which shows the flow of the process which performs data acquisition, the update monitoring of edit object data, and data overwrite update in the processing node which is contained in a fault tolerant computer system and performs the process with respect to the request | requirement from the outside. 処理ノードより取得したデータをユーザに対して提示するための、処理ノード間でデータ内容が一致する場合の画面表示例を示す図である。It is a figure which shows the example of a screen display when the data content corresponds between process nodes for showing the data acquired from the process node with respect to a user. 処理ノードより取得したデータをユーザに対して提示するための、処理ノード間でデータ内容に差異が有る場合の画面表示例を示す図である。It is a figure which shows the example of a screen display when there exists a difference in the data content between processing nodes for showing the data acquired from the processing node with respect to a user.
 図1は、フォールトトレラントコンピュータシステムにおけるデータアクセス方法の概要を示す図である。 FIG. 1 is a diagram showing an outline of a data access method in a fault tolerant computer system.
 主な構成要素は、フォールトトレラントコンピュータシステム0201を構成する、処理ノード0212からのデータ取得、ユーザへの提示、編集、処理ノード0212への編集済みデータの上書き更新等の処理を行う保守ノード0211、外部からの要求に対する処理等を並列実行する複数の処理ノード0212及びユーザ端末0202である。複数の処理ノード0212では、外部からの要求に対して、各ノードにて保有する同一データ0101を用いて、同じ処理を同じタイミングで実行する。フォールトトレラントコンピュータシステム0201の動作を保証するためには、並列実行する複数ノード間でアプリケーションが処理に用いるデータの内容は常に同一である必要がある。一方で、ユーザがデータ0101を参照し、編集する場合、個々の処理ノード0212に個別にアクセスすること、同一データ0101を同じ内容になるように編集することは負荷となり、人為的ミスの原因となり得る。これらへの対策として本発明による方法の概要を以下に述べる。 Main components are a maintenance node 0211 that constitutes the fault-tolerant computer system 0201, and performs processing such as data acquisition from the processing node 0212, presentation to the user, editing, overwriting update of edited data to the processing node 0212, A plurality of processing nodes 0212 and a user terminal 0202 that execute processing in response to an external request in parallel. In response to an external request, the plurality of processing nodes 0212 execute the same processing at the same timing using the same data 0101 held in each node. In order to guarantee the operation of the fault-tolerant computer system 0201, the contents of data used by the application for processing must be always the same among a plurality of nodes executed in parallel. On the other hand, when the user refers to and edits the data 0101, accessing each processing node 0212 individually and editing the same data 0101 so as to have the same contents are burdens and cause human error. obtain. As a countermeasure against these problems, an outline of the method according to the present invention will be described below.
 ユーザがユーザ端末0202を介して、複数の処理ノード0212が保有する同一データ0101を参照する場合、各処理ノード0212から保守ノード0211へとデータを収集する(0121)。ここでデータ0101を収集するために、各処理ノード0212にて該当するデータ0101の複製を生成し、保守ノード0211へ送信し、保守ノード0211上に前記データを保存する(0102)。保守ノード0211にて収集データ0102の内容比較を行い(0122)、内容比較結果に基づいて、ユーザ端末0202の画面0111へのデータ内容の画面表示を行う(0112)。ここで内容比較の結果、全ての処理ノード0212からのデータの内容が一致している場合、事前に定義されている代表となる処理ノード0212もしくは稼働中の処理ノードの中で事前に指定された条件に合致する1つの処理ノード0212から取得したデータの内容(全処理ノードとも一致)のみを表示する。また内容比較の結果、少なくとも1つの処理ノード0212からのデータの内容に差異がある場合、処理ノード0212間で差異の有る部分のデータ内容を表示する。 When the user refers to the same data 0101 held by a plurality of processing nodes 0212 via the user terminal 0202, the data is collected from each processing node 0212 to the maintenance node 0211 (0121). Here, in order to collect the data 0101, a copy of the corresponding data 0101 is generated at each processing node 0212, transmitted to the maintenance node 0211, and the data is stored on the maintenance node 0211 (0102). The maintenance node 0211 compares the contents of the collected data 0102 (0122), and displays the data contents on the screen 0111 of the user terminal 0202 based on the contents comparison result (0112). Here, if the contents of the data from all the processing nodes 0212 match as a result of the content comparison, it is designated in advance in the processing node 0212 which is a representative defined in advance or the processing node in operation. Only the content of data acquired from one processing node 0212 that matches the condition (matches all processing nodes) is displayed. If there is a difference in data content from at least one processing node 0212 as a result of the content comparison, the data content of a portion having a difference between the processing nodes 0212 is displayed.
 ユーザがユーザ端末0202を介して、処理ノード0212上のデータ0101の編集を行う場合、0121にて各処理ノード0212から収集したデータ0102から1つのデータを選択して(0103)、該データ0103に対して編集ツールを用いてユーザに編集させる。編集後のデータ0103は、保守ノード0211から各処理ノード0212へと配信され、各処理ノード0212における該当データ0101の内容を上書き更新する(0123)。 When the user edits the data 0101 on the processing node 0212 via the user terminal 0202, one data is selected from the data 0102 collected from each processing node 0212 in 0121 (0103), and the data 0103 is stored in the data 0103. On the other hand, the user is allowed to edit using an editing tool. The edited data 0103 is distributed from the maintenance node 0211 to each processing node 0212, and the contents of the corresponding data 0101 in each processing node 0212 are overwritten and updated (0123).
 以上のことから、ユーザの操作として1つのデータを参照及び編集するだけで、フォールトトレラントコンピュータシステム0201を構成する複数の処理ノード0212に対して、同一データの内容を一括して更新することができ、また、処理ノード0212の間でデータ内容に差異も発生しない。 From the above, it is possible to update the contents of the same data collectively to a plurality of processing nodes 0212 constituting the fault tolerant computer system 0201 only by referring to and editing one data as a user operation. In addition, there is no difference in data contents between the processing nodes 0212.
 図2は、ネットワーク(通信媒体)を介して相互接続された複数の独立したノードにより構成され、構成する各ノードにおいて同じ処理を並列実行させることを特徴とするフォールトトレラントコンピュータシステムの概要を示す図である。 FIG. 2 is a diagram showing an overview of a fault-tolerant computer system that is configured by a plurality of independent nodes interconnected via a network (communication medium), and that the same processing is executed in parallel in each of the constituent nodes. It is.
 本フォールトトレラントコンピュータシステム0201の主な構成要素は、LAN0214を介して相互接続する、処理ノード0212からのデータ取得、ユーザへの提示、編集、処理ノード0212への編集済みデータの上書き更新等の処理を行う保守ノード0211、2つ以上の処理ノード0212、広域ネットワーク0203に接続し外部システムとの通信の中継を行うゲートウェイサーバ0213、等である。また外部ネットワーク0205を介して保守ノード0211に接続するユーザ端末0202は、ユーザ向けの情報提示、各種操作、等に用いられる。 The main components of the fault tolerant computer system 0201 are processing such as data acquisition from the processing node 0212, presentation to the user, editing, overwriting update of the edited data to the processing node 0212, which are interconnected via the LAN 0214. A maintenance node 0211 that performs the above, two or more processing nodes 0212, a gateway server 0213 that connects to the wide area network 0203 and relays communication with an external system, and the like. A user terminal 0202 connected to the maintenance node 0211 via the external network 0205 is used for information presentation for users, various operations, and the like.
 フォールトトレラントコンピュータシステム0201は、広域ネットワーク0203を介して通信可能な外部システム0204からの要求を受け付けて、該要求に対する処理を実施し、処理結果を応答として該外部システム0204に返信することによるサービスを提供する。ここでは外部システム0204からの要求として入力メッセージ0231を受信し、該要求に対する処理結果を格納した出力メッセージ0241を外部システム0204に対して送信する。 The fault tolerant computer system 0201 receives a request from the external system 0204 that can communicate via the wide area network 0203, performs processing on the request, and returns a service result as a response to the external system 0204. provide. Here, the input message 0231 is received as a request from the external system 0204, and an output message 0241 storing the processing result for the request is transmitted to the external system 0204.
 フォールトトレラントコンピュータシステム0201の内部では、広域ネットワーク0203を介して外部システム0204からの要求として入力メッセージ0231を受信したゲートウェイサーバ0213がLAN0214を介して、システム内の全ての処理ノード0212に対して入力メッセージ0232として転送し直す。ここでほぼ同時に全ての処理ノード0212が該メッセージを受信し、該メッセージに対する処理を開始できるように、入力メッセージ0232をブロードキャスト送信する。該入力メッセージ0232を受信した各処理ノード0212は、各々該入力メッセージ0232に対する処理を実行して、処理結果を格納した出力メッセージ0242を、LAN0214を介してゲートウェイサーバ0213に対して送信する。各処理ノード0212からの出力メッセージ0242を受信したゲートウェイサーバ0213は要求元の外部システム0204への応答として出力メッセージ0241を作成し、その出力メッセージ0241を外部システム0204に送信する。ここでゲートウェイサーバ0213は、各処理ノード0212から受信した1つ以上の出力メッセージ0242のデータ内容の比較照合、正誤判定等を行い、正しいメッセージデータを出力メッセージ0241として、要求元の外部システム0204に送信する。前記出力メッセージ0242のデータ内容の比較照合、正誤判定では、データ内容が合致するものが最も多い出力メッセージ0242が正しいメッセージデータと見なし、前記正しい出力メッセージ0242のうちの1つを、外部システム0204への出力メッセージ0241とする。 In the fault tolerant computer system 0201, the gateway server 0213 that has received the input message 0231 as a request from the external system 0204 via the wide area network 0203 sends an input message to all the processing nodes 0212 in the system via the LAN 0214. Transfer as 0232 again. Here, almost all the processing nodes 0212 receive the message and broadcast the input message 0232 so that the processing for the message can be started. Each processing node 0212 that has received the input message 0232 executes processing for the input message 0232 and transmits an output message 0242 storing the processing result to the gateway server 0213 via the LAN 0214. The gateway server 0213 that has received the output message 0242 from each processing node 0212 creates an output message 0241 as a response to the requesting external system 0204, and transmits the output message 0241 to the external system 0204. Here, the gateway server 0213 performs comparison and collation of data contents of one or more output messages 0242 received from each processing node 0212, correct / incorrect determination, etc., and sends correct message data to the requesting external system 0204 as an output message 0241. Send. In the comparison / collation and correctness / incorrectness determination of the data content of the output message 0242, the output message 0242 having the largest number of matching data contents is regarded as the correct message data, and one of the correct output messages 0242 is sent to the external system 0204. Output message 0241.
 保守ノード0211では、前記外部システム0204からの要求に対して実行するオンライン処理は一切実行しない。ユーザ端末0202を用いて保守ノード0211にログインしたユーザが処理ノード0212におけるデータを参照、編集する際に、当該データを各処理ノード0212から取得、保存し、編集後の当該データの各処理ノード0212への転送、上書き更新、等を行う。 The maintenance node 0211 does not execute any online processing executed in response to the request from the external system 0204. When a user who logs in to the maintenance node 0211 using the user terminal 0202 refers to and edits data in the processing node 0212, the data is acquired and stored from each processing node 0212, and each processing node 0212 of the data after editing is stored. Transfer to, overwrite update, etc.
 保守ノード0211の主なハードウェア構成は、処理装置(CPU)0221、記憶装置(メモリ、ハードディスク)0222、通信装置0223からなる。記憶装置0222には、処理ノード0212からデータを取得し記憶装置0222内の指定領域にそのデータを保存するためのソフトウェアプログラム、処理ノード0212から取得したデータの内容比較を行いユーザに提示するための画面表示等を行うためのソフトウェアプログラム、前記処理ノード0212から取得、保存したデータをユーザが編集するためのソフトウェアプログラム、前記ユーザにより編集されたデータを前記処理ノード0212に転送、上書き更新するためのソフトウェアプログラム、LAN0214を介して保守ノード0211と処理ノード0212の間で通信を行うためのソフトウェアプログラム等が格納され、これらのソフトウェアプログラムは処理装置0221により処理される。また通信装置0223は、処理ノード0212がデータを取得する際の通信処理、またはユーザ端末0202からログインするための画面の入出力等を行うための通信処理、等を行う。 The main hardware configuration of the maintenance node 0211 includes a processing device (CPU) 0221, a storage device (memory, hard disk) 0222, and a communication device 0223. In the storage device 0222, a software program for acquiring data from the processing node 0212 and storing the data in a designated area in the storage device 0222, for comparing the contents of the data acquired from the processing node 0212 and presenting it to the user A software program for performing screen display, a software program for editing data acquired and stored from the processing node 0212, and data edited by the user for transferring to the processing node 0212 for overwriting update A software program, a software program for performing communication between the maintenance node 0211 and the processing node 0212 via the LAN 0214, and the like are stored, and these software programs are processed by the processing device 0221. The communication device 0223 performs communication processing when the processing node 0212 acquires data, communication processing for inputting / outputting a screen for logging in from the user terminal 0202, and the like.
 なお、処理装置(CPU)0221は、処理に必要なプログラムをハードディスク等の記憶装置0222から読み出して各処理を実行する。また、記憶装置0222や通信装置0223の動作を制御する。また、後述する各図面で説明するフローチャートやシーケンス図における保守ノード0211の処理は、特段の説明がない限り処理装置(CPU)0221が実行するものとする。 Note that the processing device (CPU) 0221 reads a program necessary for processing from the storage device 0222 such as a hard disk and executes each processing. It also controls operations of the storage device 0222 and the communication device 0223. In addition, the processing of the maintenance node 0211 in the flowcharts and sequence diagrams described in the drawings to be described later is assumed to be executed by the processing device (CPU) 0221 unless otherwise specified.
 処理ノード0212の主なハードウェア構成は、処理装置(CPU)0224、記憶装置(メモリ、ハードディスク)0225、通信装置0226からなる。記憶装置0225には、フォールトトレラントコンピュータシステム0201により外部システム0204に対して提供するサービスを実行する際に必要なデータ、上記サービスに関する外部システム0204からの要求に対して処理を実行するためのユーザプログラム、複数の処理ノード0212の間での稼動中に同期を実施するためのソフトウェアプログラム、ユーザに指定された処理ノード0212におけるデータを取得し、保守ノード0212に送信するためのソフトウェアプログラム、ユーザ端末0202を介してユーザが保守ノード0211においてデータを編集している最中に処理ノード0212上での当該データに対する更新の有無を監視するソフトウェアプログラム、LAN0214を介して処理ノード0212とゲートウェイサーバ0213の間の通信または処理ノード0212と保守ノード0211の間の通信を行うためのソフトウェアプログラム等が格納され、これらのソフトウェアプログラムは処理装置0224により処理される。また通信装置0226は、ゲートウェイサーバ0213からの入力メッセージ0232を受信し、ゲートウェイサーバ0213に出力メッセージ0242を送信するための通信処理を行う。 The main hardware configuration of the processing node 0212 includes a processing device (CPU) 0224, a storage device (memory, hard disk) 0225, and a communication device 0226. The storage device 0225 stores data necessary for executing a service provided to the external system 0204 by the fault tolerant computer system 0201, and a user program for executing processing for a request from the external system 0204 regarding the service. , A software program for performing synchronization during operation among a plurality of processing nodes 0212, a software program for acquiring data in the processing node 0212 designated by the user, and transmitting the data to the maintenance node 0212, and a user terminal 0202 A software program for monitoring whether or not there is an update to the data on the processing node 0212 while the user is editing data at the maintenance node 0211 via the LAN, and the processing node 0212 and the gate via the LAN 0214 Software program for performing communication between the communication or processing node 0212 and maintenance node 0211 between Eisaba 0213 is stored, these software programs are processed by the processing device 0224. The communication device 0226 receives the input message 0232 from the gateway server 0213 and performs communication processing for transmitting the output message 0242 to the gateway server 0213.
 なお、処理装置(CPU)0224は、処理に必要なプログラムをハードディスク等の記憶装置0225から読み出して各処理を実行し、また、記憶装置0225や通信装置0226の動作を制御する。また、後述する各図面で説明するフローチャートやシーケンス図における処理ノード0212の処理は、特段の説明がない限り処理装置(CPU)0224が実行するものとする。 Note that the processing device (CPU) 0224 reads a program necessary for processing from the storage device 0225 such as a hard disk, executes each processing, and controls operations of the storage device 0225 and the communication device 0226. In addition, the processing of the processing node 0212 in the flowcharts and sequence diagrams described in the drawings to be described later is assumed to be executed by the processing device (CPU) 0224 unless otherwise specified.
 ユーザ端末0202の主なハードウェア構成は、処理装置(CPU)、記憶装置(ハードディスク)、通信装置からなる。前記記憶装置には、保守ノード0211にログインし、コマンド操作、画面表示等を行うためのソフトウェアプログラム、ユーザ端末0202と保守ノード0211との間の通信を行うためのソフトウェアプログラム等が格納され、前記処理装置により処理される。また前記通信装置は、保守ノード0211へのログインに対する画面の入出力等を行うための通信処理を行う。 The main hardware configuration of the user terminal 0202 includes a processing device (CPU), a storage device (hard disk), and a communication device. The storage device stores a software program for logging in to the maintenance node 0211, performing command operations, screen display, and the like, a software program for performing communication between the user terminal 0202 and the maintenance node 0211, and the like. Processed by the processing device. The communication device performs communication processing for inputting / outputting a screen for login to the maintenance node 0211.
 なお、前記処理装置はハードディスク等の前記記憶装置から処理に必要なプログラムを読み出して各処理を実行する。また、前記記憶装置や前期通信装置の動作を制御する。また、後述する各図面で説明するフローチャートやシーケンス図におけるユーザ端末0202の処理は、特段の説明がない限り前記処理装置(CPU)が実行するものとする。 The processing device reads out a program necessary for processing from the storage device such as a hard disk and executes each processing. It also controls the operation of the storage device and the previous communication device. In addition, the processing of the user terminal 0202 in the flowcharts and sequence diagrams described in the drawings to be described later is executed by the processing device (CPU) unless otherwise specified.
 図3は、フォールトトレラントコンピュータシステムにおけるデータアクセス方法を実施する際の、フォールトトレラントコンピュータシステムを構成する複数のノード間での全体処理シーケンスを示す図である。 FIG. 3 is a diagram showing an overall processing sequence between a plurality of nodes constituting the fault tolerant computer system when the data access method in the fault tolerant computer system is executed.
 主な構成要素は、ユーザ端末0202と、フォールトトレラントコンピュータシステム0201を構成する保守ノード0211、処理ノード1(0212a)、処理ノード2(0212b)、処理ノード3(0212c)である。 Main components are a user terminal 0202, a maintenance node 0211, a processing node 1 (0212a), a processing node 2 (0212b), and a processing node 3 (0212c) that constitute the fault-tolerant computer system 0201.
 0301において、ユーザ端末0202にてユーザの操作により保守ノード0211にログインする。0302において、ユーザの操作により、ユーザがアクセスするデータを指定する。保守ノード0211にて0302のデータ指定を受付けると、0311において、処理ノード1(0212a)に対してユーザ指定の該当データを要求すると、処理ノード1(0212a)は0321において該当データを抽出し、その該当データを保守ノード0211に送信する。0312において、処理ノード2(0212b)に対してユーザ指定の該当データを要求すると、処理ノード2(0212b)は0331において該当データを抽出し、その該当データを保守ノード0211に送信する。0313において、処理ノード3(0212c)に対してユーザ指定の該当データを要求すると、処理ノード3(0212c)は0341において該当データを抽出し、その該当データを保守ノード0211に送信する。以降、フォールトトレラントコンピュータシステム0201を構成する全ての処理ノード0212に対して0311~0313と同様の処理を実施し、ユーザ指定の該当データを全ての処理ノード0212から取得する。0314において、0311~0313にて取得したデータを保守ノード0211内の格納領域(ハードディスク等)に保存する。0315において、0311~0313にて処理ノード0211から取得した各データの内容比較を行う。0316において、0315の内容比較結果に基づき、ユーザ端末0202にデータ内容の表示を行う。なお0315、0316における処理及び表示方法の詳細は図6、図10にて述べる。 In 0301, the user terminal 0202 logs in to the maintenance node 0211 by a user operation. In 0302, data to be accessed by the user is designated by the user's operation. When the maintenance node 0211 accepts 0302 data designation, in 0311, when the user requests the corresponding data specified by the user to the processing node 1 (0212a), the processing node 1 (0212a) extracts the corresponding data in 0321, The corresponding data is transmitted to the maintenance node 0211. In 0312, when requesting the user-specified corresponding data to the processing node 2 (0212b), the processing node 2 (0212b) extracts the corresponding data in 0331 and transmits the corresponding data to the maintenance node 0211. In 0313, when requesting the corresponding data designated by the user to the processing node 3 (0212c), the processing node 3 (0212c) extracts the corresponding data in 0341 and transmits the corresponding data to the maintenance node 0211. Thereafter, the same processing as 0311 to 0313 is performed on all the processing nodes 0212 constituting the fault tolerant computer system 0201, and the corresponding data designated by the user is acquired from all the processing nodes 0212. In 0314, the data acquired in 0311 to 0313 is stored in a storage area (hard disk or the like) in the maintenance node 0211. In 0315, the contents of the data acquired from the processing node 0211 are compared in 0311 to 0313. In 0316, based on the content comparison result in 0315, the data content is displayed on the user terminal 0202. Details of the processing and display method in 0315 and 0316 will be described with reference to FIGS.
 0303において、ユーザ端末0202にてユーザの操作により保守ノード0211に対してデータ編集を開始する。保守ノード0211にて0303のユーザによるデータ編集開始を受付けると、0317において編集ツールを起動し、編集対象となる該当データを開く。この後はユーザによるデータ編集作業が実施される。0304において、ユーザの操作により保守ノード0211に対するデータ編集を終了する。保守ノード0211にて0304のユーザによるデータ編集終了を受付けると、0318において、ユーザが編集を実施した該当データに関して更新対象となる処理ノード0212(全処理ノードもしくは個別の処理ノード)を決定する。0319において、0318にて決定した更新対象の処理ノード0212に対してユーザによる編集済みのデータを配信する。前記保守ノード0211より配信された編集済みデータを受信した処理ノード0212では、該当データへの上書き更新を実施する(0322、0332、0342)。なお0317~0319における処理の詳細は図7にて述べる。また0322、0332、0342における処理の詳細は図9にて述べる。
図4は、フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードのモジュール構成を示す図である。
In 0303, the user terminal 0202 starts data editing for the maintenance node 0211 by a user operation. When the maintenance node 0211 accepts the start of data editing by the user 0303, the editing tool is activated at 0317 and the corresponding data to be edited is opened. Thereafter, data editing work by the user is performed. In 0304, data editing for the maintenance node 0211 is terminated by the user's operation. When the maintenance node 0211 accepts the completion of data editing by the user 0304, in 0318, the processing node 0212 (all processing nodes or individual processing nodes) to be updated with respect to the corresponding data edited by the user is determined. In 0319, the data edited by the user is distributed to the processing node 0212 to be updated determined in 0318. The processing node 0212 that has received the edited data distributed from the maintenance node 0211 performs overwrite update on the corresponding data (0322, 0332, 0342). Details of the processing in 0317 to 0319 will be described with reference to FIG. Details of the processes at 0322, 0332, and 0342 will be described with reference to FIG.
FIG. 4 is a diagram showing a module configuration of a maintenance node that is included in the fault tolerant computer system and performs processing such as data acquisition from the processing node, presentation to the user, editing, overwriting update of the edited data to the processing node, and the like. is there.
 保守ノード0211には、処理ノード0212からのデータ取得、ユーザへの提示、ユーザによる編集の管理、処理ノード0212への編集済みデータの上書き更新等の処理を行うデータアクセス管理部0401、処理ノード0212より取得したデータを格納するためのハードディスク0402、ユーザがデータ編集を行うための編集ツール0403が導入される。データアクセス管理部0401は、処理装置(CPU)0221により実行されるソフトウェアプログラムである。 The maintenance node 0211 includes a data access management unit 0401 and a processing node 0212 that perform processing such as data acquisition from the processing node 0212, presentation to the user, management of editing by the user, and overwrite update of the edited data to the processing node 0212. A hard disk 0402 for storing the acquired data and an editing tool 0403 for the user to edit the data are introduced. The data access management unit 0401 is a software program executed by the processing device (CPU) 0221.
 データアクセス管理0401の主な構成要素は、画面表示部0415を介したユーザからの指定に基づいてデータ通信部0417を介して処理ノード0212よりデータを取得しそのデータをハードディスク0402へ保存するデータ取得・保存部0411と、データ取得・保存部0411が複数の処理ノード0212より取得したデータの内容比較を行うデータ内容比較部0412と、画面表示部0415を介したユーザからの指定に基づいて編集ツール0403の起動及び終了監視を行うデータ編集管理部0413と、ユーザが編集ツール0403を用いて編集したデータを処理ノード0212へと配信し該当データの上書き更新を行うデータ配信・更新部0414と、通信媒体0205を介したユーザ端末0202からのリモート接続に対してコマンド入力画面やデータ内容比較部0412の処理結果の出力画面、編集ツール0403の画面等を提供する画面表示部0415と、通信媒体0205を介したユーザ端末0202からのリモート接続を受け付け画面表示部0415に接続するリモートアクセス部0416と、通信媒体0214を介してシステム内の処理ノード0212等との間の通信を行うデータ通信部0417と、である。プロファイル情報0421は、処理ノード0212が保有するデータ毎にデータ属性情報、アクセス権限、他の処理ノードでの保有の有無、処理ノード間でのデータ内容一致の要否、等を定義しており、これらをデータ内容比較部0412、データ配信・更新部0414等が各々の処理の中で参照する。プロファイル情報0421の詳細は図8に述べる。 The main component of the data access management 0401 is data acquisition for acquiring data from the processing node 0212 via the data communication unit 0417 based on the designation from the user via the screen display unit 0415 and storing the data in the hard disk 0402. A storage unit 0411, a data content comparison unit 0412 that compares data contents acquired by the data acquisition / storage unit 0411 from a plurality of processing nodes 0212, and an editing tool based on designation from the user via the screen display unit 0415 A data editing management unit 0413 that monitors activation and termination of 0403, a data distribution / update unit 0414 that distributes data edited by the user using the editing tool 0403 to the processing node 0212 and overwrites and updates the corresponding data, and communication Remote connection from user terminal 0202 via medium 0205 A screen display unit 0415 that provides a command input screen, an output result output screen of the data content comparison unit 0412, a screen of the editing tool 0403, and the like, and a screen for accepting a remote connection from the user terminal 0202 via the communication medium 0205 A remote access unit 0416 connected to the display unit 0415, and a data communication unit 0417 for performing communication between the processing node 0212 and the like in the system via the communication medium 0214. The profile information 0421 defines, for each data held by the processing node 0212, data attribute information, access authority, presence / absence of possession at other processing nodes, necessity / unnecessity of data content matching between processing nodes, and the like. The data content comparison unit 0412, the data distribution / update unit 0414, and the like refer to these in each process. Details of the profile information 0421 will be described in FIG.
 図5は、フォールトトレラントコンピュータシステムに含まれ、外部からの要求に対する処理等を実行する処理ノードのモジュール構成を示す図である。 FIG. 5 is a diagram showing a module configuration of a processing node included in the fault-tolerant computer system and executing processing for an external request.
 処理ノード0212には、指定されたデータの取得、保守ノード0211への送信等の処理を行うデータアクセス管理部0501、外部システム0204からの要求に対して各種の処理を行うユーザプログラム0502、ミドルウェア0503、またユーザプログラム0502、ミドルウェア0503が参照及び更新するデータの格納先であるハードディスク0504、メモリ0505が導入される。データアクセス管理部0501は、処理装置(CPU)0224により実行されるソフトウェアプログラムである。 The processing node 0212 includes a data access management unit 0501 that performs processing such as acquisition of designated data and transmission to the maintenance node 0211, a user program 0502 that performs various processing in response to requests from the external system 0204, and middleware 0503. In addition, a hard disk 0504 and a memory 0505, which are storage destinations of data to be referenced and updated by the user program 0502, middleware 0503, are introduced. The data access management unit 0501 is a software program executed by the processing device (CPU) 0224.
 データアクセス管理部0501の主な構成要素は、データ通信部0513を介して保守ノード0211からのデータ取得要求を受付け、ハードディスク0504またはメモリ0505から該当データを抽出し、その該当データを保守ノード0211に送信し、さらに、保守ノード0211からのデータの上書き更新要求を受け付けて該当データへの上書き更新を実施するデータ管理部0501、データ管理部0501が保守ノード0211へと送信した元のデータへの処理ノード0211内のプログラム等による更新を監視するデータ更新監視部0512、通信媒体0214を介してシステム内の保守ノード0211等との間の通信を行うデータ通信部0513である。 The main component of the data access management unit 0501 receives a data acquisition request from the maintenance node 0211 via the data communication unit 0513, extracts the relevant data from the hard disk 0504 or the memory 0505, and sends the relevant data to the maintenance node 0211. Data management unit 0501 that receives a data overwrite update request from the maintenance node 0211 and performs overwrite update on the corresponding data, and processing to the original data transmitted by the data management unit 0501 to the maintenance node 0211 A data update monitoring unit 0512 that monitors updates by a program or the like in the node 0211 and a data communication unit 0513 that performs communication with the maintenance node 0211 or the like in the system via the communication medium 0214.
 図6は、フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードにて、処理ノードからの取得したデータをユーザに表示する処理の流れを示すフローチャートである。 FIG. 6 is a maintenance node that is included in the fault tolerant computer system and performs processing such as data acquisition from the processing node, presentation to the user, editing, overwriting update of the edited data to the processing node, and the like from the processing node. It is a flowchart which shows the flow of the process which displays the acquired data to a user.
 0601において、ユーザ端末0202を介してのユーザによる操作から、アクセスするデータのデータパスを取得する。0602において、0601にて取得したデータパスに該当するデータを処理ノード0212に要求して取得する。0603において、0602にて処理ノード0212より取得したデータを保守ノード0211内の格納領域(ハードディスク等)に保存する。0604において、まだ全ての処理ノード0212からデータ取得を終了していなければ、0602、0603の処理を繰り返す。0604において、全ての処理ノード0212からデータ取得を終了していれば、0605において、0602~0604にて処理ノード0212から取得した同一データの内容比較を実施する。
ここでデータ内容を比較するのに「diff」等の一般的なツールを用いても良い。0606において、0605のデータ内容比較の結果として、全ての処理ノード0212からのデータの内容が一致している場合、0607において、該当データのプロファイル情報を参照する。0608において、該当データのプロファイル情報の「内容一致」の項が、処理ノード0212間で内容一致してはいけない(NO)と記載されている場合、0610において、ユーザに対する警告(データ内容が一致してはいけないにも関わらず、一致している旨)を表示する。0609において、事前に定義されている代表処理ノード0212もしくは稼働中の処理ノードの中で事前に指定された条件に合致する1つの処理ノード0212から取得したデータの内容(全処理ノードとも一致)を表示する。0606において、0605のデータ内容比較の結果として、少なくとも1つの処理ノード0212からのデータの内容に差異がある場合、0611において、該当データのプロファイル情報を参照する。0612において、該当データのプロファイル情報の「内容一致」の項が、処理ノード0212間で内容一致する必要がある(YES)と記載されている場合、0613において、ユーザに対する警告(データ内容が一致する必要があるにも関わらず、一致していない旨)を表示する。0614において、処理ノード0212間で差異の有る部分のデータ内容を表示する。ここでの表示方法の詳細は図10Bにて示す。
In 0601, a data path of data to be accessed is acquired from an operation by the user via the user terminal 0202. In 0602, data corresponding to the data path acquired in 0601 is requested to the processing node 0212 and acquired. In 0603, the data acquired from the processing node 0212 in 0602 is stored in a storage area (such as a hard disk) in the maintenance node 0211. In 0604, if data acquisition from all the processing nodes 0212 has not been completed yet, the processing of 0602 and 0603 is repeated. If the data acquisition from all the processing nodes 0212 has been completed in 0604, the contents of the same data acquired from the processing nodes 0212 in 0602 to 0604 are compared in 0605.
Here, a general tool such as “diff” may be used to compare the data contents. In 0606, if the data contents from all the processing nodes 0212 match as a result of the data content comparison in 0605, the profile information of the corresponding data is referred to in 0607. In 0608, when the “content match” section of the profile information of the corresponding data indicates that the contents should not match between the processing nodes 0212 (NO), in 0610, a warning to the user (data contents match) Although it is not allowed to be displayed, it is displayed that it matches. In 0609, the contents of data acquired from one processing node 0212 that matches the condition specified in advance in the representative processing node 0212 defined in advance or the processing node in operation (matches with all processing nodes). indicate. In 0606, if there is a difference in the data contents from at least one processing node 0212 as a result of the data content comparison in 0605, the profile information of the corresponding data is referred to in 0611. In 0612, if the item “content match” in the profile information of the corresponding data indicates that the content needs to match between the processing nodes 0212 (YES), a warning to the user (data content matches) in 0613. Displayed to indicate that they do not match even though they are necessary. In 0614, the data contents of a portion having a difference between the processing nodes 0212 are displayed. Details of the display method here are shown in FIG. 10B.
 図7は、フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードにて、ユーザにより編集されたデータを処理ノードへ上書き更新する処理の流れを示すフローチャートである。 FIG. 7 is a fault-tolerant computer system that is edited by a user at a maintenance node that performs processing such as data acquisition from a processing node, presentation to a user, editing, and overwrite update of edited data to a processing node. 6 is a flowchart showing a flow of processing for overwriting and updating updated data in a processing node.
 0701において、ユーザ端末0202を介してのユーザによる操作から、データの編集開始指示を受付ける。0702において、図6のように処理ノード0212から取得したデータの内容を比較した結果、全ての処理ノード0212からのデータの内容が一致している場合は、0703において、事前に定義されている代表処理ノード0212もしくは稼働中の処理ノードの中で事前に指定された条件に合致する1つの処理ノード0212からの取得したデータを編集対象となるデータと決定する。0702において、図6のように処理ノード0212から取得したデータの内容を比較した結果、少なくとも1つの処理ノード0212からのデータの内容に差異がある場合は、0704において、ユーザが選択した処理ノード0212からのデータを編集対象となるデータと決定する(ここではユーザにデータ取得元の処理ノードを選択させる画面表示を行う)。0705において、編集ツールを起動し、0703または0704にて決定したデータを開く。ここで編集ツールは編集対象となるデータの種別毎に事前に規定しておくものとする。例えばテキストファイル等であれば、テキストエディタ等である。0706において、0705にて起動した編集ツールの終了を監視し、終了を検出していない場合は、0707において処理ノード0212側で該当データの更新を検出し、更新後のデータが保守ノード0211に送信された場合は、0708において、ユーザに更新発生を通知し、前記処理ノード0212側で更新後のデータに差替えるか否かの選択を提示し、ユーザの選択に従ってデータの差替えの実行もしくは非実行を行う。その後、0706の処理に戻る。0707において、処理ノード0212側で該当データの更新を検出していない場合は0706の処理に戻る。0706において、0705にて起動した編集ツールの終了を監視し、終了を検出した場合は、0709において、編集済みデータの上書き更新先とする処理ノード0212をユーザに選択させる。ここでは、全処理ノード0212に一括して上書き更新を実施するか、1つの処理ノードを個別に指定して上書き更新を実施するか、を選択させる。ユーザが全処理ノードへの上書き更新を選択する場合、0710において、該当データのプロファイル情報を参照する。0711において、該当データのプロファイル情報の「内容一致」の項が、処理ノード0212間で内容一致する必要がある(YES)と記載されている場合は、0712において、全処理ノード0212に対してユーザによる編集済みデータの上書き更新を実施する。0711において、該当データのプロファイル情報の「内容一致」の項が処理ノード0212間で内容一致してはいけない(NO)と記載されている場合は、0713において、ユーザに対して警告(全処理ノードでの内容一致は不可)を表示し、上書き更新は実施しない。0709において、ユーザが1つの処理ノードを個別に指定した上書き更新を選択する場合は、0714において、該当データのプロファイル情報を参照する。0715において、該当データのプロファイル情報の「内容一致」の項が処理ノード0212間で内容一致する必要がある(YES)と記載されている場合は、0716において、ユーザに対して警告(全処理ノードで内容一致することが必要)を表示し、上書き更新は実施しない。0715において、該当データのプロファイル情報の「内容一致」の項が処理ノード0212間で内容一致してはいけない(NO)と記載されている場合は、0717において、個別の処理ノード0212に対して、ユーザによる編集済みデータの上書き更新を実施する。0718において、個々の処理ノード0212から上書き更新の実行結果を受信する。上書き更新を実施した全ての処理ノード0212で成功した場合、0719において、上書き更新を実施した全ての処理ノード0212に対して終了指示を送信し、終了する。0718において、上書き更新を実施した処理ノード0212のうち、少なくとも1つの処理ノード0212にて失敗した場合、0720において、上書き更新を実施した全ての処理ノード0212に対してデータの元戻し指示を送信し、終了する。 In 0701, an instruction to start editing of data is received from an operation by the user via the user terminal 0202. In 0702, if the contents of the data from all the processing nodes 0212 match as a result of comparing the contents of the data acquired from the processing node 0212 as shown in FIG. 6, the representative defined in advance in 0703 Data acquired from one processing node 0212 that matches a condition specified in advance in the processing node 0212 or an active processing node is determined as data to be edited. In 0702, if there is a difference in the data contents from at least one processing node 0212 as a result of comparing the data contents acquired from the processing node 0212 as shown in FIG. 6, the processing node 0212 selected by the user in 0704 Is determined as data to be edited (here, a screen display for allowing the user to select a processing node as a data acquisition source is performed). In 0705, the editing tool is activated and the data determined in 0703 or 0704 is opened. Here, the editing tool is defined in advance for each type of data to be edited. For example, if it is a text file etc., it is a text editor etc. In 0706, the end of the editing tool started in 0705 is monitored. If the end is not detected, update of the corresponding data is detected on the processing node 0212 side in 0707, and the updated data is transmitted to the maintenance node 0211. If it is, in 0708, the user is notified of the occurrence of the update, the processing node 0212 is presented with a selection as to whether or not to replace it with the updated data, and the data replacement is executed or not executed according to the user's selection. I do. Thereafter, the processing returns to 0706. In 0707, if the processing node 0212 has not detected the update of the corresponding data, the processing returns to 0706. In 0706, the end of the editing tool activated in 0705 is monitored. If the end is detected, in 0709, the user is made to select the processing node 0212 that is the overwrite update destination of the edited data. Here, it is selected whether to perform overwrite update collectively for all the processing nodes 0212, or to perform overwrite update by individually specifying one processing node. When the user selects overwrite update to all processing nodes, the profile information of the corresponding data is referred to in 0710. In 0711, if the “content match” section of the profile information of the corresponding data indicates that the content needs to be matched between the processing nodes 0212 (YES), then in 0712, the user is sent to all the processing nodes 0212. Update the edited data by overwriting. In 0711, if the “content match” section of the profile information of the corresponding data indicates that the content should not match between the processing nodes 0212 (NO), in 0713, a warning is given to the user (all processing nodes Is not possible), and overwrite update is not performed. In 0709, when the user selects overwrite update in which one processing node is individually specified, in 0714, the profile information of the corresponding data is referred to. In 0715, if the “content match” section of the profile information of the corresponding data indicates that the content needs to match between the processing nodes 0212 (YES), a warning (all processing nodes) is issued in 0716. (The content must match in the above) is displayed, and overwriting is not performed. In 0715, if the “content match” section of the profile information of the corresponding data indicates that the content should not match between the processing nodes 0212 (NO), in 0717, for each processing node 0212, The user overwrites and edits the edited data. In 0718, the execution result of the overwrite update is received from each processing node 0212. If all the processing nodes 0212 that have performed the overwrite update succeed, in 0719, an end instruction is transmitted to all the processing nodes 0212 that have performed the overwrite update, and the processing ends. In 0718, if at least one of the processing nodes 0212 that have performed the overwrite update fails, in 0720, an instruction to restore the data is sent to all the processing nodes 0212 that have performed the overwrite update. ,finish.
 図8は、フォールトトレラントコンピュータシステムに含まれ、処理ノードからのデータ取得、ユーザへの提示、編集、処理ノードへの編集済みデータの上書き更新等の処理を行う保守ノードにおいて管理される、データの属性情報、アクセス権限、他の処理ノードでの保有の有無、処理ノード間でのデータ内容一致の要否、等を定義したプロファイル情報の書式を示す図である。 FIG. 8 is a diagram of a fault-tolerant computer system that manages data in a maintenance node that performs processing such as data acquisition from a processing node, presentation to a user, editing, overwriting and updating of edited data in a processing node. It is a figure which shows the format of the profile information which defined attribute information, access authority, the presence or absence of possession in another processing node, the necessity of data content matching between processing nodes, etc.
 プロファイル情報の主な構成要素は、種別0801、データパス0802、アクセス権限0803、アクセス内容0804、他ノード保有0805、内容一致0806である。これらの項目に該当する設定値はデータ毎に指定される。 Main components of profile information are a type 0801, a data path 0802, an access authority 0803, an access content 0804, another node possession 0805, and a content match 0806. Setting values corresponding to these items are specified for each data.
 種別0801には、データの種別が記載される。データパス0802には、データの配置場所、特定するための情報が記載される。例えば種別0801がファイルであれば、ファイルパスが記載され、種別0801がメモリデータであれば、アドレス及びサイズが記載される。アクセス権限0803には、該当データへアクセスが許可されるユーザの権限が記載される。アクセス内容0804には、アクセス権限0803にて許可されるユーザが実行可能なアクセス内容を記載する。図の例では、「R」(読込み可)、「W」(書込み可)等が記載されている。他ノード保有0805には、該当データを他の処理ノード0212でも保有しているか否か(YES/NO)を記載する。内容一致0806には、該当データを他の処理ノード0212でも保有している場合に、処理ノード0212間でデータ内容を一致する必要があるか、一致してはいけないか(YES/NO)を記載する。 The type 0801 describes the type of data. The data path 0802 describes information for specifying the location of data. For example, if the type 0801 is a file, the file path is described, and if the type 0801 is memory data, the address and size are described. The access authority 0803 describes the authority of the user who is permitted to access the corresponding data. The access content 0804 describes the access content that can be executed by the user permitted by the access authority 0803. In the example of the figure, “R” (reading is possible), “W” (writing is possible), and the like are described. In other node possession 0805, whether or not the relevant data is possessed by other processing node 0212 is described (YES / NO). The content match 0806 describes whether the data content needs to be matched between the processing nodes 0212 or not (YES / NO) when the corresponding data is held in other processing nodes 0212. To do.
 なお上記プロファイル情報はファイル等の形式で処理ノード0212毎に作成され、保守ノード0211にて保存、管理するものであり、複数の処理ノード0212から取得した同一データの内容表示、ユーザによる編集済みデータの複数の処理ノード0212に対する上書き更新等の処理を実施する際に参照される。またプロファイル情報はフォールトトレラントコンピュータシステムの管理者もしくはユーザにより事前に作成され、適宜更新されるものである。 The profile information is created for each processing node 0212 in the form of a file, etc., and is stored and managed by the maintenance node 0211. The content data of the same data acquired from a plurality of processing nodes 0212 and the data edited by the user are displayed. It is referred to when executing processing such as overwriting update for a plurality of processing nodes 0212. The profile information is created in advance by the administrator or user of the fault tolerant computer system and is updated as appropriate.
 図9は、フォールトトレラントコンピュータシステムに含まれ、外部からの要求に対する処理等を実行する処理ノードにて、データ取得、編集対象データの更新監視、データ上書き更新等を行う処理の流れを示すフローチャートである。 FIG. 9 is a flowchart showing the flow of processing that is included in the fault-tolerant computer system and performs data acquisition, update monitoring of data to be edited, data overwrite update, and the like in a processing node that executes processing in response to an external request. is there.
 0901において、保守ノード0211からデータ取得要求を受付ける。0902において、0901での要求に該当するデータを処理ノード0212内で取得し、保守ノード0211に送信する。0903において、0902にて取得した該当データを複製し、その複製データを一時格納領域(ハードディスク内の一時利用ディレクトリ、等)に格納する。0904において、前記保守ノード0211より要求されたデータに対して、処理ノード0212内のプログラムによる更新の監視、または他のユーザによる該当データの更新の監視を開始する。0905において、0904の更新監視の結果、更新を検出した場合は、0906において、更新後の該当データを保守ノード0211に更新通知とともに送信する。その後、0905の処理に戻る。0905において、0904の更新監視の結果、更新を検出していない場合は、0907において保守ノード0211からの該当データの上書き更新指示及びユーザによる編集済みデータを受付けた場合、0908において、該当データに対して保守ノード0211から受信したユーザによる編集済みデータで上書き更新する。その後、0905の処理に戻る。0909において、保守ノード0211からの該当データの元戻し指示を受付けた場合、0910において、該当データに対して、0903にて一時格納領域に格納していた複製データ(編集・更新前のデータ)で上書き更新する。0912において、一時格納領域より前記複製データ(編集・更新前のデータ)を削除する。0911において、保守ノードからの終了指示(処理ノード0212への該当データの上書き更新が正常に完了)を受付けた場合、0912において、一時格納領域より前記複製データ(編集・更新前のデータ)を削除する。 In 0901, a data acquisition request is received from the maintenance node 0211. In 0902, data corresponding to the request in 0901 is acquired in the processing node 0212 and transmitted to the maintenance node 0211. In 0903, the corresponding data acquired in 0902 is duplicated, and the duplicated data is stored in a temporary storage area (a temporary use directory in the hard disk, etc.). In 0904, monitoring of update by the program in the processing node 0212 or monitoring of update of the corresponding data by another user is started for the data requested by the maintenance node 0211. In 0905, when an update is detected as a result of the update monitoring in 0904, the corresponding data after the update is transmitted to the maintenance node 0211 together with an update notification in 0906. Thereafter, the processing returns to 0905. In 0905, if no update has been detected as a result of the update monitoring in 0904, in 0907, if an instruction to overwrite the corresponding data from the maintenance node 0211 and edited data by the user are received, in 0908, the corresponding data is processed. The user overwrites and updates the user-edited data received from the maintenance node 0211. Thereafter, the processing returns to 0905. In 0909, when an instruction to restore the corresponding data from the maintenance node 0211 is received, in 0910, the corresponding data is copied data (data before editing / updating) stored in the temporary storage area in 0903. Overwrite and update. In 0912, the duplicated data (data before editing / updating) is deleted from the temporary storage area. In 0911, when an end instruction from the maintenance node (overwrite update of the corresponding data to the processing node 0212 is normally completed) is received, the duplicated data (data before editing / updating) is deleted from the temporary storage area in 0912 To do.
 図10Aは、処理ノードより取得したデータをユーザに対して提示するための、処理ノード間でデータ内容が一致する場合の画面表示例を示す図である。 FIG. 10A is a diagram showing a screen display example when the data contents match between the processing nodes for presenting the data acquired from the processing nodes to the user.
 画面表示1001は、図6にて示した、複数の処理ノード0212から取得した同一データに対する内容を保守ノード0211において比較した結果として、全ての処理ノード0212からのデータの内容が一致する場合には、処理ノード0212上のデータを指定したユーザのコマンド操作に対する出力結果として表示する。1011には、取得したデータの属性情報(種別、名称)及び内容比較結果(図の例では全処理ノード0212からのデータが一致)を表示する。1012には、取得したデータの内容をそのまま表示する。 The screen display 1001 is displayed when the contents of the data from all the processing nodes 0212 match as a result of comparing the contents of the same data acquired from the plurality of processing nodes 0212 shown in FIG. The data on the processing node 0212 is displayed as an output result for the command operation of the designated user. In 1011, attribute information (type and name) of the acquired data and a content comparison result (data from all processing nodes 0212 match in the example in the figure) are displayed. In 1012, the contents of the acquired data are displayed as they are.
 図10Bは、処理ノードより取得したデータをユーザに対して提示するための、処理ノード間でデータ内容に差異が有る場合の画面表示例を示す図である。 FIG. 10B is a diagram illustrating a screen display example when there is a difference in data contents between processing nodes for presenting data acquired from the processing nodes to a user.
 画面表示1002は、図6にて示した、複数の処理ノード0212から取得した同一データに対する内容を保守ノード0211において比較した結果として、少なくとも1つの処理ノード0212からのデータの内容に差異が有る場合に、処理ノード0212上のデータを指定したユーザのコマンド操作に対する出力結果として表示する。1021には、取得したデータの属性情報(種別、名称)及び内容比較結果(図の例では1つの処理ノード0212からのデータに差異有り)を表示する。1021には、前記差異の有る1つの処理ノード0212とその他の処理ノード0212との間での差異の有る部分のデータ内容を比較形式で表示する。 The screen display 1002 shows a case where there is a difference in data contents from at least one processing node 0212 as a result of comparing the contents for the same data acquired from a plurality of processing nodes 0212 shown in FIG. The data on the processing node 0212 is displayed as an output result for the command operation of the designated user. In 1021, attribute information (type and name) of the acquired data and a content comparison result (in the example of the figure, there is a difference in data from one processing node 0212) are displayed. In 1021, the data content of a portion having a difference between the one processing node 0212 having the difference and the other processing node 0212 is displayed in a comparison format.
 本発明によるフォールトトレラントコンピュータシステムにおけるデータアクセス方法は、特にユーザがフォールトトレラントコンピュータシステム0201にて稼動するアプリケーションプログラムのデバッグ、テスト等の作業を行う際に活用できる。 The data access method in the fault-tolerant computer system according to the present invention can be used particularly when the user performs work such as debugging and testing of an application program running on the fault-tolerant computer system 0201.
 例えば、テスト、デバッグのためにアプリケーションプログラムの定義ファイルを編集し、設定値等の変更を行う場合、従来技術による方法では、1つの処理ノード0212ずつアクセスして、同一ファイルに対して同内容の更新を実施していく必要があった。また全処理ノード0212における該当ファイルの内容が一致しているかをユーザ自身で確認する必要があった。もし処理ノード0212間で該当ファイルの内容に差異があれば、処理ノード0212間でアプリケーションプログラムが異なる動作をし、フォールトトレラントコンピュータシステム0201が異常状態となり、テスト、デバッグが正しく実施できなくなる可能性がある。これに対して本発明による方法を活用すれば、ユーザは該当ファイルを1度開き、内容の更新を実施するだけでよく、ユーザ自身が確認しなくとも、全処理ノード0212にて該当ファイルの内容が一致していることが保証される。さらにIPアドレス等のノード固有情報に対する更新は、全処理ノード0212で同一内容とならないように制限される。これらのことからユーザが前記ファイルの更新を行っても、前述のように処理ノード0212間でアプリケーションプログラムが異なる動作をすることはない。 For example, when editing a definition file of an application program for testing and debugging and changing a setting value or the like, the method according to the prior art accesses one processing node 0212 at a time and accesses the same file with the same contents. It was necessary to carry out updates. In addition, it is necessary for the user to check whether the contents of the corresponding files in all the processing nodes 0212 are the same. If there is a difference in the contents of the corresponding file between the processing nodes 0212, the application program may operate differently between the processing nodes 0212, and the fault-tolerant computer system 0201 becomes in an abnormal state, and the test and debugging may not be performed correctly. is there. On the other hand, if the method according to the present invention is used, the user only has to open the file once and update the contents. Are guaranteed to match. Furthermore, updating of node-specific information such as an IP address is restricted so that all processing nodes 0212 do not have the same content. Therefore, even if the user updates the file, the application program does not operate differently between the processing nodes 0212 as described above.
 またアプリケーション等のログを参照し障害解析等を行う場合、従来技術による方法では、1つの処理ノード0212ずつアクセスして、該当するログファイルを開いて参照する必要があった。またユーザ自身により処理ノード0212間でログファイルに記載された同一処理に対するログ情報を比較参照し、差異を発見する必要があった。このためログの量が増大すると、ユーザの負荷も増大することとなる。これに対して本発明による方法では、ユーザは該当ファイルを1度開くのみで、自動的に処理ノード0212間で差異の有る箇所が表示されるため、発生した障害の原因箇所の特定が容易となる。 Also, when performing failure analysis or the like by referring to a log of an application or the like, in the conventional method, it is necessary to access each processing node 0212 and open and refer to the corresponding log file. Further, it is necessary to compare and refer to log information for the same processing described in the log file between the processing nodes 0212 by the user himself and find a difference. For this reason, when the amount of logs increases, the load on the user also increases. On the other hand, in the method according to the present invention, the user only needs to open the corresponding file once, and the location having a difference between the processing nodes 0212 is automatically displayed. Become.
 その他、例えばフォールトトレラントコンピュータシステム0201に対して、遠隔操作により外部システム等から定義情報、参照データ等が転送され、各処理ノード0212に対して格納される場合、人為的ミス、ネットワーク障害、待機中等によりデータ格納に失敗する処理ノード0212が発生する可能性があるため、本発明による方法を活用して該当データを参照し、正しく各処理ノード0212に前記定義情報、参照データ等が格納されているか確認することは、作業負荷も低く、有効である。 In addition, for example, when definition information, reference data, etc. are transferred from an external system or the like by remote operation to the fault tolerant computer system 0201 and stored in each processing node 0212, human error, network failure, waiting, etc. May cause processing nodes 0212 that fail to store data, refer to the corresponding data using the method of the present invention, and whether the definition information, reference data, etc. are correctly stored in each processing node 0212 Confirmation is effective because the workload is low.
 以上、本発明の実施の形態について、その実施の形態に基づき具体的に説明したが、これに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
As mentioned above, although embodiment of this invention was described concretely based on the embodiment, it is not limited to this and can be variously changed in the range which does not deviate from the summary.
0101 データ
0111 ユーザ端末の画面
0201 フォールトトレラントコンピュータシステム
0202 ユーザ端末
0211 保守ノード
0212 処理ノード
0101 Data 0111 User terminal screen 0201 Fault tolerant computer system 0202 User terminal 0211 Maintenance node 0212 Processing node

Claims (10)

  1.  ネットワークを介して接続された複数の処理ノードと前記複数の処理ノードにおけるデータを取得、編集、更新する保守ノードとを備えるフォールトトレラントコンピュータシステムにおける方法であって、前記複数の処理ノードが同一のデータを用いて同一の処理を並列して実行するステップと、ユーザが前記複数の処理ノードが有する同一のデータの参照または編集を行う場合、前記保守ノードが、複数の処理ノードにおける同一データを各処理ノードからネットワークを介して取得し保存するステップと、前記保守ノードが、前記複数の処理ノードから取得した同一データの内容を比較し、比較結果に基づきユーザに対してユーザ端末を介して内容表示を行うステップと、事前に定義されている代表となる処理ノードもしくは稼働中の処理ノードの中で事前に指定された条件に合致する1つの処理ノードからの取得したデータを対象としてユーザ端末を介して保守ノード上でユーザが編集を行うステップと、前記保守ノードは前記編集後のデータを前記複数の処理ノードに転送し、上書き更新するステップと、を有することを特徴とする方法。 A method in a fault tolerant computer system comprising a plurality of processing nodes connected via a network and a maintenance node for acquiring, editing, and updating data in the plurality of processing nodes, wherein the plurality of processing nodes have the same data When the user performs the same process in parallel using the same and the user refers to or edits the same data of the plurality of processing nodes, the maintenance node processes the same data in the plurality of processing nodes. The step of acquiring and storing from the node via the network, and the maintenance node comparing the content of the same data acquired from the plurality of processing nodes, and displaying the content to the user via the user terminal based on the comparison result Steps to perform and pre-defined representative processing nodes or running A step in which a user edits on a maintenance node via a user terminal for data acquired from one processing node that matches a condition specified in advance in the processing node; Transferring the data to the plurality of processing nodes and overwriting and updating the data.
  2.  請求項1記載の方法であって、前記フォールトトレラントコンピュータシステムは、ネットワークを介して外部装置からの処理要求を受信し、または、ネットワークを介して前記外部装置へ前記処理要求に対する処理内容を送信するゲートウェイ装置を備え、前記ゲートウェイ装置は、ネットワークを介して前記外部装置から受信した処理要求を受信し、
    前記処理要求を前記複数の処理ノードへ送信し、前記複数の処理ノードは、前記処理要求に対する処理をそれぞれ並列して実行し、前記実行した処理内容を前記ゲートウェイ装置へそれぞれ送信し、前記ゲートウェイ装置は、前記複数の処理ノードから受信した各処理ノードで実行された処理内容を照合し、正常とみなした処理内容を前記外部装置へネットワークを介して送信することを特徴とする方法。
    The method according to claim 1, wherein the fault tolerant computer system receives a processing request from an external device via a network, or transmits a processing content for the processing request to the external device via a network. A gateway device, the gateway device receives a processing request received from the external device via a network;
    The processing request is transmitted to the plurality of processing nodes, the plurality of processing nodes respectively execute processing for the processing request in parallel, and the executed processing content is transmitted to the gateway device, respectively, and the gateway device Is a method of collating processing contents executed at each processing node received from the plurality of processing nodes, and transmitting the processing contents regarded as normal to the external apparatus via the network.
  3.  請求項1記載の方法であって、前記保守ノードは、前記複数の処理ノードが保有するデータ毎に関して、データの属性情報、アクセス権限、他の処理ノードでの保有の有無、処理ノード間でのデータ内容一致の要否、等を定義したプロファイル情報を保持することを特徴とする方法。 The method according to claim 1, wherein the maintenance node has, for each piece of data held by the plurality of processing nodes, data attribute information, access authority, presence / absence of holding at other processing nodes, between processing nodes. A method of holding profile information that defines whether or not data content match is necessary.
  4.  請求項1または3記載の方法であって、前記保守ノードは、前記複数の処理ノードから取得した同一データの内容を比較し、ユーザに対してユーザ端末を介して内容表示を行う際に、比較の結果、前記複数の処理ノード全てのデータの内容が一致する場合、代表となる1つの処理ノードのデータのみを内容表示する、当該データのプロファイル情報を参照し、内容一致しないデータであればユーザに対して警告する、また比較の結果、少なくとも1つの処理ノードのデータの内容に差異がある場合、差異の有る部分の内容を並べて表示する、当該データのプロファイルを参照し、内容一致が必要なデータであればユーザに対して警告することを特徴とする方法。 The method according to claim 1 or 3, wherein the maintenance node compares contents of the same data acquired from the plurality of processing nodes, and compares the contents when the contents are displayed to the user via the user terminal. As a result, when the data contents of all of the plurality of processing nodes match, only the data of one representative processing node is displayed, the profile information of the data is referred to, and if the data does not match, the user If there is a difference in the data contents of at least one processing node as a result of the comparison, the contents of the difference parts are displayed side by side. A method of warning the user if it is data.
  5.  請求項1または3記載の方法であって、前記保守ノードが前記複数の処理ノードから取得し保存する同一データに対して、ユーザがユーザ端末を介して編集する際に、前記内容比較結果に基づき、前記複数の処理ノード全てのデータの内容が一致する場合、代表となる1つの処理ノードから取得し保存したデータに対して編集処理を実施させる、また少なくとも1つの処理ノードのデータの内容に差異がある場合、どの処理ノードから取得し保存したデータに対して編集するかを選択させることを特徴とする方法。 The method according to claim 1 or 3, wherein when the user edits the same data acquired and stored from the plurality of processing nodes via the user terminal by the maintenance node based on the content comparison result. When the data contents of all of the plurality of processing nodes match, the editing process is performed on the data acquired and stored from one representative processing node, and the data contents of at least one processing node are different. If there is, a method of selecting from which processing node to edit the data acquired and saved.
  6.  請求項1または3記載の方法であって、前記保守ノードがユーザによる編集後のデータを前記複数の処理ノードに転送し、上書き更新する際に、当該データのプロファイル情報を参照し、前記複数の処理ノード全てに対してデータの転送及び上書き更新を実施するか、該当する1つの処理ノードに対してのみデータの転送及び上書き更新を実施するかを判定することを特徴とする方法。 The method according to claim 1 or 3, wherein when the maintenance node transfers data edited by a user to the plurality of processing nodes and overwrites and updates it, the profile information of the data is referred to, A method comprising determining whether to perform data transfer and overwrite update for all processing nodes, or to perform data transfer and overwrite update for only one corresponding processing node.
  7.  請求項1または3記載の方法であって、前記保守ノードがユーザによる編集後のデータを前記複数の処理ノードに転送し、上書き更新する際に、ユーザの選択により、前記複数の処理ノード全てに対してデータの転送及び上書き更新を実施するか、該当する1つの処理ノードに対してのみデータの転送及び上書き更新を実施するかを判定することを特徴とする方法。 4. The method according to claim 1 or 3, wherein when the maintenance node transfers the data edited by the user to the plurality of processing nodes and overwrites and updates the data, all of the plurality of processing nodes are selected by the user. A method, comprising: determining whether to perform data transfer and overwrite update for a corresponding processing node or to perform data transfer and overwrite update for only one corresponding processing node.
  8.  請求項1または6または7記載の方法であって、前記保守ノードが前記複数の処理ノード全てに対してデータの転送及び上書き更新を実施する際に、前記複数の処理ノード全ての更新前のデータの内容を記録しておき、少なくとも1つの処理ノードに対するデータの転送及び上書き更新に失敗した場合、前記複数の処理ノード全ての当該データを更新前の内容に戻すことを特徴とする方法。 8. The method according to claim 1, wherein when the maintenance node performs data transfer and overwrite update for all of the plurality of processing nodes, the data before all of the plurality of processing nodes is updated. Is recorded, and when data transfer to at least one processing node and overwriting update fails, the data of all of the plurality of processing nodes is returned to the content before update.
  9.  請求項1または5記載の方法であって、ユーザがユーザ端末を介して前記保守ノード上でデータを編集している際に、前記処理ノード上のプログラムによる当該データの更新の有無、他のユーザによる当該データの更新の有無を監視し、更新を検出した場合、ユーザに対して通知し、ユーザの選択により当該データの内容を前記更新後の内容に差し替えるか否かを決定することを特徴とする方法。 6. The method according to claim 1 or 5, wherein when a user edits data on the maintenance node via a user terminal, whether the data is updated by a program on the processing node, other users The presence or absence of the update of the data is monitored, and when the update is detected, the user is notified, and whether or not the content of the data is replaced with the updated content is determined by the user's selection how to.
  10.  ネットワークを介して接続された同一のデータを用いて同一の処理を並列して実行する複数の処理ノードと前記複数の処理ノードにおけるデータを取得、編集、更新する保守ノードとを備えるフォールトトレラントコンピュータシステムであって、
    前記保守ノードは、
    ネットワークを介して各処理ノードから取得した同一データを保存する記憶装置と、
    前記複数の処理ノードから取得した同一データの内容を比較し、ユーザ端末に比較結果の表示をさせるとともに、事前に定義されている代表となる処理ノードもしくは稼働中の処理ノードの中で事前に指定された条件に合致する1つの処理ノードからの取得したデータをユーザ端末に表示させ、ユーザによる編集結果を前記記憶装置に保存し、前記編集後のデータを前記複数の処理ノードに転送する処理装置と、
    を備えることを特徴とするフォールトトレラントコンピュータシステム。
    A fault tolerant computer system comprising a plurality of processing nodes that execute the same processing in parallel using the same data connected via a network, and a maintenance node that acquires, edits, and updates data in the plurality of processing nodes Because
    The maintenance node is
    A storage device for storing the same data acquired from each processing node via a network;
    Compares the contents of the same data acquired from the multiple processing nodes, displays the comparison result on the user terminal, and specifies in advance among the processing nodes that are defined in advance or are in operation A processing device for displaying acquired data from one processing node that matches a specified condition on a user terminal, storing an editing result by a user in the storage device, and transferring the edited data to the plurality of processing nodes When,
    A fault tolerant computer system comprising:
PCT/JP2011/058576 2010-05-06 2011-04-05 Fault tolerant computer system and data access method WO2011138886A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010106089A JP5331749B2 (en) 2010-05-06 2010-05-06 Fault tolerant computer system and data access method
JP2010-106089 2010-05-06

Publications (1)

Publication Number Publication Date
WO2011138886A1 true WO2011138886A1 (en) 2011-11-10

Family

ID=44903738

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/058576 WO2011138886A1 (en) 2010-05-06 2011-04-05 Fault tolerant computer system and data access method

Country Status (2)

Country Link
JP (1) JP5331749B2 (en)
WO (1) WO2011138886A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314744A (en) * 1995-05-18 1996-11-29 Hitachi Ltd Fault tolerant system
JPH09231155A (en) * 1996-02-27 1997-09-05 Nippon Denki Joho Service Kk Device and method for supporting remote editor

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02240730A (en) * 1989-03-14 1990-09-25 Nec Corp Information processing system
JP4070398B2 (en) * 2000-10-25 2008-04-02 中部電力株式会社 How to use data between multiple computers
JP4186456B2 (en) * 2001-11-28 2008-11-26 沖電気工業株式会社 Distributed file sharing system and control method thereof

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08314744A (en) * 1995-05-18 1996-11-29 Hitachi Ltd Fault tolerant system
JPH09231155A (en) * 1996-02-27 1997-09-05 Nippon Denki Joho Service Kk Device and method for supporting remote editor

Also Published As

Publication number Publication date
JP2011237846A (en) 2011-11-24
JP5331749B2 (en) 2013-10-30

Similar Documents

Publication Publication Date Title
US9304815B1 (en) Dynamic replica failure detection and healing
US8069144B2 (en) System and methods for asynchronous synchronization
US7155462B1 (en) Method and apparatus enabling migration of clients to a specific version of a server-hosted application, where multiple software versions of the server-hosted application are installed on a network
JP5360978B2 (en) File server and file operation notification method in file server
JP4473153B2 (en) Method, system and program for network configuration checking and repair
US7716319B2 (en) Computer system and method for managing log information
US20150263909A1 (en) System and method for monitoring a large number of information processing devices in a communication network
JP5698429B2 (en) Computer system, method and computer program for managing components
US20140379656A1 (en) System and Method for Maintaining a Cluster Setup
US20150081773A1 (en) High availability architecture for a cloud-based concurrent-access collaboration platform
US20080263082A1 (en) Recovery segment identification in a computing infrastructure
US20070088763A1 (en) Methods and systems for validating accessibility and currency of replicated data
JP2004227359A (en) Operation management method for storage system based on policy
US6820136B1 (en) System and method for replicating monitored registry keys
CN112491606A (en) Method for automatically deploying high-availability cluster of service system based on infrastructure
US7093163B2 (en) Processing takeover method in multiple computer system
JP2015506112A (en) Redirecting requests to a second location during a temporary failure
CN112035062B (en) Migration method of local storage of cloud computing, computer equipment and storage medium
JP5239072B2 (en) Computer system, method and computer program for managing components
CN109445988A (en) Isomery disaster recovery method, device, system, server and disaster recovery platform
JP5331749B2 (en) Fault tolerant computer system and data access method
JP2020119207A (en) Database management service provision system
CN114760314A (en) Server management method, device, computer equipment and storage medium
US7644306B2 (en) Method and system for synchronous operation of an application by a purality of processing units
EP2126701A1 (en) Data management in a data storage system using data sets

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11777405

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11777405

Country of ref document: EP

Kind code of ref document: A1