WO2017094162A1 - 多重系システム - Google Patents
多重系システム Download PDFInfo
- Publication number
- WO2017094162A1 WO2017094162A1 PCT/JP2015/083994 JP2015083994W WO2017094162A1 WO 2017094162 A1 WO2017094162 A1 WO 2017094162A1 JP 2015083994 W JP2015083994 W JP 2015083994W WO 2017094162 A1 WO2017094162 A1 WO 2017094162A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- input
- timing
- unit
- data
- calculation
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/18—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
- G06F11/183—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components
- G06F11/184—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits by voting, the voting not being performed by the redundant components where the redundant components implement processing functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1675—Temporal synchronisation or re-synchronisation of redundant processing components
- G06F11/1679—Temporal synchronisation or re-synchronisation of redundant processing components at clock signal level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1658—Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/1675—Temporal synchronisation or re-synchronisation of redundant processing components
- G06F11/1683—Temporal synchronisation or re-synchronisation of redundant processing components at instruction level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/18—Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/52—Program synchronisation; Mutual exclusion, e.g. by means of semaphores
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/25—Routing or path finding in a switch fabric
- H04L49/253—Routing or path finding in a switch fabric using establishment or release of connections between ports
- H04L49/255—Control mechanisms for ATM switching fabrics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/30—Peripheral units, e.g. input or output ports
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/30—Peripheral units, e.g. input or output ports
- H04L49/3081—ATM peripheral units, e.g. policing, insertion or extraction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/50—Overload detection or protection within a single switching element
Definitions
- the present invention relates to a multiplex system having a plurality of processing systems.
- fault tolerant design is performed in which processing systems are multiplexed and operation continues in another processing system even if a failure occurs in one of the processing systems.
- the processing systems perform the calculation at the same timing, if the timing at which data is input to each processing system is shifted, the calculation results of the respective processing systems do not match. Specifically, the first data is input to the first processing system before the calculation timing, but the first data is input to the second processing system after the calculation timing.
- the first processing system performs the calculation using the first data at the first timing, while the second processing system performs the calculation without using the first data at the first timing. For this reason, the calculation result of the first processing system and the calculation result of the second processing system do not match each other. In such a processing system, it is necessary to match the timing at which data is input to each processing system.
- the calculation executed at the timing at which data is input in each processing system Different. Specifically, the first processing system starts the second calculation after the second data is input, but the second processing system starts the first calculation after the second data is input. This is the case. In this case, the first processing system performs the second calculation using the second data, while the second processing system performs the first calculation using the second data. For this reason, the calculation result after the second data is input to the first processing system and the second processing system is different between the first processing system and the second processing system. In such a processing system, it is necessary to match the timing at which computation is started in each processing system.
- a clock signal output from a single crystal oscillator is used as a clock source for each processing system.
- Each processing system operates in accordance with a clock signal output from a single crystal oscillator.
- the failure rate of a crystal oscillator is higher than that of other ICs (Integrated Circuits). For this reason, the reliability of the system is lowered, and the merit of enabling continuous operation by multiplexing the processing systems is impaired.
- the clock signal synchronized by the synchronization IC is used as a clock source for each processing system.
- the synchronization IC synchronizes clock signals output from a plurality of crystal oscillators.
- Each processing system operates in accordance with the clock signal synchronized by the synchronization IC.
- the system since the system has a plurality of crystal oscillators, the entire system does not stop even if a single crystal oscillator fails. Therefore, the reliability of the system can be maintained.
- the synchronization IC is very expensive, this method cannot be applied to an embedded system in which cost is important.
- Patent Document 1 and Patent Document 2 as prior art documents disclosing methods for solving such problems.
- the difference in the number of clock cycles of each processing system having a different clock source is counted. Then, in consideration of the difference in the number of clock cycles of each processing system, data input to each processing system and comparison of calculation results of each processing system are performed. For example, when the operation of the second processing system is 10 clocks slower than the operation of the first processing system, the same data is input to the second processing system 10 clocks after the data is input to the first processing system. To be adjusted. The calculation result of the first processing system is compared with the calculation result of the second processing system after 10 clocks. Thereby, even when each processing system is operating asynchronously, each processing system can perform the same operation using the same data. Furthermore, it becomes possible to compare the results of the same calculation of each processing system.
- ⁇ 100 PPM Parts Per Million
- a deviation within ⁇ 100 PPM occurs in the accuracy of a crystal oscillator that is generally used. That is, when a 100 MHz (megahertz) crystal oscillator is used, a variation occurs in a range of ⁇ 1 picosecond with respect to 10 nanoseconds which is one clock time. Therefore, when one clock of the first processing system is 10 nanoseconds + 1 picosecond and one clock of the second processing system is 10 nanoseconds-1 picosecond, the first processing system and the second processing system In this processing system, a time difference of 1 microsecond occurs in a time of 1 million clocks. One million clocks is one second at 100 MHz.
- a time difference of 3.6 milliseconds occurs in the time of 3.6 billion clocks in the first processing system and the second processing system.
- 3.6 billion clocks is one hour at 100 MHz. That is, the longer the operating time of each processing system, the wider the time difference between the processing systems.
- the calculation results of the processing system with the earlier processing must be held until the calculation results of the processing system with the slower processing are obtained. Furthermore, as the operation time of each processing system becomes longer, the amount of operation results that must be held increases, so that there is no space in the buffer. And it becomes impossible to compare the calculation results of the respective processing systems. That is, when the time difference between the processing systems is widened, the method disclosed in Patent Document 1 makes it difficult to compare the results of the same computations of the processing systems.
- An object of the present invention is to allow the operations of a plurality of processing systems to be synchronized even when the timing at which data is input to the plurality of processing systems is not synchronized in a multiplex system.
- the multiplex system of the present invention includes a plurality of input units into which data is input.
- Each of the plurality of input units outputs an input notification at an input timing at which the data is input, and is a later timing of the input timing and a timing at which an input notification is output from another input unit The data is output at the timing.
- the data is output from each of the plurality of input units in synchronization. Therefore, even when the timing at which data is input to each of the plurality of processing systems is not synchronized, the operations of the plurality of processing systems can be synchronized.
- FIG. 1 is a configuration diagram of a multiplex system 100 according to Embodiment 1.
- FIG. 2 is a functional configuration diagram of an input unit 110 according to Embodiment 1.
- FIG. 3 is a configuration diagram of an arithmetic circuit 220 in the first embodiment.
- 2 is a functional configuration diagram of an output unit 130 according to Embodiment 1.
- FIG. 4 is a flowchart of a multiplexing method according to the first embodiment.
- 5 is a flowchart of input processing (S110) in the first embodiment.
- 5 is a flowchart of output processing (S130) in the first embodiment.
- FIG. 6 is a functional configuration diagram of an input unit 110 in the second embodiment.
- FIG. 10 is a flowchart of input processing (S110) in the second embodiment.
- FIG. 5 is a configuration diagram of a multiplex system 100 in a third embodiment.
- FIG. 10 is a functional configuration diagram of a specifying unit 140 according to Embodiment 3.
- 10 is a flowchart of a multiplexing method according to the third embodiment.
- 10 is a flowchart of specific processing (S140) in the third embodiment.
- Embodiment 1 FIG. A multiplex system 100 having a plurality of processing systems will be described with reference to FIGS.
- the multiplex system 100 includes a plurality of integrated circuits 210, a plurality of arithmetic circuits 220, and a single integrated circuit 230.
- the integrated circuit 210 and the integrated circuit 230 are an LSI (Large Scale). It is a circuit called Integration.
- the arithmetic circuit 220 is a circuit having a processor.
- the plurality of integrated circuits 210, the plurality of arithmetic circuits 220, and the one integrated circuit 230 are connected via signal lines. Specifically, the plurality of integrated circuits 210 are connected to each other, and the plurality of arithmetic circuits 220 are connected to the integrated circuit 230. The nth integrated circuit 210 is connected to the nth arithmetic circuit 220.
- the integrated circuit 210 functions as the input unit 110
- the arithmetic circuit 220 functions as the arithmetic unit 120
- the integrated circuit 230 functions as the output unit 130. That is, the multiplex system 100 includes “units” such as a plurality of input units 110, a plurality of arithmetic units 120, and one output unit 130 as functional components.
- the function of “unit” is realized by hardware called a circuit. The function of “part” will be described later.
- the input unit 110 and the calculation unit 120 are associated with each other on a one-to-one basis, and the set of the input unit 110 and the calculation unit 120 constitutes a processing system. That is, the n-th input unit 110 and the n-th arithmetic unit 120 are associated with each other on a one-to-one basis, and the set of the n-th input unit 110 and the n-th arithmetic unit 120 constitutes the n-th processing system. To do.
- the nth input unit 110 is the input unit 110 included in the nth integrated circuit 210
- the nth arithmetic unit 120 is the arithmetic unit 120 included in the nth arithmetic circuit 220.
- the input unit 110 includes a storage unit 111, a notification unit 112, a detection unit 113, and a synchronization unit 114 as functional components. The functions of these units will be described later.
- the arithmetic circuit 220 includes a processor 221, a memory 222, and an oscillator 223.
- the processor 221 is connected to the memory 222 and the oscillator 223 via a signal line.
- the processor 221 is an integrated circuit that performs processing.
- the processor 901 is a CPU (Central Processing Unit).
- the memory 222 is a nonvolatile storage device.
- the memory 222 is a ROM (Read Only Memory).
- the oscillator 223 is a circuit that generates a clock signal.
- the oscillator 223 is a crystal oscillator.
- the oscillator 223 is a clock source for the processor 221.
- the processor 221 operates using the clock frequency of the oscillator 223 as the operating frequency. However, the processor 221 may operate by multiplying the clock frequency of the oscillator 223 and using the multiplied clock frequency as an operating frequency.
- the memory 222 stores a calculation program. A plurality of operations and the order of operations are defined in the operation program.
- the processor 221 operates in accordance with the clock signal generated by the oscillator 223 and executes the arithmetic program stored in the memory 222.
- the processor 221 functions as the calculation unit 120.
- the output unit 130 includes a majority decision unit 131, a detection unit 132, a reset unit 133, and a timer unit 134 as functional components. The functions of these units will be described later.
- the operation of the multiplex system 100 corresponds to a multiplexing method.
- step S101 when data is input to each of the plurality of input units 110, the process proceeds to step S110.
- Data input to each input unit 110 is referred to as input data 101.
- the same input data 101 is input to each input unit 110.
- the timing at which the input data 101 is input to each input unit 110 may be shifted. That is, the input data 101 may be input to each input unit 110 without being synchronized in timing input to each input unit 110.
- Step S110 is an input process.
- Each of the plurality of input units 110 outputs the input notification 104 at the input timing when the input data 101 is input, and outputs the input data 101 at the synchronization timing.
- the synchronization timing is the later of the input timing and the timing when the input notification 104 is output from the other input unit 110.
- each input unit 110 outputs the input notification 104 and the input data 101 as follows.
- the input data 101 is input to the storage unit 111, and the storage unit 111 inputs the input data 101.
- the notification unit 112 detects the timing at which the input data 101 is stored in the storage unit 111 as the input timing, and outputs the input notification 104.
- the detection unit 113 detects the later timing of the input timing and the timing when the input notification 104 is output from the other input unit 110 as the synchronization timing.
- the synchronization unit 114 reads the input data 101 from the storage unit 111 and outputs the input data 101 when the synchronization timing is detected.
- step S ⁇ b> 111 the input data 101 is input to the storage unit 111.
- the storage unit 111 stores input data 101.
- step S112 the storage unit 111 outputs a storage notification 191.
- the storage notification 191 is a signal for notifying that the input data 101 has been stored in the storage unit 111.
- the output storage notification 191 is input to the notification unit 112 and the detection unit 113.
- step S113 the notification unit 112 outputs the input notification 104.
- the input notification 104 is a signal for notifying that the input data 101 has been input to the input unit 110.
- the output notification 104 that has been output is input to another input unit 110.
- step S114 the detection unit 113 detects the synchronization timing.
- the synchronization timing is the later of the timing at which the storage notification 191 output from the storage unit 111 is input and the timing at which the input notification 104 output from another input unit 110 is input.
- the detection unit 113 detects the synchronization timing as follows.
- the other input units 110 are the second input unit 110 and the third input unit 110.
- the detection unit 113 has first to third flags.
- the value of the first flag changes from 0 to 1.
- the value of the second flag changes from 0 to 1
- the third flag is changed.
- the value changes from 0 to 1.
- the detection unit 113 detects the timing when all the values of the first to third flags become 1 as the synchronization timing. When the synchronization timing is detected, the process proceeds to step S115.
- step S115 the detection unit 113 outputs a detection notification 192.
- the detection notification 192 is a signal for notifying that the synchronization timing has been detected.
- the output detection notification 192 is input to the synchronization unit 114.
- step S ⁇ b> 116 the synchronization unit 114 reads the input data 101 from the storage unit 111. Then, the synchronization unit 114 outputs the read input data 101. The input data 101 output from the synchronization unit 114 of the nth input unit 110 is input to the nth calculation unit 120.
- Step S120 is a calculation process.
- the plurality of calculation units 120 start calculation when input data 101 output from the plurality of input units 110 is input. That is, the nth computing unit 120 starts computation when the input data 101 output from the nth input unit 110 is input.
- Each of the plurality of calculation units 120 outputs the calculation result 102.
- the calculation unit 120 notified of the error from the output unit 130 does not perform calculation and does not output the calculation result 102. This is because the processing system having the calculation unit 120 notified of the error is considered to be out of order.
- step S121 the calculation unit 120 determines whether calculation is necessary.
- the calculation unit 120 determines whether or not calculation is necessary as follows.
- the memory 222 stores calculation flags.
- the value of the calculation flag is changed from 0 to 1 when an error is notified. When the value of the calculation flag is 0, the calculation unit 120 determines that calculation is necessary. When the value of the calculation flag is 1, the calculation unit 120 determines that no calculation is necessary. If it is determined that an operation is necessary, the process proceeds to step S122.
- step S122 the operation unit 120 performs an operation using the input data 101 that has been input.
- the processor 221 that functions as the calculation unit 120 executes the calculation program stored in the memory 222.
- the process proceeds to step S123.
- step S123 the calculation unit 120 outputs the calculation result 102.
- the calculation result 102 is data indicating a result obtained by the calculation.
- the output calculation result 102 is input to the output unit 130.
- Step S130 is an output process.
- the output unit 130 selects the calculation result 102 from the plurality of calculation results 102 obtained by the plurality of calculation units 120, and outputs data having the same contents as the selected calculation result 102.
- Data output from the output unit 130 is referred to as output data 103.
- the output unit 130 notifies the error to the calculation unit 120 from which the calculation result 102 that has not been selected is obtained.
- step S131 the majority decision unit 131 detects a comparison timing for comparing the calculation results 102.
- the comparison timing is the earlier of the timing at which the calculation results 102 output from the plurality of calculation units 120 are input and the timing at which the calculation results 102 should be compared.
- the timing at which the calculation result 102 should be compared is the timing at which the timeout notification 195 output from the timer unit 134 is input.
- the majority decision unit 131 detects the comparison timing as follows.
- the plurality of calculation units 120 are first to third calculation units 120.
- the calculation results 102 output from the first to third calculation units 120 are input to the majority decision unit 131, the timer unit 134, and the detection unit 132.
- the majority decision unit 131 has first to third flags.
- the value of the nth flag changes from 0 to 1 when the calculation result 102 output from the nth calculation unit 120 is input.
- the timer unit 134 starts time measurement when the first calculation result 102 of the calculation results 102 output from the first to third calculation units 120 is input, and the first calculation result 102 is displayed. Measures the elapsed time since input.
- the timer unit 134 When the elapsed time reaches the hold time, the timer unit 134 outputs a timeout notification 195.
- the timeout notification 195 is a signal for notifying that the elapsed time has reached the holding time.
- the output timeout notification 195 is input to the majority decision unit 131.
- the holding time is a predetermined time. Specifically, the hold time is 1 millisecond.
- the majority decision unit 131 detects the earlier timing of the timing at which all the values of the first to third flags are 1 and the timing at which the timeout notification 195 is input as the comparison timing. When the comparison timing is detected, the process proceeds to step S132.
- step S ⁇ b> 132 the majority voting unit 131 takes the majority of the input calculation results 102 and selects the majority calculation result 102.
- the majority calculation result 102 means the calculation result 102 selected by the majority vote. That is, the first to third calculation results 102 are input, the first calculation result 102 and the second calculation result 102 are the first value, and the third calculation result 102 is the second value. In this case, the majority decision unit 131 selects the first calculation result 102 and the second calculation result 102.
- step S ⁇ b> 133 the majority decision unit 131 outputs data having the same content as the selected calculation result 102 as the output data 103.
- the output data 103 is output outside the multiplex system 100.
- the output data 103 is input to the detection unit 132 and the reset unit 133.
- the reset unit 133 outputs a reset notification 196 when the output data 103 is input.
- the reset notification 196 is a signal for resetting the measurement of elapsed time.
- the output reset notification 196 is input to the timer unit 134.
- the timer unit 134 stops measuring the elapsed time and returns the measured time to zero.
- step S134 the detection unit 132 compares the input calculation result 102 with the input output data 103.
- step S135 the detection unit 132 determines whether the input calculation result 102 matches the input output data 103. If at least one of the calculation results 102 does not match the output data 103, the process proceeds to step S136.
- the detection unit 132 In step S136, the detection unit 132 generates the error notification 105. Specifically, the detection unit 132 identifies the calculation unit 120 that is the input source of the calculation result 102 that does not match the output data 103, and generates an error notification 105 that includes an identifier that identifies the specified calculation unit 120.
- the error notification 105 is data for notifying the arithmetic unit 120 from which the minority calculation result 102 is obtained.
- the minority calculation result 102 means a calculation result 102 that is not selected by majority vote.
- the detection unit 132 outputs the generated error notification 105.
- the output error notification 105 is input to each of the plurality of arithmetic units 120.
- the calculation unit 120 identified by the identifier included in the error notification 105 does not perform the next calculation. In other words, the calculation unit 120 that has been notified of the error does not perform the subsequent calculation. This is because the processing system having the calculation unit 120 notified of the error is considered to be out of order.
- the multiplex system 100 can synchronize the operation of each of the plurality of processing systems even when the timing at which data is input to each of the plurality of processing systems is not synchronized.
- the plurality of input units 110 output the input data 101 at the synchronization timing. Therefore, the input data 101 is input to the plurality of arithmetic units 120 at the same timing.
- the plurality of calculation units 120 start calculation at the timing when the input data 101 is input. That is, the timing at which the input data 101 is input is the timing at which the execution of calculations in the calculation program is started. Therefore, the same input data 101 is input to the plurality of calculation units 120 at the timing when the same calculation is executed even if there is a difference in the operating frequencies of the plurality of calculation units 120. Therefore, the plurality of calculation units 120 can execute the same calculation using the same input data 101.
- the plurality of calculation units 120 can output the same calculation result 102.
- the arithmetic program is activated when the internal timer of the processor 221 reaches a predetermined value. For example, the predetermined value is 0.
- the arithmetic programs in the plurality of processors 221 are started at substantially the same time. Even if the timing at which the arithmetic program starts is slightly shifted because the operating frequency is different between the processors 221, the arithmetic program starts when the input data 101 is input. Therefore, as long as no trouble such as a failure occurs in any of the processing systems, the plurality of calculation units 120 can execute the same calculation using the same input data 101. The plurality of calculation units 120 can output the same calculation result 102.
- the timing deviation at which the calculation is started does not increase.
- the accuracy deviation of the oscillator 223 is within ⁇ 100 PPM
- the operating frequency of the processor 221 is 100 MHz
- the timing of the completion of the calculation is several hundred microseconds. To a certain extent. This is because the calculation is started when the input data 101 arrives. Since the difference in timing for completing the calculation is small, the amount of the calculation result 102 of each calculation unit 120 held by the output unit 130 can be small. That is, it is possible to obtain an effect that the storage area is small without being caught by the time-out.
- the number of processing systems that the multi-system 100 has is not three, but may be two or four or more.
- FIG. A form in consideration of a failure in which the input data 101 is not input to any of the input units 110 will be described with reference to FIGS. 9 and 10. However, the description which overlaps with Embodiment 1 is abbreviate
- the input unit 110 includes a reset unit 115 and a timer unit 116 as elements of a functional configuration in addition to the storage unit 111, the notification unit 112, the detection unit 113, and the synchronization unit 114.
- the functions of storage unit 111, notification unit 112, detection unit 113, and synchronization unit 114 are the same as those in the first embodiment.
- the functions of the reset unit 115 and the timer unit 116 will be described later.
- each of the plurality of input units 110 outputs the input data 101 at the limit timing when the synchronization timing is not reached before the limit timing.
- the restriction timing is a timing at which the input data 101 should be input.
- the input process (S110) will be described based on FIG.
- the input process (S110) includes steps S111 to S113 and steps S115 to S117. Steps S111 to S113, step S115, and step S116 are basically the same as those in the first embodiment.
- step S111 the storage unit 111 stores the input data 101.
- step S112 the storage unit 111 outputs a storage notification 191.
- step S113 the notification unit 112 outputs the input notification 104. After step S113, the process proceeds to step S117.
- step S117 the detection unit 113 detects the preceding timing.
- the preceding timing is the earlier of the synchronization timing and the limit timing.
- the synchronization timing is the timing at which the storage notification 191 output from the storage unit 111 is input and the timing at which the input notification 104 output from the other input unit 110 is input. This is the later timing.
- the method for detecting the synchronization timing is as described in step S114 in the first embodiment.
- the specific restriction timing is a timing at which the time elapsed since the input data 101 input last time is output reaches the allowable time.
- the allowable time is a predetermined time.
- the detection unit 113 detects the limit timing as follows.
- the input data 101 output last time from the synchronization unit 114 is input to the reset unit 115 in addition to the calculation unit 120.
- the reset unit 115 outputs a reset notification 193.
- the reset notification 193 is a signal for resetting the time measurement.
- the output reset notification 193 is input to the timer unit 116.
- the timer unit 116 starts measuring time, and measures the elapsed time that has elapsed since the reset notification 193 was input.
- the timer unit 116 outputs a timeout notification 194.
- the timeout notification 194 is a signal for notifying that the elapsed time has reached the allowable time.
- the output timeout notification 194 is input to the detection unit 113.
- the allowable time is a predetermined time. Specifically, the allowable time is 10 milliseconds.
- the detection unit 113 detects the timing at which the timeout notification 194 is input as the limit timing.
- step S115 When the limit timing or the synchronization timing is detected as the preceding timing, the process proceeds to step S115.
- step S115 the detection unit 113 outputs a detection notification 192, and the output detection notification 192 is input to the synchronization unit 114.
- step S ⁇ b> 116 the synchronization unit 114 outputs the input data 101, and the output input data 101 is input to the calculation unit 120 and the reset unit 115.
- the reset unit 115 outputs a reset notification 193, and the output reset notification 193 is input to the timer unit 116.
- the timer unit 116 resets the measured time to zero and starts measuring time.
- Embodiment 3 A form in which a plurality of calculation results 102 are output to the outside will be described with reference to FIGS. However, the description which overlaps with Embodiment 1 and Embodiment 2 is abbreviate
- the configuration of the multiplex system 100 includes a plurality of integrated circuits 210, a plurality of arithmetic circuits 220, and one integrated circuit 240.
- the integrated circuit 210 and the arithmetic circuit 220 function as the input unit 110 and the arithmetic unit 120 as described in the first embodiment.
- the integrated circuit 240 functions as the specifying unit 140. That is, the multiplex system 100 includes the specifying unit 140 as an element of the functional configuration. The function of the specifying unit 140 will be described later.
- the functional configuration of the specifying unit 140 is the same as the functional configuration of the output unit 130 described in the first embodiment. That is, the specifying unit 140 includes a majority decision unit 141, a detection unit 142, a reset unit 143, and a timer unit 144 as functional configuration elements.
- the multiplexing method includes step S101, step S110, step S120, and step S140.
- Step S101, step S110, and step S120 are basically the same as those in the first or second embodiment.
- the calculation result 102 is output to the outside of the multiplex system 100. Further, the calculation result 102 is input to the specifying unit 140.
- Step S140 is a specific process.
- the specifying unit 140 specifies the calculation unit 120 from which the calculation result 102 that is not selected by the majority vote among the plurality of calculation units 120 is obtained. Then, the specifying unit 140 notifies the specified calculating unit 120 of the error, and the calculating unit 120 notified of the error does not perform the next and subsequent calculations.
- the procedure of the identification process (S140) will be described.
- the specific process (S140) includes steps S141 to S146. Steps S141 to S146 correspond to steps S131 to S136 described with reference to FIG. 8 in the first embodiment.
- step S141 the majority decision unit 141 detects a comparison timing for comparing the calculation results 102.
- the method for detecting the comparison timing is as described in the first embodiment.
- step S142 the majority decision unit 141 takes the majority decision of the input calculation result 102, and selects the majority calculation result 102.
- step S143 the majority decision unit 141 outputs the selected calculation result 102.
- the calculation result 102 output from the majority decision unit 141 is referred to as a selection result 197.
- the selection result 197 is input to the detection unit 142 and the reset unit 143.
- the reset unit 143 outputs a reset notification 196, and the output reset notification 196 is input to the timer unit 134.
- the timer unit 134 stops measuring the elapsed time and returns the measured time to zero.
- step S144 the detection unit 142 compares the input calculation result 102 with the input selection result 197.
- step S145 the detection unit 142 determines whether the input calculation result 102 matches the input selection result 197. If at least one of the calculation results 102 does not match the selection result 197, the process proceeds to step S146.
- step S146 the detection unit 142 generates an error notification 105 and outputs the generated error notification 105.
- the output error notification 105 is input to each of the plurality of arithmetic units 120.
- the contents of the error notification 105 and the method for generating the error notification 105 are as described in the first embodiment.
- the calculation unit 120 identified by the identifier included in the error notification 105 does not perform the next calculation. In other words, the calculation unit 120 that has been notified of the error does not perform the subsequent calculation.
- the input data 101 is input from the outside compared to the time from when the input data 101 is input from the outside to when the output data 103 is output to the outside in the first and second embodiments. It takes a short time until the calculation result 102 is output to the outside. That is, according to the third embodiment, the response time to the outside of the multiplex system 100 can be shortened.
- 100 multiplex system 101 input data, 102 operation result, 103 output data, 104 input notification, 105 error notification, 110 input unit, 111 storage unit, 112 notification unit, 113 detection unit, 114 synchronization unit, 115 reset unit, 116 Timer section, 120 arithmetic section, 130 output section, 131 majority section, 132 detection section, 133 reset section, 134 timer section, 140 identification section, 141 majority section, 142 detection section, 143 reset section, 144 timer section, 191 storage notification , 192 detection notification, 193 reset notification, 194 timeout notification, 195 timeout notification, 196 reset notification, 197 selection result, 210 integrated circuit, 220 arithmetic circuit, 221 processor, 222 memory, 223 oscillation , 230 integrated circuits, 240 an integrated circuit.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Hardware Redundancy (AREA)
- Electric Clocks (AREA)
Abstract
Description
フォルトトレラント設計の一つとして、故障が発生した処理系を検知し、検知した処理系を分離し、残りの処理系で処理を継続する方法がある。
この方法では、各処理系に故障が発生していない場合に、各処理系の演算結果を一致させるため、各処理系に同じ入力を与える必要がある。
しかし、処理系が同じタイミングで演算を行う場合、各処理系にデータが入力されるタイミングがずれると、各処理系の演算結果が一致しない。具体的には、第1の処理系には第1のデータが演算タイミングの前に入力されたが、第2の処理系には第1のデータが演算タイミングの後に入力された場合である。この場合、第1の処理系は第1のタイミングに第1のデータを用いて演算を行うが、第2の処理系は第1のタイミングに第1のデータを用いずに演算を行う。そのため、第1の処理系の演算結果と第2の処理系の演算結果は互いに一致しない。
このような処理系のシステムでは、各処理系にデータが入力されるタイミングを合わせる必要がある。
このような処理系のシステムでは、各処理系で演算が開始されるタイミングを合わせる必要がある。
(1)単一の水晶発振器から出力されるクロック信号を各処理系のクロック源とする。そして、各処理系は単一の水晶発振器から出力されるクロック信号に合わせて動作する。
しかし、この方法の場合、水晶発振器が単一故障すると、システム全体が停止してしまう。また、一般に水晶発振器の故障率は他のIC(Integrated Circuit)に比べて高い。そのため、システムの信頼度は低下し、処理系を多重化して継続動作を可能とするメリットが損なわれる。
(2)同期化用ICによって同期化されたクロック信号を各処理系のクロック源とする。同期化用ICは複数の水晶発振器から出力されるクロック信号を同期化する。そして、各処理系は同期化用ICによって同期化されたクロック信号に合わせて動作する。
この場合、システムが複数の水晶発振器を持つため、水晶発振器が単一故障してもシステム全体が停止することはない。したがって、システムの信頼度を保つことができる。
しかし、同期化用ICは非常に高価であるため、コストを重要視する組み込みシステムでは、この方法を適用することができない。
そのため、各処理系に別々のクロック源を与えて各処理系を非同期で動かした上で、各処理系の演算開始のタイミングを合わせる必要がある。
例えば、第2の処理系の動作が第1の処理系の動作よりも10クロック遅い場合、データが第1の処理系に入力されてから10クロック後に、同じデータが第2の処理系に入力されるように調整される。また、第1の処理系の演算結果は10クロック後の第2の処理系の演算結果と比較される。
これにより、各処理系が非同期で動作している場合でも、各処理系が同じデータを用いて同じ演算を行うことが可能となる。さらに、各処理系の同じ演算の結果を比較することが可能となる。
このため、第1の処理系の1クロックが10ナノ秒+1ピコ秒であり、第2の処理系の1クロックが10ナノ秒-1ピコ秒であった場合、第1の処理系と第2の処理系とには、100万クロックの時間に1マイクロ秒の時間差が発生する。100万クロックは100MHzで1秒である。さらに、第1の処理系と第2の処理系とには、36億クロックの時間に3.6ミリ秒の時間差が発生する。36億クロックは100MHzで1時間である。つまり、各処理系の動作時間が長くなるほど、各処理系の時間差が広がる。
また、各処理系の演算結果を比較するためには、処理が早い方の処理系の演算結果を、処理が遅い方の処理系の演算結果が得られるまで、保持しなければならない。さらに、各処理系の動作時間が長くなると、保持しなければならない演算結果の量が増えるため、バッファの空きが無くなる。そして、各処理系の演算結果を比較することができなくなる。
つまり、各処理系の時間差が広がる場合、特許文献1に開示された方法では、各処理系の同じ演算の結果を比較することが困難になる。
つまり、各処理系にデータが届くタイミングが同時でない場合、特許文献2に開示された方法は使用できない。
また、周期的な演算においては、各処理系が同期化のコマンドを送受信するまで各処理系が待機状態となるような動作が適さない場合がある。その場合、特許文献2に開示された方法は使用できない。
前記複数の入力部それぞれは、前記データが入力された入力タイミングに入力通知を出力し、前記入力タイミングと他の入力部から入力通知が出力されたタイミングとのうちの遅い方のタイミングである同期タイミングに前記データを出力する。
複数の処理系を有する多重系システム100について、図1から図8に基づいて説明する。
図1に基づいて、多重系システム100の構成について説明する。
多重系システム100は、複数の集積回路210と複数の演算回路220と1つの集積回路230とを備える。
具体的には、集積回路210および集積回路230はLSI(Large Scale
Integration)と呼ばれる回路である。また、演算回路220はプロセッサを有する回路である。
具体的には、複数の集積回路210は互いに接続されて、複数の演算回路220は集積回路230に接続されている。また、第nの集積回路210は第nの演算回路220に接続されている。
つまり、多重系システム100は、複数の入力部110と複数の演算部120と1つの出力部130といった「部」を機能構成の要素として備える。そして、「部」の機能は回路というハードウェアで実現される。「部」の機能については後述する。
つまり、第nの入力部110と第nの演算部120とが1対1に対応付けられて、第nの入力部110と第nの演算部120との組が第nの処理系を構成する。第nの入力部110は第nの集積回路210が備える入力部110であり、第nの演算部120は第nの演算回路220が備える演算部120である。
入力部110は、記憶部111と通知部112と検出部113と同期部114とを機能構成の要素として備える。これらの部の機能については後述する。
演算回路220は、プロセッサ221とメモリ222と発振器223とを備える。プロセッサ221は、メモリ222と発振器223に信号線を介して接続されている。
プロセッサ221はプロセッシングを行う集積回路である。具体的には、プロセッサ901はCPU(Central Processing Unit)である。
メモリ222は不揮発性の記憶装置である。具体的には、メモリ222はROM(Read Only Memory)である。
発振器223はクロック信号を生成する回路である。具体的には、発振器223は水晶発振器である。
発振器223には個体差がある。具体的には、発振器223の精度には、±100PPM以内の偏差が生じる。そのため、発振器223の定格周波数が100MHzである場合、発振器223には±10KHz(キロヘルツ)の差が生じる。つまり、早い発振器223ではクロック周波数が100MHz+10KHzであり、遅い発振器223ではクロック周波数が100MHz-10KHzである。したがって、プロセッサ221間で動作周波数に差が生じる。
プロセッサ221は、発振器223によって生成されるクロック信号に合わせて動作し、メモリ222に記憶されている演算プログラムを実行する。プロセッサ221は演算部120として機能する。
出力部130は、多数決部131と検出部132とリセット部133とタイマ部134とを機能構成の要素として備える。これらの部の機能については後述する。
多重系システム100の動作は多重化方法に相当する。
ステップS101において、複数の入力部110それぞれにデータが入力されると、処理はステップS110に進む。それぞれの入力部110に入力されるデータを入力データ101という。
なお、それぞれの入力部110には同じ入力データ101が入力される。また、それぞれの入力部110に入力データ101が入力されるタイミングは、ずれても構わない。つまり、入力データ101は、それぞれの入力部110に入力されるタイミングが同期されずに、それぞれの入力部110に入力されても構わない。
複数の入力部110それぞれは、入力データ101が入力された入力タイミングに入力通知104を出力し、入力データ101を同期タイミングに出力する。同期タイミングは、入力タイミングと他の入力部110から入力通知104が出力されたタイミングとのうちの遅い方のタイミングである。
入力データ101が記憶部111に入力されて、記憶部111が入力データ101を入力する。
通知部112は、入力データ101が記憶部111に記憶されたタイミングを入力タイミングとして検出して入力通知104を出力する。
検出部113は、入力タイミングと他の入力部110から入力通知104が出力されたタイミングとのうちの遅い方のタイミングを同期タイミングとして検出する。
同期部114は、同期タイミングが検出されたときに、記憶部111から入力データ101を読み出して入力データ101を出力する。
ステップS111において、入力データ101が記憶部111に入力される。そして、記憶部111は入力データ101を記憶する。
出力された記憶通知191は、通知部112と検出部113とに入力される。
出力された入力通知104は、他の入力部110に入力される。
同期タイミングは、記憶部111から出力された記憶通知191が入力されたタイミングと他の入力部110から出力された入力通知104が入力されたタイミングとのうちの遅い方のタイミングである。
検出部113は第1~第3のフラグを有する。
記憶通知191が入力されると第1のフラグの値が0から1に変わる。また、第2の入力部110の入力通知104が入力されると第2のフラグの値が0から1に変わり、第3の入力部110の入力通知104が入力されると第3のフラグの値が0から1に変わる。
検出部113は、第1~第3のフラグの全ての値が1になったタイミングを同期タイミングとして検出する。
同期タイミングが検出されると、処理はステップS115に進む。
出力された検出通知192は、同期部114に入力される。
第nの入力部110の同期部114から出力された入力データ101は、第nの演算部120に入力される。
ステップS120は演算処理である。
ステップS120において、複数の演算部120は、複数の入力部110から出力された入力データ101が入力されたときに演算を始める。つまり、第nの演算部120は、第nの入力部110から出力された入力データ101が入力されたときに演算を始める。
そして、複数の演算部120それぞれは、演算結果102を出力する。
但し、出力部130からエラーが通知された演算部120は、演算を行わず、演算結果102を出力しない。エラーが通知された演算部120を有する処理系は故障していると考えられるためである。
ステップS121において、演算部120は演算の要否を判定する。
メモリ222には演算フラグが記憶されている。演算フラグの値は、エラーが通知された場合に0から1に変更される。
演算フラグの値が0である場合、演算部120は演算が必要であると判定する。また、演算フラグの値が1である場合、演算部120は演算が不要であると判定する。
演算が必要であると判定されると、処理はステップS122に進む。
演算が終了すると、処理はステップS123に進む。
出力された演算結果102は、出力部130に入力される。
ステップS130は出力処理である。
ステップS130において、出力部130は、複数の演算部120によって得られた複数の演算結果102から演算結果102を選択し、選択した演算結果102と同じ内容のデータを出力する。出力部130から出力されるデータを出力データ103という。
また、出力部130は、選択しなかった演算結果102が得られた演算部120にエラーを通知する。
ステップS131において、多数決部131は、演算結果102を比較する比較タイミングを検出する。
比較タイミングは、複数の演算部120から出力された演算結果102が入力されたタイミングと演算結果102の比較が済んでいるべきタイミングとのうちの早い方のタイミングである。
演算結果102の比較が済んでいるべきタイミングは、タイマ部134から出力されるタイムアウト通知195が入力されるタイミングである。
第1~第3の演算部120から出力された演算結果102は、多数決部131、タイマ部134および検出部132に入力される。
多数決部131は第1~第3のフラグを有する。第nのフラグの値は、第nの演算部120から出力された演算結果102が入力されると0から1に変わる。
タイマ部134は、第1~第3の演算部120から出力される演算結果102のうち1つ目の演算結果102が入力されると時間の計測を開始し、1つ目の演算結果102が入力されてから経過した経過時間を計測する。そして、タイマ部134は、経過時間が保留時間に達すると、タイムアウト通知195を出力する。タイムアウト通知195は、経過時間が保留時間に達したことを通知するための信号である。出力されたタイムアウト通知195は、多数決部131に入力される。保留時間は予め決められた時間である。具体的には、保留時間は1ミリ秒である。
多数決部131は、第1~第3のフラグの全ての値が1になったタイミングとタイムアウト通知195が入力されたタイミングとのうちの早い方のタイミングを比較タイミングとして検出する。
比較タイミングが検出されると、処理はステップS132に進む。
つまり、第1~第3の演算結果102が入力されて、第1の演算結果102および第2の演算結果102が第1の値であり、第3の演算結果102が第2の値である場合、多数決部131は第1の演算結果102および第2の演算結果102を選択する。
出力データ103は、多重系システム100の外部に出力される。また、出力データ103は、検出部132とリセット部133とに入力される。
タイマ部134は、経過時間の計測を停止し、計測した時間をゼロに戻す。
少なくともいずれかの演算結果102が出力データ103と一致しない場合、処理はステップS136に進む。
具体的には、検出部132は、出力データ103と一致しない演算結果102の入力元の演算部120を特定し、特定した演算部120を識別する識別子を含んだエラー通知105を生成する。
エラー通知105は、少数派の演算結果102が得られた演算部120を通知するためのデータである。少数派の演算結果102は、多数決で選ばれない演算結果102を意味する。
エラー通知105に含まれる識別子によって識別される演算部120は、次回以降の演算を行わない。つまり、エラーが通知された演算部120は次回以降の演算を行わない。エラーが通知された演算部120を有する処理系は故障していると考えられるためである。
多重系システム100は、複数の処理系それぞれにデータが入力されるタイミングが同期されない場合であっても、複数の処理系それぞれの動作を同期させることができる。
複数の入力部110は同期タイミングに入力データ101を出力する。そのため、複数の演算部120には入力データ101が同じタイミングで入力される。
そのため、複数の演算部120それぞれの動作周波数に差が生じていても、同じ演算が実行されるタイミングには同じ入力データ101が複数の演算部120に入力されている。したがって、複数の演算部120は、同じ入力データ101を用いて同じ演算を実行することができる。そして、複数の演算部120は、同じ演算結果102を出力することができる。
具体的には、プロセッサ221の内部タイマが所定値になったときに演算プログラムが起動される。例えば、所定値は0である。この場合、入力データ101が入力されたタイミングでプロセッサ221の内部タイマの値を0に変更することにより、複数のプロセッサ221において演算プログラムはほぼ同じ時刻に起動する。プロセッサ221間で動作周波数が違うために演算プログラムが起動するタイミングが若干ずれたとしても、演算プログラムは入力データ101が入力されたときに起動する。そのため、いずれかの処理系で故障等のトラブルが発生しない限り、複数の演算部120は、同じ入力データ101を用いて同じ演算を実行することができる。そして、複数の演算部120は、同じ演算結果102を出力することができる。
入力データ101が入力されたタイミングでプロセッサ221の内部タイマの値が所定値になるため、プロセッサ221間で動作周波数が違っても演算が開始されるタイミングのずれは拡大しない。入力データ101が入力される周期が数百ミリ秒で、発振器223の精度の偏差が±100PPM以内で、プロセッサ221の動作周波数が100MHzである場合、演算が完了するタイミングのずれが数百マイクロ秒程度に抑えられる。入力データ101が届いたタイミングで、演算が開始されるためである。そして、演算が完了するタイミングのずれが小さいことにより、出力部130が保持する各演算部120の演算結果102の量が少なくて済む。つまり、タイムアウトに引っかからず、記憶領域が小さくて済む、という効果を得ることができる。
多重系システム100が有する処理系の数は3つではなく、2つまたは4つ以上であってもよい。
入力データ101がいずれかの入力部110に入力されない故障を考慮した形態について、図9および図10に基づいて説明する。但し、実施の形態1と重複する説明は省略または簡略する。
多重系システム100の構成、演算回路220の構成および出力部130の機能構成は、実施の形態1と同じである。
入力部110は、記憶部111と通知部112と検出部113と同期部114との他に、リセット部115とタイマ部116とを機能構成の要素として備える。
記憶部111、通知部112、検出部113および同期部114の機能は、実施の形態1と同じである。リセット部115およびタイマ部116の機能については後述する。
多重化方法の手順、演算処理(S120)の手順および出力処理(S130)の手順は、実施の形態1と同じである。
但し、図5に基づいて説明した多重化方法において、入力処理(S110)は以下の点で実施の形態1と異なる。
入力処理(S110)は、ステップS111~S113およびステップS115~S117を含んでいる。ステップS111~S113、ステップS115およびステップS116は、実施の形態1と基本的に同じである。
ステップS112において、記憶部111は記憶通知191を出力する。
ステップS113において、通知部112は入力通知104を出力する。
ステップS113の後、処理はステップS117に進む。
先行タイミングは、同期タイミングと制限タイミングとのうちの早い方のタイミングである。
同期タイミングは、実施の形態1で説明したように、記憶部111から出力された記憶通知191が入力されたタイミングと他の入力部110から出力された入力通知104が入力されたタイミングとのうちの遅い方のタイミングである。
同期タイミングを検出する方法は、実施の形態1においてステップS114で説明した通りである。
同期部114から前回出力された入力データ101は、演算部120の他に、リセット部115に入力される。
リセット部115は、入力データ101が入力されるとリセット通知193を出力する。リセット通知193は時間の計測をリセットするための信号である。出力されたリセット通知193はタイマ部116に入力される。
タイマ部116は、リセット通知193が入力されると時間の計測を開始し、リセット通知193が入力されてから経過した経過時間を計測する。そして、タイマ部116は、経過時間が許容時間に達すると、タイムアウト通知194を出力する。タイムアウト通知194は、経過時間が許容時間に達したことを通知するための信号である。出力されたタイムアウト通知194は検出部113に入力される。許容時間は予め決められた時間である。具体的には、許容時間は10ミリ秒である。
検出部113は、タイムアウト通知194が入力されたタイミングを制限タイミングとして検出する。
リセット部115は入力データ101が入力されるとリセット通知193を出力し、出力されたリセット通知193はタイマ部116に入力される。タイマ部116は、リセット通知193が入力されると、計測した時間をゼロに戻して時間の計測を開始する。
複数の入力部110は入力データ101を遅くても制限タイミングには出力する。そのため、入力データ101が伝送される伝送経路が、いずれかの入力部110において断線している場合であっても、多重系システム100は動作を継続することができる。
複数の演算結果102が外部に出力される形態について、図11から図14に基づいて説明する。但し、実施の形態1および実施の形態2と重複する説明は省略または簡略する。
図11に基づいて、多重系システム100の構成について説明する。
多重系システム100は、複数の集積回路210と複数の演算回路220と1つの集積回路240とを備える。
集積回路210および演算回路220は、実施の形態1で説明したように入力部110および演算部120として機能する。
集積回路240は特定部140として機能する。つまり、多重系システム100は特定部140を機能構成の要素として備える。特定部140の機能については後述する。
特定部140の機能構成は、実施の形態1で説明した出力部130の機能構成と同じである。
つまり、特定部140は、多数決部141と検出部142とリセット部143とタイマ部144とを機能構成の要素として備える。
図13に基づいて、多重化方法について説明する。
多重化方法は、ステップS101、ステップS110、ステップS120およびステップS140を有する。
ステップS101、ステップS110およびステップS120は、実施の形態1または実施の形態2と基本的に同じである。但し、演算処理(S120)において、演算結果102は多重系システム100の外部に出力される。また、演算結果102は特定部140に入力される。
ステップS140において、特定部140は、複数の演算部120のうちの多数決で選ばれない演算結果102が得られた演算部120を特定する。
そして、特定部140は特定した演算部120にエラーを通知し、エラーが通知された演算部120は次回以降の演算を行わない。
特定処理(S140)は、ステップS141~S146を有する。ステップS141~S146は、実施の形態1で図8に基づいて説明したステップS131~S136に相当する。
リセット部143は選択結果197が入力されるとリセット通知196を出力し、出力されたリセット通知196はタイマ部134に入力される。タイマ部134は経過時間の計測を停止し、計測した時間をゼロに戻す。
少なくともいずれかの演算結果102が選択結果197と一致しない場合、処理はステップS146に進む。
エラー通知105に含まれる識別子によって識別される演算部120は、次回以降の演算を行わない。つまり、エラーが通知された演算部120は次回以降の演算を行わない。
実施の形態3では、実施の形態1および実施の形態2で入力データ101が外部から入力されてから出力データ103が外部へ出力されるまでの時間に比べて、入力データ101が外部から入力されてから演算結果102が外部へ出力されるまでの時間が短い。すなわち、実施の形態3により、多重系システム100の外部への応答時間を短縮することができる。
各実施の形態は、好ましい形態の例示であり、本発明の技術的範囲を制限することを意図するものではない。各実施の形態は、部分的に実施してもよいし、他の形態と組み合わせて実施してもよい。
フローチャート等を用いて説明した手順は、システムおよび方法の手順の一例である。
機能構成の要素である「部」は「回路」と読み替えてもよい。
Claims (11)
- データがそれぞれに入力される複数の入力部を備え、
前記複数の入力部それぞれは、前記データが入力された入力タイミングに入力通知を出力し、前記入力タイミングと他の入力部から入力通知が出力されたタイミングとのうちの遅い方のタイミングである同期タイミングに前記データを出力する
ことを特徴とする多重系システム。 - 前記複数の入力部それぞれは、
前記データが入力されて前記データを記憶する記憶部と、
前記データが前記記憶部に記憶されたタイミングを前記入力タイミングとして検出して入力通知を出力する通知部と、
前記入力タイミングと他の入力部から入力通知が出力されたタイミングとのうちの遅い方のタイミングを前記同期タイミングとして検出する検出部と、
前記同期タイミングが検出されたときに、前記記憶部から前記データを読み出して前記データを出力する同期部と
を備える請求項1に記載の多重系システム。 - 前記複数の入力部それぞれは、制限タイミングまでに前記同期タイミングにならない場合、前記制限タイミングに前記データを出力する
請求項1に記載の多重系システム。 - 前記制限タイミングは、前回入力されたデータが出力されてから経過した時間が許容時間に達するタイミングである
請求項3に記載の多重系システム。 - 前記複数の入力部それぞれは、
前記データが入力されて前記データを記憶する記憶部と、
前記データが前記記憶部に記憶されたタイミングを前記入力タイミングとして検出して入力通知を出力する通知部と、
前記入力タイミングと他の入力部から入力通知が出力されたタイミングとのうちの遅い方のタイミングを前記同期タイミングとして検出する要素であって、前記同期タイミングと前記制限タイミングとのうちの早い方のタイミングである先行タイミングを検出する要素である検出部と、
前記先行タイミングが検出されたときに、前記記憶部から前記データを読み出して前記データを出力する同期部と
を備える請求項4に記載の多重系システム。 - 演算を行う複数の演算部を備え、
前記複数の演算部それぞれは、入力部に対応付けられて、対応付けられた入力部から出力されたデータが入力されたときに演算を始める
請求項1に記載の多重系システム。 - 前記複数の演算部によって得られた複数の演算結果から演算結果を選択し、選択した演算結果と同じ内容のデータを出力する出力部を備える
請求項6に記載の多重系システム。 - 前記出力部は、選択しなかった演算結果が得られた演算部にエラーを通知する
請求項7に記載の多重系システム。 - エラーが通知された演算部は、次回以降の演算を行わない
請求項8に記載の多重系システム。 - 前記複数の演算部のうちの多数決で選ばれない演算結果が得られた演算部を特定する特定部を備える
請求項6に記載の多重系システム。 - 前記特定部は、特定した演算部にエラーを通知し、
前記エラーが通知された演算部は、次回以降の演算を行わない
請求項10に記載の多重系システム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/083994 WO2017094162A1 (ja) | 2015-12-03 | 2015-12-03 | 多重系システム |
US15/766,323 US20180293142A1 (en) | 2015-12-03 | 2015-12-03 | Multiplex system |
DE112015007095.8T DE112015007095B4 (de) | 2015-12-03 | 2015-12-03 | Multiplexsystem |
JP2017553568A JP6266190B2 (ja) | 2015-12-03 | 2015-12-03 | 多重系システム |
CN201580084811.7A CN108292251A (zh) | 2015-12-03 | 2015-12-03 | 复用系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2015/083994 WO2017094162A1 (ja) | 2015-12-03 | 2015-12-03 | 多重系システム |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2017094162A1 true WO2017094162A1 (ja) | 2017-06-08 |
Family
ID=58796635
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2015/083994 WO2017094162A1 (ja) | 2015-12-03 | 2015-12-03 | 多重系システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US20180293142A1 (ja) |
JP (1) | JP6266190B2 (ja) |
CN (1) | CN108292251A (ja) |
DE (1) | DE112015007095B4 (ja) |
WO (1) | WO2017094162A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS578867A (en) * | 1980-06-17 | 1982-01-18 | Mitsubishi Electric Corp | Parallel system of electronic computer |
JPS58172043A (ja) * | 1982-04-02 | 1983-10-08 | Hitachi Ltd | 多重系データ伝送装置 |
JPH02212941A (ja) * | 1988-12-14 | 1990-08-24 | Natl Semiconductor Corp <Ns> | モジュラ冗長故障許容コンピュータシステムにおいて信号を同期するための方法及び回路 |
JP2001505338A (ja) * | 1997-04-02 | 2001-04-17 | ゼネラル・ダイナミックス・インフォメーション・システムズ・インコーポレーテッド | フォールト・トレラント・コンピュータ・システム |
JP2003316598A (ja) * | 2002-04-22 | 2003-11-07 | Mitsubishi Electric Corp | 高信頼性モード動作併用長命令実行プロセッサ |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5899865A (ja) | 1981-12-09 | 1983-06-14 | Hitachi Ltd | 多重化演算処理同期システム |
JP5206009B2 (ja) | 2008-02-18 | 2013-06-12 | 日本電気株式会社 | フォルトトレラントコンピュータ、同期制御方法、及びプログラム |
JP2011248809A (ja) * | 2010-05-31 | 2011-12-08 | Nec Engineering Ltd | 冗長演算システム |
US8589625B2 (en) * | 2010-09-15 | 2013-11-19 | Pure Storage, Inc. | Scheduling of reconstructive I/O read operations in a storage environment |
DE102011086530A1 (de) * | 2010-11-19 | 2012-05-24 | Continental Teves Ag & Co. Ohg | Mikroprozessorsystem mit fehlertoleranter Architektur |
US8972772B2 (en) * | 2011-02-24 | 2015-03-03 | The Charles Stark Draper Laboratory, Inc. | System and method for duplexed replicated computing |
JP5699057B2 (ja) * | 2011-08-24 | 2015-04-08 | 株式会社日立製作所 | プログラマブルデバイス、プログラマブルデバイスのリコンフィグ方法および電子デバイス |
CN103425553B (zh) * | 2013-09-06 | 2015-01-28 | 哈尔滨工业大学 | 一种双机热备份系统及该系统的故障检测方法 |
US9720742B2 (en) * | 2014-05-15 | 2017-08-01 | GM Global Technology Operations LLC | Service and system supporting coherent data access on multicore controller |
US9992135B2 (en) * | 2015-12-11 | 2018-06-05 | Intel Corporation | Apparatus and method for fusion of compute and switching functions of exascale system into a single component by using configurable network-on-chip fabric with distributed dual mode input-output ports and programmable network interfaces |
-
2015
- 2015-12-03 JP JP2017553568A patent/JP6266190B2/ja not_active Expired - Fee Related
- 2015-12-03 US US15/766,323 patent/US20180293142A1/en not_active Abandoned
- 2015-12-03 WO PCT/JP2015/083994 patent/WO2017094162A1/ja active Application Filing
- 2015-12-03 CN CN201580084811.7A patent/CN108292251A/zh active Pending
- 2015-12-03 DE DE112015007095.8T patent/DE112015007095B4/de not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS578867A (en) * | 1980-06-17 | 1982-01-18 | Mitsubishi Electric Corp | Parallel system of electronic computer |
JPS58172043A (ja) * | 1982-04-02 | 1983-10-08 | Hitachi Ltd | 多重系データ伝送装置 |
JPH02212941A (ja) * | 1988-12-14 | 1990-08-24 | Natl Semiconductor Corp <Ns> | モジュラ冗長故障許容コンピュータシステムにおいて信号を同期するための方法及び回路 |
JP2001505338A (ja) * | 1997-04-02 | 2001-04-17 | ゼネラル・ダイナミックス・インフォメーション・システムズ・インコーポレーテッド | フォールト・トレラント・コンピュータ・システム |
JP2003316598A (ja) * | 2002-04-22 | 2003-11-07 | Mitsubishi Electric Corp | 高信頼性モード動作併用長命令実行プロセッサ |
Also Published As
Publication number | Publication date |
---|---|
JPWO2017094162A1 (ja) | 2018-01-25 |
CN108292251A (zh) | 2018-07-17 |
US20180293142A1 (en) | 2018-10-11 |
DE112015007095T5 (de) | 2018-07-26 |
JP6266190B2 (ja) | 2018-01-24 |
DE112015007095B4 (de) | 2018-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10734914B2 (en) | Fault-tolerant controller for modular multi-level converters | |
US5572620A (en) | Fault-tolerant voter system for output data from a plurality of non-synchronized redundant processors | |
WO2019079116A1 (en) | FOLLOWING TOLERANT CLOCK MONITOR SYSTEM | |
JP6103825B2 (ja) | 半導体集積回路、情報処理装置 | |
US20200382233A1 (en) | Information processing apparatus and time synchronization method | |
US9600023B2 (en) | Method and data processing unit for providing a timestamp | |
JP2003248598A (ja) | マイクロコントローラ及びマイクロコントローラの故障検出方法 | |
US8156371B2 (en) | Clock and reset synchronization of high-integrity lockstep self-checking pairs | |
JP5436422B2 (ja) | 高インテグリティと高可用性のコンピュータ処理モジュール | |
US7656215B2 (en) | Clock generator circuit, clock selector circuit, and semiconductor integrated circuit | |
JP6266190B2 (ja) | 多重系システム | |
JP2014102662A (ja) | マイクロコンピュータ暴走監視装置 | |
CN107615205B (zh) | 时钟诊断装置及时钟诊断方法 | |
CN114020095B (zh) | 一种基于时钟对齐与同步的双处理器锁步系统 | |
JP6722055B2 (ja) | 処理同期制御システム及び処理同期制御方法 | |
JP2009187258A (ja) | 入出力端子共用クロック周波数選択発振回路 | |
CN114730199A (zh) | 用于同步多个处理器的系统和方法 | |
JP5987723B2 (ja) | 通信用スレーブ | |
JP5892083B2 (ja) | パラメータ設定装置、パラメータ設定プログラム及びパラメータ設定方法 | |
US9703315B2 (en) | Transmission device and time synchronization method | |
Najvirt et al. | How to synchronize a pausible clock to a reference | |
US11294421B2 (en) | Precision timing between systems | |
JPH08305611A (ja) | Cpu監視方法及びcpu監視装置 | |
JP5604799B2 (ja) | フォールトトレラントコンピュータ | |
JPH04143816A (ja) | 時間計測方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 15909792 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2017553568 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 15766323 Country of ref document: US |
|
WWE | Wipo information: entry into national phase |
Ref document number: 112015007095 Country of ref document: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 15909792 Country of ref document: EP Kind code of ref document: A1 |