WO2008072350A1 - 二重化タイマを用いたシステム監視装置、および監視方法 - Google Patents

二重化タイマを用いたシステム監視装置、および監視方法 Download PDF

Info

Publication number
WO2008072350A1
WO2008072350A1 PCT/JP2006/325085 JP2006325085W WO2008072350A1 WO 2008072350 A1 WO2008072350 A1 WO 2008072350A1 JP 2006325085 W JP2006325085 W JP 2006325085W WO 2008072350 A1 WO2008072350 A1 WO 2008072350A1
Authority
WO
WIPO (PCT)
Prior art keywords
timer
time
interrupt signal
timers
processor
Prior art date
Application number
PCT/JP2006/325085
Other languages
English (en)
French (fr)
Inventor
Yoshio Hirose
Original Assignee
Fujitsu Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Limited filed Critical Fujitsu Limited
Priority to JP2008549181A priority Critical patent/JP4983806B2/ja
Priority to PCT/JP2006/325085 priority patent/WO2008072350A1/ja
Publication of WO2008072350A1 publication Critical patent/WO2008072350A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software

Definitions

  • the present invention relates to a system monitoring method, and in a system that periodically performs processing corresponding to an interrupt from a timer, appropriately detects a timer failure, stops the system, etc.
  • the present invention relates to a system monitoring apparatus and a monitoring method that can perform the necessary processing.
  • Patent Document 1 with the configuration shown in FIG. 1, different timeout periods are set for the two timers.
  • the timer A is set to the timeout value A and the timer T2 is set to the timeout value B.
  • A be B.
  • the timer is configured to count up from 0 and raise an interrupt when the set timeout time is reached.
  • timer T1 times out and the CPU is interrupted.
  • the CPU reads the timer value of timer T2. Assuming that the read timer value is A ', if timer 2 is normal, the relationship A ⁇ A' should be established. Therefore
  • Timer T2 times out before timer T1
  • Patent Document 1 when it is determined that timer T1 has timed out and both timers are operating normally, next time, timer T2 has timed out time A and timer T1 has timed out The interval B is set, and the functions of both timers are changed each time. Therefore, in order to cause the CPU to perform the processing necessary for the work that should be executed in response to a single timer interrupt, it is necessary to set the timer twice, which is complicated. .
  • Fig. 3 shows a configuration in Patent Document 2 as another prior art
  • Fig. 4 shows a time chart.
  • the time-out period is set so that timer T1 times out first in two timers Tl and timer ⁇ 2.
  • the timer T1 times out MPU receives an interrupt, turns on the work flag, and resets the timeout time so that timer T1 times out and timer T2 times out.
  • the MPU checks whether the work flag is ON. If it is ON, the MPU turns the work flag OFF. At this time, if the work flag is originally OFF, it is determined that the timer T1 has failed.
  • timer T1 times out again and an interrupt occurs.
  • the MPU confirms that the work flag is OFF, and if it is ON, determines that timer T2 has failed. If it is OFF, return to the original state and set the timeout period for timer Tl and timer ⁇ 2 so that timer T1 times out first.
  • Patent Document 1 Japanese Patent Laid-Open No. 60-059447 “Microcomputer System”
  • Patent Document 2 JP-A-11-65986 “Timer Fault Detection System and Detection Method and Recording medium on which program for executing detection method is recorded "
  • an object of the present invention is to reduce the overhead of setting a timeout time for a timer and to enable determination of a failed timer among duplicated timers. .
  • the system monitoring device of the present invention outputs an interrupt signal from a timer camera and causes a processor in the monitoring target system to execute a predetermined process, and at every common time interval (2T), An operation that outputs an interrupt signal when the time interval deviates by half (T) from each other is provided with at least two timers that repeat using the timeout time reload function. Each time an interrupt signal is input, it is determined whether there are two timer failures.
  • the system monitoring apparatus of the present invention further includes a flag register that stores a flag indicating an identifier of the timer that has output the interrupt signal in response to an input of an interrupt signal having any timer power. Corresponding to the input of the next interrupt signal from the timer, the identifier of the timer that output the interrupt signal is compared with the stored contents of the flag register to determine the presence or absence of a timer failure.
  • the system monitoring apparatus of the present invention further includes a memory for storing a time indicated by a system clock provided in the system in response to the input of an interrupt signal having two timers, and the processor includes Based on the result of the comparison of the above-mentioned timer identifiers and the time difference between the time indicated by the system clock when the next interrupt signal is input and the previous interrupt signal input time stored in the memory, Identify the failure timer.
  • the setting of the timeout time for the timer is basically performed by using the reload function of the timer, and the overhead for setting the timeout time for the timer can be reduced.
  • the timer that no longer outputs the interrupt signal can be identified, or when the interrupt signal is input and the previous interrupt signal.
  • a fault timer that raised an interrupt at a time interval that is significantly different from 2T as the set time-out time is identified. It becomes possible to separate.
  • the present invention it is possible to greatly reduce the time-out time setting overhead for the timer by using the time-out time reload function for the timer as compared with the prior art. It is also possible to identify the failure timer among the duplicated timers using the contents stored in the flag register and the time indicated by the system clock. If one timer fails, it will fail. It is also possible to continue system operation using a timer, which greatly contributes to improving the practicality of system monitoring devices using a duplex timer.
  • FIG. 1 is a configuration block diagram of a system monitoring method in a first conventional example.
  • FIG. 2 is an explanatory diagram of a timeout time setting method in the first conventional example.
  • FIG. 3 is a configuration block diagram of a system monitoring method in a second conventional example.
  • FIG. 4 is an explanatory diagram of a timeout time setting method in a second conventional example.
  • FIG. 5 is a configuration block diagram of the first embodiment.
  • FIG. 6 is a flowchart of a main routine of timer failure detection processing in the first embodiment.
  • FIG. 7 is a flowchart of interrupt processing 1 for FIG.
  • FIG. 8 is a flowchart of interrupt processing 2 for FIG.
  • FIG. 9 is a configuration block diagram of a first example of a reliable timer.
  • FIG. 10 is a configuration block diagram of a second example of the reliable timer.
  • FIG. 11 is a configuration block diagram of a second embodiment.
  • FIG. 12 is a flowchart of interrupt processing 1 in the second embodiment.
  • FIG. 13 is a flowchart of interrupt processing 2 in the second embodiment.
  • FIG. 14 is a configuration block diagram of a third embodiment.
  • FIG. 15 is a flowchart of interrupt processing 2 in the third embodiment.
  • FIG. 5 is a block diagram showing the configuration of the first exemplary embodiment of the present invention.
  • the first embodiment includes two timers 1 and 2, an interrupt controller 3 and a processor 4, and two processors 4 and 2 are provided.
  • the timers 1 and 2 are connected to each other by the bus 5, the timers 1 and 2 are each given an interrupt notification signal to the interrupt controller 3, and the interrupt controller 3 is given an interrupt control signal to the processor 4.
  • the processor 4 includes a CPU 6 that determines whether or not a timer has failed in response to an interrupt from the timers 1 and 2 and performs processing necessary to execute a predetermined operation as interrupt processing.
  • a ROM read only memory
  • RAM random access memory
  • an input / output unit etc.
  • the system monitoring apparatus using the duplex timer of the present invention can be considered to be composed of timers 1 and 2, and an interrupt controller 3, and includes all the components shown in FIG. It can also be thought of as being formed on a single chip as a processor system.
  • the interrupt controller 3 receives an interrupt (notification) signal from the timer 1 and the timer 2 at the same time, or outputs an interrupt signal for one of the timers, and the corresponding interrupt processing is executed. While the other timer power interrupt signal is output, the arbitration operation is performed, and as a result of the arbitration operation, an interrupt control signal indicating the identifier of the timer that output the interrupt signal is sent to the CPU 6 inside the processor 4 This is output, and is not directly related to the timer failure detection method of the present invention.
  • FIGS. 6 to 8 are flowcharts of the timer failure detection process in the first embodiment.
  • the timeout time of timer 1 is set to T and the timeout time of timer 2 is set to 2% in step S1.
  • timer 1 is set to have no reload function and timer 2 is set to have reload function.
  • the reload function is a function that automatically resets the time-out time set in the reload register to the timer automatically when the timer times out, for example, and continues the function as a timer.
  • Timer 2 set to TIMES out every 2 hours, and an interrupt signal is periodically sent to the interrupt controller 3.
  • step S2 the power to wait for an interrupt from timer 1
  • interrupt processing 1 is executed by CPU 6
  • the contents of the interrupt table held in the memory (not shown) inside the processor 4 are set.
  • time T elapses from the start of the main routine in FIG. 6, timer 1 times out and interrupt processing 1 in FIG. 7 as a subroutine is started by giving an interrupt.
  • step S6 the timeout time of timer 1 is set to 2 ⁇ instead of ⁇ at the time of main routine start, and timer 1 is also set with a reload function.
  • a flag register that stores a pre-pierce timer flag as a flag for identifying which timer interrupt occurred last time.
  • timer 1 and timer 2 interrupts Prepared in the system monitoring device composed of the controller 3, "0" as the identifier of the timer 1 that raised the interrupt at this point is used as the flag by the CPU 6 in the processor 4 via the nose 5 Is set in the flag register.
  • step S7 the contents of the above-described interrupt table are changed to execute interrupt processing 2 in response to the interrupt, so that a predetermined operation to be originally executed for the timer interrupt is performed.
  • the process is started and a return to the main routine is performed. Due to the above processing, timer 1 and timer 2 are common and output an interrupt signal to interrupt controller 3 at the same time interval of 2 ⁇ and half of the time interval, i.e., when they deviate from each other by time ⁇ . become.
  • step S3 in FIG. 6 the timer 1 or timer 2 waits for an interrupt.
  • timer 2 will be timed out after a certain time and interrupt processing 2 will be executed by raising an interrupt.
  • FIG. 8 is a flowchart of interrupt processing 2 as a subroutine. Interrupt processing 2 When the S starts, the identifier (timer ID) of the timer that raised the interrupt is first checked in step S10, and whether or not the timer ID matches the pre-pierce timer flag value in step S11. Is determined.
  • timer ID is "1" as the ID of timer 2 and the value of the pre-pierce 'timer' flag is "0".
  • step S12 the value of the pre-pierce 'timer' flag is inverted, that is, "1".
  • the processing necessary for the work that should be originally executed in response to the timer interrupt is performed. It is activated and returns to the main routine.
  • timer 1 While the timer continues to operate normally, timer 1 times out after time T, and the same interrupt processing 2 is repeated. As a timer failure, for example, if timer 1 fails and no more interrupts are raised, interrupts will be issued continuously from timer 2. Or if timer 1 starts to time out in a time shorter than the set time, it depends on the degree of shortening. Become.
  • step S13 the system is instructed to stop. If this is the case, it is possible to disconnect the failed timer and continue the system operation using a non-failed timer.However, as described above, depending on the failure method, the timer power of the failed timer may be continuously interrupted. In this first embodiment, the failure timer cannot be identified because there is a case in which both the failure and the timer force are continuously interrupted. In this first embodiment, the failure timer cannot be identified. The system is shut down at the time of failure.
  • a system monitoring function that is functionally equivalent to the conventional example can be realized.
  • the conventional example it was necessary to set at least two timeout times for the timer each time corresponding to one timer interrupt processing.
  • the timer reload function was used. By doing so, the number of times of timeout time setting can be greatly reduced, and the overhead of the timeout time setting in the system monitoring device can be remarkably reduced.
  • FIG. 9 is a block diagram of a first configuration example of the high reliability timer.
  • high reliability Thailand The machine 10 is composed of two timers 11 and 12, and the same command is given to the two timers from the CPU 6 in FIG.
  • the point that the interrupt signal is given from the timer 11 and the timer 12 to the interrupt controller 3 is the same as in FIG.
  • the timer 12 has the same configuration as a general timer having a reload function. That is, when a command for setting 2 T as a timeout time is given from the CPU 6 to the timer 12, the value 2T is stored in the reload register 15 and set to the counter 16 via a selector, for example. Is done. Assuming that the counter 16 is a down counter, the interrupt signal is output from the 0 detection circuit 17 to the interrupt controller 3 when the count time reaches 2T and the count value reaches "0". It will be. At the time of this 0 detection, the counter 16 is not shown from the 0 detection circuit 17 !, a set signal is given to the set terminal, the stored contents of the reload register 15 are set in the counter 16, and the countdown operation is performed. Continued.
  • the timer 11 further includes a right 1-bit shift circuit 18 as a configuration unique to the present invention.
  • the right 1-bit shift circuit 18 performs an operation to divide the value by 2, and the value of the time T of the execution result is calculated.
  • the counter 16 is set via the selector and the count time of the counter 16 reaches T and the count value becomes “0”, an interrupt signal is given from the 0 detection circuit 17 to the interrupt controller 3.
  • the reload register 15 stores the value of time 2T.
  • the value of the time 2T stored in the reload register 15 is set in the counter 16 via the selector, and the counter 16 counts down. Will be done.
  • FIG. 10 is a block diagram illustrating a second example of the reliable timer.
  • the highly reliable timer 20 is composed of two timers 21 and 22. Each of these two timers is provided with a left 1-bit shift circuit 25, which is not a general one in which conventional power is used, and has a configuration unique to the present invention.
  • a command instructing to set time T as a time-out period is given to high-reliability timer 20 in FIG. 10 from CPU 6 in FIG.
  • the value of time T is A value 2T that is set by the counter 16 and doubled by the left 1-bit shift circuit 25 that performs an operation of multiplying 2 is stored in the reload register 15.
  • the count value of the counter 16 becomes “0”, the contents of the reload register 15 are set in the counter 16 in the same manner as described above.
  • the value of 2T is obtained by the left 1-bit shift circuit 25 when the command is input from the CPU 6, and the value is set as it is in the counter 16, and at the same time in the reload register 15. Also 2T value is stored.
  • counter 16 counts down and 0 detection circuit 17 detects “0” as the count value, the content stored in reload register 15 is set in counter 16 and the countdown operation is continued.
  • the failed timer of the two timers cannot be identified, so that the system operation is stopped when the timer failure is detected.
  • an embodiment in which one of the two timers can be identified as a failed timer, and even if one of the timers fails, the function of the other timer can be used to continue system operation. Will be described as a second embodiment.
  • the flag register is provided in the system monitoring device. Of course, it is also possible to provide the flag register in the processor 4 in FIG.
  • FIG. 11 is a configuration block diagram of the second embodiment. Comparing this figure with FIG. 5 showing the first embodiment, the difference is that a system clock 30 indicating the unified time of the entire system is further connected to the bus 5.
  • the CPU 6 in the processor 4 gives an interrupt control signal from the interrupt controller 3 in addition to the comparison between the timer ID and the pre-pierce 'timer flag value in the first embodiment.
  • Tprev the input time
  • the flowchart of the main routine of the timer failure detection process in the second embodiment is the same as that in FIG. 6 for the first embodiment, and a description thereof will be omitted.
  • FIG. 12 is a flowchart of interrupt processing 1 in the second embodiment.
  • the process in the figure is triggered by an interrupt from timer 1 as in step S2 of FIG. 6 in the first embodiment.
  • step S16 the timeout time of timer 1 is set to 2T in the same way as step S6 in Fig. 7, and the state with the reload function is set, and the pre-pierce timer is set.
  • the flag value is set to “0” indicating the identifier of timer 1
  • the current time value Tnow indicated by the system clock is read in step S17 in addition to the processing in step S7 of FIG.
  • the value is stored in a memory (not shown) that stores the value of Tprev, and the process returns to the main routine.
  • FIG. 13 is a flowchart of interrupt processing 2 in the second embodiment.
  • the identifier (timer ID) of the timer that raised the interrupt is checked at step S20, and the system in Fig. 11 is also checked.
  • the time value (Tnow) indicated by the clock 30 is recorded, and it is determined in step S21 whether the timer ID and the pre-pierce timer flag value match.
  • step S22 If the two values do not match, it is determined that the timer is operating normally, the value of the pre-pierce timer flag is inverted in step S22, and the value of Tprev is set in step S23.
  • the value of Tonow is assigned to the memory that stores the value, the processing necessary for the original operation to be executed in response to the timer interrupt is started, and the process returns to the main routine. While the two timers are operating normally, the processing from step S20 to step S23 is repeated as interrupt processing 2.
  • step S21 the timer ID value matches the pre-pierce timer flag value, and in step S24 the current time Tnow and Tprev values are stored. The difference from the memory value to be calculated is calculated as Tdiff.
  • step S25 it is determined whether or not the value matches the steady interrupt period 2T of the two timers. Actually, it seems that there is some error, so for example, if it is in the range of about 10%, it is determined that Tdiff and 2T match, and in step S26, the timer on the powerful side has failed and raised the interrupt.
  • the timer is disconnected, the timeout time of the timer that raised the interrupt is reset to T, and the reload function is enabled. Then, the value of Tnow is assigned to the memory storing Tprev, the processing necessary for the original work for the timer interrupt is started, and the process returns to the main routine. Is done.
  • step S27 whether or not the Tdiff value is about T is determined within an error range of ⁇ 10%. If it is determined that they match, the timeout time is reset to T in step S26 previously. Assuming that the other timer operates normally, the value of Tonow is assigned to the memory storing Tprev in step S23, and is necessary for the original work corresponding to the timer interrupt. The process is started and the process returns to the main routine.
  • Tdiff becomes a value that does not match, for example, 2T or T.
  • an interrupt from timer 1 occurs in step S2 of Figure 6 in the main routine, interrupt processing 1 in Figure 12 ends, and interrupt from timer 1 occurs before an interrupt from timer 2 occurs in step S3 of the main routine.
  • the power Tdiff is not equal to 2T or T.
  • step S28 it is determined whether or not the timer that did not raise an interrupt, in this case, timer 2, is operating, and if it is operating, an interrupt was raised in step S29.
  • the timer on the side that is, timer 1, is disconnected and the return to the main routine is performed.
  • step S30 it is determined that both timers have failed, and an instruction to stop the system is issued.
  • step S29 When timer 1 is disconnected in step S29 and timer 2 is in operation, if an interrupt from timer 2 occurs again in step S3 of the main routine in FIG. 6, the timer ID is set to timer 2 in step S21. Since this is an identifier and the value of the pre-pierce timer flag remains the same as that of timer 1, it is determined that they do not match, and the value of the pre-timer flag is reversed in step S22. In step S 23, Tnow is stored in the memory storing Tprev, processing necessary for the original operation for the timer interrupt is started, and a return to the main routine is performed. [0046] Since timer 1 has already been disconnected, the next interrupt detected in step S3 of FIG. 6 of the main routine is an interrupt from timer 2.
  • step S21 When this interrupt occurs, it is determined in step S21 that the timer ID and the pre-pierce 'timer' flag value match, and the Tdiff value obtained in step S24 is determined to be about 2T in step S25. After step S26, the process returns to the main routine. However, since the timer that did not raise the interrupt, that is, timer 1, has already been disconnected, the timer disconnect processing is omitted, and the return to the main routine is performed after other processing is performed.
  • the second embodiment it is possible to determine which of the two timers has failed by utilizing a system clock that indicates a uniform time throughout the system. Even if one timer fails, the system operation can be continued. However, if the system operation is continued using the monitoring function with one timer, for example, even if the remaining timer fails and no interrupt is raised, it cannot be detected, and the failure detection function is sufficient. Because it does not work, the operation using one timer is an emergency evacuation measure when it is difficult to shut down the system, for example. Basically, when a failure of one timer is detected, for example, an alarm is generated to alert the system administrator, and when it is time to stop the system, the system operation is stopped, and the board that contains the failed timer It is necessary to perform repairs such as replacement.
  • a system clock that uniformly indicates the time in the system is used to determine the timer failure.
  • a similar counter that does not necessarily use the system clock is included in the system. If it is installed, it is possible to use it. Further, it is naturally possible to provide a memory for storing the time indicated by the system clock in the processor 4 in FIG. 11 connected in the system monitoring device.
  • FIG. 14 is a configuration block diagram of the third embodiment.
  • processors' elements (PE) 4 forces 4 and shared memory 35 to form a multiprocessor system.
  • each PE checks its existence information written in the shared memory 35 by a check routine that is activated in response to an interrupt from the timer, and is updated! If there is anything, the PE fails. It is judged that
  • the survival information written to the shared memory 35 may be any data that is updated each time there is a timer power interrupt, and the local timer value built into each PE can be used. Is possible. If the timer is not duplicated in the third embodiment, if the timer fails, the check routine will not be started inside each PE, and it will not be possible to detect a PE failure.
  • a master PE is determined among a plurality of PEs, here four PEs, and the master PE isolates the failed PE to ensure system reliability.
  • the master PE can be determined by any method. For example, when the identifier (ID) is the smallest and the PE becomes the master, the rule can be used. Since the master PE may fail, for example, the rule that the PE with the next lowest ID after the master PE becomes the next master candidate is decided, and if the master PE fails, the next master candidate PE It is assumed that the master PE is disconnected and thereafter operates as the master PE.
  • each of PE4 forces 4 in Fig. 14 is the main routine in Fig. 6, interrupt processing 1 in Fig. 7.
  • FIG. 15 is a flowchart of interrupt processing 2 in the third embodiment.
  • interrupt processing 2 starts, and the ID of the timer that raised the interrupt is checked in step S35.
  • the existence information of all PEs including the existence information of its own PE is checked, and the number of PEs determined to be failed in step S37 is "0", "1", or It is determined whether it is more than that.
  • step S38 If the number of failed PEs is "0", then the master PE is also normal, and each PE determines whether it is a master PE in step S38 and is not a master PE! / In some cases, return to the main routine is performed. Only the master PE executes the processing from step S39.
  • step S39 the master PE determines whether or not the timer ID checked in step S35 matches the value of the pre-pierce timer flag. If they do not match, the timer operates. Since it is normal, the value of the pre-pierce timer flag is reversed in step S40, and the process returns to the main routine.
  • step S41 and S47 are similar to steps S24 to S30 in FIG. 13 for the second embodiment. Processing is performed. That is, Tdiff was calculated using the time indicated by the system clock in the second embodiment (of course, the system clock value may be used in this embodiment as well), but in the third embodiment, step S41 is used.
  • the Tdiff value is calculated from the survival information stored in the shared memory in step S42, and it is determined in step S42 whether the value is about 2T including an error within ⁇ 10%.
  • step S43 the timer that did not raise the interrupt is disconnected, and after the timeout time of the timer that raised the interrupt is reset to T, the value of the pre-pierce 'timer' flag is inverted in step S40. Return to the main routine.
  • step S44 it is determined whether or not the value is about T. If it is about T, one timer is already disconnected and the rest is left. The timer determines that the operation is continuing and returns to the main routine. If it is not about T, the more powerful timer is activated in step S45. It is determined whether or not it is in operation. If it is in operation, the timer that raised the interrupt is disconnected in step S46, and the process returns to the main routine. If the timer with the strongest interrupt is not running, both timers have failed, and an emergency stop command is issued in step S47.
  • step S37 If the number of PEs determined to be failed in step S37 is 1, it is determined whether or not the failed PE is the master PE in step S50. In step S51, it is determined whether or not it is the master PE. If it is not the master PE, a return to the main routine is performed.
  • step S50 If it is determined in step S50 that the master PE has failed, it is determined in step S52 whether or not the master PE is a candidate for the next master PE. If it is a candidate and if it is determined that it is a master PE in step S51, the failed PE is disconnected by the master PE (or a new master PE) in step S53. In step S40, the value of the pre-pierce timer flag is reversed and the process returns to the main routine.
  • step S37 If the number of PEs determined to be faulty in step S37 is 2 or more, the timer ID is compared with the value of the pre-pierce timer flag in step S60, and they match. In this case, it is determined that the life information of each PE has not been updated by continuously issuing interrupts in a time shorter than the predetermined period due to a timer failure.
  • step S61 it is determined whether or not it is the master PE. If it is not the master PE, a return to the main routine is performed. If it is a master PE, it is determined in step S62 whether or not the timer that did not raise an interrupt is running. If not, both timers have failed. The emergency stop is instructed to the system.
  • step S64 If it is in operation After the timer that raised the interrupt in step S64 is disconnected, the timeout time of the timer that raised the interrupt is reset to T, and the value of the pre-pierce 'timer' flag is reversed in step S40 Return to the main routine is performed.
  • step S60 If it is determined in step S60 that the timer ID and the pre-pierce timer flag value do not match !, it is determined that multiple PEs have failed at the same time, and emergency stop processing is performed in the following steps. Do. That is, in step S65, it is determined whether it is a normal PE that has not failed and the PE with the lowest ID among normal PEs. If these two conditions are satisfied, an emergency stop instruction is issued in step S63. Is called. In Fig. 14, an emergency stop is instructed when two of the four PEs fail.
  • step S65 If the condition of step S65 is not satisfied, for example, if it is a faulty PE, it is determined whether all PEs in step S66 have failed and whether it is the master PE. For example, if you are not the master PE, return to the main routine. If all PEs are faulty, the processing content after the return is not clear. However, here, if the condition of step S66 is not satisfied, a return to the main routine is performed. If the condition in step S66 is satisfied, an emergency stop instruction is issued to the system in step S63. In this case, only a single PE has instructed emergency stop processing. In an emergency, all PEs may instruct emergency stop processing.
  • the reliability of the system is improved by duplicating the timer in the system that detects the failure of each processor element constituting the multiprocessor system in response to the interrupt from the timer. Can be raised.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 タイマに対するタイムアウト時間設定のオーバヘッドを削減し、二重化されたタイマのうちで故障したタイマの識別を可能にすることを目的とし、タイマから割込み信号を出力し、監視対象システム内のプロセッサにあらかじめ定められた処理を実行させるシステム監視装置が、共通で同一の時間間隔毎に、かつその時間間隔の半分だけ互いにずれた時点で割込み信号を出力する動作を、タイムアウト時間のリロード機能を用いて繰り返す2つのタイマを備える。

Description

二重化タイマを用いたシステム監視装置、および監視方法
技術分野
[0001] 本発明はシステムの監視方式に係り、タイマからの割込みに対応して定期的に定 められた処理を実施しているシステムにおいて、タイマの故障を適切に検出し、シス テム停止などの必要な処理を行うことを可能とするシステム監視装置、および監視方 法に関する。
背景技術
[0002] システムに定期的に何かの動作をさせたい場合、タイマを使って定期的にシステム を制御するプロセッサの CPUに割込みをかける、といった方法が一般的に用いられ ている。またシステムの信頼性を上げるために、多少コストがかかっても、信頼性向上 のための制御などを 2重化、 3重化することもよくとられる手法である。 CPUに割込み をかけるタイマについても同様で、タイマの信頼性を上げるためにタイマを 2重化して V、る従来例として次のような文献がある。
[0003] 特許文献 1では、図 1に示すような構成で、 2つのタイマに異なるタイムアウト時間を 設定する。図 2に示すように、タイマ T1にはタイムアウト時間として Aという値を、タイ マ T2にはタイムアウト時間として Bという値を設定する。ここで Aく Bとする。ここでタイ マは 0からカウントアップして、設定したタイムアウト時間になると割込みをあげる構成 になっているものとしている。タイマをセットして A時間経過後、タイマ T1がタイムァゥ トして CPUに割込みがかかる。割込みが力かると CPUはタイマ T2のタイマ値をリード する。リードしたタイマ値を A 'とすると、タイマ 2が正常であれば、 A< A 'の関係が成 り立っているはずである。従って
•タイマ T1より先にタイマ T2がタイムアウトする、
'タイマ T1のタイムアウト後、タイマ T2のタイマ値が A< A,の関係を満たしていない、 ことを検出すると、タイマが故障したと判断することができる。
[0004] 特許文献 1では、タイマ T1がタイムアップして両方のタイマが正常に動作していると 判断した場合は、次回はタイマ T2にタイムアウト時間 Aを、タイマ T1にタイムアウト時 間 Bを設定して、両者のタイマの機能を、 1回ごとに入れ換えている。そこで、 1回のタ イマ力 の割込みに対応して本来実行されるべき作業に必要な処理を CPUに行わ せるのに、タイマの設定を 2回ずつ行う必要が有り、処理が煩雑であった。
[0005] 別の従来技術としての特許文献 2における構成を図 3に、タイムチャートを図 4に示 す。この文献では、 2つのタイマ Tl、タイマ Τ2に、タイマ T1の方が先にタイムアウトす るように、タイムアウト時間をセットする。まずタイマ T1がタイムアウトする力 MPUは 割込みを受けて、作業フラグを ONにするとともに、タイマ T1をタイマ T2がタイムァゥ トして力もタイムアウトするように、タイムアウト時間を再セットする。次にタイマ T2がタ ィムアウトして割込みが発生すると、 MPUは作業フラグが ONであるかどうか確認し、 ONであれば作業フラグを OFFにする。この時作業フラグがもともと OFFであればタ イマ T1が故障したと判断する。次に正常であれば再びタイマ T1がタイムアウトして割 込みが発生する。 MPUは作業フラグが OFFである力確認し、 ONになっているとタイ マ T2が故障したと判断する。 OFFの場合はもとに戻って、タイマ Tl、タイマ Τ2をタイ マ T1が先にタイムアウトするようにタイムアウト時間をセットする。特許文献 2でも、 1回 のタイマ力 の割込みに対応して実行されるべき作業に必要な処理を MPUに行わ せるのに、タイマの設定を例えば 3回行う必要が有り、処理が煩雑であった。
[0006] このように特許文献 1、特許文献 2の従来技術では、タイマからの割込みに対応して 実行されるべき作業に必要な処理をプロセッサに行わせるためにタイマの設定を複 数回ずつ行う必要があり、処理が煩雑になるという問題点があった。
[0007] またどちらの特許文献においても、二重化されたタイマのいずれに故障が発生した かを判別することができず、タイマの故障発生時には基本的にはシステムをシャットダ ゥンするしか方法はないという問題点があった。特許文献 2においては、故障タイマ の判別が可能と記述されて 、るが、この判別はタイマが故障して割込みをあげなくな つたような場合に対応しており、例えばタイマが設定された時間よりも早く割込みをあ げるようになったような場合には必ずしも故障タイマの判別ができるとは限らな 、と ヽ う問題点があった。
特許文献 1:特開昭 60— 059447 「マイクロコンピュータシステム」
特許文献 2 :特開平 11— 65986 「タイマの障害検出システム及び検出方法並びに 検出方法を実行するためのプログラムを記録した記録媒体」
発明の開示
[0008] 本発明の目的は、上述の問題点に鑑み、タイマに対するタイムアウト時間設定のォ ーバヘッドを削減することと、二重化されたタイマのうちで故障したタイマの判別を可 會 とすることである。
[0009] 本発明のシステム監視装置は、タイマカゝら割込み信号を出力し、監視対象システム 内のプロセッサに予め定められた処理を実行させるものであり、共通の時間間隔(2T )毎に、その時間間隔が互いに半分 (T)ずれた時点で割込み信号を出力する動作を 、タイムアウト時間のリロード機能を用いて繰り返す 2つのタイマを少なくとも備えるも のであって、プロセッサが 2つのタイマのいずれ力からの割込み信号の入力が繰り返 される毎に、 2つのタイマの故障の有無を判定する。
[0010] また本発明のシステム監視装置は、いずれかのタイマ力もの割込み信号の入力に 対応して、その割込み信号を出力したタイマの識別子を示すフラグを格納するフラグ レジスタをさらに備え、プロセッサがタイマからの次の割込み信号の入力に対応して、 その割込み信号を出力したタイマの識別子とフラグレジスタの格納内容とを比較して 、タイマ故障の有無を判定する。
[0011] さらに本発明のシステム監視装置は、 2つのタイマ力もの割込み信号の入力に対応 して、システム内に備えられているシステム時計が示す時刻を格納するためのメモリ をさらに備え、プロセッサが前述のタイマ識別子の比較の結果と、次の割込み信号の 入力時のシステム時計の示す時刻とメモリに格納されている前回の割込み信号入力 時刻との時間差とに基づいて、二重化されたタイマのうちの故障タイマの識別を行う。
[0012] このように本発明においては、基本的にタイマに対するタイムアウト時間の設定がタ イマのリロード機能を用いて行われ、タイマに対するタイムアウト時間の設定のための オーバヘッドを削減することができる。
[0013] また割込み信号を出力したタイマの識別子とフラグレジスタの格納内容との比較に よって、例えば割込み信号を出力しなくなったタイマを識別することや、割込み信号 の入力時点と前回の割込み信号の入力時点との比較によって、例えば設定されたタ ィムアウト時間としての 2Tと大きく異なる時間間隔で割込みをあげた故障タイマを識 別することが可能となる。
[0014] 本発明によれば、タイマに対するタイムアウト時間のリロード機能を利用して、タイマ に対するタイムアウト時間設定のオーバヘッドを従来技術に比較して大きく削減する ことが可能となる。またフラグレジスタの格納内容やシステム時計の示す時刻を利用 して、二重化されたタイマのうちの故障タイマの識別を行うことが可能となり、一方のタ イマが故障しても、故障して ヽな 、タイマを利用してシステム動作を継続することも可 能となり、二重化タイマを用いたシステム監視装置の実用性向上に寄与するところが 大きい。
図面の簡単な説明
[0015] [図 1]第 1の従来例におけるシステム監視方式の構成ブロック図である。
[図 2]第 1の従来例におけるタイムアウト時間設定方法の説明図である。
[図 3]第 2の従来例におけるシステム監視方式の構成ブロック図である。
[図 4]第 2の従来例におけるタイムアウト時間設定方法の説明図である。
[図 5]第 1の実施例の構成ブロック図である。
[図 6]第 1の実施例におけるタイマ故障検出処理のメインルーチンのフローチャートで ある。
[図 7]図 6に対する割込み処理 1のフローチャートである。
[図 8]図 6に対する割込み処理 2のフローチャートである。
[図 9]高信頼タイマの第 1の例の構成ブロック図である。
[図 10]高信頼タイマの第 2の例の構成ブロック図である。
[図 11]第 2の実施例の構成ブロック図である。
[図 12]第 2の実施例における割込み処理 1のフローチャートである。
[図 13]第 2の実施例における割込み処理 2のフローチャートである。
[図 14]第 3の実施例の構成ブロック図である。
[図 15]第 3の実施例における割込み処理 2のフローチャートである。
発明を実施するための最良の形態
[0016] 図 5は、本発明の第 1の実施例の構成ブロック図である。同図において第 1の実施 例は 2つのタイマ 1、 2、割込みコントローラ 3、プロセッサ 4を備え、プロセッサ 4と 2つ のタイマ 1、 2との間はバス 5によって接続され、タイマ 1、 2からはそれぞれ割込み通 知信号が割込みコントローラ 3に与えられ、割込みコントローラ 3からはプロセッサ 4に 対して割込み制御信号が与えられる構成となっている。プロセッサ 4は、タイマ 1、 2か らの割込みに対応してタイマの故障の有無を判定するとともに、割込み処理として予 め定められた作業を実行するために必要な処理を実行する CPU6を備えると共に、 図示しないメモリとしての ROMや RAM、入出力部などを備えることは当然である。
[0017] 図 5において本発明の二重化タイマを用いたシステム監視装置は、タイマ 1、 2、お よび割込みコントローラ 3によって構成されると考えることもでき、また図 5の構成要素 をすベて備えたプロセッサシステムとして 1つのチップ上に形成されると考えることも できる。
[0018] なお割込みコントローラ 3は、タイマ 1とタイマ 2とから同時に割込み (通知)信号が出 力されたとき、あるいは片方のタイマ力も割込み信号が出力され、それに対応した割 込み処理が実行されている間に他方のタイマ力 割込み信号が出力された場合の 調停動作などを行い、その調停動作の結果として、割込み信号を出力したタイマの 識別子などを示す割込み制御信号をプロセッサ 4の内部の CPU6に出力するもので あり、本発明のタイマ故障検出方式とは直接には関係のないものである。
[0019] 図 6から図 8は、第 1の実施例におけるタイマ故障検出処理のフローチャートである 。まず図 6のメインルーチンにおいて処理が開始されると、ステップ S1でタイマ 1のタ ィムアウト時間が T、タイマ 2のタイムアウト時間が 2Τに設定される。この時、タイマ 1は リロード機能がない状態に、タイマ 2はリロード機能がある状態に設定される。リロード 機能とはタイマがタイムアウトしたときに、例えばリロード用レジスタに予め設定された タイムアウト時間を自動的にタイマに再設定し、タイマとしての機能を継続する機能で あり、ステップ S1でタイムアウト時間が 2Τに設定されたタイマ 2は時間 2Τ毎にタイム アウトし、定期的に割込み信号を割込みコントローラ 3に与えることになる。
[0020] 続いてステップ S2でタイマ 1からの割込み待ち状態となる力 ここでタイマ 1から割 込み信号が出力されたとき、すなわち割込みが上がった場合には、 CPU6によって 割込み処理 1が実行されるように、プロセッサ 4の内部で図示しないメモリに保持され て 、る割込みテーブルの内容が設定される。 [0021] 図 6のメインルーチンのスタート時点から時間 Tが経過すると、タイマ 1がタイムアウト し、割込みをあげることによって、サブルーチンとしての図 7の割込み処理 1が開始さ れる。この割込み処理 1では、まずステップ S6でタイマ 1のタイムアウト時間がメインル 一チンスタート時点の Τではなく 2Τに設定され、タイマ 1に対してもリロード機能ありの 設定が行われる。さらに次の割込みの時点で、前回どちらのタイマ力 割込みがあが つて 、たかを識別するためのフラグとしての、プリ一ピアス ·タイマ ·フラグを格納する フラグレジスタ力 例えばタイマ 1、タイマ 2と割込みコントローラ 3とによって構成され るシステム監視装置内に用意され、この時点で割り込みをあげたタイマ 1の識別子と しての" 0"がそのフラグとして、プロセッサ 4内の CPU6によって、ノ ス 5を介してフラ グレジスタにセットされる。
[0022] 続いてステップ S7で前述の割込みテーブルの内容力 割込みに対応して割込み 処理 2を実行するように変更され、タイマ割込みに対して本来実行すべき予め定めら れた作業を行うための処理が起動され、メインルーチンへのリターンが行われる。以 上の処理によって、タイマ 1とタイマ 2は共通で同一の時間間隔 2Τ毎に、かつその時 間間隔の半分、すなわち時間 Τだけ互いにずれた時点で、割込み信号を割込みコン トローラ 3に出力することになる。
[0023] 続いて図 6のステップ S3でタイマ 1、またはタイマ 2からの割込み待ちの状態となる。
2つのタイマが正常に動作している場合には、タイマ 2がさらに時間 Τの後にタイムァ ゥトし、割込みをあげることによって、割込み処理 2が実行される。
[0024] 図 8は、サブルーチンとしての割込み処理 2のフローチャートである。割込み処理 2 力 Sスタートすると、まずステップ S 10で割込みをあげたタイマの識別子 (タイマ ID)が チェックされ、ステップ S 11でそのタイマ IDとプリ一ピアス ·タイマ ·フラグの値が一致 するか否かが判定される。
[0025] タイマの動作が正常であれば、ここではタイマ IDの値はタイマ 2の IDとしての" 1"で あり、プリ一ピアス 'タイマ'フラグの値は" 0"であるために、これらの値は一致せず、ス テツプ S 12でプリ一ピアス 'タイマ'フラグの値が反転、すなわち" 1"とされ、最後にタ イマ割込みに対応して本来実行すべき作業に必要な処理が起動されて、メインルー チンへのリターンが行われる。 [0026] タイマが正常動作を続けている間は、さらに時間 Tの後にタイマ 1がタイムアウトし、 同様の割込み処理 2が繰り返されることになる。タイマの故障として、例えばタイマ 1が 故障して割込みをあげなくなった場合には、タイマ 2から連続して割込みがあがるよう になる。あるいはタイマ 1が設定された時間より短い時間でタイムアウトを起こしてしま うようになった場合には短くなつた度合いにもよる力 ある程度時間が経過するとタイ マ 1から連続して割込みがあがるようになる。
[0027] このようにタイマの故障によって、どちらかのタイマ力も連続して割込みがあがるよう になると、図 8のステップ S11でタイマ IDとプリ一ピアス 'タイマ'フラグとの値が一致す ると判定され、ステップ S 13でシステムの停止が指示される。 れば、故障したタイマを切り離し、故障していないタイマを用いてシステム動作を継続 することもできるが、前述のように故障の仕方によって、故障した方のタイマ力 連続 して割込みがあがる場合と、故障して 、な 、タイマ力 連続して割込みがあがる場合 との両方のケースが存在するために、この第 1の実施例では故障タイマの識別を行う ことができず、どちらかのタイマが故障した時点でシステム停止が行われる。
[0029] この第 1の実施例では、機能的には従来例と同等のシステム監視機能を実現する ことができる。従来例では 1回のタイマ割込み処理に対応して、タイマに対して少なく とも 2回のタイムアウト時間の設定を毎回行うことが必要であった力 第 1の実施例で はタイマのリロード機能を利用することによって、タイムアウト時間設定の回数を大幅 に削減することができ、システム監視装置におけるタイムアウト時間設定のオーバへ ッドを格段に少なくすることが可能となる。
[0030] 図 5の実施例ではリロード機能を持つ一般的なタイマを 2個使うために、タイマ 1に 対して最初にタイムアウト時間として Tを設定し、次に 2Tを設定する処理が必要とな る。処理をさらに簡略ィ匕するために図 9、または図 10の高信頼タイマを使用すること によって、例えばシステムの起動時に CPU6から 2つのタイマ 1、タイマ 2に 1つのコマ ンドを与えるだけで 2つのタイマに対するタイムアウト時間の設定を 1回で行うことが可 能となる。
[0031] 図 9は、高信頼タイマの第 1の構成例のブロック図である。同図において高信頼タイ マ 10は 2つのタイマ 11と 12とによって構成され、図 5の CPU6からはバス 5を介して 同一のコマンドが 2つのタイマに対して与えられる。割込み信号がタイマ 11とタイマ 1 2とからそれぞれ割込みコントローラ 3に与えられる点は図 5と同じである。
[0032] 2つのタイマ 11、 12のうちで、タイマ 12はリロード機能を持つ一般的なタイマと同一 の構成を持っている。すなわちタイマ 12に対して CPU6からタイムアウト時間として 2 Tを設定するためのコマンドが与えられると、その値 2Tがリロード用レジスタ 15に格 納されると共に、例えばセレクタを介してカウンタ 16に対して設定される。カウンタ 16 がダウンカウンタであるとすると、カウントダウンしてカウント時間が 2Tに達し、カウント 値が" 0"となった時点で、 0検出回路 17から割込み信号が割込みコントローラ 3に対 して出力されることになる。そしてこの 0検出の時点で、 0検出回路 17からカウンタ 16 の図示しな!、セット端子に対してセット信号が与えられ、リロード用レジスタ 15の格納 内容がカウンタ 16にセットされ、カウントダウンの動作が続行される。
[0033] これに対してタイマ 11は、本発明に特有の構成として、さらに右 1ビットシフト回路 1 8を備えている。このタイマ 11においては、バス 5を介して CPU6から時間 2Tを設定 するコマンドが与えられると、右 1ビットシフト回路 18によってその値を 2で割る演算が 実行され、実行結果の時間 Tの値が、例えばセレクタを介してカウンタ 16に設定され 、カウンタ 16のカウント時間が Tに達し、カウント値が" 0"となると、 0検出回路 17から 割込み信号が割込みコントローラ 3に与えられる。またコマンドの入力時点でリロード 用レジスタ 15には時間 2Tの値が格納される。そして 0検出回路 17からカウンタ 16に 対してセット信号が与えられた時点で、セレクタを介してリロード用レジスタ 15に格納 されている時間 2Tの値がカウンタ 16に設定され、カウンタ 16のカウントダウンの動作 が行われることになる。
[0034] 図 10は、高信頼タイマの第 2の例の構成ブロック図である。同図において高信頼タ イマ 20は 2つのタイマ 21と 22によって構成されている。これらの 2つのタイマはいず れも従来力も使用されている一般的なものではなぐそれぞれ左 1ビットシフト回路 25 を備え、本発明に特有の構成を持っている。
[0035] 図 10の高信頼タイマ 20に対しては、図 5の CPU6から時間 Tをタイムアウト時間とし て設定することを指示するコマンドが与えられる。タイマ 21側ではその時間 Tの値が カウンタ 16に設定されると共に、 2を乗算する演算を行う左 1ビットシフト回路 25によ つて 2倍された値 2Tがリロード用レジスタ 15に格納される。そしてカウンタ 16のカウン ト値が" 0"になった時点で、前述と同様にリロード用レジスタ 15の内容がカウンタ 16 にセットされることになる。
[0036] タイマ 22側では、 CPU6からのコマンドの入力時点で左 1ビットシフト回路 25によつ て 2Tの値が得られ、その値がそのままカウンタ 16に設定され、同時にリロード用レジ スタ 15にも 2Tの値が格納される。カウンタ 16がカウントダウンし、 0検出回路 17によ つてカウント値としての" 0"が検出されると、リロード用レジスタ 15に格納されている内 容がカウンタ 16にセットされ、カウントダウンの動作が続行される。
[0037] 以上に説明した第 1の実施例では、 2つのタイマのうち故障したタイマの識別を行う ことができな 、ため、タイマの故障が検出された時点でシステムの動作が停止される 。これに対して、 2つのタイマのうちで故障したタイマの識別を可能とし、一方のタイマ が故障しても、他方のタイマの機能を利用してシステムの動作を続行することが可能 な実施例を第 2の実施例として説明する。なお、第 1の実施例においてフラグレジスタ はシステム監視装置内に備えられるものとした力 図 5のプロセッサ 4内にフラグレジ スタを備えることも当然可能である。
[0038] 図 11は、第 2の実施例の構成ブロック図である。同図を第 1の実施例を示す図 5と 比較すると、システム全体としての統一的な時刻を示すシステム時計 30がバス 5にさ らに接続されている点が異なっている。そしてこの第 2の実施例では、プロセッサ 4の 内部の CPU6が、実施例 1におけるタイマ IDとプリ一ピアス'タイマ ·フラグの値との比 較に加えて、割込み制御信号が割込みコントローラ 3から与えられた時刻と、例えば システム監視装置内で図示しな 、メモリに格納されて 、る前回の割込み制御信号の 入力時刻 (Tprev)の値を比較することによって、 2つのタイマのうちでどちらのタイマ が故障したかを判別する処理を行うことになる。
[0039] 第 2の実施例におけるタイマ故障検出処理のメインルーチンのフローチャートは第 1 の実施例に対する図 6と同じであり、その説明を省略する。
図 12は、第 2の実施例における割込み処理 1のフローチャートである。同図の処理 は、第 1の実施例における図 6のステップ S2と同様に、タイマ 1からの割込みがあがつ た時点で開始される処理であり、まずステップ S16で図 7のステップ S6と同様にタイ マ 1のタイムアウト時間が 2Tに設定され、またリロード機能ありの状態が設定され、プ リ一ピアス ·タイマ ·フラグの値がタイマ 1の識別子を示す" 0"に設定された後に、ステ ップ S17で図 7のステップ S7における処理に加えて、システム時計の示す現在時刻 の値 Tnowがリードされ、その値が Tprevの値を格納する、図示しないメモリに格納さ れて、メインルーチンへのリターンが行われる。
[0040] 図 13は、第 2の実施例における割込み処理 2のフローチャートである。メインルーチ ンとしての図 6のステップ S3でタイマ 1、またはタイマ 2からの割込みがあがると、ステ ップ S 20で割込みをあげたタイマの識別子 (タイマ ID)がチェックされ、また図 11のシ ステム時計 30の指示する時刻の値 (Tnow)カ^ードされ、ステップ S21でタイマ IDと プリ一ピアス ·タイマ ·フラグの値が一致する力否かが判定される。
[0041] 両者の値が一致しない場合にはタイマの動作は正常なものであると判定され、ステ ップ S 22でプリ一ピアス ·タイマ ·フラグの値が反転され、ステップ S 23で Tprevの値を 格納するメモリに Tnowの値が代入され、タイマ割込みに対して実行すべき本来の作 業に必要な処理が起動されて、メインルーチンへのリターンが行われる。 2つのタイマ が正常に動作している間は、割込み処理 2としてステップ S20からステップ S23まで の処理が繰り返される。
[0042] タイマ 1、タイマ 2のいずれかに故障が発生すると、前述のように同一のタイマ力 連 続して割込みがあがることになる。同一のタイマ力も割込みがあがった場合には、ス テツプ S 21でタイマ IDの値とプリ一ピアス ·タイマ ·フラグの値が一致すると判定され、 ステップ S24で現在の時刻 Tnowと Tprevの値を格納するメモリの値との差が Tdiffと して計算され、ステップ S25でその値が 2つのタイマの定常的な割込み周期 2T程度 に一致するか否かが判定される。実際にはある程度の誤差があると考えられるので、 例えば士 10%程度の範囲であれば Tdiffと 2Tとが一致したものと判定され、ステップ S26で割込みを上げな力つた側のタイマが故障したものとしてそのタイマが切り離さ れ、割込みをあげた方のタイマのタイムアウト時間が Tに再設定され、リロード機能あ りの状態とされる。そして Tprevを格納するメモリに Tnowの値が代入され、タイマ割 込みに対する本来の作業に必要な処理が起動されて、メインルーチンへのリターン が行われる。
[0043] ステップ S21でタイマ IDの値とプリ一ピアス ·タイマ ·フラグの値が一致したと判定さ れた以後のステップ S25の判定において、 Tdiffの値が 2Tに一致しないと判定され ると、ステップ S27で Tdiffの値が T程度であるか否かが ± 10%の誤差の範囲で判定 され、両者が一致していると判定されると、以前にステップ S26でタイムアウト時間が Tに再設定された、切り離されて 、な 、方のタイマが正常に動作して 、るものとして、 ステップ S23で Tprevを格納するメモリに Tnowの値が代入され、タイマ割込みに対 応する本来の作業に必要な処理が起動されて、メインルーチンへのリターンが行わ れる。
[0044] タイマが設定タイムアウト時間よりも短い時間で割込みをあげるような壊れ方をする と、 Tdiffが、例えば 2Tにも、また Tにも一致しない値となる。例えばメインルーチンの 図 6のステップ S2でタイマ 1からの割込みがあがり、図 12の割込み処理 1が終了して メインルーチンのステップ S3で、タイマ 2からの割込みがあがる前にタイマ 1からの割 込みがあがったとすると、図 10のステップ S21でタイマ IDとプリ一ピアス'タイマ ·フラ グの値が一致すると判定される力 Tdiffの値が 2Tにも、また Tにも一致しないものと すると、ステップ S28の処理に移行し、割込みをあげなかった方のタイマ、ここではタ イマ 2が稼働中であるカゝ否かが判定され、稼働中である場合には、ステップ S29で割 込みをあげた側のタイマ、すなわちタイマ 1が切り離されて、メインルーチンへのリタ一 ンが行われる。この時、割込みをあげな力つた方のタイマ 2が稼働中でない場合には 、ステップ S30で両方のタイマが故障したものと判定され、システム停止の指示が行 われる。
[0045] ステップ S29でタイマ 1が切り離され、タイマ 2が稼働中である状態で再びメインルー チンの図 6のステップ S3でタイマ 2からの割込みがあがると、ステップ S21においてタ イマ IDはタイマ 2の識別子であり、プリ一ピアス ·タイマ ·フラグの値はタイマ 1の識別 子のままとなっているために、両者は一致しないと判定され、ステップ S22でプリービ ァス ·タイマ ·フラグの値が反転され、ステップ S 23で Tprevを格納するメモリに Tnow が格納され、タイマ割込みに対する本来の作業に必要な処理が起動され、メインル 一チンへのリターンが行われる。 [0046] すでにタイマ 1が切り離されているために、メインルーチンの図 6のステップ S3で検 出される次の割込みはタイマ 2からの割込みである。この割込みがあがると、ステップ S21でタイマ IDとプリ一ピアス 'タイマ'フラグとの値が一致していると判定され、ステツ プ S24で求められる Tdiffの値がステップ S25で 2T程度であると判定され、ステップ S 26の処理の後にメインルーチンへのリターンが行われる。ただしここでは割込みを あげなかった側のタイマ、すなわちタイマ 1はすでに切り離されているので、タイマ切 り離しの処理は省略され、その他の処理が行われた後にメインルーチンへのリターン が行われる。
[0047] 以上説明したように、この第 2の実施例ではシステム全体で統一的な時刻を示すシ ステム時計を活用することによって、 2つのタイマのうちどちらが故障したかの判別が 可能となり、 1つのタイマが故障してもシステム動作を継続することが可能となる。ただ し 1つのタイマによる監視機能を用いてシステム動作を継続している場合には、例え ば残ったタイマが故障して割込みをあげなくなってもそれを検出できず、故障検出機 能が十分に働かないために、 1つのタイマを用いての動作は、例えばシステムの停止 が困難であるときの緊急避難的な処置である。基本的には片方のタイマの故障検出 時に、例えばアラームを発生することによってシステムの管理者に注意を促し、システ ムを停止できるタイミングになったらシステムの動作を停止し、故障したタイマを含む 基板の交換などの修理を行うことが必要である。
[0048] また第 2の実施例では、システム内の時刻を統一的に示すシステム時計を利用して タイマ故障の判別を行った力 必ずしもシステム時計を使う必要はなぐ同様のカウン タなどがシステムに搭載されていれば、それを使うことも当然可能である。さらにシス テム時計の示す時刻を格納するメモリを、システム監視装置内でなぐ図 11のプロセ ッサ 4の内部に備えることも当然可能である。
[0049] 次に第 3の実施例について説明する。この第 3の実施例は、本発明のシステム監視 方式を高信頼組込みマルチプロセッサシステムに適用したものである。図 14は、第 3 の実施例の構成ブロック図である。同図においては複数、ここでは 4個のプロセッサ' エレメント(PE) 4力も 4、および共有メモリ 35がマルチプロセッサシステムを構成し
0 3
ており、各プロセッサ 'エレメント 4力 4に対して、図 5の第 1の実施例におけると同 様に割込みコントローラ 3が接続される構成となっている。
[0050] この第 3の実施例では、マルチプロセッサシステムとしての信頼性を向上させるため に、 4つのプロセッサ ·エレメント(PE) 4力 4力 ある決められた時間毎に共有メモ
0 3
リ 35内の所定のデータ、すなわち生存情報を更新するものとする。各 PEはタイマか らの割込みに対応して起動されるチェックルーチンによって、共有メモリ 35に書き込 まれた各 PEの生存情報をチェックし、更新されて!、な 、ものがあれば PEは故障して いるものと判断する。
[0051] 共有メモリ 35に書き込まれる生存情報は、タイマ力 の割込みがある毎に更新され るものであればどのようなデータでもよぐ各 PEに内蔵されるローカルなタイマの値を 使うことも可能である。第 3の実施例でタイマを二重化していない場合には、タイマが 故障してしまうと各 PEの内部でチヱックルーチンが起動されず、 PEの故障を検出す ることができなくなる。
[0052] この第 3の実施例では複数個、ここでは 4個の PEの中でマスタとなる PEを決めてお き、マスタ PEが故障した PEを切り離すことによって、システムの信頼性を確保するも のとする。マスタ PEの決め方はどのような方法を用いてもよぐ例えば識別子 (ID)が 最も小さ 、PEがマスタとなると 、うルールを用いることもできる。マスタ PEが故障する 場合もあるため、例えばマスタ PEの次に IDが小さい PEが次のマスタ候補になるとい う規則を決めておき、マスタ PEが故障した場合には次のマスタ候補の PEがマスタ P Eを切り離し、以後マスタ PEとして動作するものとする。
[0053] 第 3の実施例におけるタイマ故障検出処理のメインルーチン、および割込み処理 1 のフローチャートは第 1の実施例に対する図 6、図 7と同じであるものとする。ただしこ こでは図 14の PE4力 4のそれぞれが、図 6のメインルーチン、図 7の割込み処理 1
0 3
、および図 15で説明する割込み処理 2を基本的に実行するものとし、前述のように、 例えば故障 PEの切り離しやシステム全体の緊急停止指示などに必要な処理は、マ スタ PEだけが行うものとする。メインルーチン、割込み処理 1、割込み処理 2のすベて をマスタ PEだけが実行することも可能である力 マスタ PEが故障した場合の処理の 引継ぎなどが面倒になるため、ここではメインルーチンを含む処理の大部分が各 PE によって並列的に実行されるものとして、フローチャートを説明する。 [0054] 図 15は、第 3の実施例における割込み処理 2のフローチャートである。メインルーチ ン、すなわち図 6のステップ S3でタイマ 1、またはタイマ 2からの割込みがあがると、割 込み処理 2がスタートし、まずステップ S35で割込みをあげたタイマの IDがチェックさ れ、ステップ S36で自 PEの生存情報を含めて、すべての PEの生存情報 (各 PE個別 の共有メモリの値)がチェックされ、ステップ S37で故障と判定された PEの数が" 0"、 " 1"、またはそれ以上のいずれであるかが判定される。
[0055] 故障した PEの数が" 0"である場合には当然マスタ PEも正常であり、各 PEはステツ プ S38で自分がマスタ PEであるか否かを判定し、マスタ PEでな!/、場合にはメインル 一チンへのリターン動作を実行する。そしてマスタ PEだけがステップ S39以降の処 理を実行する。
[0056] すなわちマスタ PEによってステップ S39で、ステップ S35でチェックされたタイマ ID とプリ一ピアス ·タイマ ·フラグの値が一致するか否かが判定され、一致しな 、場合に はタイマの動作が正常であるため、ステップ S40でプリ一ピアス ·タイマ ·フラグの値が 反転されて、メインルーチンへのリターンが行われる。
[0057] ステップ S39でタイマ IDとプリ一ピアス 'タイマ'フラグの値が一致する場合には、ス テツプ S41力ら S47で、第 2の実施例に対する図 13のステップ S24から S30までに類 似した処理が行われる。すなわち第 2の実施例でシステム時計の示す時刻を用いて Tdiffが計算されたのに対して (もちろん本実施例でもシステム時計の値を用いても 構わない)、第 3の実施例ではステップ S41で共有メモリに格納された生存情報から Tdiffの値が計算され、ステップ S42でその値が ± 10%以内の誤差を含んで 2T程 度であるか否かが判定され、 2T程度であれば、ステップ S43で割込みをあげなかつ た側のタイマが切り離され、割込みを上げたほうのタイマのタイムアウト時間が Tに再 設定された後に、ステップ S40でプリ一ピアス 'タイマ'フラグの値が反転されて、メイ ンルーチンへのリターンが行われる。
[0058] Tdiffの値が 2T程度でな!、場合には、ステップ S44でその値が T程度であるか否か が判定され、 T程度である場合にはすでに 1つのタイマが切り離され、残りのタイマに よって動作が継続されているものと判定されて、メインルーチンへのリターンが行われ る。 T程度でない場合には、ステップ S45で割込みをあげな力つたほうのタイマが稼 働中であるか否かが判定され、稼働中である場合にはステップ S46で割込みをあげ た側のタイマが切り離されて、メインルーチンへのリターンが行われる。割込みをあげ な力つた方のタイマが稼働中でない場合には、 2つのタイマがともに故障したことにな るため、ステップ S47でシステムの緊急停止指示が行われる。
[0059] ステップ S37で故障と判定された PEの数が 1個である場合には、ステップ S50で故 障した PEがマスタ PEであるか否かが判定され、マスタ PEでな!/、場合にはステップ S 51で自分がマスタ PEであるか否かが判定され、マスタ PEでない場合にはメインルー チンへのリターンが行われる。
[0060] ステップ S50でマスタ PEが故障したと判定されると、ステップ S52で自分が次のマ スタ PEの候補であるカゝ否かが判定され、その候補でな!、場合にはメインルーチンへ のリターンが行われ、その候補である場合、およびステップ S51で自分がマスタ PEで あると判定された場合には、ステップ S53でマスタ PE (あるいは新しいマスタ PE)によ つて故障 PEが切り離され、ステップ S40でプリ一ピアス ·タイマ ·フラグの値が反転さ れて、メインルーチンへのリターンが行われる。
[0061] ここで故障と判定された PEの数が 1個の場合には、タイマ IDとプリ一ピアス 'タイマ. フラグの値の比較などのタイマ故障検出のための処理は実行されないものとする。す なわち、例えば lms程度の短 、時間間隔で PEの故障判定を繰り返すものとすれば 、その短い時間間隔の間に PEとタイマとが共に故障する確率は非常に小さいものと 考えられるため、本実施例では故障と判定された PEの数が 1個だけの場合には、タ イマの故障検出に必要な処理を行わないものとする。
[0062] ステップ S37で故障と判定された PEの数が 2個以上の場合には、ステップ S60でタ イマ IDとプリ一ピアス ·タイマ ·フラグの値とが比較され、一致して ヽる場合にはタイマ が故障して所定の周期より短い時間で連続して割込みをあげ、各 PEの生存情報が 更新されなかったものと判断する。そしてステップ S61で自分がマスタ PEであるカゝ否 かが判定され、マスタ PEでない場合にはメインルーチンへのリターンが行われる。マ スタ PEである場合には、ステップ S62で割込みをあげなかった方のタイマが稼働中 であるか否かが判定され、稼働中でない場合には両方のタイマが故障したことになる のでステップ S63でシステムに対して緊急停止が指示される。稼働中である場合には 、ステップ S64で割込みをあげたタイマが切り離され、割込みをあげな力つた方のタイ マのタイムアウト時間が Tに再設定され、ステップ S40でプリ一ピアス 'タイマ'フラグの 値が反転された後に、メインルーチンへのリターンが行われる。
[0063] ステップ S60でタイマ IDとプリ一ピアス ·タイマ ·フラグの値が一致しな!、と判定され ると、本当に複数の PEが同時に故障したと判断し、以下のステップで緊急停止処理 を行う。すなわちステップ S65で自分が故障していない正常の PEで、かつ正常 PEの 中で最も IDが小さい PEかが判定され、この 2つの条件を満たす場合にはステップ S6 3で緊急停止の指示が行われる。これは図 14で 4個の PEのうち 2個が故障した状態 に対して緊急停止が指示されるものである。
[0064] ステップ S65の条件が成立しな 、場合、例えば自分が故障 PEである場合には、ス テツプ S66ですベての PEが故障し、かつ自分がマスタ PEであるか否かが判定され、 例えば自分がマスタ PEでない場合にはメインルーチンへのリターンが行われる。す ベての PEが故障している場合にはリターン後の処理内容が明確ではないが、ここで はステップ S66の条件が成立しない場合にはメインルーチンへのリターンが行われる ものとする。ステップ S66の条件が成立する場合には、ステップ S63でシステムに対 する緊急停止指示が行われる。ここでは単一の PEのみが緊急停止処理を指示した 力 緊急時であるので全 PEが緊急停止処理を指示してもよ 、。
[0065] このように第 3の実施例では、タイマからの割込みに対応してマルチプロセッサシス テムを構成する各プロセッサ 'エレメントの故障検出を行うシステムにおいてタイマを 二重化することによって、システムの信頼性を上げることが可能となる。

Claims

請求の範囲
[1] タイマ力も割込み信号を出力し、監視対象システム内のプロセッサに予め定められた 処理を実行させるシステム監視装置であって、
共通の時間間隔毎に、該時間間隔が互いに半分ずれた時点で割込み信号を出力 する動作を、タイムアウト時間のリロード機能を用いて繰り返す 2つのタイマを備え、 前記プロセッサが、該 2つのタイマのうちのいずれかのタイマからの割込み信号の 入力が繰り返される毎に、該 2つのタイマの故障の有無を判定することを特徴とする 二重化タイマを用いたシステム監視装置。
[2] 前記システム監視装置が、前記 2つのタイマのうちのいずれかのタイマ力 の割込み 信号の入力に対応して、該割込み信号を出力したタイマの識別子を示すフラグを格 納するフラグレジスタをさらに備え、
前記プロセッサが、タイマからの次の割込み信号の入力に対応して、該次の割込み 信号を出力したタイマの識別子と該フラグレジスタの格納内容とを比較して、タイマ故 障の有無を判定することを特徴とする請求項 1記載の二重化タイマを用いたシステム 監視装置。
[3] 前記 2つのタイマが、ともに前記タイムアウト時間を格納するリロード用レジスタを備え るとともに、
一方のタイマが、さらに右 1ビットシフト回路を備え、
前記システムの起動時にプロセッサ力 送られる前記共通で同一の時間間隔の値 のタイムアウト時間の設定を要求するコマンドに対応して、該一方のタイマ内のカウン タに、該右 1ビットシフト回路を介して該時間間隔の半分の値がカウントアウト時間とし て設定されることを特徴とする請求項 1記載の二重化タイマを用いたシステム監視装 置。
[4] 前記 2つのタイマが、ともに前記タイムアウト時間を格納するリロード用レジスタを備え るとともに、
一方のタイマ力 前記プロセッサからのバスと該一方のタイマ内のカウンタとの間の 2つの経路のうちで、該リロード用レジスタを介する経路上で、該バスとリロード用レジ スタとの間に左 1ビットシフト回路を備え、 他方のタイマが前記プロセッサからのバスと該他方のタイマ内のカウンタとの間で、 前記リロード用レジスタを介する経路と、介しない経路との 2つの経路の接続点と前記 バスの間に接続される左 1ビットシフト回路をさらに備え、
前記システムの起動時にプロセッサ力 送られる、前記タイムアウト時間として前記 時間間隔の半分の値を設定することを要求するコマンドに対応して、前記一方のタイ マ内のカウンタに、前記リロード用レジスタを介しない経路によってカウントアウト時間 の設定が行われることを特徴とする請求項 1記載の二重化タイマを用いたシステム監 視装置。
[5] 前記システム監視装置が、前記 2つのタイマのうちのいずれかのタイマ力 の割込み 信号の入力に対応して、前記システム内に備えられて ヽるシステム時計の示す時刻 が格納されるメモリをさらに備え、
前記プロセッサが、前記タイマ識別子の比較結果と、前記次の割込み信号の入力 時のシステム時計の示す時刻と前記メモリに格納されて!、る前回の割込み信号入力 時刻との時間差とに基づいて、二重化されたタイマのうちの故障タイマの識別を行う ことを特徴とする請求項 2記載の二重化タイマを用いたシステム監視装置。
[6] 前記プロセッサが、前記 2つのタイマのうちで故障と判定された一方のタイマを切り離 し、他方のタイマ力ゝらの割込み信号を用いて、前記監視対象システムの動作を継続さ せることを特徴とする請求項 5記載の二重化タイマを用いたシステム監視装置。
[7] タイマ力も割込み信号を出力し、監視対象システム内のプロセッサに予め定められた 処理を実行させるシステム監視方法であって、
2つのタイマ力 共通の時間間隔毎に、該時間間隔が互いに半分ずれた時点で割 込み信号を出力する動作を、タイムアウト時間のリロード機能を用いて繰り返し、 前記プロセッサが、該 2つのタイマのうちのいずれかのタイマからの割込み信号の 入力が繰り返される毎に、該 2つのタイマの故障の有無を判定することを特徴とする 二重化タイマを用いたシステム監視方法。
[8] 前記システムの起動時に前記プロセッサ力 タイマに対するタイムアウト時間として、 前記 2つのタイマのうちの一方に前記共通で同一の時間間隔の半分の値を前記リロ ード機能を無効として設定し、他方のタイマに該同一の時間間隔の値をリロード機能 を有効として設定し、
該一方のタイマが最初の割込み信号を出力した時点で、該一方のタイマのタイムァ ゥト時間を前記同一の時間間隔の値に、前記リロード機能を有効として再設定するこ とを特徴とする請求項 7記載の二重化タイマを用いたシステム監視方法。
[9] 前記 2つのタイマのうちの 、ずれかのタイマ力 の割込み信号の入力に対応して、該 割込み信号を出力したタイマの識別子を示すフラグをフラグレジスタに格納し、 前記プロセッサが、タイマからの次の割込み信号の入力に対応して、該次の割込み 信号を出力したタイマの識別子と該フラグレジスタの格納内容とを比較して、タイマ故 障の有無を判定することを特徴とする請求項 7記載の二重化タイマを用いたシステム 監視方法。
[10] 前記 2つのタイマのうちのいずれかのタイマ力もの割込み信号の入力に対応して、前 記システム内に備えられて ヽるシステム時計の示す時刻をメモリに格納し、
前記プロセッサが、前記タイマ識別子の比較結果と、前記次の割込み信号の入力 時のシステム時計の示す時刻と前記メモリに格納されて!、る前回の割込み信号入力 時刻との時間差とに基づいて、二重化されたタイマのうちの故障タイマの識別を行う ことを特徴とする請求項 9記載の二重化タイマを用いたシステム監視方法。
[11] 前記プロセッサが、前記 2つのタイマのうちで故障と判定された一方のタイマを切り離 し、他方のタイマ力ゝらの割込み信号を用いて、前記監視対象システムの動作を継続さ せることを特徴とする請求項 10記載の二重化タイマを用いたシステム監視方法。
[12] タイマ力も割込み信号を出力し、監視対象マルチプロセッサシステム内の各プロセッ サに予め定められた処理を実行させるシステム監視装置であって、
共通で同一の時間間隔毎に、かつ該時間間隔の半分だけ互!、にずれた時点で割 込み信号を出力する動作を、タイムアウト時間のリロード機能を用いて繰り返す 2つの タイマを備え、
該マルチプロセッサシステム内の少なくとも 1台のプロセッサが、該 2つのタイマのう ちのいずれかのタイマからの割込み信号の入力が繰り返される毎に、該 2つのタイマ の故障の有無を判定することを特徴とする二重化タイマを用いたシステム監視装置。
[13] 前記マルチプロセッサシステムの起動時に前記少なくとも 1台のプロセッサ力 タイマ に対するタイムアウト時間として、前記 2つのタイマのうちの一方に前記共通で同一の 時間間隔の半分の値を前記リロード機能を無効として設定し、他方のタイマに該同一 の時間間隔の値をリロード機能を有効として設定し、
該一方のタイマが最初の割込み信号を出力した時点で、該一方のタイマのタイムァ ゥト時間を前記同一の時間間隔の値に、前記リロード機能を有効として再設定するこ とを特徴とする請求項 12記載の二重化タイマを用いたシステム監視装置。
[14] 前記システム監視装置が、前記 2つのタイマのうちのいずれかのタイマ力 の割込み 信号の入力に対応して、該割込み信号を出力したタイマの識別子を示すフラグを格 納するフラグレジスタをさらに備え、
前記少なくとも 1台のプロセッサが、タイマからの次の割込み信号の入力に対応して 、該次の割込み信号を出力したタイマの識別子と該フラグレジスタの格納内容とを比 較して、タイマ故障の有無を判定することを特徴とする請求項 12記載の二重化タイマ を用いたシステム監視装置。
[15] 前記マルチプロセッサシステムが、前記複数のプロセッサに対して前記 2つのタイマ のうちのいずれかのタイマ力 割込み信号が入力された時、該複数のプロセッサから それぞれ出力される現在時刻の値が格納される共有メモリをさらに備え、
前記少なくとも 1台のプロセッサが、前記タイマの識別子の比較結果と、該共有メモ リの格納内容とに基づいて、二重化されたタイマのうちの故障タイマの識別を行うこと を特徴とする請求項 12記載の二重化タイマを用いたシステム監視装置。
[16] 前記少なくとも 1台のプロセッサ力 前記 2つのタイマのうちで故障と判定された一方 のタイマを切り離し、他方のタイマからの割込み信号を用いて、前記監視対象システ ムの動作を継続させることを特徴とする請求項 15記載の二重化タイマを用いたシス テム監視装置。
PCT/JP2006/325085 2006-12-15 2006-12-15 二重化タイマを用いたシステム監視装置、および監視方法 WO2008072350A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008549181A JP4983806B2 (ja) 2006-12-15 2006-12-15 二重化タイマを用いたシステム監視装置、および監視方法
PCT/JP2006/325085 WO2008072350A1 (ja) 2006-12-15 2006-12-15 二重化タイマを用いたシステム監視装置、および監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2006/325085 WO2008072350A1 (ja) 2006-12-15 2006-12-15 二重化タイマを用いたシステム監視装置、および監視方法

Publications (1)

Publication Number Publication Date
WO2008072350A1 true WO2008072350A1 (ja) 2008-06-19

Family

ID=39511382

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2006/325085 WO2008072350A1 (ja) 2006-12-15 2006-12-15 二重化タイマを用いたシステム監視装置、および監視方法

Country Status (2)

Country Link
JP (1) JP4983806B2 (ja)
WO (1) WO2008072350A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116982031A (zh) * 2021-03-17 2023-10-31 高通股份有限公司 使用独立冗余定时器的片上系统定时器故障检测和恢复

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6059447A (ja) * 1983-09-09 1985-04-05 Nippon Signal Co Ltd:The マイクロコンピユ−タシステム
JPH01209516A (ja) * 1988-02-17 1989-08-23 Hitachi Ltd タイマの動作監視方式
JPH02304636A (ja) * 1989-05-19 1990-12-18 Mitsubishi Electric Corp ウォッチドッグタイマ回路
JPH04205243A (ja) * 1990-11-30 1992-07-27 Nec Corp タイマー制御方法
JPH0566812A (ja) * 1991-09-05 1993-03-19 Yaskawa Electric Corp プログラマブルコントローラの二重化ウオツチドツグタイマ
JPH1166031A (ja) * 1997-08-11 1999-03-09 Mitsubishi Electric Corp マイクロコンピュータの内蔵タイマ
JPH1165986A (ja) * 1997-08-27 1999-03-09 Nec Corp タイマの障害検出システム及び検出方法並びに検出方法を実行するためのプログラムを記録した記録媒体
JP2003131906A (ja) * 2001-10-24 2003-05-09 Mitsubishi Electric Corp Cpuの暴走監視制御回路

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04182842A (ja) * 1990-11-19 1992-06-30 Fujitsu Ltd タイマ監視方式

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6059447A (ja) * 1983-09-09 1985-04-05 Nippon Signal Co Ltd:The マイクロコンピユ−タシステム
JPH01209516A (ja) * 1988-02-17 1989-08-23 Hitachi Ltd タイマの動作監視方式
JPH02304636A (ja) * 1989-05-19 1990-12-18 Mitsubishi Electric Corp ウォッチドッグタイマ回路
JPH04205243A (ja) * 1990-11-30 1992-07-27 Nec Corp タイマー制御方法
JPH0566812A (ja) * 1991-09-05 1993-03-19 Yaskawa Electric Corp プログラマブルコントローラの二重化ウオツチドツグタイマ
JPH1166031A (ja) * 1997-08-11 1999-03-09 Mitsubishi Electric Corp マイクロコンピュータの内蔵タイマ
JPH1165986A (ja) * 1997-08-27 1999-03-09 Nec Corp タイマの障害検出システム及び検出方法並びに検出方法を実行するためのプログラムを記録した記録媒体
JP2003131906A (ja) * 2001-10-24 2003-05-09 Mitsubishi Electric Corp Cpuの暴走監視制御回路

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116982031A (zh) * 2021-03-17 2023-10-31 高通股份有限公司 使用独立冗余定时器的片上系统定时器故障检测和恢复

Also Published As

Publication number Publication date
JP4983806B2 (ja) 2012-07-25
JPWO2008072350A1 (ja) 2010-03-25

Similar Documents

Publication Publication Date Title
JP4330547B2 (ja) 情報処理システムの制御方法、情報処理システム、情報処理システムの制御プログラム、冗長構成制御装置
JP4655718B2 (ja) コンピュータシステム及びその制御方法
US5742851A (en) Information processing system having function to detect fault in external bus
US10360115B2 (en) Monitoring device, fault-tolerant system, and control method
JP2006178659A (ja) フォールト・トレラント・コンピュータシステムと、そのための割り込み制御方法
JP2001034495A (ja) 二重化システム
JP5332257B2 (ja) サーバシステム、サーバ管理方法、およびそのプログラム
WO2008072350A1 (ja) 二重化タイマを用いたシステム監視装置、および監視方法
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JP6654662B2 (ja) サーバ装置およびサーバシステム
KR100194979B1 (ko) 이중화 프로세서 시스템의 동작모드 결정방법
JP2001175545A (ja) サーバシステムおよび障害診断方法ならびに記録媒体
CN113742165B (zh) 双主控设备及主备控制方法
JP2007026038A (ja) パス監視システム,パス監視方法,およびパス監視プログラム
JP4613019B2 (ja) コンピュータシステム
JPH1165986A (ja) タイマの障害検出システム及び検出方法並びに検出方法を実行するためのプログラムを記録した記録媒体
JPH03266131A (ja) 多重化システムの無応答判定方式
JP2006178688A (ja) 多重化装置及びレガシーデバイス多重化方法
JPS6116340A (ja) プロセツサシステムの緊急動作装置
JP2744113B2 (ja) 計算機システム
CN113742165A (zh) 双主控设备及主备控制方法
JPS6077252A (ja) 入出力制御装置
JP2007135023A (ja) 複数台構成サーバのマスタ切り替え方法およびプラントシステム
JPH1139032A (ja) マルチcpu型集中監視装置
JPH0474222A (ja) 計算機システム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 06834812

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2008549181

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06834812

Country of ref document: EP

Kind code of ref document: A1