WO2021234912A1 - 制御装置、制御方法、および制御プログラム - Google Patents

制御装置、制御方法、および制御プログラム Download PDF

Info

Publication number
WO2021234912A1
WO2021234912A1 PCT/JP2020/020122 JP2020020122W WO2021234912A1 WO 2021234912 A1 WO2021234912 A1 WO 2021234912A1 JP 2020020122 W JP2020020122 W JP 2020020122W WO 2021234912 A1 WO2021234912 A1 WO 2021234912A1
Authority
WO
WIPO (PCT)
Prior art keywords
execution
alarm
monitoring period
implementation process
failure
Prior art date
Application number
PCT/JP2020/020122
Other languages
English (en)
French (fr)
Inventor
愛子 尾居
亮介 佐藤
侑一 須藤
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to US17/923,728 priority Critical patent/US20230176561A1/en
Priority to PCT/JP2020/020122 priority patent/WO2021234912A1/ja
Priority to JP2022524806A priority patent/JP7360077B2/ja
Publication of WO2021234912A1 publication Critical patent/WO2021234912A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0286Modifications to the monitored process, e.g. stopping operation or adapting control
    • G05B23/0291Switching into safety or degraded mode, e.g. protection and supervision after failure
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0267Fault communication, e.g. human machine interface [HMI]
    • G05B23/027Alarm generation, e.g. communication protocol; Forms of alarm
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0275Fault isolation and identification, e.g. classify fault; estimate cause or root of failure
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance

Definitions

  • the present invention relates to a control device, a control method, and a control program.
  • Non-Patent Document 1 There is a technology to analyze alarm messages and integrate multiple alarms for accurate failure response (see Non-Patent Document 1).
  • the technique described in Non-Patent Document 1 suppresses the same alarm or a large number of alarms, and realizes execution of an action for the generated alarm.
  • Non-Patent Document 1 it is not possible to execute a detailed operation such as instructing the execution of a workflow according to the occurrence status of an alarm in the latest predetermined time. As a result, there is a problem that it is not possible to properly deal with a failure, such as executing one countermeasure multiple times.
  • the present invention has been made in view of the above circumstances, and an object of the present invention is to provide a technique capable of appropriately dealing with a failure.
  • the control device of one aspect of the present invention starts with the occurrence of an alarm indicating a failure or recovery in the control unit that controls the execution of the workflow including the handling execution process and the control unit. If the action implementation process can be executed before the monitoring period expires, an instruction is given to wait for the action implementation process to be executed. When the execution is instructed and the most recently generated alarm indicates recovery, an instruction unit for instructing the cancellation of the execution of the action implementation process is provided.
  • the control method of one aspect of the present invention starts when the computer generates an alarm indicating a failure, a step of controlling the execution of a workflow including a coping implementation step, and the computer triggering an alarm indicating a failure or recovery. If the action implementation process can be executed before the expiration of any of the monitoring periods, the step to instruct to wait for the action implementation process to be executed and the monitoring period that the computer has most recently expired when the monitoring period expires.
  • the step of instructing the execution of the action implementation process is provided, and when the alarm corresponding to the most recently expired monitoring period indicates recovery, the step of instructing the cancellation of the execution of the action implementation process is provided.
  • One aspect of the present invention is a control program that causes a computer to function as the control device.
  • FIG. 1 is a diagram illustrating a functional block of a control device according to an embodiment of the present invention.
  • FIG. 2 is a diagram illustrating an example of a data structure of workflow data.
  • FIG. 3 is a diagram illustrating an example of a data structure of monitoring data.
  • FIG. 4 is a diagram illustrating a data structure of coping time data and an example of the data.
  • FIG. 5 is a flowchart illustrating a control process by the control unit.
  • FIG. 6 is a flowchart illustrating the instruction processing by the instruction unit.
  • FIG. 7 is a flowchart illustrating the calculation process by the calculation unit.
  • FIG. 8 is a diagram illustrating a hardware configuration of a computer used in a control device.
  • Control device When a failure occurs in the controlled device 2, the control device 1 shown in FIG. 1 responds to the failure according to a predetermined workflow.
  • the control target device 2 is a device for providing a network service, and is a control target for troubleshooting by the control device 1.
  • the control device 1 confirms the failure status in the preliminary confirmation process.
  • the control device 1 deals with the controlled target device 2 in the coping implementation process.
  • the control device 1 confirms the result of the coping implementation process and the like in the post-confirmation process.
  • the control device 1 particularly adjusts the timing of executing the coping implementation step in consideration of the occurrence status of each alarm of failure or recovery. For example, even in a situation where a failure alarm and a recovery alarm are continuously generated, the control device 1 executes a coping implementation step at an appropriate timing.
  • the monitoring period calculated by the predetermined calculation method is set after the alarm related to the controlled object device 2 is generated.
  • the control device 1 waits for the execution of the coping implementation process during the monitoring period corresponding to any of the alarms.
  • the control device 1 executes or cancels the coping implementation process after the monitoring period corresponding to each alarm ends. Further, the control device 1 executes a countermeasure implementation step when the alarm generation status satisfies the predetermined condition even before the expiration of the monitoring period corresponding to each alarm.
  • the alarm indicates an event that indicates a change or abnormality in the network service and triggers the start of a workflow for responding to the failure.
  • the alarm may be a report from the operator in addition to the alarm issued by the controlled object device 2, or may be information observed by the device connected to the controlled object device 2.
  • the information observed by the device connected to the controlled device 2 is, for example, information indicating an abnormality in the traffic distribution amount on the communication network, information indicating a change in the connection configuration between the devices, and the like.
  • the control device 1 includes workflow data 11, monitoring data 12, coping time data 13, control unit 21, external information acquisition unit 22, instruction unit 23, and calculation unit 24.
  • the workflow data 11, the monitoring data 12, and the coping time data 13 are data stored in the memory 902 or the storage 903.
  • the control unit 21, the external information acquisition unit 22, the instruction unit 23, and the calculation unit 24 are functional units mounted on the control device 1 by the execution of the CPU 901.
  • the control device 1 defines a workflow to be activated when an alarm related to the controlled device 2 occurs.
  • the workflow specifies the execution contents by the control device 1 in each of the pre-confirmation process, the coping implementation process, and the post-confirmation process.
  • the workflow may be defined for each failure location, failure type, etc. that have occurred in the controlled device 2.
  • the workflow data 11 is data that stores the workflow identifier activated by the control unit 21, which will be described later, and the progress status thereof when an alarm related to the controlled device 2 occurs. As shown in FIG. 2, the workflow data 11 associates a process with a state of the process such as being executed or waiting as the progress status of the workflow to the workflow identifier that identifies the started workflow.
  • the monitoring data 12 is data for a monitoring period set in the control device 1. As shown in FIG. 3, the monitoring data 12 includes a monitoring identifier that identifies the set monitoring period, an alarm type that triggers the setting of the monitoring period, a monitoring period, a timer count that specifies the time from the start of the monitoring period, and the like. To associate.
  • the alarm type may at least identify either failure or recovery and may be associated with more detailed information.
  • the coping time data 13 specifies the time required from the start to the end of the coping implementation process. As shown in FIG. 4, the coping time data 13 associates the estimated implementation time with the alarm type. When the response differs depending on the implementation time of the response implementation process, the response time data 13 may associate the response content with the estimated implementation time for each alarm type and scheduled implementation time.
  • control unit 21 controls the execution of the workflow including the handling implementation process.
  • the control unit 21 acquires an alarm indicating a failure of the controlled target device 2 from the external information acquisition unit 22, the control unit 21 sequentially executes each step of the workflow for dealing with the failure.
  • the control unit 21 follows the instruction from the instruction unit 23, which will be described later, in the execution of the coping implementation process among the steps of the workflow.
  • the control unit 21 updates the workflow data 11 according to the execution status of the workflow.
  • the control unit 21 waits for the execution of the coping implementation process. After that, when the instruction unit 23 gives an execution instruction, the control unit 21 executes the coping implementation step. Further, when the instruction unit 23 gives an instruction to cancel, the control unit 21 cancels the execution of the coping implementation process and executes the subsequent post-confirmation process.
  • the control process by the control unit 21 will be described with reference to FIG.
  • the order of processing shown in FIG. 5 is an example and is not limited to this.
  • steps S101 to S105 are executed for each step of the workflow for dealing with the failure.
  • step S101 the control unit 21 determines whether or not the next step to be executed is a coping implementation step.
  • the control unit 21 executes the step in step S105.
  • step S102 determines whether or not there is a standby instruction from the instruction unit 23. If there is no standby instruction, the control unit 21 executes the coping implementation step in step S105. On the other hand, when there is an instruction to wait, in step S103, the control unit 21 waits for the execution of the coping implementation step until there is an instruction from the instruction unit 23.
  • control unit 21 processes according to the instruction.
  • the control unit 21 executes the handling implementation process in step S105.
  • the execution of the waiting handling implementation process is canceled, and the process returns to step S101 in order to execute the next process.
  • control unit 21 ends the processing for this workflow.
  • control unit 21 executes a workflow different from the workflow executed immediately before. For example, when the failure is not resolved by the workflow handling execution process executed earlier and it is necessary to take different measures, the control unit 21 executes a new workflow according to the instruction from the instruction unit 23.
  • the external information acquisition unit 22 is an interface with the control target device 2.
  • the external information acquisition unit 22 acquires information such as an alarm of the control target device 2 and inputs it to the control unit 21. Further, the external information acquisition unit 22 inputs commands such as confirmation and countermeasure from the control unit 21 to the control target device 2, acquires the execution result of the command in the control target device 2, and inputs the acquired result to the control unit 21. input.
  • the instruction unit 23 inputs to the control unit 21 an instruction regarding the implementation of the countermeasure implementation process by the control unit 21 according to the alarm generation status.
  • the instruction unit 23 sets a monitoring period for the alarm.
  • the instruction unit 23 updates the monitoring data 12 according to the alarm generation status.
  • the monitoring period is set each time an alarm occurs. In the embodiment of the present invention, the monitoring period is calculated by the calculation unit 24 described later.
  • the instruction unit 23 instructs to wait for the execution of the coping implementation process if the coping implementation process can be executed before the monitoring period that starts when the alarm indicating the failure or recovery occurs expires.
  • the countermeasure implementation process Instructs to wait for execution.
  • the instruction unit 23 provides a monitoring period for detecting the subsequent alarm, and makes the execution of the countermeasure implementation process wait until the occurrence of the alarm during the monitoring period is stopped.
  • the instruction unit 23 determines an instruction to be input to the control unit 21 according to the type of the alarm that has occurred most recently.
  • the most recently generated alarm indicates a failure, specifically, when the state in which the alarm does not occur continues for a predetermined time after the failure alarm occurs, it is considered that the controlled device 2 is in the failure state.
  • 23 instructs the control unit 21 to execute the coping implementation process.
  • the instruction unit 23 instructs to cancel the execution of the coping implementation process.
  • the natural healing of the failure is considered from the occurrence status of the alarm, it is possible to avoid unnecessary execution of the countermeasure by canceling the countermeasure execution process of the workflow that has already been started.
  • the instruction unit 23 After instructing the instruction unit 23 to wait for the execution of the coping implementation process, if the alarm generated during the monitoring period satisfies a predetermined condition, the instruction unit 23 instructs the execution of the coping implementation process. For example, when it is necessary to take an early action such as a specific alarm being continuously generated while waiting for the execution of the action implementation process, the instruction unit 23 sends the control unit 21 to the control unit 21 without waiting for the expiration of each monitoring period. Instruct the execution of the action implementation process.
  • the predetermined condition is a condition indicating that it is necessary to respond at an early stage, for example, the number or frequency of occurrence of a specific alarm, the elapsed time from the occurrence of the alarm, the content of failure indicated by the alarm, and the like.
  • the instruction unit 23 instructs the execution of the coping implementation process before the expiration of the monitoring period.
  • the instruction unit 23 has the effect of avoiding the situation where the coping implementation process is repeated a plurality of times by outputting an instruction regarding the coping implementation process after the expiration of the monitoring time, and the execution of the coping implementation process without waiting for the expiration of the monitoring time. By outputting the instruction, it is possible to enjoy both the effects of being able to immediately deal with the failure state of the controlled device 2.
  • the instruction unit 23 instructs the execution of a new workflow. ..
  • the coping implementation process of the new workflow shows a coping content different from the coping implementation process of the workflow that has already been executed. Even if the control unit 21 executes the countermeasure implementation process, the failure that triggered the execution of the workflow may not be resolved and the same alarm may occur. In such a situation, in order to prevent the control unit 21 from executing the same coping implementation step again, the instruction unit 23 instructs the control unit 21 to execute a new workflow.
  • the failure that triggered the execution of the workflow including the action implementation process has not been resolved, for example, it indicates a failure similar to the failure that occurred earlier within a predetermined time after the action execution process is executed. For example, when an alarm occurs.
  • the instruction processing by the instruction unit 23 will be described with reference to FIG.
  • the order of processing shown in FIG. 6 is an example and is not limited to this.
  • step S201 the instruction unit 23 divides the processing according to the event that has occurred. If an alarm occurs, the process proceeds to step S211. If each monitoring period expires while waiting for the execution of the countermeasure implementation step, the process proceeds to step S251.
  • step S211 the instruction unit 23 divides the processing according to the state at the time of the alarm occurrence.
  • step S221 when the pre-execution process is being executed or before the workflow is started, or before the action implementation process is waiting to be executed.
  • step S221 the instruction unit 23 sets the monitoring period.
  • step S222 the instruction unit 23 instructs the control unit 21 to wait for the execution of the coping implementation process.
  • step S231 when the alarm generation condition satisfies a predetermined condition indicating that it is necessary to respond at an early stage, the instruction unit 23 instructs the control unit 21 to execute the standby response implementation step in step S232. .. If the predetermined conditions are not met, the process ends.
  • step S241 when the alarm indicates that the failure that triggered the execution of the workflow including the action implementation step has not been resolved, the instruction unit 23 instructs the control unit 21 to execute the new workflow in step S242. do. If the alarm cannot determine that the failure has not been resolved and indicates the possibility that the failure has been resolved, the process ends.
  • step S201 if each monitoring period expires while waiting for the execution of the countermeasure implementation process, the process proceeds to step S251.
  • step S251 the instruction unit 23 divides the processing according to the most recently generated alarm type.
  • the instruction unit 23 cancels the standby of the countermeasure implementation process from the control unit 21, instructs the control unit 21 to execute the countermeasure implementation process, and ends the process.
  • the instruction unit 23 instructs the control unit 21 to cancel the execution of the coping implementation process, and ends the process.
  • the calculation unit 24 calculates the monitoring period set by the instruction unit 23.
  • the monitoring period is calculated to have a positive correlation with the alarm occurrence interval.
  • the monitoring period calculated when the alarm is generated is notified to the instruction unit 23. If the alarm generation interval is short, the monitoring period is short, and if the alarm generation interval is long, the monitoring period is long.
  • the timing of execution of the response implementation process can be adjusted according to the urgency of the response indicated by the frequency of occurrence of the alarm.
  • the calculation unit 24 sets the monitoring period so that the time having a positive correlation with the time required for the execution of the response implementation process is added to the monitoring period. Update.
  • the calculation unit 24 updates the monitoring period and timer count of the monitoring data 12. The alarm may be temporarily stopped while the action is taken in the action implementation process. Therefore, the calculation unit 24 extends the monitoring period by the time required to complete the execution of the coping implementation process in consideration of the temporary stop of the alarm due to the coping by the coping implementation process.
  • the time required to execute the coping implementation process is defined in the coping time data 13.
  • the instruction unit 23 can determine the instruction regarding the standby response implementation process according to the alarm generation status at the time when the execution of the response implementation process is completed.
  • a method for detecting the execution of the coping implementation process a method in which the calculation unit 24 monitors and detects the execution of the coping implementation process, a method in which the control unit 21 notifies the execution of the coping implementation process, and an execution of the coping implementation process. There is a method to refer to the log that records.
  • the calculation unit 24 specifies the monitoring period for the alarm related to the alarm that triggered the detected countermeasure implementation process among the monitoring periods in progress at that time. , The specified monitoring period may be updated.
  • the alarm association means that there is a high possibility that the faulty device is related to the fault, for example, the faulty device is the same, or is adjacent or connected.
  • f is a function for calculating the monitoring time from the alarm occurrence interval
  • E is a function for calculating the time required for the implementation of the coping implementation process.
  • n is an alarm identifier in the alarm group related to the failure F.
  • the alarm group relating to the failure F includes an alarm indicating a failure and an alarm indicating recovery from the failure.
  • the monitoring period is the sum of the time that has a positive correlation with the alarm occurrence interval and the time that has a positive correlation with the time required to implement the response implementation process when the response implementation process is started. Indicates that it will be calculated.
  • the start time of the countermeasure may be the time when the calculation unit 24 detects the implementation of the countermeasure, the time notified by the control unit 21, the time specified by the log or the like, and other times. It may be specified by a method.
  • the calculation process by the calculation unit 24 will be described with reference to FIG. 7.
  • the order of processing shown in FIG. 7 is an example and is not limited to this.
  • step S301 the calculation unit 24 divides the processing according to the event that has occurred. If an alarm is generated, the process proceeds to step S302, and if execution of the countermeasure implementation step is detected, the process proceeds to step S303.
  • step S302 when an alarm occurs, the calculation unit 24 calculates the monitoring period from the alarm generation interval and ends the process. The calculated monitoring period is provided to the instruction unit 23.
  • step S303 When the execution of the countermeasure implementation process is detected in step S303, the calculation unit 24 adds the time required for the execution of the countermeasure implementation process to the currently ongoing monitoring period, and ends the process.
  • the instruction unit 23 waits for the expiration of the monitoring period according to the monitoring period in which the time required for executing the coping step is added.
  • control device 1 can adjust the execution timing of the coping implementation process according to the alarm generation status and provide an appropriate monitoring period. Specifically, the control device 1 can avoid a situation in which the execution of the same coping implementation step is repeated a plurality of times, or the coping implementation step is executed even though the natural healing has occurred. In addition, if a situation that requires immediate action occurs while waiting for the execution of the response implementation process, the response implementation process is executed immediately, so that the opportunity to execute the response implementation process is not lost. In addition, by checking the alarm occurrence status during the monitoring period, it is possible to determine the action content after understanding the cause of the alarm occurrence.
  • the control device 1 can appropriately respond to a failure of the controlled device 2 by using a workflow.
  • the control device 1 of the present embodiment described above includes, for example, a CPU (Central Processing Unit, processor) 901, a memory 902, a storage 903 (HDD: Hard Disk Drive, SSD: Solid State Drive), and a communication device 904.
  • a general purpose computer system including an input device 905 and an output device 906 is used.
  • each function of the control device 1 is realized by executing the control program loaded on the memory 902 by the CPU 901.
  • the control device 1 may be mounted on one computer or may be mounted on a plurality of computers. Further, the control device 1 may be a virtual machine mounted on a computer.
  • the control program of the control device 1 can be stored in a computer-readable recording medium such as an HDD, SSD, USB (Universal Serial Bus) memory, CD (Compact Disc), DVD (Digital Versatile Disc), or via a network. It can also be delivered.
  • a computer-readable recording medium such as an HDD, SSD, USB (Universal Serial Bus) memory, CD (Compact Disc), DVD (Digital Versatile Disc), or via a network. It can also be delivered.
  • the present invention is not limited to the above embodiment, and many modifications can be made within the scope of the gist thereof.
  • Control device Control target device 11 Workflow data 12 Monitoring data 13 Response time data 21 Control unit 22 External information acquisition unit 23 Instruction unit 24 Calculation unit 901 CPU 902 Memory 903 Storage 904 Communication device 905 Input device 906 Output device

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Debugging And Monitoring (AREA)
  • Maintenance And Management Of Digital Transmission (AREA)

Abstract

制御装置1は、故障を示すアラームが発生すると、対処実施工程を含むワークフローの実行を制御する制御部21と、制御部21に、故障または回復を示すアラームの発生を契機に開始する監視期間が満了する前に、対処実施工程を実行可能である場合、対処実施工程の実行の待機を指示し、監視期間が満了すると、直近で発生したアラームが故障を示す場合、対処実施工程の実行を指示し、直近で発生したアラームが回復を示す場合、対処実施工程の実行のキャンセルを指示する指示部を備える。

Description

制御装置、制御方法、および制御プログラム
 本発明は、制御装置、制御方法、および制御プログラムに関する。
 近年、業務効率化のため、業務の自動化に関する取り組みが活発である。通信業界の場合、通信ネットワークにおける故障対応業務において、ワークフローエンジン等を導入し、運用を自動化するケースがある。装置の故障に対するオペレーションがワークフローとして予め記述される。当該故障を示すアラームの発生を契機に、このワークフローに従ってコンピュータが故障に対応することで、業務の自動化を実現する。
 正確な故障対応のために、アラームのメッセージを解析し、複数アラームの集約化する技術がある(非特許文献1参照)。非特許文献1に記載の技術は、同一アラームまたは大量アラームを抑止し、発生したアラームに対するアクションの実行を実現する。
Jim Brown、" Working with SEC- the Simple Event Correlator "、[online]、2003年11月23日、[令和2年5月12日検索]、インターネット〈URL:http://simple-evcorr.sourceforge.net/SEC-tutorial/article.html〉
 しかしながら、非特許文献1に記載の技術では、直近の所定時間におけるアラームの発生状況に応じてワークフローの実行を指示するなど、きめ細やかなオペレーションを実行することはできない。その結果、一つの対処を複数回実行するなど、適切に故障に対応することができない問題がある。
 本発明は、上記事情に鑑みてなされたものであり、本発明の目的は、適切に故障に対応することが可能な技術を提供することである。
 本発明の一態様の制御装置は、故障を示すアラームが発生すると、対処実施工程を含むワークフローの実行を制御する制御部と、制御部に、故障または回復を示すアラームの発生を契機に開始する監視期間が満了する前に、対処実施工程を実行可能である場合、対処実施工程の実行の待機を指示し、監視期間が満了すると、直近で発生したアラームが故障を示す場合、対処実施工程の実行を指示し、直近で発生したアラームが回復を示す場合、対処実施工程の実行のキャンセルを指示する指示部を備える。
 本発明の一態様の制御方法は、コンピュータが、故障を示すアラームが発生すると、対処実施工程を含むワークフローの実行を制御するステップと、コンピュータが、故障または回復を示すアラームの発生を契機に開始するいずれかの監視期間が満了する前に、対処実施工程を実行可能である場合、対処実施工程の実行の待機を指示するステップと、コンピュータが、監視期間が満了すると、直近で満了した監視期間に対応するアラームが故障を示す場合、対処実施工程の実行を指示し、直近で満了した監視期間に対応するアラームが回復を示す場合、対処実施工程の実行のキャンセルを指示するステップを備える。
 本発明の一態様は、上記制御装置として、コンピュータを機能させる制御プログラムである。
 本発明によれば、適切に故障に対応することが可能な技術を提供することができる。
図1は、本発明の実施の形態に係る制御装置の機能ブロックを説明する図である。 図2は、ワークフローデータのデータ構造の一例を説明する図である。 図3は、監視データのデータ構造の一例を説明する図である。 図4は、対処時間データのデータ構造とデータの一例を説明する図である。 図5は、制御部による制御処理を説明するフローチャートである。 図6は、指示部による指示処理を説明するフローチャートである。 図7は、算出部による算出処理を説明するフローチャートである。 図8は、制御装置に用いられるコンピュータのハードウエア構成を説明する図である。
 以下、図面を参照して、本発明の実施形態を説明する。図面の記載において同一部分には同一符号を付し説明を省略する。
 (制御装置)
 図1に示す制御装置1は、制御対象装置2に故障が発生すると、予め定められたワークフローに従って故障に対応する。制御対象装置2は、ネットワークサービスを提供するための装置であって、制御装置1による故障対処の制御対象である。
 本発明の実施の形態においてワークフローは、事前確認工程、対処実施工程、および事後確認工程を有する場合を説明する。制御装置1は、事前確認工程において、故障の状況を確認する。制御装置1は、対処実施工程において、制御対象装置2に対して対処を行う。制御装置1は、事後確認工程において、対処実施工程の結果等を確認する。
 本発明の実施の形態に係る制御装置1は特に、故障または回復の各アラームの発生状況を考慮して、対処実施工程を実行するタイミングを調節する。例えば、故障のアラームと回復のアラームが連続的に発生する状況においても、制御装置1は、適切なタイミングで、対処実施工程を実行する。
 本発明の実施の形態において、制御対象装置2に関するアラームが発生してから、所定の算出方法で算出される監視期間を設定する。制御装置1は、アラームが連続的に発生する場合において、いずれかのアラームに対応する監視期間中において、対処実施工程の実行を待機する。制御装置1は、各アラームに対応する監視期間が終了した後に、対処実施工程を実行またはキャンセルする。また制御装置1は、各アラームに対応する監視期間の満了前であっても、アラームの発生状況が所定条件を満たした場合、対処実施工程を実行する。
 なお、本発明の実施の形態においてアラームは、ネットワークサービスの変化や異常を示し、故障に対応するためのワークフロー開始の契機となるイベントを意味する。アラームは、制御対象装置2が発するアラームのほか、オペレータからの申告であっても良いし、制御対象装置2に接続する装置で観測される情報あっても良い。制御対象装置2に接続する装置で観測される情報は、例えば、通信ネットワーク上のトラヒック流通量の異常を示す情報、装置間の接続構成の変化を示す情報等である。
 制御装置1は、ワークフローデータ11、監視データ12、対処時間データ13、制御部21、外部情報取得部22、指示部23および算出部24を備える。ワークフローデータ11、監視データ12および対処時間データ13は、メモリ902またはストレージ903に記憶されるデータである。制御部21、外部情報取得部22、指示部23および算出部24は、CPU901の実行によって制御装置1に実装される機能部である。
 制御装置1は、制御対象装置2に関するアラームが発生した際に起動するワークフローを定義する。ワークフローは、事前確認工程、対処実施工程および事後確認工程の各工程において、制御装置1による実行内容を特定する。ワークフローは、制御対象装置2に生じた故障箇所、故障種別等ごとに、定義されても良い。
 ワークフローデータ11は、制御対象装置2に関するアラームが発生した際に、後述の制御部21が起動したワークフローの識別子と、その進捗状況を記憶するデータである。ワークフローデータ11は、図2に示すように、起動したワークフローを識別するワークフロー識別子に、ワークフローの進捗状況として、工程と、実行中または待機中などのその工程の状態を対応づける。
 監視データ12は、制御装置1において設定された監視期間のデータである。監視データ12は、図3に示すように、設定された監視期間を識別する監視識別子、監視期間を設定するトリガとなったアラーム種別、監視期間、監視期間開始からの時間を特定するタイマーカウント等を対応づける。アラーム種別は、少なくとも故障または回復のいずれかを特定し、さらに詳細な情報が対応づけられても良い。
 対処時間データ13は、対処実施工程の開始から終了までに要する時間を特定する。対処時間データ13は、図4に示すように、アラーム種別に想定実施時間を対応づける。また対処実施工程の実施時刻によって対処が異なる場合、対処時間データ13は、アラーム種別および実施予定時刻ごとに、対処内容と想定実施時間を対応づけても良い。
 制御部21は、故障を示すアラームが発生すると、対処実施工程を含むワークフローの実行を制御する。制御部21は、外部情報取得部22から、制御対象装置2の故障を示すアラームを取得すると、その故障に対処するワークフローの各工程を順次実行する。本発明の実施の形態において制御部21は、ワークフローの各工程のうち、対処実施工程の実行においては、後述の指示部23からの指示に従う。制御部21は、ワークフローの実行状況に応じて、ワークフローデータ11を更新する。
 具体的には、対処実施工程の実施にあたり、指示部23から待機の指示がある場合、制御部21は、対処実施工程の実行を待機する。その後指示部23から実行の指示があると、制御部21は、対処実施工程を実行する。また指示部23からキャンセルの指示があると、制御部21は、対処実施工程の実行をキャンセルし、その後の事後確認工程を実行する。
 図5を参照して、制御部21による制御処理を説明する。なお図5に示す処理の順序は一例であって、これに限るものではない。
 制御対象装置2に故障を示すアラームが発生すると、その故障に対処するためのワークフローの各工程について、ステップS101ないしステップS105の処理を実行する。
 まずステップS101において制御部21は、次に実施する工程が、対処実施工程であるか否かを判定する。次に実施する工程が、事前確認工程または事後確認工程である場合、ステップS105において制御部21は、その工程を実行する。
 次に実施する工程が、対処実施工程である場合、ステップS102において制御部21は、指示部23から待機の指示があるか否かを判定する。待機の指示がない場合、ステップS105において制御部21は、対処実施工程を実行する。一方、待機の指示がある場合、ステップS103において制御部21は、指示部23からの指示があるまで、対処実施工程の実行を待機する。
 ステップS104において指示部23から指示があると、その指示に従って制御部21は処理する。対処実施工程の実行の指示の場合、ステップS105において制御部21は、対処実施工程を実行する。一方、対処実施工程のキャンセルの指示の場合、待機中の対処実施工程の実行をキャンセルし、次の工程を実行するためにステップS101に戻る。
 ワークフローの各工程について、ステップS101ないしステップS105の処理が終了すると、制御部21は、このワークフローについての処理を終了する。
 また制御部21は、あるワークフローの対処実施工程を実行した後に、指示部23から新たなワークフローを実行する指示が入力されると、直前に実行したワークフローとは別のワークフローを実行する。例えば、先に実行したワークフロー対処実施工程によって故障が解消せず、異なる対処を行う必要がある場合、制御部21は、指示部23からの指示に従って新たなワークフローを実行する。
 外部情報取得部22は、制御対象装置2とのインタフェースである。外部情報取得部22は、制御対象装置2のアラーム等の情報を取得して制御部21に入力する。また外部情報取得部22は、制御部21からの確認および対処等のコマンドを制御対象装置2に入力して、制御対象装置2におけるコマンドの実行結果を取得し、取得した結果を制御部21に入力する。
 指示部23は、アラームの発生状況に応じて、制御部21による対処実施工程の実施に関する指示を、制御部21に入力する。指示部23は、制御対象装置2において故障または回復を示すアラームが発生すると、そのアラームに対する監視期間を設定する。指示部23は、アラームの発生状況に応じて、監視データ12を更新する。監視期間は、アラームが発生する度に設定される。本発明の実施の形態において監視期間は、後述の算出部24によって算出される。
 指示部23は、故障または回復を示すアラームの発生を契機に開始する監視期間が満了する前に、対処実施工程を実行可能である場合、対処実施工程の実行の待機を指示する。故障または回復を示すアラームが連続的に発生し、複数の監視期間が並列して設けられている場合、各監視期間が満了する前において対処実施工程が実行可能であっても、対処実施工程の実行の待機を指示する。故障を示すアラームと回復を示すアラームが繰り返し連続的に発生する状況において、故障を示すアラームが発生する度に対処実施工程が実行されると、対処実施工程が複数回繰り返されることになってしまう。そこで指示部23は、アラームが発生すると、後続のアラームを検出するための監視期間を設け、監視期間中のアラームの発生が収まるまで、対処実施工程の実行を待機させる。
 指示部23は、各監視期間が満了すると、直近で発生したアラームの種別によって、制御部21に入力する指示を決定する。直近で発生したアラームが故障を示す場合、具体的には、故障のアラームが発生した後アラームが発生しない状態が所定時間続く場合、制御対象装置2が故障状態であると考えられるので、指示部23は、制御部21に対処実施工程の実行を指示する。これにより故障または回復を示すアラームが連続的に発生する状況においても、対処実施工程の実行を1回のみに抑制することができる。
 一方直近で発生したアラームが回復を示す場合、具体的には、回復のアラームが発生した後アラームが発生しない状態が所定時間続く場合、制御対象装置2の故障が自然治癒したと考えられるので、指示部23は、対処実施工程の実行のキャンセルを指示する。アラームの発生状況から故障の自然治癒が考えられる場合に、既に起動したワークフローの対処実施工程をキャンセルすることにより、無駄な対処の実行を回避することができる。
 指示部23は、対処実施工程の実行の待機を指示した後、監視期間中に発生したアラームが所定条件を満たす場合、対処実施工程の実行を指示する。例えば、対処実施工程の実行の待機中に、特定のアラームが連続的に発生するなど早期に対応する必要がある場合、指示部23は、各監視期間の満了を待たずに、制御部21に対処実施工程の実行を指示する。ここで所定条件とは、早期に対応する必要があることを示す条件であって、例えば、特定のアラームが発生した回数または頻度、アラームが発生してからの経過時間、アラームが示す故障内容等で特定される。指示部23は、アラームの発生状況が予め定めた条件に合う場合、監視期間の満了前に、対処実施工程の実行を指示する。これにより指示部23は、監視時間の満了後に対処実施工程に関する指示を出力することで対処実施工程が複数回繰り返される状況を回避する効果と、監視時間の満了を待たず対処実施工程の実行の指示を出力することで制御対象装置2の故障状態に早急に対処することができる効果の両方を、享受することができる。
 指示部23は、対処実施工程が実行された後に発生したアラームが、対処実施工程を含むワークフローの実行のトリガとなった故障が解消していないことを示す場合、新たなワークフローの実行を指示する。新たなワークフローの対処実施工程は、既に実行したワークフローの対処実施工程とは異なる対処内容を示す。制御部21が、対処実施工程を実行しても、そのワークフローの実行の契機となった故障が解消せず、同様のアラームが発生する場合がある。そのような状況において、制御部21が再度同じ対処実施工程を実行することを回避するために、指示部23は、制御部21に対して、新たなワークフローを実行するよう指示する。対処実施工程を含むワークフローの実行のトリガとなった故障が解消していないことを示す場合は、例えば、対処実施工程の実行後の所定時間内に、先に発生した故障と同様の故障を示すアラームが発生した場合などである。
 図6を参照して、指示部23による指示処理を説明する。なお図6に示す処理の順序は一例であって、これに限るものではない。
 ステップS201において指示部23は、発生したイベントに応じて、処理をわける。アラームが発生した場合、ステップS211に進み、対処実施工程の実行の待機中に、各監視期間が満了した場合、ステップS251に進む。
 ステップS211において指示部23は、アラーム発生時の状態に応じて、処理をわける。
 アラーム発生時に、事前実施工程の実行中またはワークフローの起動前など、対処実施工程の実行の待機前の場合、ステップS221に進む。ステップS221において指示部23は、監視期間を設定する。ステップS222において指示部23は、対処実施工程の実行の待機を、制御部21に指示する。
 アラーム発生時に、対処実施工程の実行の待機中の場合、ステップS231に進む。ステップS231において、アラームの発生状況が、早期に対応する必要があることを示す所定条件を満たす場合、ステップS232において指示部23は、待機中の対処実施工程の実行を、制御部21に指示する。所定条件を満たさない場合、処理を終了する。
 アラーム発生時に、対処実施工程の実行後の場合、ステップS241に進む。ステップS241において、アラームが、対処実施工程を含むワークフローの実行のトリガとなった故障が解消していないことを示す場合、ステップS242において指示部23は、新しいワークフローの実行を、制御部21に指示する。アラームが、故障が解消していないとまで判断できず、故障が解消している可能性を示す場合、処理を終了する。
 ステップS201において、対処実施工程の実行の待機中に、各監視期間が満了した場合、ステップS251に進む。ステップS251において指示部23は、直近で発生したアラーム種別によって、処理をわける。直近で発生したアラーム種別が故障の場合、ステップS252において指示部23は、制御部21に、対処実施工程の待機を解除し、その対処実施工程の実行を指示して、処理を終了する。直近で発生したアラーム種別が回復の場合、ステップS253において指示部23は、制御部21に、対処実施工程の実行のキャンセルを指示して、処理を終了する。
 算出部24は、指示部23が設定する監視期間を算出する。監視期間は、アラームの発生間隔と正の相関を持つように算出される。アラームの発生を契機に算出される監視期間は、指示部23に通知される。アラームの発生間隔が短いと、監視期間は短くなり、アラームの発生間隔が長いと、監視期間は長くなる。アラームの発生頻度が示す対処の緊急度に応じて対処実施工程の実行のタイミングを調節することができる。
 また算出部24は、監視期間中に対処実施工程の実行が検知されると、監視期間に、対処実施工程の実行に要する時間と正の相関を持つ時間が加算されるように、監視期間を更新する。対処実施工程の実行が検知された際、算出部24は、監視データ12の監視期間およびタイマーカウントを更新する。対処実施工程において対処が行われる間、アラームの発生が一時的に停止する場合がある。そこで、対処実施工程による対処に伴うアラームの一時的な停止を考慮して、算出部24は、監視期間を、対処実施工程の実行が完了するために必要な時間分延長する。対処実施工程の実行に要する時間は、対処時間データ13で定義される。これにより、指示部23は、対処実施工程の実行が完了した時点のアラーム発生状況に従って、待機中の対処実施工程についての指示を判断することができる。なお対処実施工程の実行を検知する方法として、算出部24が対処実施工程の実行を監視して検知する方法、制御部21から、対処実施工程の実行が通知される方法、対処実施工程の実行を記録するログを参照する方法等がある。
 また算出部24は、対処実施工程の実行が検知された際、そのときに進行中の監視期間のうち、検知された対処実施工程の契機となったアラームと関連するアラームに対する監視期間を特定し、特定された監視期間を更新しても良い。アラームの関連とは、例えば、故障装置が同一である、あるいは隣接関係または接続関係にあるなど、故障に関連がある可能性が高いことを意味する。
 監視期間を算出する式の一例を、式(1)に示す。
Figure JPOXMLDOC01-appb-M000001
 式(1)において、fは、アラーム発生間隔から監視時間を算出するための関数で、Eは、対処実施工程の実施に要する時間を算出するための関数である。nは、故障Fに関するアラーム群のうちのアラームの識別子である。故障Fに関するアラーム群は、故障を示すアラームと、故障の回復を示すアラームを含む。式(1)は、監視期間は、アラーム発生間隔と正の相関を持つ時間と、対処実施工程が開始された場合に対処実施工程の実施に要する時間と正の相関を持つ時間との和で算出されることを示す。なお、対処の開始時刻は、算出部24が対処の実施を検知した時刻であっても良いし、制御部21から通知された時刻でも良いし、ログ等によって特定された時刻でも良く、その他の方法で特定されても良い。
 図7を参照して、算出部24による算出処理を説明する。なお図7に示す処理の順序は一例であって、これに限るものではない。
 ステップS301において算出部24は、発生したイベントに応じて、処理をわける。アラームが発生した場合、ステップS302に進み、対処実施工程の実行が検知された場合、ステップS303に進む。
 ステップS302において算出部24は、アラームが発生すると、アラームの発生間隔から監視期間を算出して、処理を終了する。算出された監視期間は、指示部23に提供される。
 ステップS303において算出部24は、対処実施工程の実行が検知されると、現在進行中の監視期間に、対処実施工程の実行に要する時間を加算して、処理を終了する。対処工程の実行に要する時間が加算された監視期間に従って、指示部23は、監視期間の満了を待機する。
 このように本発明の実施の形態に係る制御装置1は、アラームの発生状況に応じて、対処実施工程の実行のタイミングを調節し、適切な監視期間を設けることができる。具体的には制御装置1は、同じ対処実施工程の実行が複数回繰り返す、自然治癒しているにもかかわらず対処実施工程を実行するなどの状況を回避することができる。また対処実施工程の実行の待機中に、早急に対処しなければならない状況が発生した場合、即座に対処実施工程を実行するので、対処実施工程の実行の機会を失することもない。また監視期間中のアラームの発生状況を確認することで、アラームが発生した原因を把握した上で対処内容を決定することができる。
 本発明の実施の形態に係る制御装置1は、ワークフローを用いて、制御対象装置2の故障に、適切に対応することができる。
 上記説明した本実施形態の制御装置1は、例えば、CPU(Central Processing Unit、プロセッサ)901と、メモリ902と、ストレージ903(HDD:Hard Disk Drive、SSD:Solid State Drive)と、通信装置904と、入力装置905と、出力装置906とを備える汎用的なコンピュータシステムが用いられる。このコンピュータシステムにおいて、CPU901がメモリ902上にロードされた制御プログラムを実行することにより、制御装置1の各機能が実現される。
 なお、制御装置1は、1つのコンピュータで実装されてもよく、あるいは複数のコンピュータで実装されても良い。また制御装置1は、コンピュータに実装される仮想マシンであっても良い。
 制御装置1の制御プログラムは、HDD、SSD、USB(Universal Serial Bus)メモリ、CD (Compact Disc)、DVD (Digital Versatile Disc)などのコンピュータ読取り可能な記録媒体に記憶することも、ネットワークを介して配信することもできる。
 なお、本発明は上記実施形態に限定されるものではなく、その要旨の範囲内で数々の変形が可能である。
 1 制御装置
 2 制御対象装置
 11 ワークフローデータ
 12 監視データ
 13 対処時間データ
 21 制御部
 22 外部情報取得部
 23 指示部
 24 算出部
 901 CPU
 902 メモリ
 903 ストレージ
 904 通信装置
 905 入力装置
 906 出力装置

Claims (8)

  1.  故障を示すアラームが発生すると、対処実施工程を含むワークフローの実行を制御する制御部と、
     前記制御部に、
     故障または回復を示すアラームの発生を契機に開始する監視期間が満了する前に、前記対処実施工程を実行可能である場合、前記対処実施工程の実行の待機を指示し、
     前記監視期間が満了すると、直近で発生したアラームが故障を示す場合、前記対処実施工程の実行を指示し、直近で発生したアラームが回復を示す場合、前記対処実施工程の実行のキャンセルを指示する指示部
     を備える制御装置。
  2.  前記監視期間は、アラームの発生間隔と正の相関を持つように算出される
     請求項1に記載の制御装置。
  3.  前記監視期間中に前記対処実施工程の実行が検知されると、前記監視期間に、前記対処実施工程の実行に要する時間と正の相関を持つ時間が加算される
     請求項1または2に記載の制御装置。
  4.  前記監視期間は、前記アラームが発生する度に設定され、
     前記指示部は、各監視期間が満了すると、前記対処実施工程の実行またはキャンセルを指示する
     請求項1ないし3のいずれか1項に記載の制御装置。
  5.  前記対処実施工程の実行の待機を指示した後、前記監視期間中に発生したアラームが所定条件を満たす場合、前記指示部は、前記対処実施工程の実行を指示する
     請求項1ないし4のいずれか1項に記載の制御装置。
  6.  前記指示部は、前記対処実施工程が実行された後に発生したアラームが、前記対処実施工程を含むワークフローの実行のトリガとなった故障が解消していないことを示す場合、新たなワークフローの実行を指示する
     請求項1ないし5のいずれか1項に記載の制御装置。
  7.  コンピュータが、故障を示すアラームが発生すると、対処実施工程を含むワークフローの実行を制御するステップと、
     前記コンピュータが、故障または回復を示すアラームの発生を契機に開始するいずれかの監視期間が満了する前に、前記対処実施工程を実行可能である場合、前記対処実施工程の実行の待機を指示するステップと、
     前記コンピュータが、前記監視期間が満了すると、直近で満了した監視期間に対応するアラームが故障を示す場合、前記対処実施工程の実行を指示し、直近で満了した監視期間に対応するアラームが回復を示す場合、前記対処実施工程の実行のキャンセルを指示するステップ
     を備える制御方法。
  8.  コンピュータを、請求項1ないし請求項6のいずれか1項に記載の制御装置として機能させるための制御プログラム。
PCT/JP2020/020122 2020-05-21 2020-05-21 制御装置、制御方法、および制御プログラム WO2021234912A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/923,728 US20230176561A1 (en) 2020-05-21 2020-05-21 Control device, control method and control program
PCT/JP2020/020122 WO2021234912A1 (ja) 2020-05-21 2020-05-21 制御装置、制御方法、および制御プログラム
JP2022524806A JP7360077B2 (ja) 2020-05-21 2020-05-21 制御装置、制御方法、および制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2020/020122 WO2021234912A1 (ja) 2020-05-21 2020-05-21 制御装置、制御方法、および制御プログラム

Publications (1)

Publication Number Publication Date
WO2021234912A1 true WO2021234912A1 (ja) 2021-11-25

Family

ID=78707868

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/020122 WO2021234912A1 (ja) 2020-05-21 2020-05-21 制御装置、制御方法、および制御プログラム

Country Status (3)

Country Link
US (1) US20230176561A1 (ja)
JP (1) JP7360077B2 (ja)
WO (1) WO2021234912A1 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034509A (ja) * 1999-07-16 2001-02-09 Hitachi Ltd 情報処理装置の障害回復方法
JP2015188153A (ja) * 2014-03-26 2015-10-29 株式会社日立製作所 通信システム
US20170086247A1 (en) * 2014-06-03 2017-03-23 Telefonaktiebolaget Lm Ericsson (Publ) Handling Of Control Interface Failure In Multicast Transmissions Via A Cellular Network

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001034509A (ja) * 1999-07-16 2001-02-09 Hitachi Ltd 情報処理装置の障害回復方法
JP2015188153A (ja) * 2014-03-26 2015-10-29 株式会社日立製作所 通信システム
US20170086247A1 (en) * 2014-06-03 2017-03-23 Telefonaktiebolaget Lm Ericsson (Publ) Handling Of Control Interface Failure In Multicast Transmissions Via A Cellular Network

Also Published As

Publication number Publication date
JPWO2021234912A1 (ja) 2021-11-25
JP7360077B2 (ja) 2023-10-12
US20230176561A1 (en) 2023-06-08

Similar Documents

Publication Publication Date Title
JP5713056B2 (ja) プロセス制御装置及びシステム並びにその更新方法
JP2014509012A5 (ja)
CN102141947A (zh) 一种对采用嵌入式操作系统的计算机应用系统中异常任务的处理方法及系统
JP6971016B2 (ja) 制御装置、制御方法およびプログラム
JP4288418B2 (ja) 計算機システムおよび状態取得方法ならびに状態取得プログラム
EP3093766A1 (en) Redundant system and method for managing redundant system
CN108632106A (zh) 监控服务设备的系统
JP2005242404A (ja) コンピュータシステムの系切替方法
JP2011044110A (ja) ソフトウェアプログラム実行装置、ソフトウェアプログラム実行方法、及びプログラム
WO2021234912A1 (ja) 制御装置、制御方法、および制御プログラム
WO2015075803A1 (ja) 情報処理装置、方法、プログラム及び記録媒体
EP1540435B1 (en) Alarm recovery method and system
JP5327591B2 (ja) 情報処理装置の保守管理方法、その装置及びそのプログラム
JP2001331330A (ja) プロセス異常検知及び復旧システム
EP3509249B1 (en) Systems and methods for health monitoring and upgrade of a distributed controller
JP2003345638A (ja) 記憶制御装置の制御方法及び記憶制御装置及びプログラム
JP2010026830A (ja) システムに負荷をかけないデータバックアップ方法
JP2021069009A (ja) 情報処理システム、情報処理システムの制御方法、情報処理装置、及びプログラム
JP2006277278A (ja) 自律型コンピュータシステムおよびその自動整合方法
JP2024013997A (ja) 制御プログラム、制御方法および制御装置
JP2004246621A (ja) 情報採取プログラム、情報採取装置および情報採取方法
JP3202694B2 (ja) 環境アラーム機能評価方法と装置
JP3603703B2 (ja) 入出力実行時間監視システム及び方法
JPH11232143A (ja) マルチスレッドの監視方法
JP2009020545A (ja) コンピュータの異常監視装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20937139

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2022524806

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20937139

Country of ref document: EP

Kind code of ref document: A1