WO2010055590A1 - 監視抑止エラーメッセージ選択方法及びプログラム - Google Patents

監視抑止エラーメッセージ選択方法及びプログラム Download PDF

Info

Publication number
WO2010055590A1
WO2010055590A1 PCT/JP2008/070878 JP2008070878W WO2010055590A1 WO 2010055590 A1 WO2010055590 A1 WO 2010055590A1 JP 2008070878 W JP2008070878 W JP 2008070878W WO 2010055590 A1 WO2010055590 A1 WO 2010055590A1
Authority
WO
WIPO (PCT)
Prior art keywords
error message
process transition
transition
predicted
monitoring
Prior art date
Application number
PCT/JP2008/070878
Other languages
English (en)
French (fr)
Inventor
柳瀬 隆史
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to JP2010537656A priority Critical patent/JP5299433B2/ja
Priority to PCT/JP2008/070878 priority patent/WO2010055590A1/ja
Priority to EP08878136.4A priority patent/EP2357565B1/en
Publication of WO2010055590A1 publication Critical patent/WO2010055590A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0609Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on severity or priority
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0604Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time
    • H04L41/0622Management of faults, events, alarms or notifications using filtering, e.g. reduction of information by using priority, element types, position or time based on time

Definitions

  • This technology relates to information processing technology for identifying error messages to be excluded from monitoring targets among error messages issued from monitoring target devices.
  • an error message issued from a computer that is a monitoring target device is monitored, and when an error message is detected, a predetermined action corresponding to the importance is performed. If the error message is an important one that leads to a failure, appropriate measures are taken to prevent the failure in advance, and if the error message is not important, an incident is reported to the customer.
  • an error message for monitoring suppression is not selected based on the correct criteria, an error related to the error message may lead to a system failure, which may increase the response time.
  • monitoring suppression should be set for specific error messages accordingly. Is possible. However, if the information for identifying the necessity of monitoring the error message is not known, no measures can be taken conventionally.
  • the purpose of the present technology is to select an error message that does not require monitoring so that the response time can be reduced as a whole even when information for specifying the necessity of monitoring the error message is not obtained. Is to provide.
  • an error message is sent from a data storage unit in which history data of a process executed to deal with an error message issued from a monitoring target device is stored in association with an error message and a matter.
  • the first process transition corresponding to the process transition of the matter indicating that the solution processing has not been performed is specified for each error message, and the time spent for the first process transition is determined for each error message.
  • the third process transition related to the process transition is specified for each error message, and the total time spent in the process of the difference between the third process transition and the second process transition for each error message is related to the error message.
  • the predicted increase value is calculated as the predicted increase value of the response time, and the predicted decrease value is compared with the predicted increase value for each error message. If the predicted decrease value is larger than the predicted increase value, the error message is displayed.
  • a selection step of selecting for selecting.
  • FIG. 1 is a system outline diagram.
  • FIG. 2 is a functional block diagram of the monitoring suppression error message selection device.
  • FIG. 3 is a diagram illustrating an example of data stored in the response history DB.
  • FIG. 4 is a diagram illustrating a main processing flow of the present embodiment of the present technology.
  • FIG. 5 is a diagram showing a processing flow of average process time calculation processing.
  • FIG. 6 is a diagram illustrating an example of data stored in the average process time DB.
  • FIG. 7 is a diagram illustrating a process flow of the process transition generation process.
  • FIG. 8 is a diagram illustrating an example of data stored in the reception process transition DB.
  • FIG. 9 is a diagram illustrating a processing flow of the response process transition generation processing.
  • FIG. 10 is a diagram illustrating a processing flow of a response time decrease predicted value calculation process.
  • FIG. 11 is a diagram illustrating a processing flow of a response time decrease predicted value calculation process.
  • FIG. 12 is a diagram illustrating an example of data stored in the increase / decrease predicted value DB.
  • FIG. 13 is a diagram illustrating a processing flow of the unmonitored matter addition process extraction process.
  • FIG. 14 is a diagram showing a processing flow of normal time response process transition generation processing.
  • FIG. 15 is a diagram illustrating an example of a bigram of process transition for a non-monitoring item.
  • FIG. 16 is a diagram illustrating an example of a process transition bigram for a treatment case.
  • FIG. 17 is a diagram illustrating a processing flow of the unmonitored matter addition process extraction process.
  • FIG. 18 is a diagram illustrating a processing flow of a response time increase predicted value calculation process.
  • FIG. 19 is a diagram illustrating a processing flow of the monitoring suppression message selection processing.
  • FIG. 20 is a diagram illustrating a processing flow of the monitoring suppression message selection processing.
  • FIG. 21 is a diagram illustrating an example of a monitoring confirmation message selection confirmation screen.
  • FIG. 22 is a functional block diagram of a computer.
  • FIG. 1 shows a system outline diagram according to an embodiment of the present technology.
  • a monitoring target device 100 that is a customer's computer system is connected to a monitoring device 200 that sends a predetermined notification to a predetermined destination in response to an error message issued from the monitoring target device 100 via the network 1.
  • the function of the monitoring device 200 may be integrated with the monitoring target device 100.
  • the monitoring device 200 and the monitoring target device 100 also store log data such as actions taken in response to the error message.
  • the network 1 also includes a monitoring suppression error message selection device 300 that performs the main processing in the present embodiment, and a user terminal 400 that is operated by a user who is an administrator who causes the monitoring suppression error message selection device 300 to perform processing. It is connected.
  • the monitoring target device 100 is not limited to one, and one customer may include a plurality of systems, or may be a plurality of customer systems. There is no limitation also on the number of monitoring devices 200.
  • FIG. 2 shows a functional block diagram of the monitoring suppression error message selection device 300.
  • the monitoring suppression error message selection device 300 includes a response history DB 301, a response process transition generation unit 302, a response process transition DB 303, an average process time calculation unit 304, an average process time DB 305, an additional process extraction unit 306, and an addition.
  • the process data storage unit 307, the decrease predicted value calculation unit 308, the increase predicted value calculation unit 309, the increase / decrease prediction value DB 310, and a message selection processing unit 311 are included.
  • the response history DB 301 stores data as shown in FIG. 3, for example.
  • the case ID, customer name, error message, process start time, process end time, process name, and process type are registered.
  • the process represents the name of a response performed for an error message, and includes a process performed by a customer, a process performed by a system engineer, a process performed by the monitoring apparatus 200, and the like.
  • the case ID, customer name, and error message are input by the system engineer in charge of the case.
  • the process start time, process end time, and process name are extracted from the log data held in the monitoring target device 100 or the monitoring device 200, but may be input by the system engineer in charge of the matter. Good.
  • process type is any one of “notification”, “information collection”, and “resolution action”, and is automatically specified from the process name. Note that such data collection processing is not the main part of the present embodiment, and is also possible with the prior art, and will not be described further.
  • the reception process transition generation unit 302 performs the processing described below using data stored in the reception history DB 301 and stores the processing result in the reception process transition DB 303.
  • the average process time calculation unit 304 performs the processing described below using data stored in the response history DB 301 and stores the processing result in the average process time DB 305.
  • the additional process extraction unit 306 performs the processing described below using the data stored in the reception process transition DB 303 and stores the processing result in the additional process data storage unit 307.
  • the decrease predicted value calculation unit 308 performs processing described below using data stored in the response process transition DB 303 and the average process time DB 305, and stores the processing result in the increase / decrease predicted value DB 310.
  • the increase predicted value calculation unit 309 performs processing described below using the data stored in the response process transition DB 303, the additional process data storage unit 307, and the average process time DB 305, and the processing result is increased or decreased by the increase / decrease predicted value DB 310.
  • the message selection processing unit 311 performs processing described below using the data stored in the increase / decrease predicted value DB 310, for example, processing for transmitting a processing result to the user terminal 400 or setting for the monitoring device 200. To implement.
  • the average process time calculation unit 304 performs an average process time calculation process using data stored in the response history DB 301 (FIG. 4: step S1). The average process time calculation process will be described with reference to FIGS.
  • the average process time calculation unit 304 specifies one unprocessed combination of the error message name and the process name in the response history DB 301 (step S21). Then, all records corresponding to the specified combination are read from the response history DB 301 (step S23). Further, the number of read records is counted and stored in a storage device such as a main memory in association with the identified combination (step S25). Then, the difference between the process start time and the process end time of each read record is calculated and accumulated to calculate the process accumulated time, and is stored in a storage device such as a main memory in association with the specified combination (for example, Step S27).
  • the average process time calculation unit 304 determines whether all combinations of error message names and process names have been processed (step S29). If there is an unprocessed combination, the process returns to step S21. On the other hand, when processing is performed for all combinations, the average process time calculation unit 304 calculates the average process time for each error message and each process by dividing the process accumulated time by the count value for each combination. The average process time DB 305 is stored in association with the message and process (step S31). Then, the process returns to the original process.
  • FIG. 6 shows an example of data stored in the average process time DB 305.
  • the table in FIG. 6 is a table for an error message such as an Eventlog error, for example, and an average process time is registered for each process performed for the error message.
  • the response process transition generation unit 302 then performs response process transition generation processing using data stored in the response history DB 301 (step S ⁇ b> 3).
  • the response process transition generation process will be described with reference to FIGS.
  • the reception process transition generation unit 302 identifies one unprocessed customer in the reception history DB 301 (step S41). Then, a record relating to one unprocessed case for the identified customer is extracted from the response history DB 301, the processes are arranged in the order of the process start time, and a process transition is formed. Store in the storage device (step S43). However, if there is a process that reappears in the formed process transition, the process name is deleted from the process transition (step S45). Depending on the case, rework of the process may occur, but rework is not considered here. However, this process is arbitrary.
  • the response process transition is a process in which processes are arranged in time series from the process executed first to the process executed last.
  • the reception process transition generation unit 302 determines whether all cases of the identified customer have been processed in the reception history DB 301 (step S47). If there is an unprocessed matter, the process returns to step S43. On the other hand, when all cases are processed for the specified customer, the formed process transition is classified for each related error message name, and the number of cases is counted, and the count value is used as the error message name and Corresponding to the process transition, it is stored in a storage device such as a main memory (step S49).
  • the response process transition generation unit 302 identifies one unprocessed error message name (step S51) and further identifies one unprocessed process transition (step S53). Then, the specified process transition and the count value of the number of cases are registered in the specified customer and error message name table in the response process transition DB 303 (step S55). The processing shifts to the processing in FIG.
  • a table as shown in FIG. 8 is stored in the reception process transition DB 303.
  • the table of FIG. 8 is a table for the error message “Eventlog error” of the customer ABC company, and the number of cases, the case type, and the response process transition are registered.
  • the case type is not yet registered.
  • the response process transition generation unit 302 determines whether the process related to “monitoring” is included in the specified process transition (step S57). In the example of FIG. 8, it is determined whether or not a process of “monitoring notification” is included. For example, if the specified process transition is the process transition in the first and second lines in FIG. 8, since “monitoring notification” is not included, a negative determination is made in step S57.
  • the reception process transition generation unit 302 registers the item type as “non-monitoring” in the corresponding record in the reception process transition DB 303. (Step S59). Then, control goes to a step S67.
  • a process related to “monitoring” is included in the identified process transition
  • it is determined whether “resolved action” is included in the identified process transition (step S61). That is, it is determined whether or not it is recorded that an action for solving a problem is performed. For example, in the case of process transitions in the third to fifth lines in FIG. 8, it is determined that “solution action” is included, and in the case of process transitions in the sixth line, “solution action”. "Is not included.
  • the handling process transition generation unit 302 registers the item type as “present action” in the corresponding record of the handling process transition DB 303 (step S65). . Then, control goes to a step S67.
  • the response process transition generation unit 302 registers the item type as “No Action” in the corresponding record of the Response Process Transition DB 303 (Step S ⁇ b> 3). S63). Then, control goes to a step S67.
  • the response process transition generation unit 302 determines whether all process transitions have been processed for the specified error message name of the specified customer (step S67). If there is an unprocessed process transition, the process returns to the step S53 in FIG. On the other hand, if there is no unprocessed process transition, it is determined whether all error message names have been processed for the identified customer (step S69). If there is an unprocessed error message name, the process returns to step S51 in FIG. On the other hand, if there is no unprocessed error message name, it is determined whether all the customers have been processed (step S71). If there is an unprocessed customer, the process returns to step S41 in FIG. On the other hand, when all the customers have been processed, the process returns to the original process.
  • the data stored in the reception process transition DB 303 may be separately prepared and registered in the reception process transition DB 303.
  • data stored in the average process time DB 305 may be separately prepared and registered in the average process time DB 305.
  • the decrease predicted value calculation unit 308 performs a response time decrease predicted value calculation process using data stored in the response process transition DB 303 and the average process time DB 305 (step S5). ).
  • the response time decrease predicted value calculation process will be described with reference to FIGS.
  • the decrease predicted value calculation unit 308 identifies one unprocessed combination of the customer and the error message name in the response process transition DB 303 (step S81). Then, for the specified combination, the process transition and the number of cases corresponding to the “no treatment” case are extracted from the response process transition DB 303 (step S83). In the example of FIG. 8, the data in the sixth row is read out.
  • the “no action” case indicates that the error message is being monitored, but no resolution action has been taken even if there is a report of the monitoring result. If it is not monitored, the “no action” matter will not occur. In other words, if the error message is not monitored, the time taken for the “no treatment” item can be reduced. Therefore, in the response time decrease predicted value calculation process, the time that will be reduced is predicted based on the “no treatment” case.
  • the decrease predicted value calculation unit 308 determines whether all extraction process transitions have been processed for the specified combination (step S93). If there is an unprocessed extraction process transition, the process returns to step S85. On the other hand, when there is no unprocessed extraction process transition, the process proceeds to the process of FIG.
  • the decrease predicted value calculation unit 308 registers the response time decrease predicted value added in step S91 in the increase / decrease predicted value DB 310 in association with the combination of the customer and the error message name.
  • FIG. 12 shows an example of data stored in the increase / decrease predicted value DB 310.
  • FIG. 12 shows a table of customer ABC, and this table shows, for each error message, a response time decrease prediction value, a response time normal increase prediction value, and a response time longest increase prediction value. Are registered.
  • step S95 a response time decrease predicted value is registered.
  • the predicted decrease value calculation unit 308 determines whether all combinations of the customer and the error message name have been processed (step S97). If there is an unprocessed combination, the process returns to step S81 in FIG. On the other hand, if there is no unprocessed combination, the process returns to the original process.
  • the total work time that can be reduced when monitoring is lost can be calculated as a predicted decrease value.
  • the additional process extraction unit 306 performs non-monitoring matter addition process extraction processing using data stored in the response process transition DB 303 (step S ⁇ b> 7).
  • the non-monitoring item addition process extraction process will be described with reference to FIGS.
  • the additional process extraction unit 306 identifies one unprocessed combination of the customer and the error message name in the response process transition DB 303 (step S101). Then, for the identified combination, the process transition that is the “non-monitoring” item and includes the largest number of processes is identified as the longest response process transition and stored in a storage device such as a main memory (step S103). In the example of FIG. 8, since the number of processes is larger in the second row among the process transitions in the first row and the second row, the process transition in the second row is selected. However, the process transition having the longest total time may be specified from the average process time stored in the average process time DB 305. The process transition specified here is used to specify the longest additional process in the non-monitoring item.
  • the additional process extraction unit 306 extracts all the process transitions corresponding to the “non-monitoring” item for the specified combination in the response process transition DB 303 and stores them in a storage device such as a main memory (step). S105). In the example of FIG. 8, the first row and the second row are extracted. Then, a normal time response process transition generation process for the process transition corresponding to the non-monitoring item is performed (step S107). The normal time response process transition generation processing will be described with reference to FIG.
  • the additional process extraction unit 306 extracts a bigram of the process from the extracted process transition, counts the number of cases of the process transition including the bigram for each bigram type, and stores it in a storage device such as a main memory. (Step S123).
  • the process transitions in the first and second lines are broken down into a chain of two processes.
  • the bigram from customer report to SE contact the bigram from SE contact to log collection, and the bigram from log collection to solution processing are decomposed.
  • the second line is similarly decomposed.
  • the number of cases is the total number of process transitions including the corresponding bigram. If the bigram is from customer report to SE contact, there are 4 process transitions on the 1st line and 3 process transitions on the 2nd line. There are a total of 7 cases.
  • the additional process extraction unit 306 identifies the bigram having the largest number of cases among the bigrams including the process related to “report” at the head, and sets the bigram at the head of the bigram chain (step S125). For example, in the case of a non-monitoring item, “customer report” is extracted. If it is a treatment case described below, “monitoring notification” is extracted. In the example of FIG. 15, the bigram from the customer report to the SE contact is specified and set at the top of the bigram chain.
  • the additional process extraction unit 306 identifies the bigram having the largest number of cases among the bigrams including the last process name of the bigram chain at the head, and connects the bigram chain to the bigram chain (step S127). Since the bigram from customer report to SE contact has already been selected, there are many cases among the bigram from SE contact to log collection and the bigram from SE contact to case search, which is the bigram including SE contact at the head. A bigram from SE contact to log collection is selected. Then, a bigram chain in the order of customer report, SE contact, and log collection is formed.
  • the additional process extraction unit 306 determines whether or not the last process name of the bigram chain is “resolution action” (step S129). If the last process name of the bigram chain is not “resolution action”, the bigram is still linked, and the process returns to step S127.
  • the bigram that can be linked to “log collection” of the last process name is the bigram from log collection to solution action, so when this is linked, “customer notification”-> “SE contact”-> “log” A process transition of “collection”-> “resolution action” is formed.
  • the additional process extraction unit 306 sets the current bigram chain as a normal time response process transition (step S131).
  • the normal time response process transition for the non-monitoring item is obtained. Then, the process returns to the process of FIG.
  • a typical process transition is formed by concatenating bigrams that are more likely to occur, and the process transition is used as a normal time response process transition in the following processing.
  • the additional process extraction unit 306 extracts process transitions corresponding to the action cases from the response process transition DB 303 for the specified combination (step S109).
  • process transitions in the third to fifth lines are extracted.
  • generation process about the process transition applicable to a treatment case is implemented (step S111).
  • the process as shown in FIG. 14 is performed for the process transition extracted as the treatment case.
  • a bigram as shown in FIG. 16 is extracted.
  • step S125 from the monitoring report to the SE communication bigram, from the monitoring notification to the case search bigram, and from the monitoring notification to the log collection bigram, the largest number of the monitoring notification to the log collection bigram.
  • a process called “SE contact” and a process called “case search” are extracted.
  • an extra process is specified as compared with the normal time response process transition in the case of monitoring.
  • a process that is unnecessary for the process transition that becomes the longest when the error message is not monitored is identified as the longest additional process.
  • the additional process extraction unit 306 includes processes that exist in the normal time response process transition of the non-monitoring matter but do not exist in the normal time response process transition of the treatment matter (except for the process corresponding to “monitoring notification”),
  • the process is specified as a normal additional process and stored in the additional process data storage unit 307 in association with the combination of the customer and the error message name (step S115).
  • the process of “SE contact” is extracted.
  • the additional process extraction unit 306 determines whether all combinations of customers and error message names have been processed (step S117). If there is an unprocessed combination, the process returns to step S101 in FIG. On the other hand, if all combinations are processed, the process returns to the original process.
  • the process transition of the case that occurs most frequently may be adopted instead of the processing described above, or the average time of the corresponding process transition may be calculated, A process transition closest to the average time may be adopted.
  • the predicted increase value calculation unit 309 performs a response time increase predicted value calculation process using the data stored in the additional process data storage unit 307 and the average process time DB 305. Implement (step S9).
  • the response time increase predicted value calculation process will be described with reference to FIG.
  • the increase predicted value calculation unit 309 specifies an unprocessed combination of a customer and an error message name in the additional process data storage unit 307 (step S141). Further, for the specified combination, the longest time additional process and the normal time additional process are read from the additional process data storage unit 307 (step S143). Then, the average process time corresponding to each of the longest time additional process and the normal time additional process is read out from the average process time DB 305 (step S145).
  • the predicted increase value calculation unit 309 calculates the total of the average process time for the longest additional process and the total of the average process time for the normal additional process (step S147).
  • the predicted increase value calculation unit 309 extracts the number of treatment cases for the identified combination from the response process transition DB 303 (step S149).
  • the number of cases may be counted in step S109 and stored in the additional process data storage unit 307.
  • the increase predicted value calculation unit 309 calculates the product of the total average process time for the longest additional process and the number of treatment cases as the longest increase predicted value, and further calculates the average process time for the normal additional process.
  • the product of the total and the number of treated cases is calculated as an increase prediction value at the normal time, and is registered in the increase / decrease prediction value DB 310 in association with the identified combination (step S151).
  • the increase predicted value calculation unit 309 determines whether all combinations of the customer and the error message name have been processed (step S153). If there is an unprocessed combination, the process returns to step S141. On the other hand, if there is no unprocessed combination, the process returns to the original process.
  • the message selection processing unit 311 performs monitoring suppression message selection processing using data stored in the increase / decrease predicted value DB 310 (step S ⁇ b> 11).
  • the monitoring suppression message selection process will be described with reference to FIGS.
  • the message selection processing unit 311 identifies one unprocessed customer in the increase / decrease predicted value DB 310 (step S161). Further, one unprocessed error message is specified for the customer (step S163). Then, for the identified customer and error message, the response time decrease predicted value, the longest response time increase predicted value, and the normal response time increase predicted value are read from the increase / decrease predicted value DB 310 (step S165).
  • the message selection processing unit 311 determines whether the response time decrease predicted value is larger than the normal response time increase predicted value (step S167). As a result, it is determined whether or not the response time is reduced when the specified error message is not monitored during normal operation. If this condition is met, the specified error message is set as a normal monitoring suppression message and stored in a storage device such as a main memory (step S169). Thereafter, the process proceeds to step S171. On the other hand, if this condition is not met, the process proceeds to step S171.
  • the message selection processing unit 311 determines whether the response time decrease predicted value is longer than the longest response time increase predicted value (step S171). Accordingly, it is determined whether or not the response time is reduced in total if the specified error message is not monitored at the longest time. If this condition is met, the specified error message is set as the longest monitoring suppression message and stored in a storage device such as a main memory (step S173). Thereafter, the processing shifts to the processing in FIG. On the other hand, even if the above conditions are not met, the processing shifts to the processing in FIG.
  • the message selection processing unit 311 determines whether all error messages have been processed (step S175). If there is an unprocessed error message, the process returns to step S163 via the terminal K. On the other hand, if all error messages have been processed for the specified customer, a monitoring suppression message for the specified customer is transmitted to the user terminal 400 to be presented to the user (step S177).
  • the DAT error is specified as a monitoring suppression message both at normal time and at the longest time
  • the Eventlog error and RAID error are specified as normal monitoring suppression messages and presented to the user. For example, a screen as shown in FIG. 21 is presented on the user terminal 400. In the example of FIG. 21, the longest monitoring suppression message and the normal monitoring suppression message are listed.
  • the check box is checked for the DAT error, which is the longest and normal monitoring suppression message, and the check box is checked for other normal monitoring suppression messages. It is a state that has not been done. In this way, the longest monitoring suppression message is presented in a state in which the check box is checked in order to prompt the user to suppress monitoring more strongly.
  • the normal monitoring suppression message is presented without checking the check box so as to determine whether or not to suppress monitoring by the user.
  • the user should click the send button after checking the check box, except for messages that must be monitored by referring to the contract with the customer.
  • the check attached to the longest monitoring suppression message may be unavoidable depending on the contents of the contract. If you reply with a check, the response time can be reduced and the possibility of cost reduction increases.
  • the user terminal 400 receives an input from the user, and transmits the monitored suppression message identifier to the monitoring suppression error message selection device 300.
  • the monitoring suppression error message selection device 300 receives the identifier of the monitoring suppression message from the user terminal 400, specifies the final monitoring suppression message using this as an instruction from the user, for example, as a monitoring suppression message to the monitoring device 200.
  • Set step S179. As for the monitoring suppression message set in this way, the monitoring notification is not performed and the customer notification is given.
  • the message selection processing unit 311 determines whether or not processing has been performed for all customers (step S181). If there is an unprocessed customer, the process returns to step S161 via the terminal L. If there is no unprocessed customer, the process returns to the original process and the process ends.
  • an error message to be set as a monitoring suppression message is selected and presented to the user, and the error message that has been instructed after confirmation by the user is used as the monitoring suppression message. Will be able to be set. As described above, if monitoring suppression is set for a message that is predicted to have a shorter response time when monitoring is suppressed, the cost can be reduced comprehensively.
  • the functional block diagram shown in FIG. 2 is an example and does not necessarily correspond to an actual program module configuration.
  • the treatment time for no treatment (corresponding to a predicted decrease value) is calculated by calculating the sum of the average process times of the processes that make up the number of cases is shown.
  • a process for calculating the response time for each process transition item may be performed, and the total of the response times of the non-process process items may be calculated and used.
  • the sum of the response times of unmonitored process transitions and the sum of the response times of treated process transitions may be calculated, and these differences may be simply used as the predicted increase value.
  • various calculation methods are possible for the predicted decrease value and the predicted increase value.
  • the order may be changed or it may be executed in parallel.
  • the monitoring target device 100, the monitoring device 200, the monitoring suppression error message selection device 300, and the user terminal 400 are computer devices, and as shown in FIG. 22, a memory 2501, a CPU 2503, a hard disk drive (HDD) 2505, A display control unit 2507 connected to the display device 2509, a drive device 2513 for a removable disk 2511, an input device 2515, and a communication control unit 2517 for connecting to a network are connected by a bus 2519.
  • An operating system (OS: Operating System) and an application program for executing the processing in this embodiment are stored in the HDD 2505, and are read from the HDD 2505 to the memory 2501 when executed by the CPU 2503.
  • OS Operating System
  • the CPU 2503 controls the display control unit 2507, the communication control unit 2517, and the drive device 2513 to perform necessary operations. Further, data in the middle of processing is stored in the memory 2501 and stored in the HDD 2505 if necessary.
  • an application program for performing the above-described processing is stored in a computer-readable removable disk 2511 and distributed, and installed from the drive device 2513 to the HDD 2505.
  • the HDD 2505 may be installed via a network such as the Internet and the communication control unit 2517.
  • Such a computer apparatus realizes various functions as described above by organically cooperating hardware such as the CPU 2503 and the memory 2501 described above, the OS, and necessary application programs.
  • an error message is sent from a data storage unit in which history data of a process executed to deal with an error message issued from a monitoring target device is stored in association with an error message and a matter.
  • the first process transition corresponding to the process transition of the matter that was monitored but did not perform the solution processing is specified for each error message, and the time spent for the first process transition for each error message
  • the third process transition related to the process transition of the matter is specified for each error message, and the total time spent for the process of the difference between the third process transition and the second process transition is determined for each error message.
  • An increase predicted value calculation step for calculating an increase in response time for a response time, and a decrease predicted value and an increase predicted value are compared for each error message.
  • a selection step of selecting is performed.
  • an error message that does not need to be monitored is selected based on a predicted decrease value that is expected to decrease if not monitored and an estimated increase value that is expected to increase if not monitored. Will be able to. Note that the error message may be selected automatically or may be finally set by the administrator.
  • the monitoring suppression error message selection method includes a step of presenting the selected error message to the user, and a step of performing setting so as to exclude the error message selected by the user from the monitoring target error message. Further, it may be included. Depending on the customer, there is an error message that must be monitored in accordance with the maintenance contract. This is confirmed by the administrator (that is, the user) here.
  • the decrease predicted value calculation step described above includes, from the data storage unit, a process transition of an item that includes a process that indicates that the error message is a monitoring target and that does not include a process that indicates the execution of the solution processing, as an error message. Extracting the first process transition every time, and for each error message, the time spent in the extracted first process transition is summed for all cases corresponding to the first process transition, and the predicted value decreases May be included.
  • the increase predicted value calculation step described above extracts, for each error message, a process transition of a matter including a process indicating that the error message is not a monitoring target from the data storage unit, and from the extracted process transition A process of a matter including a second process transition specifying step for specifying a second process transition, and a process indicating that the error message is a monitoring target and a process indicating the execution of the solution action from the data storage unit for each error message.
  • the third process transition specifying step for extracting the transition and specifying the third process transition from the extracted process transition, and the process of the difference between the third process transition and the second process transition for each error message
  • the estimated time is the total time spent for the number of cases corresponding to the third process transition. It may include a time calculation step of calculating.
  • the second process transition specifying step described above includes, for each error message, extracting a process transition of a matter including a process indicating that the error message is not a monitoring target from the data storage unit, and the extracted process A step of specifying the longest process transition among the transitions as a second process transition may be included. It assumes the worst case.
  • the second process transition specifying step described above includes, for each error message, extracting a process transition of a matter including a process indicating that the error message is not a monitoring target from the data storage unit, and the extracted process
  • the transition is divided into bigrams, and the number of cases is counted for each bigram.
  • the process that indicates that the error message is not monitored is included at the top, the process that indicates the implementation of the resolution action is included at the end, and the bigram with the highest number is given priority.
  • the bigram may be connected to generate a second process transition. This is a technique for forming a standard process transition as the second process transition.
  • the second process transition specifying step divides the extracted process transition into bigrams, counts the number of each bigram, and includes a process indicating that the error message is not a monitoring target at the top, indicating the implementation of the resolution action.
  • the method further includes the step of generating a fourth process transition by concatenating the bigrams so as to give priority to the bigrams having a large number of cases in the end, And a step of calculating, for each error message, a total time spent in the process of the difference between the third process transition and the fourth process transition as a second increase predicted value of the response time for the error message. Good.
  • the selection step described above compares the decrease predicted value with the second increase predicted value for each error message, and selects the error message when the decrease predicted value is larger than the second increase predicted value.
  • the step of performing may be included. Thus, by calculating the two predicted increase values, for example, it is possible to give a criterion for judgment to a user who is an administrator.
  • the time calculation step described above extracts the average processing time of the corresponding process from the average processing time data storage unit that stores the average processing time for each process, and the extracted average processing time and the number of cases A step of calculating an increase predicted value from the above may be included. A model-like increase prediction value can be calculated.
  • the third process transition specifying step described above performs, for each error message, a process transition of a matter including a process indicating that the error message is a monitoring target and a process indicating the execution of the solution action from the data storage unit.
  • the process of extracting, dividing the extracted process transitions into bigrams, counting the number of each bigram, including the process that indicates that the error message is to be monitored at the beginning, and the process that indicates the implementation of the resolution action at the end Including a large number of bigrams and concatenating bigrams to generate a third process transition.

Abstract

 監視抑止エラーメッセージ選択方法は、エラーメッセージを監視していたが解決処置を行わなかったことを表す案件のプロセス遷移に相当する第1のプロセス遷移を特定し、当該第1のプロセス遷移に費やされる時間の総和を応対時間の減少予測値として算出し、エラーメッセージを監視していなかったことを表す案件のプロセス遷移に係る第2のプロセス遷移と、エラーメッセージを監視しており解決処置を行ったことを表す案件のプロセス遷移に係る第3のプロセス遷移とを特定し、第3のプロセス遷移と第2のプロセス遷移との差のプロセスに費やされる時間の総和を応対時間の増加予測値として算出し、減少予測値と増加予測値とを比較して、減少予測値が増加予測値より大きい場合に該当するエラーメッセージを選択するものである。

Description

監視抑止エラーメッセージ選択方法及びプログラム
 本技術は、監視対象装置から発せられるエラーメッセージのうち監視対象から除外すべきエラーメッセージを特定するための情報処理技術に関する。
 計算機運用サービス業務では、監視対象装置である計算機から発せられるエラーメッセージを監視して、エラーメッセージを検出するとその重要性に合わせた所定の処置を行う。エラーメッセージが障害につながる重要なものであれば障害を未然に防ぐための適切な処置を行い、重要なものでない場合でも顧客に発生報告を行うなどの応対を行う。
 しかしながら、エラーメッセージが多発する顧客システムでは応対に多大なコストがかかり、重要度の低いエラーメッセージを選択して監視抑止(すなわち監視対象から除外)とすることで、応対に要する総時間の削減、すなわちコストの削減を図ることが求められている。
 一方で、正しい基準で監視抑止とするエラーメッセージを選択しないと、エラーメッセージに係るエラーがシステム障害につながってしまい、かえって応対時間が長くなってしまうということになりかねない。
 なお、エラーメッセージの重要性が既知で、その重要性に応じてエラーメッセージの監視を行うか否かを設定するような技術は存在している。しかしながら、特定のエラーメッセージが監視抑止可能であるかがわからない場合にはそのような設定はできない。
特開2005-276042号公報
 上で述べたように、エラーメッセージの重要度などのエラーメッセージの監視の必要性を特定するための情報が既知であれば、それに応じて特定のエラーメッセージに対して監視抑止の設定を行うことは可能である。しかしながら、エラーメッセージの監視の必要性を特定するための情報が既知でない場合には、従来では何らの対策を採ることができない。
 従って、本技術の目的は、エラーメッセージの監視の必要性を特定するための情報が得られていない場合でも、全体として応対時間を削減できるように、監視不要なエラーメッセージを選択するための技術を提供することである。
 本監視抑止エラーメッセージ選択方法は、監視対象装置から発せられるエラーメッセージに対処するため実施されたプロセスの履歴データがエラーメッセージ及び案件に対応付けられて格納されているデータ格納部から、エラーメッセージを監視していたが解決処置を行わなかったことを表す案件のプロセス遷移に相当する第1のプロセス遷移をエラーメッセージ毎に特定し、エラーメッセージ毎に、当該第1のプロセス遷移に費やされる時間の総和を当該エラーメッセージについての応対時間の減少予測値として算出する減少予測値算出ステップと、データ格納部から、エラーメッセージを監視していなかったことを表す案件のプロセス遷移に係る第2のプロセス遷移と、エラーメッセージを監視しており解決処置を行ったことを表す案件のプロセス遷移に係る第3のプロセス遷移とをエラーメッセージ毎に特定し、エラーメッセージ毎に第3のプロセス遷移と第2のプロセス遷移との差のプロセスに費やされる時間の総和を当該エラーメッセージについての応対時間の増加予測値として算出する増加予測値算出ステップと、エラーメッセージ毎に、減少予測値と増加予測値とを比較して、減少予測値が増加予測値より大きい場合に当該エラーメッセージを選択する選択ステップとを含む。
図1は、システム概要図である。 図2は、監視抑止エラーメッセージ選択装置の機能ブロック図である。 図3は、応対履歴DBに格納されるデータの一例を示す図である。 図4は、本技術の本実施の形態のメインの処理フローを示す図である。 図5は、平均プロセス時間算出処理の処理フローを示す図である。 図6は、平均プロセス時間DBに格納されるデータの一例を示す図である。 図7は、応対プロセス遷移生成処理の処理フローを示す図である。 図8は、応対プロセス遷移DBに格納されるデータの一例を示す図である。 図9は、応対プロセス遷移生成処理の処理フローを示す図である。 図10は、応対時間減少予測値算出処理の処理フローを示す図である。 図11は、応対時間減少予測値算出処理の処理フローを示す図である。 図12は、増減予測値DBに格納されるデータの一例を示す図である。 図13は、非監視案件追加プロセス抽出処理の処理フローを示す図である。 図14は、通常時応対プロセス遷移生成処理の処理フローを示す図である。 図15は、非監視案件についてのプロセス遷移のバイグラムの一例を示す図である。 図16は、有処置案件についてのプロセス遷移のバイグラムの一例を示す図である。 図17は、非監視案件追加プロセス抽出処理の処理フローを示す図である。 図18は、応対時間増加予測値算出処理の処理フローを示す図である。 図19は、監視抑止メッセージ選択処理の処理フローを示す図である。 図20は、監視抑止メッセージ選択処理の処理フローを示す図である。 図21は、監視抑止メッセージの選択確認画面の一例を示す図である。 図22は、コンピュータの機能ブロック図である。
 図1に、本技術の一実施の形態に係るシステム概要図を示す。例えば、顧客のコンピュータ・システムである監視対象装置100は、ネットワーク1を介して、監視対象装置100から発せられるエラーメッセージに応答して所定の宛先に所定の通知を行う監視装置200に接続されている。但し、監視装置200の機能は監視対象装置100と一体化されている場合もある。また、監視装置200や監視対象装置100には、エラーメッセージに対応して実施された処置などのログデータも蓄積されているものとする。さらに、本実施の形態における主要な処理を実施する監視抑止エラーメッセージ選択装置300と、監視抑止エラーメッセージ選択装置300に対して処理を行わせる管理者たるユーザが操作するユーザ端末400もネットワーク1に接続されている。監視対象装置100は、1つに限定されるものではなく、1人の顧客で複数のシステムが含まれる場合もあれば、複数の顧客のシステムである場合もある。監視装置200の台数についても限定はない。
 図2に、監視抑止エラーメッセージ選択装置300の機能ブロック図を示す。監視抑止エラーメッセージ選択装置300は、応対履歴DB301と、応対プロセス遷移生成部302と、応対プロセス遷移DB303と、平均プロセス時間算出部304と、平均プロセス時間DB305と、追加プロセス抽出部306と、追加プロセスデータ格納部307と、減少予測値算出部308と、増加予測値算出部309と、増減予測値DB310と、メッセージ選択処理部311とを有する。
 応対履歴DB301は、例えば図3に示すようなデータを格納している。図3の例では、案件IDと、顧客名と、エラーメッセージと、プロセス開始時刻と、プロセス終了時刻と、プロセス名と、プロセス種別とが登録されるようになっている。なお、プロセスとは、エラーメッセージに対して行われる応対の名称を表しており、顧客によって行われるもの、システムエンジニアによっておこなわれるもの、監視装置200によって行われるものなどが含まれる。これらのデータ項目のうち案件ID、顧客名及びエラーメッセージについては、その案件を担当するシステムエンジニアなどが入力する。また、プロセス開始時刻、プロセス終了時刻及びプロセス名については、監視対象装置100又は監視装置200などに保持されているログデータから抽出するが、その案件を担当するシステムエンジニアにより入力することにしてもよい。さらに、プロセス種別は、ここでは「通報」「情報収集」「解決処置」のいずれかであり、プロセス名から自動的に特定される。なお、このようなデータを収集する処理については、本実施の形態の主要部ではなく、また従来技術でも可能であるのでこれ以上述べない。
 応対プロセス遷移生成部302は、応対履歴DB301に格納されているデータを用いて以下で述べる処理を実施し、処理結果を応対プロセス遷移DB303に格納する。また、平均プロセス時間算出部304は、応対履歴DB301に格納されているデータを用いて以下で述べる処理を実施し、処理結果を平均プロセス時間DB305に格納する。追加プロセス抽出部306は、応対プロセス遷移DB303に格納されているデータを用いて以下で述べる処理を実施し、処理結果を追加プロセスデータ格納部307に格納する。そして、減少予測値算出部308は、応対プロセス遷移DB303及び平均プロセス時間DB305に格納されているデータを用いて以下で述べる処理を実施し、処理結果を増減予測値DB310に格納する。また、増加予測値算出部309は、応対プロセス遷移DB303、追加プロセスデータ格納部307及び平均プロセス時間DB305に格納されているデータを用いて以下で述べる処理を実施し、処理結果を増減予測値DB310に格納する。メッセージ選択処理部311は、増減予測値DB310に格納されているデータを用いて以下で述べる処理を実施し、例えばユーザ端末400に処理結果を送信したり、監視装置200に設定を行ったりする処理を実施する。
 次に、図4乃至図21を用いて図2に示した監視抑止エラーメッセージ選択装置300の処理内容について説明する。まず、平均プロセス時間算出部304は、応対履歴DB301に格納されているデータを用いて、平均プロセス時間算出処理を実施する(図4:ステップS1)。平均プロセス時間算出処理については、図5及び図6を用いて説明する。
 平均プロセス時間算出部304は、応対履歴DB301において、エラーメッセージ名及びプロセス名の未処理の組み合わせについて1つ特定する(ステップS21)。そして、応対履歴DB301から、特定された組み合わせに該当するレコードを全て読み出す(ステップS23)。さらに、読み出したレコードの数をカウントし、特定された組み合わせに対応付けて例えばメインメモリなどの記憶装置に格納する(ステップS25)。そして、読み出した各レコードのプロセス開始時刻とプロセス終了時刻との差を算出するとともに累積してプロセス累積時間を算出し、特定された組み合わせに対応付けて例えばメインメモリなどの記憶装置に格納する(ステップS27)。
 ここで、平均プロセス時間算出部304は、エラーメッセージ名及びプロセス名の全ての組み合わせについて処理したか判断する(ステップS29)。未処理の組み合わせが存在する場合にはステップS21に戻る。一方、全ての組み合わせについて処理した場合には、平均プロセス時間算出部304は、組み合わせ毎に、プロセス累積時間をカウント値で除することによって、エラーメッセージ及びプロセス毎に平均プロセス時間を算出し、エラーメッセージ及びプロセスに対応付けて平均プロセス時間DB305に格納する(ステップS31)。そして元の処理に戻る。
 図6に、平均プロセス時間DB305に格納されているデータの一例を示す。図6のテーブルは、例えばEventlogエラーというエラーメッセージについてのテーブルであって、そのエラーメッセージについて行われたプロセス毎に、平均プロセス時間が登録されている。
 図4の処理フローの説明に戻って、次に、応対プロセス遷移生成部302は、応対履歴DB301に格納されているデータを用いて応対プロセス遷移生成処理を実施する(ステップS3)。この応対プロセス遷移生成処理については図7乃至図9を用いて説明する。
 応対プロセス遷移生成部302は、応対履歴DB301において、未処理の顧客を1人特定する(ステップS41)。そして、応対履歴DB301から、特定された顧客について未処理の1案件に係るレコードを抽出し、プロセス開始時刻の順でプロセスを並べてプロセス遷移を形成し、当該プロセス遷移のデータを例えばメインメモリなどの記憶装置に格納する(ステップS43)。但し、形成されたプロセス遷移において再出現するプロセスが存在すれば、当該プロセス名をプロセス遷移から削除する(ステップS45)。案件によっては、プロセスの手戻りが発生する場合もあるが、ここでは手戻りについては考慮しないものとする。但し、この処理は任意である。なお、応対プロセス遷移は、最初に実施されたプロセスから最後に実施されたプロセスまで、時系列にプロセスが並べられたものである。
 その後、応対プロセス遷移生成部302は、応対履歴DB301において、特定された顧客の全ての案件を処理したか判断する(ステップS47)。未処理の案件が存在する場合にはステップS43に戻る。一方、特定された顧客について全ての案件を処理した場合には、形成されたプロセス遷移を、関係するエラーメッセージ名毎に分類して該当案件数をカウントし、当該カウント値を、エラーメッセージ名及びプロセス遷移に対応付けてメインメモリなどの記憶装置に格納する(ステップS49)。
 ここで、応対プロセス遷移生成部302は、未処理のエラーメッセージ名を1つ特定し(ステップS51)、さらに未処理のプロセス遷移を1つ特定する(ステップS53)。そして、応対プロセス遷移DB303における、特定された顧客及びエラーメッセージ名のテーブルに、特定されたプロセス遷移及び案件数のカウント値を登録する(ステップS55)。処理は端子Aを介して図9の処理に移行する。
 例えば、図8に示すようなテーブルが、応対プロセス遷移DB303に格納される。図8のテーブルは、顧客ABC社のエラーメッセージ「Eventlogエラー」についてのテーブルであり、案件数と、案件種別と、応対プロセス遷移とが登録されるようになっている。ステップS55ではまだ案件種別は登録されない。
 図9の処理の説明に移行して、応対プロセス遷移生成部302は、特定されたプロセス遷移に「監視」に係るプロセスが含まれるか判断する(ステップS57)。図8の例では「監視通報」というプロセスが含まれているか判断する。例えば、特定されたプロセス遷移が図8の第1行目及び第2行目のようなプロセス遷移の場合には、「監視通報」は含まれていないので、ステップS57で否定的な判断がなされる。
 ここで、特定されたプロセス遷移に「監視」に係るプロセスが含まれていない場合には、応対プロセス遷移生成部302は、案件種別を「非監視」として、応対プロセス遷移DB303の該当レコードに登録する(ステップS59)。そして、ステップS67に移行する。一方、特定されたプロセス遷移に「監視」に係るプロセスが含まれている場合には、特定されたプロセス遷移に「解決処置」が含まれるか判断する(ステップS61)。すなわち、何らかの問題解決のための処置を実施したことが記録されているか判断する。例えば、図8の第3乃至第5行目のようなプロセス遷移の場合には「解決処置」が含まれていると判断され、第6行目のようなプロセス遷移の場合には「解決処置」が含まれていないと判断される。
 特定されたプロセス遷移に「解決処置」が含まれている場合には、応対プロセス遷移生成部302は、案件種別を「有処置」として、応対プロセス遷移DB303の該当レコードに登録する(ステップS65)。そして、ステップS67に移行する。
 一方、特定されたプロセス遷移に「解決処置」が含まれていない場合には、応対プロセス遷移生成部302は、案件種別を「無処置」として、応対プロセス遷移DB303の該当レコードに登録する(ステップS63)。そしてステップS67に移行する。
 その後、応対プロセス遷移生成部302は、特定された顧客の特定されたエラーメッセージ名について、全てのプロセス遷移を処理したか判断する(ステップS67)。未処理のプロセス遷移が存在する場合には、端子Bを介して図7のステップS53に戻る。一方、未処理のプロセス遷移が存在しない場合には、特定された顧客について、全てのエラーメッセージ名を処理したか判断する(ステップS69)。未処理のエラーメッセージ名が存在する場合には、端子Cを介して図7のステップS51に戻る。一方、未処理のエラーメッセージ名が存在しない場合には、全ての顧客について処理したか判断する(ステップS71)。未処理の顧客が存在する場合には、端子Dを介して図7のステップS41に戻る。一方、全ての顧客について処理した場合には、元の処理に戻る。
 このような処理を実施することによって、顧客及びエラーメッセージ毎に、実際に行われているプロセス遷移及びその案件数を特定することができる。以上のようにして本実施の形態における前処理が完了する。なお、応対プロセス遷移DB303に格納されるデータについては、別途用意して応対プロセス遷移DB303に、登録するような構成であってもよい。また、平均プロセス時間DB305に格納されるデータについても、同様に別途用意して平均プロセス時間DB305に登録するようにしてもよい。
 図4の処理の説明に戻って、減少予測値算出部308は、応対プロセス遷移DB303及び平均プロセス時間DB305に格納されているデータを用いて、応対時間減少予測値算出処理を実施する(ステップS5)。応対時間減少予測値算出処理については、図10乃至図12を用いて説明する。
 減少予測値算出部308は、応対プロセス遷移DB303において、顧客及びエラーメッセージ名の未処理の組み合わせを1つ特定する(ステップS81)。そして、応対プロセス遷移DB303から、特定された組み合わせについて、「無処置」案件に該当するプロセス遷移及び案件数を抽出する(ステップS83)。図8の例では、第6行目のデータが読み出されることになる。
 本実施の形態では、「無処置」案件は、当該エラーメッセージを監視しているが監視の結果の通報があっても解決処置を実施していないということを表しており、もし当該エラーメッセージを監視しないようにすると、当該「無処置」案件は発生しなくなる。すなわち、当該エラーメッセージを監視しないようにすれば、「無処置」案件についてかかった時間は削減できると考えられる。よって、応対時間減少予測値算出処理では、「無処置」案件に基づき、削減されるであろう時間を予測するものである。
 減少予測値算出部308は、抽出されたプロセス遷移のうち、未処理の抽出プロセス遷移を1つ特定する(ステップS85)。そして、特定されたプロセス遷移に含まれる各プロセスの平均プロセス時間を、平均プロセス時間DB305から取得する(ステップS87)。図8の第6行目のデータの場合には、「監視通報」の10分と「SE連絡」の15分が取得される。さらに、特定されたプロセス遷移について、該当する平均プロセス時間を加算して合計プロセス時間を算出し、例えばメインメモリなどの記憶装置に格納する(ステップS89)。10+15=25分が合計プロセス時間と算出される。
 また、減少予測値算出部308は、特定されたプロセス遷移について合計プロセス時間と案件数の積を算出し、計算結果を、特定された組み合わせについての応対時間減少予測値に加算する(ステップS91)。図8の第6行目のデータの場合には、16件であるので、25分×16=400分が算出される。
 その後、減少予測値算出部308は、特定された組み合わせについて、全ての抽出プロセス遷移について処理したか判断する(ステップS93)。未処理の抽出プロセス遷移が存在する場合には、ステップS85に戻る。一方、未処理の抽出プロセス遷移が存在しない場合には、端子Eを介して図11の処理に移行する。
 図11の処理の説明に移行して、減少予測値算出部308は、ステップS91で加算された応対時間減少予測値を、顧客及びエラーメッセージ名の組み合わせに対応付けて、増減予測値DB310に登録する(ステップS95)。例えば、図12に、増減予測値DB310に格納されるデータの一例を示す。図12では、顧客ABC社のテーブルを示しており、このテーブルには、エラーメッセージ毎に、応対時間の減少予測値と、応対時間の通常時増加予測値と、応対時間の最長時増加予測値とが登録されているようになっている。ステップS95では、応対時間の減少予測値が登録される。
 そして、減少予測値算出部308は、顧客及びエラーメッセージ名の全ての組み合わせについて処理したか判断する(ステップS97)。未処理の組み合わせが存在している場合には、端子Fを介して図10のステップS81に戻る。一方、未処理の組み合わせが存在していない場合には、元の処理に戻る。
 以上のような処理を実施することによって、エラーメッセージ毎に、監視しなくなった場合に削減できる作業時間の累計を減少予測値として算出することができるようになる。
 図4の処理の説明に戻って、追加プロセス抽出部306は、応対プロセス遷移DB303に格納されるデータを用いて、非監視案件追加プロセス抽出処理を実施する(ステップS7)。非監視案件追加プロセス抽出処理については、図13乃至図17を用いて説明する。
 追加プロセス抽出部306は、応対プロセス遷移DB303において、顧客及びエラーメッセージ名の未処理の組み合わせを1つ特定する(ステップS101)。そして、特定された組み合わせについて、「非監視」案件で且つ包含するプロセス数が最も多いプロセス遷移を、最長時応対プロセス遷移として特定し、例えばメインメモリなどの記憶装置に格納する(ステップS103)。図8の例では、第1行目と第2行目のプロセス遷移のうち、第2行目の方がプロセス数が多いので、第2行目のプロセス遷移が選択される。但し、平均プロセス時間DB305に格納されている平均プロセス時間から、合計時間が最長となるプロセス遷移を特定するようにしてもよい。ここで特定されたプロセス遷移が、非監視案件における最長時追加プロセスを特定するために用いられる。
 次に、追加プロセス抽出部306は、応対プロセス遷移DB303において、特定された組み合わせについて、「非監視」案件に該当する全てのプロセス遷移を抽出し、例えばメインメモリなどの記憶装置に格納する(ステップS105)。図8の例では、第1行目と第2行目が抽出される。そして、非監視案件に該当するプロセス遷移についての通常時応対プロセス遷移生成処理を実施する(ステップS107)。通常時応対プロセス遷移生成処理については、図14を用いて説明する。
 追加プロセス抽出部306は、抽出プロセス遷移から、プロセスのbigram(バイグラム)を抽出し、各バイグラム種別について、当該バイグラムを含むプロセス遷移の案件数をカウントして、例えばメインメモリなどの記憶装置に格納する(ステップS123)。図8の例では、第1行目と第2行目のプロセス遷移を、2つのプロセスの連鎖に分解する。すなわち、第1行目の例では、顧客通報からSE連絡へのバイグラム、SE連絡からログ採取へのバイグラム、ログ採取から解決処置へのバイグラムに分解する。第2行目についても同様に分解する。そうすると、図15に示すようなデータが得られる。案件数は、該当するバイグラムを含むプロセス遷移の合計件数であり、顧客通報からSE連絡へのバイグラムであれば、第1行目のプロセス遷移が4件で第2行目のプロセス遷移が3件であり、合計7件となる。
 次に、追加プロセス抽出部306は、先頭に「通報」に係るプロセスを含むバイグラムのうち案件数が最も多いバイグラムを特定し、バイグラム連鎖の先頭に設定する(ステップS125)。例えば、非監視案件の場合には、「顧客通報」を抽出する。以下で述べる有処置案件であれば「監視通報」を抽出する。図15の例では、顧客通報からSE連絡へのバイグラムが特定され、バイグラム連鎖の先頭に設定される。
 そして、追加プロセス抽出部306は、バイグラム連鎖の最後尾プロセス名を先頭に含むバイグラムのうち案件数が最も多いバイグラムを特定し、バイグラム連鎖に連結する(ステップS127)。顧客通報からSE連絡へのバイグラムが既に選択されているので、SE連絡を先頭に含むバイグラムであるSE連絡からログ採取へのバイグラムとSE連絡から事例検索へのバイグラムとのうち、案件数が多いSE連絡からログ採取へのバイグラムが選択される。そして、顧客通報、SE連絡、ログ採取という順番のバイグラム連鎖が形成される。
 その後、追加プロセス抽出部306は、バイグラム連鎖の最後尾プロセス名が「解決処置」であるか判断する(ステップS129)。バイグラム連鎖の最後尾プロセス名が「解決処置」でない場合には、まだバイグラムを連結することになるのでステップS127に戻る。図15の例では、最後尾プロセス名の「ログ採取」に連結できるバイグラムはログ採取から解決処置へのバイグラムであるので、これを連結すると「顧客通報」->「SE連絡」->「ログ採取」->「解決処置」というプロセス遷移が形成される。
 バイグラム連鎖の最後尾プロセス名が「解決処置」である場合には、追加プロセス抽出部306は、現バイグラム連鎖を通常時応対プロセス遷移として設定する(ステップS131)。図15を処理する場合には、非監視案件についての通常時応対プロセス遷移が得られたことになる。そして処理は図13の処理に戻る。
 このように、発生する可能性のより高いバイグラムを連結して典型的なプロセス遷移を形成し、当該プロセス遷移を通常時応対プロセス遷移として以下の処理で用いる。
 図13の処理の説明に戻って、追加プロセス抽出部306は、特定された組み合わせについて、有処置案件に該当するプロセス遷移を、応対プロセス遷移DB303から抽出する(ステップS109)。図8の例では、第3行目乃至第5行目のプロセス遷移が抽出される。そして、有処置案件に該当するプロセス遷移についての通常時応対プロセス遷移生成処理を実施する(ステップS111)。図14に示すような処理を、有処置案件として抽出されたプロセス遷移について実施する。そうすると、図16に示すようなバイグラムが抽出される。また、ステップS125では、監視通報からSE連絡へのバイグラムと、監視通報から事例検索へのバイグラムと、監視通報からログ採取へのバイグラムとのうち、件数が最も多い監視通報からログ採取へのバイグラムが先頭のバイグラムとして選択される。次に、ログ採取を先頭とするバイグラムは1つだけで、ログ採取から解決処置へのバイグラムであるので先頭のバイグラムに連結する。そうすると、最後尾プロセス名が「解決処置」であるので、「監視通報」->「ログ採取」->「解決処置」というプロセス遷移が、有処置案件についての通常時応対プロセス遷移として設定される。
 処理は端子Gを介して図17の処理に移行して、追加プロセス抽出部306は、非監視案件の最長時応対プロセス遷移に存在するが有処置案件の通常時応対プロセス遷移に存在しないプロセス(但し「監視通報」に相当するプロセスを除く)を、最長時追加プロセスとして特定し、顧客及びエラーメッセージ名に対応付けて追加プロセスデータ格納部307に格納する(ステップS113)。上で述べた例では、「SE連絡」というプロセスと「事例検索」というプロセスとが抽出される。これによって、あるエラーメッセージを監視しない場合に、監視した場合の通常時応対プロセス遷移に比して余計に必要となるプロセスが特定される。特にステップS113では、エラーメッセージを監視しない場合に最も長くなるプロセス遷移について余計に必要となるプロセスが、最長時追加プロセスとして特定される。
 また、追加プロセス抽出部306は、非監視案件の通常時応対プロセス遷移に存在するが有処置案件の通常時応対プロセス遷移に存在しないプロセス(但し「監視通報」に相当するプロセスを除く)を、通常時追加プロセスとして特定し、顧客及びエラーメッセージ名の組み合わせに対応付けて追加プロセスデータ格納部307に格納する(ステップS115)。上で述べた例では、「SE連絡」というプロセスのみが抽出される。このような処理を実施することで、あるエラーメッセージを監視しない場合に、監視した場合の通常時応対プロセス遷移に比して余計に必要となる、プロセスが特定される。
 そして、追加プロセス抽出部306は、顧客及びエラーメッセージ名の全ての組み合わせについて処理したか判断する(ステップS117)。未処理の組み合わせが存在する場合には、端子Hを介して図13のステップS101に戻る。一方、全ての組み合わせについて処理した場合には元の処理に戻る。
 このような処理を実施することによって、上で述べたように2つのパターンについて、エラーメッセージを監視しない場合に余計に必要となるプロセスを特定することができるようになる。
 なお、通常時応対プロセス遷移については、上で述べたような処理ではなく、最も多く発生する案件のプロセス遷移を採用するようにしてもよいし、該当プロセス遷移の平均時間を算出して、当該平均時間に最も近くなるプロセス遷移を採用するようにしてもよい。
 図4の処理の説明に戻って、次に、増加予測値算出部309は、追加プロセスデータ格納部307及び平均プロセス時間DB305に格納されているデータを用いて、応対時間増加予測値算出処理を実施する(ステップS9)。この応対時間増加予測値算出処理については、図18を用いて説明する。
 まず、増加予測値算出部309は、追加プロセスデータ格納部307において、顧客及びエラーメッセージ名の未処理の組み合わせを特定する(ステップS141)。また、特定された組み合わせについて、最長時追加プロセス及び通常時追加プロセスを、追加プロセスデータ格納部307から読み出す(ステップS143)。そして、最長時追加プロセス及び通常時追加プロセスのそれぞれについて該当する平均プロセス時間を、平均プロセス時間DB305から読み出す(ステップS145)。
 その後、増加予測値算出部309は、最長時追加プロセスについて平均プロセス時間の合計を、通常時追加プロセスについて平均プロセス時間の合計をそれぞれ算出する(ステップS147)。最長時追加プロセスについての平均プロセス時間の合計は、上の例では、15+20=35分であり、通常時追加プロセスについての平均プロセス時間の合計は、上の例では、15分である。
 そして、増加予測値算出部309は、特定された組み合わせについての有処置案件数を、応対プロセス遷移DB303から抽出する(ステップS149)。図8の例では、有処置案件は第3レコードから第5レコードの合計12件である。なお、この件数については、ステップS109でカウントして追加プロセスデータ格納部307に格納しておくようにしてもよい。
 その後、増加予測値算出部309は、最長時追加プロセスについての平均プロセス時間の合計と有処置案件数の積を最長時の増加予測値として算出し、さらに通常時追加プロセスについての平均プロセス時間の合計と有処置案件数の積を通常時の増加予測値として算出し、特定された組み合わせに対応付けて増減予測値DB310に登録する(ステップS151)。最長時の増加予測値は、35×12=420分であり、通常時の増加予測値は、15×12=180分である。このような処理を実施することによって、図12の第1のレコードのデータが揃ったことになる。
 さらに、増加予測値算出部309は、顧客及びエラーメッセージ名の全ての組み合わせについて処理したか判断する(ステップS153)。未処理の組み合わせが存在する場合にはステップS141に戻る。一方、未処理の組み合わせが存在しない場合には、元の処理に戻る。
 以上のようにして、通常時と最長時のそれぞれについて、エラーメッセージを監視しなかった場合に余計に必要となる応対時間が、応対時間増加予測値として得られることになる。
 図4の処理の説明に戻って、メッセージ選択処理部311は、増減予測値DB310に格納されているデータを用いて、監視抑止メッセージ選択処理を実施する(ステップS11)。監視抑止メッセージ選択処理については、図19乃至図21を用いて説明する。
 メッセージ選択処理部311は、増減予測値DB310において、未処理の顧客を1人特定する(ステップS161)。また、当該顧客について未処理のエラーメッセージを1つ特定する(ステップS163)。そして、特定された顧客及びエラーメッセージについて、応対時間減少予測値と最長時の応対時間増加予測値と通常時の応対時間増加予測値とを、増減予測値DB310から読み出す(ステップS165)。
 そして、メッセージ選択処理部311は、応対時間減少予測値が通常時応対時間増加予測値より大きいか判断する(ステップS167)。これによって、通常時に、特定されたエラーメッセージを監視しないようにした方が、トータルで応対時間が減少するか否かを判断する。この条件に合致する場合には、特定されたエラーメッセージを通常時の監視抑止メッセージに設定して、メインメモリなどの記憶装置に格納する(ステップS169)。その後ステップS171に移行する。一方、この条件に合致しない場合には、ステップS171に移行する。
 さらに、メッセージ選択処理部311は、応対時間減少予測値が最長時応対時間増加予測値より長いかを判断する(ステップS171)。これによって、最長時に、特定されたエラーメッセージを監視しないようにした方が、トータルで応対時間が減少するか否かを判断する。この条件に合致する場合には、特定されたエラーメッセージを最長時の監視抑止メッセージに設定して、メインメモリなどの記憶装置に格納する(ステップS173)。その後端子Jを介して図20の処理に移行する。一方、上記条件に合致しない場合にも、端子Jを介して図20の処理に移行する。
 図20の処理の説明に移行して、メッセージ選択処理部311は、全てのエラーメッセージについて処理したか判断する(ステップS175)。未処理のエラーメッセージが存在する場合には端子Kを介してステップS163に戻る。一方、特定された顧客について、全てのエラーメッセージについて処理した場合には、特定された顧客の監視抑止メッセージを、ユーザ端末400に送信し、ユーザに提示させる(ステップS177)。図12の例では、DATエラーについては、通常時も最長時も監視抑止メッセージとして特定され、Eventlogエラー及びRAIDエラーについては通常時の監視抑止メッセージとして特定され、ユーザに提示される。例えば図21に示すような画面がユーザ端末400に提示される。図21の例では、最長時の監視抑止メッセージ及び通常時の監視抑止メッセージが列挙されている。本例では、最長時及び通常時の監視抑止メッセージであるDATエラーについては、チェックボックスにチェックが付されている状態であり、そのほかの通常時の監視抑止メッセージについてはチェックボックスにはチェックが付されていない状態である。このように、最長時の監視抑止メッセージについては、ユーザに対して、より強く監視抑止するように促すため、チェックボックスにチェックを付した状態で提示する。通常時の監視抑止メッセージについては、ユーザに監視抑止するか否かを判断するように、チェックボックスにはチェックを付さない状態で提示されている。ユーザは、顧客との契約を参照して、必ず監視しなければならないメッセージを除き、チェックボックスにチェックを付した後に送信ボタンをクリックするべきである。なお、最長時の監視抑止メッセージに付されたチェックについても、契約内容によっては外さざるを得ない場合もある。チェックを付して返信すれば、応対時間を削減でき、コスト削減につながる可能性が高くなる。
 ユーザ端末400は、ユーザからの入力を受け付け、チェックの付された監視抑制メッセージの識別子を、監視抑止エラーメッセージ選択装置300に送信する。監視抑止エラーメッセージ選択装置300は、ユーザ端末400から、監視抑止メッセージの識別子を受信して、これをユーザからの指示として最終的な監視抑止メッセージを特定し、例えば監視装置200に監視抑止メッセージとして設定する(ステップS179)。このようにして設定された監視抑止メッセージについては、監視通報が行われなくなり、顧客通報となる。
 その後、メッセージ選択処理部311は、全ての顧客について処理したか判断する(ステップS181)。未処理の顧客が存在する場合には端子Lを介してステップS161に戻る。未処理の顧客が存在しない場合には、元の処理に戻り、処理を終了する。
 以上のような処理を実施することによって、監視抑止メッセージとして設定すべきエラーメッセージを選択してユーザに提示するとともに、ユーザの確認の上、指示のあったエラーメッセージを監視抑止メッセージとして監視装置200に設定することができるようになる。上で述べたように、監視抑止した方が、応対時間が短くなると予測されるようなメッセージについて監視抑止設定を行えば、総合的にコストを削減することができる。
 以上本技術の実施の形態について説明したが、本技術はこれに限定されるものではない。例えば、図2に示した機能ブロック図は一例であって、必ずしも実際のプログラムモジュール構成とは対応しない。
 また、例えば、無処置の応対時間(減少予測値に相当)を、それを構成するプロセスの平均プロセス時間の和に案件数をかけるような演算で算出する例を示した。しかし、簡易的には、プロセス遷移の案件毎に応対時間を算出するような処理を実施しておき、無処置のプロセス遷移の案件の応対時間の総和を算出して用いるようにしてもよい。同様に、非監視のプロセス遷移の応対時間の総和と、有処置のプロセス遷移の応対時間の総和とを算出するようにして、これらの差を増加予測値として簡易的に用いるようにしてもよい。そのほか、減少予測値及び増加予測値については、様々な計算方法が可能である。
 また、処理フローについても処理結果が変わらない限り、順番を入れ替えたり、並列実行するようにしてもよい。
 なお、監視対象装置100、監視装置200、監視抑止エラーメッセージ選択装置300及びユーザ端末400は、コンピュータ装置であって、図22に示すように、メモリ2501とCPU2503とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施例における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。必要に応じてCPU2503は、表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ2501に格納され、必要があればHDD2505に格納される。本技術の実施例では、上で述べた処理を実施するためのアプリケーション・プログラムはコンピュータ読み取り可能なリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
 本実施の形態をまとめると以下のようになる。
 本監視抑止エラーメッセージ選択方法は、監視対象装置から発せられるエラーメッセージに対処するため実施されたプロセスの履歴データがエラーメッセージ及び案件に対応付けられて格納されているデータ格納部から、エラーメッセージを監視していたが解決処置を行わなかったことを表す案件のプロセス遷移に相当する第1のプロセス遷移をエラーメッセージ毎に特定し、前記エラーメッセージ毎に、当該第1のプロセス遷移に費やされる時間の総和を当該エラーメッセージについての応対時間の減少予測値として算出する減少予測値算出ステップと、データ格納部から、エラーメッセージを監視していなかったことを表す案件のプロセス遷移に係る第2のプロセス遷移と、エラーメッセージを監視しており解決処置を行ったことを表す案件のプロセス遷移に係る第3のプロセス遷移とをエラーメッセージ毎に特定し、エラーメッセージ毎に第3のプロセス遷移と第2のプロセス遷移との差のプロセスに費やされる時間の総和を当該エラーメッセージについての応対時間の増加予測値として算出する増加予測値算出ステップと、エラーメッセージ毎に、減少予測値と増加予測値とを比較して、減少予測値が増加予測値より大きい場合に当該エラーメッセージを選択する選択ステップとを含む。
 このようにすれば、監視しないことによって減少すると見込まれる応対時間である減少予測値と、監視しないことによって増加すると見込まれる応対時間である増加予測値に基づき、監視不要なエラーメッセージを選択することができるようになる。なお、エラーメッセージの選択については、全自動で行う場合もあれば、管理者によって最終的に設定される場合もある。
 また、本監視抑止エラーメッセージ選択方法は、選択されたエラーメッセージを、ユーザに提示するステップと、ユーザにより選択されたエラーメッセージを、監視対象エラーメッセージから除外するように設定を実施するステップとをさらに含むようにしてもよい。顧客によっては保守契約上必ず監視しなければならないようなエラーメッセージも存在するので、ここで管理者(すなわちユーザ)によって確認するものである。
 また、上で述べた減少予測値算出ステップが、データ格納部から、エラーメッセージが監視対象であることを表すプロセスを含み且つ解決処置の実施を表すプロセスを含まない案件のプロセス遷移を、エラーメッセージ毎に第1のプロセス遷移として抽出するステップと、エラーメッセージ毎に、抽出された第1のプロセス遷移で費やされる時間を当該第1のプロセス遷移に該当する案件全てについて合計した時間を減少予測値として算出するステップとを含むようにしてもよい。
 また、上で述べた増加予測値算出ステップが、エラーメッセージ毎に、データ格納部から、エラーメッセージが監視対象でないことを表すプロセスを含む案件のプロセス遷移を抽出し、当該抽出されたプロセス遷移から第2のプロセス遷移を特定する第2プロセス遷移特定ステップと、エラーメッセージ毎に、データ格納部から、エラーメッセージが監視対象であることを表すプロセス及び解決処置の実施を表すプロセスを含む案件のプロセス遷移を抽出し、当該抽出されたプロセス遷移から第3のプロセス遷移を特定する第3プロセス遷移特定ステップと、エラーメッセージ毎に、第3のプロセス遷移と第2のプロセス遷移との差のプロセスに費やされる時間を第3のプロセス遷移に該当する案件の件数分合計した時間を増加予測値として算出する時間算出ステップとを含むようにしてもよい。
 さらに、上で述べた第2プロセス遷移特定ステップが、エラーメッセージ毎に、データ格納部から、エラーメッセージが監視対象でないことを表すプロセスを含む案件のプロセス遷移を抽出するステップと、抽出されたプロセス遷移のうち最長となるプロセス遷移を第2のプロセス遷移として特定するステップとを含むようにしてもよい。最悪のケースを想定するものである。
 また、上で述べた第2プロセス遷移特定ステップが、エラーメッセージ毎に、データ格納部から、エラーメッセージが監視対象でないことを表すプロセスを含む案件のプロセス遷移を抽出するステップと、抽出されたプロセス遷移をバイグラムに分割して各バイグラムについて件数をカウントし、エラーメッセージが監視対象でないことを表すプロセスを先頭に含み、解決処置の実施を表すプロセスを最後に含み、且つ件数の多いバイグラムを優先するようにしてバイグラムを連結して第2のプロセス遷移を生成するステップとを含むようにしてもよい。第2のプロセス遷移として標準的なプロセス遷移を形成するための一手法である。
 さらに、第2プロセス遷移特定ステップが、抽出されたプロセス遷移をバイグラムに分割して各バイグラムについて件数をカウントし、エラーメッセージが監視対象でないことを表すプロセスを先頭に含み、解決処置の実施を表すプロセスを最後に含み、且つ件数の多いバイグラムを優先するようにしてバイグラムを連結して第4のプロセス遷移を生成するステップをさらに含むようにした上で、上で述べた増加予測値算出ステップが、エラーメッセージ毎に第3のプロセス遷移と第4のプロセス遷移との差のプロセスに費やされる時間の総和を当該エラーメッセージについての応対時間の第2の増加予測値として算出するステップを含むようにしてもよい。そして、上で述べた選択ステップが、エラーメッセージ毎に、減少予測値と第2の増加予測値とを比較して、減少予測値が第2の増加予測値より大きい場合に当該エラーメッセージを選択するステップを含むようにしてもよい。このように2つの増加予測値を算出することによって、例えば管理者たるユーザに判断の目安を与えることができるようになる。
 なお、上で述べた時間算出ステップが、プロセス毎に平均処理時間を格納する平均処理時間データ格納部から、該当するプロセスの平均処理時間を抽出し、当該抽出された平均処理時間と該当案件数とから増加予測値を算出するステップを含むようにしてもよい。モデル的な増加予測値を算出することができる。
 また、上で述べた第3プロセス遷移特定ステップが、エラーメッセージ毎に、データ格納部から、エラーメッセージが監視対象であることを表すプロセス及び解決処置の実施を表すプロセスを含む案件のプロセス遷移を抽出するステップと、抽出されたプロセス遷移をバイグラムに分割して各バイグラムについて件数をカウントし、エラーメッセージが監視対象であることを表すプロセスを先頭に含み、解決処置の実施を表すプロセスを最後に含み、且つ件数の多いバイグラムを優先するようにしてバイグラムを連結して第3のプロセス遷移を生成するステップとを含むようにしてもよい。

Claims (10)

  1.  監視対象装置から発せられるエラーメッセージに対処するため実施されたプロセスの履歴データがエラーメッセージ及び案件に対応付けられて格納されているデータ格納部から、エラーメッセージを監視していたが解決処置を行わなかったことを表す案件のプロセス遷移に相当する第1のプロセス遷移をエラーメッセージ毎に特定し、前記エラーメッセージ毎に、当該第1のプロセス遷移に費やされる時間の総和を当該エラーメッセージについての応対時間の減少予測値として算出する減少予測値算出ステップと、
     前記データ格納部から、エラーメッセージを監視していなかったことを表す案件のプロセス遷移に係る第2のプロセス遷移と、エラーメッセージを監視しており解決処置を行ったことを表す案件のプロセス遷移に係る第3のプロセス遷移とをエラーメッセージ毎に特定し、前記エラーメッセージ毎に前記第3のプロセス遷移と前記第2のプロセス遷移との差のプロセスに費やされる時間の総和を当該エラーメッセージについての応対時間の増加予測値として算出する増加予測値算出ステップと、
     前記エラーメッセージ毎に、前記減少予測値と前記増加予測値とを比較して、前記減少予測値が前記増加予測値より大きい場合に当該エラーメッセージを選択する選択ステップと、
     を含み、コンピュータにより実行される監視抑止エラーメッセージ選択方法。
  2.  選択された前記エラーメッセージを、ユーザに提示するステップと、
     前記ユーザにより選択されたエラーメッセージを、監視対象エラーメッセージから除外するように設定を実施するステップと、
     をさらに含む請求項1記載の監視抑止エラーメッセージ選択方法。
  3.  前記減少予測値算出ステップが、
     前記データ格納部から、エラーメッセージが監視対象であることを表すプロセスを含み且つ解決処置の実施を表すプロセスを含まない案件のプロセス遷移を、前記エラーメッセージ毎に前記第1のプロセス遷移として抽出するステップと、
     前記エラーメッセージ毎に、抽出された前記第1のプロセス遷移で費やされる時間を当該第1のプロセス遷移に該当する案件全てについて合計した時間を減少予測値として算出するステップと、
     を含む請求項1記載の監視抑止エラーメッセージ選択方法。
  4.  前記増加予測値算出ステップが、
     前記エラーメッセージ毎に、前記データ格納部から、前記エラーメッセージが監視対象でないことを表すプロセスを含む案件のプロセス遷移を抽出し、当該抽出されたプロセス遷移から第2のプロセス遷移を特定する第2プロセス遷移特定ステップと、
     前記エラーメッセージ毎に、前記データ格納部から、前記エラーメッセージが監視対象であることを表すプロセス及び前記解決処置の実施を表すプロセスを含む案件のプロセス遷移を抽出し、当該抽出されたプロセス遷移から第3のプロセス遷移を特定する第3プロセス遷移特定ステップと、
     前記エラーメッセージ毎に、前記第3のプロセス遷移と前記第2のプロセス遷移との差のプロセスに費やされる時間を前記第3のプロセス遷移に該当する案件の件数分合計した時間を増加予測値として算出する時間算出ステップと、
     を含む請求項1記載の監視抑止エラーメッセージ選択方法。
  5.  前記第2プロセス遷移特定ステップが、
     前記エラーメッセージ毎に、前記データ格納部から、前記エラーメッセージが監視対象でないことを表すプロセスを含む案件のプロセス遷移を抽出するステップと、
     抽出された前記プロセス遷移のうち最長となるプロセス遷移を前記第2のプロセス遷移として特定するステップと、
     を含む請求項3記載の監視抑止エラーメッセージ選択方法。
  6.  前記第2プロセス遷移特定ステップが、
     前記エラーメッセージ毎に、前記データ格納部から、前記エラーメッセージが監視対象でないことを表すプロセスを含む案件のプロセス遷移を抽出するステップと、
     抽出された前記プロセス遷移をバイグラムに分割して各バイグラムについて件数をカウントし、前記エラーメッセージが監視対象でないことを表すプロセスを先頭に含み、前記解決処置の実施を表すプロセスを最後に含み、且つ前記件数の多いバイグラムを優先するようにして前記バイグラムを連結して前記第2のプロセス遷移を生成するステップと、
     を含む請求項3記載の監視抑止エラーメッセージ選択方法。
  7.  前記第2プロセス遷移特定ステップが、
     抽出された前記プロセス遷移をバイグラムに分割して各バイグラムについて件数をカウントし、前記エラーメッセージが監視対象でないことを表すプロセスを先頭に含み、前記解決処置の実施を表すプロセスを最後に含み、且つ前記件数の多いバイグラムを優先するようにして前記バイグラムを連結して第4のプロセス遷移を生成するステップ
     をさらに含み、
     前記増加予測値算出ステップが、
     前記エラーメッセージ毎に前記第3のプロセス遷移と前記第4のプロセス遷移との差のプロセスに費やされる時間の総和を当該エラーメッセージについての応対時間の第2の増加予測値として算出するステップ
     を含み、
     前記選択ステップが、
     前記エラーメッセージ毎に、前記減少予測値と前記第2の増加予測値とを比較して、前記減少予測値が前記第2の増加予測値より大きい場合に当該エラーメッセージを選択するステップ
     を含む請求項4記載の監視抑止エラーメッセージ選択方法。
  8.  前記時間算出ステップが、
     前記プロセス毎に平均処理時間を格納する平均処理時間データ格納部から、該当するプロセスの平均処理時間を抽出し、当該抽出された平均処理時間と該当案件数とから増加予測値を算出するステップ
     を含む請求項3記載の監視抑止エラーメッセージ選択方法。
  9.  前記第3プロセス遷移特定ステップが、
     前記エラーメッセージ毎に、前記データ格納部から、前記エラーメッセージが監視対象であることを表すプロセス及び前記解決処置の実施を表すプロセスを含む案件のプロセス遷移を抽出するステップと、
     抽出された前記プロセス遷移をバイグラムに分割して各バイグラムについて件数をカウントし、前記エラーメッセージが監視対象であることを表すプロセスを先頭に含み、前記解決処置の実施を表すプロセスを最後に含み、且つ前記件数の多いバイグラムを優先するようにして前記バイグラムを連結して前記第3のプロセス遷移を生成するステップと、
     を含む請求項3記載の監視抑止エラーメッセージ選択方法。
  10.  監視対象装置から発せられるエラーメッセージに対処するため実施されたプロセスの履歴データがエラーメッセージ及び案件に対応付けられて格納されているデータ格納部から、エラーメッセージを監視していたが解決処置を行わなかったことを表す案件のプロセス遷移に相当する第1のプロセス遷移をエラーメッセージ毎に特定し、前記エラーメッセージ毎に、当該第1のプロセス遷移に費やされる時間の総和を当該エラーメッセージについての応対時間の減少予測値として算出する減少予測値算出ステップと、
     前記データ格納部から、エラーメッセージを監視していなかったことを表す案件のプロセス遷移に係る第2のプロセス遷移と、エラーメッセージを監視しており解決処置を行ったことを表す案件のプロセス遷移に係る第3のプロセス遷移とをエラーメッセージ毎に特定し、前記エラーメッセージ毎に前記第3のプロセス遷移と前記第2のプロセス遷移との差のプロセスに費やされる時間の総和を当該エラーメッセージについての応対時間の増加予測値として算出する増加予測値算出ステップと、
     前記エラーメッセージ毎に、前記減少予測値と前記増加予測値とを比較して、前記減少予測値が前記増加予測値より大きい場合に当該エラーメッセージを選択する選択ステップと、
     をコンピュータに実行させるための監視抑止エラーメッセージ選択プログラム。
PCT/JP2008/070878 2008-11-17 2008-11-17 監視抑止エラーメッセージ選択方法及びプログラム WO2010055590A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010537656A JP5299433B2 (ja) 2008-11-17 2008-11-17 監視抑止エラーメッセージ選択方法及びプログラム
PCT/JP2008/070878 WO2010055590A1 (ja) 2008-11-17 2008-11-17 監視抑止エラーメッセージ選択方法及びプログラム
EP08878136.4A EP2357565B1 (en) 2008-11-17 2008-11-17 Monitoring-inhibiting error message selection method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/070878 WO2010055590A1 (ja) 2008-11-17 2008-11-17 監視抑止エラーメッセージ選択方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2010055590A1 true WO2010055590A1 (ja) 2010-05-20

Family

ID=42169739

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/070878 WO2010055590A1 (ja) 2008-11-17 2008-11-17 監視抑止エラーメッセージ選択方法及びプログラム

Country Status (3)

Country Link
EP (1) EP2357565B1 (ja)
JP (1) JP5299433B2 (ja)
WO (1) WO2010055590A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021492B (zh) * 2016-11-04 2021-01-29 华为技术有限公司 一种告警合并方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030141A (ja) * 2001-07-13 2003-01-31 Hitachi Ltd 協調型アウトソーシング・サービス・システム
JP2004206495A (ja) * 2002-12-26 2004-07-22 Hitachi Ltd 管理システム、管理計算機、管理方法及びプログラム
JP2005011053A (ja) * 2003-06-19 2005-01-13 Hitachi Ltd 業務サービス管理システムおよびサービスプロバイダの評価方法
JP2005276042A (ja) 2004-03-26 2005-10-06 Nomura Research Institute Ltd システム監視業務支援システム及び支援プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720968B2 (en) * 2003-04-30 2010-05-18 International Business Machines Corporation Method and system of configuring elements of a distributed computing system for optimized value
US20060023638A1 (en) * 2004-07-29 2006-02-02 Solutions4Networks Proactive network analysis system
AU2007202006A1 (en) * 2007-04-30 2008-11-20 Ubowireless Pty Limited Wireless Broadband Network Management

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030141A (ja) * 2001-07-13 2003-01-31 Hitachi Ltd 協調型アウトソーシング・サービス・システム
JP2004206495A (ja) * 2002-12-26 2004-07-22 Hitachi Ltd 管理システム、管理計算機、管理方法及びプログラム
JP2005011053A (ja) * 2003-06-19 2005-01-13 Hitachi Ltd 業務サービス管理システムおよびサービスプロバイダの評価方法
JP2005276042A (ja) 2004-03-26 2005-10-06 Nomura Research Institute Ltd システム監視業務支援システム及び支援プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2357565A4 *

Also Published As

Publication number Publication date
EP2357565A1 (en) 2011-08-17
EP2357565B1 (en) 2014-09-17
JP5299433B2 (ja) 2013-09-25
EP2357565A4 (en) 2013-08-21
JPWO2010055590A1 (ja) 2012-04-05

Similar Documents

Publication Publication Date Title
JP4859558B2 (ja) コンピュータシステムの制御方法及びコンピュータシステム
EP2523115B1 (en) Operation management device, operation management method, and program storage medium
JP5684946B2 (ja) イベントの根本原因の解析を支援する方法及びシステム
JP4458493B2 (ja) ログ通知条件定義支援装置とログ監視システムおよびプログラムとログ通知条件定義支援方法
US20110307742A1 (en) Method and apparatus for cause analysis involving configuration changes
US20160378583A1 (en) Management computer and method for evaluating performance threshold value
JP2008134705A (ja) データ処理方法及びデータ分析装置
JP2006127464A (ja) 情報システムの信頼性評価システム、信頼性評価方法、信頼性評価プログラム
JP2011215977A (ja) 作業遅延監視方法、作業管理装置および作業管理プログラム
US9860109B2 (en) Automatic alert generation
JP2012059063A (ja) 計算機システムの管理方法、及び管理システム
JP6280862B2 (ja) イベント分析システムおよび方法
JP2019057139A (ja) 運用管理システム、監視サーバ、方法およびプログラム
WO2018122890A1 (ja) ログ分析方法、システムおよびプログラム
US8090994B2 (en) System, method, and computer readable media for identifying a log file record in a log file
JP5983102B2 (ja) 監視プログラム、方法及び装置
US20130311646A1 (en) Management method and management system
JP5299433B2 (ja) 監視抑止エラーメッセージ選択方法及びプログラム
JP5417264B2 (ja) 分析情報提供方法
JP5022590B2 (ja) 情報システムの信頼性評価システム、信頼性評価方法及び信頼性評価プログラム
JP2009151456A (ja) 監視システム、ネットワーク監視装置及びサービス実行環境監視方法
JP2006344061A (ja) シナリオ適用支援方法、管理サーバおよび管理プログラム
JP2012234381A (ja) ネットワーク運用管理システム、ネットワーク監視サーバ、ネットワーク監視方法およびプログラム
CN111143325B (zh) 一种数据采集的监测方法、监测装置及可读存储介质
JP4850733B2 (ja) ヘルスチェック装置及びヘルスチェック方法及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08878136

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2010537656

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2008878136

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE