WO2013015292A1 - Quality evaluation apparatus, quality evaluation method, and storage medium having program for same stored therein - Google Patents
Quality evaluation apparatus, quality evaluation method, and storage medium having program for same stored therein Download PDFInfo
- Publication number
- WO2013015292A1 WO2013015292A1 PCT/JP2012/068749 JP2012068749W WO2013015292A1 WO 2013015292 A1 WO2013015292 A1 WO 2013015292A1 JP 2012068749 W JP2012068749 W JP 2012068749W WO 2013015292 A1 WO2013015292 A1 WO 2013015292A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- monitoring
- sla
- violation
- unit
- allowable range
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
Definitions
- the present invention relates to a quality evaluation apparatus, a quality evaluation method, and a program for evaluating the quality of service.
- Non-Patent Document 1 shows service level items and reference information for determining the service level when exchanging SLA related to SaaS.
- Patent Document 1 discloses an example of a service evaluation system.
- the service evaluation system disclosed in Patent Document 1 first converts previously provided SLA definition information into monitoring items.
- the SLA definition information is a service level item and definition information of the service level.
- the monitoring items are a set value and a monitoring method.
- the service evaluation system monitors individual items (for example, operation status, response status, and number of connected users) in the software service of the software service provider, and records a history.
- the service evaluation system analyzes the recorded history, and records the result of analysis based on the history of a predetermined period (for example, from 0:00 to 24:00 on the previous day) as a usage record.
- the service evaluation system compares the set value with the usage record to determine whether there is a possibility of SLA violation.
- the service evaluation system described in Patent Document 1 described above has a problem that it cannot indicate the SLA compliance status of the monitoring target system.
- the SLA compliance status indicates how close the monitored system is to the occurrence of SLA violation at a specific time point during service provision, and indicates how much the SLA is violated. Information.
- the service evaluation system of Patent Document 1 compares the result of a predetermined period (monitoring period) with the set value corresponding to the SLA definition to determine whether there has been an SLA violation.
- the SLA definition information includes, for example, “one of the service level item reference values in 98% of the total response time in a monitoring period of 24 hours”. The response time is within 3 seconds.
- the response time is, for example, the time of one operation from when a certain service using terminal transmits a certain request to a certain service provider until obtaining a response to the request. That is, “98% of the total response time” indicates “98 response times out of 100 response times corresponding to 100 requests (responses)”.
- the number of occurrences of violation of the reference value is 1.5% of the total number of responses, and 0.5%
- the former is closer to the occurrence of SLA violation. That is, the number of occurrences of the reference value violation during monitoring or the occurrence rate thereof is information indicating the SLA compliance status.
- the service evaluation system of Patent Document 1 cannot show such information.
- the quality evaluation apparatus includes a violation condition that defines a condition for a violation operation to be monitored, a monitoring data acquisition interval corresponding to the violation condition, and a total monitoring number calculated based on a monitoring period corresponding to the violation condition. And an allowable range calculating means for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is the reference value of the monitoring data, and Compliance rate calculation means for calculating and outputting a compliance rate for the violation condition at an arbitrary time point during the monitoring period based on the monitoring data and the allowable range.
- the computer The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Calculate and output an allowable range indicating the allowable range of the amount of monitoring data that does not meet the monitoring reference value, which is the data reference value, Based on the monitoring data and the allowable range, a compliance rate with respect to the violation condition at an arbitrary point in the monitoring period is calculated and output.
- the program recorded in the nonvolatile storage medium of the present invention is stored in a computer.
- the monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Processing for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is the data reference value; Based on the monitoring data and the allowable range, a compliance rate with respect to the violation condition at an arbitrary point in the monitoring period is calculated and output.
- the present invention has an effect of making it possible to indicate the SLA compliance status at a specific time point during service provision.
- FIG. 1 is a block diagram showing the configuration of the quality evaluation apparatus according to the first embodiment of the present invention.
- FIG. 2 is a diagram illustrating an example of the SLA definition in the first embodiment of the present invention.
- FIG. 3 is a diagram illustrating an example of a monitoring log according to the first embodiment of this invention.
- FIG. 4 is a diagram illustrating an example of monitoring log total recording according to the first embodiment of this invention.
- FIG. 5 is a flowchart showing an operation of recording the SLA definition 2100 in the SLA definition storage unit 1021 according to the first embodiment of this invention.
- FIG. 6 is a flowchart showing the overall operation of the quality evaluation apparatus in the first embodiment of the present invention.
- FIG. 7 is a flowchart showing the operation of the monitoring unit in the first embodiment of the present invention.
- FIG. 8 is a flowchart showing the operation of the SLA allowable range calculation unit in the first embodiment of the present invention.
- FIG. 9 is a flowchart showing the operation of the SLA compliance rate calculation unit in the first embodiment of the present invention.
- FIG. 10 is a block diagram showing the configuration of the apparatus according to the second embodiment of the present invention.
- FIG. 11 is a block diagram showing the configuration of the apparatus according to the third embodiment of the present invention.
- FIG. 12 is a diagram illustrating an example of the SLA definition in the third embodiment of the present invention.
- FIG. 13 is a diagram illustrating an example of monitoring log total recording according to the third embodiment of the present invention.
- FIG. 14 is a flowchart illustrating the operation of the total monitoring number estimation unit according to the third embodiment of this invention.
- FIG. 15 is a block diagram showing a configuration of a quality evaluation apparatus according to the fourth embodiment of the present invention.
- FIG. 16 is a flowchart illustrating the operation of the SLA violation predicting unit according to the fourth embodiment of this invention.
- FIG. 17 is a block diagram showing a configuration of a quality evaluation apparatus according to the fifth embodiment of the present invention.
- FIG. 18 is a flowchart illustrating the operation of the SLA compliance rate aggregation unit according to the fifth embodiment of this invention.
- FIG. 19 is a block diagram showing the configuration of a quality evaluation apparatus that causes a computer to execute predetermined processing by the program of the present invention.
- FIG. 20 is a block diagram illustrating an example of a non-volatile storage medium on which a program is recorded.
- FIG. 1 is a block diagram showing a configuration of a quality evaluation apparatus 1000 according to the first embodiment of the present invention.
- the quality evaluation apparatus 1000 includes a monitoring unit 1011, an SLA definition storage unit 1021, a log storage unit 1022, an SLA violation range calculation unit 1031 and an SLA compliance rate calculation. Part 1032.
- the monitoring unit 1011 Based on the SLA definition, the monitoring unit 1011 performs monitoring on a monitoring target system (not shown) and acquires monitoring data that is a result of the monitoring.
- FIG. 2 is a diagram illustrating an example of the SLA definition 2100. Referring to FIG. 2, the SLA definition 2100 is composed of one or more SLA definition records 2107.
- the SLA definition record 2107 includes a service level item 2101, a monitoring reference value 2102, an SLA violation condition (also called violation condition) 2103, a monitoring method 2104, a monitoring interval (also called an acquisition interval) 2105, and a monitoring period 2106.
- a service level item 2101 indicates an item monitored as an SLA.
- the monitoring reference value 2102 indicates a value that the corresponding service level item 2101 should satisfy.
- the SLA violation condition 2103 indicates a condition for determining that the corresponding service level item 2101 is an SLA violation.
- the monitoring method 2104 indicates a method (means) for monitoring the corresponding service level item 2101.
- a monitoring interval 2105 indicates an interval at which the corresponding service level item 2101 is monitored.
- the monitoring period 2106 indicates a monitoring period for determining whether there is an SLA violation.
- the monitoring target system is, for example, a WEB three-layer system including a single server or a plurality of servers, and a data center.
- the monitoring items (service level item 2101) to be executed for the monitored system include, for example, availability such as service time and operation rate, reliability such as average recovery time and failure notification time, response time and CPU usage rate. And performance information such as batch processing time. That is, the monitoring unit 1011 performs a monitoring operation on the service level item 2101 based on the information in the SLA definition record 2107.
- the monitoring unit 1011 acquires monitoring data by executing a monitoring operation at a time interval corresponding to the monitoring interval 2105 using the monitoring method indicated by the monitoring method 2104 corresponding to a certain service level item 2101. To do. For example, the monitoring unit 1011 performs the monitoring operation at “every 5 minutes” indicated by the monitoring interval 2105 using “ping” indicated by the monitoring method 2104 in which the service level item 2101 corresponds to “service availability”. Execute and get monitoring data. Further, each time the monitoring unit 1011 executes the monitoring operation, the monitoring unit 1011 generates a monitoring log related to the service level item 2101 based on the acquired monitoring data, and outputs the monitoring log to the log storage unit 1022. The monitoring data is monitoring data acquired by executing the monitoring operation once.
- the monitoring unit 1011 generates a monitoring log total record for the service level item 2101 based on the acquired monitoring data for each segment of the monitoring period 2106, and outputs it to the log storage unit 1022.
- the monitoring data is all the monitoring data acquired from the previous segment of the monitoring period 2106 to the present segment.
- the monitoring unit 1011 may output the monitoring log record 2206 to the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032.
- the monitoring unit 1011 may output the monitoring log aggregation record 2307 to the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032.
- FIG. 3 is a diagram illustrating an example of the monitoring log 2200.
- the monitoring log 2200 includes a monitoring log record 2206 including at least a monitoring date / time 2201, a monitoring item 2202, a monitoring result 2203, and a reference value violation presence / absence 2204.
- the monitoring date / time 2201 indicates the date / time when the monitoring unit 1011 executed the monitoring operation.
- a monitoring item 2202 indicates an item of monitoring operation executed by the monitoring unit 1011.
- the monitoring log record 2206 including the monitoring item 2202 corresponds to the SLA definition record 2107 including the service level item 2101. That is, the monitoring log record 2206 is a monitoring log record 2206 for the monitoring operation executed by the monitoring unit 1011 based on the SLA definition record 2107.
- the monitoring result 2203 is information indicating the result of the monitoring operation generated by the monitoring unit 1011 based on the monitoring data acquired by executing the monitoring operation. For example, referring to FIG. 3, the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “service time” is “ ⁇ ”. This indicates that the result of the monitoring operation by the monitoring unit 1011 is normal.
- the monitoring result 2203 is “ ⁇ ”, the monitoring is performed during the time interval indicated by the monitoring interval 2105 (for example, from 2010/2/15, 14:59 to 2010/2/15, 15:00). Indicates that the service of the target system is operating normally.
- the monitoring result 2203 is, for example, a value less than 100% corresponding to the time when the operation is not confirmed.
- the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “service operating rate” is “100%”.
- the monitoring start time based on the monitoring period 2106 is “2010/2/15, 14:00” and the service operation rate calculation time is “2010/2/15, 15:20”
- the monitoring period 2106 The monitoring time is 100 minutes from the monitoring start time based on the time when the service availability is calculated.
- the monitoring time from the monitoring start time to the time when the service operation rate is calculated is 100 minutes, and the unscheduled stop time is 10 minutes, the monitoring result 2203 is “90%”.
- the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “response time” is “5 seconds”.
- the monitoring log record 2206 whose monitoring item 2202 is “response time” corresponds to the SLA definition record 2107 whose service level item 2101 is “response time”. That is, “5 seconds” of the monitoring result 2203 is a response time measured by the monitoring unit 1011 using ping based on “ping” of the monitoring method 2104 included in the corresponding SLA definition record 2107.
- the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “number of transactions” is “300”.
- Reference value violation presence / absence 2204 indicates whether the corresponding monitoring result 2203 violates the corresponding monitoring reference value 2102 (in this case, “present”) or not (in this case, “none”).
- the monitoring log record 2206 in which the presence / absence of the reference value violation 2204 is “Yes” corresponds to the monitoring data that does not satisfy the monitoring reference. For example, “5 seconds” in which the monitoring item 2202 shown in FIG. 3 is the “response time” monitoring result 2203 is “less than 3 seconds” in which the service level item 2101 shown in FIG. 2 is the monitoring reference value 2102 of “response time”. Is not satisfied.
- FIG. 4 is a diagram illustrating an example of the monitoring log tabulation record 2300.
- the monitoring log total record 2300 includes a monitoring log total record 2307 including at least a monitoring period 2302, a report date and time 2303, and an SLA maintenance status 2306.
- the SLA maintenance status 2306 is “ ⁇ ”
- the SLA definition storage unit 1021 stores an SLA definition 2100.
- the log storage unit 1022 stores a monitoring log 2200 and a monitoring log total record 2300.
- the SLA allowable range calculation unit 1031 calculates the total number of monitoring based on the monitoring interval 2105 and the monitoring period 2106 of the SLA definition 2100. Subsequently, the SLA allowable range calculation unit 1031 generates an SLA allowable range (also referred to as an allowable range) based on the calculated total number of monitoring and the corresponding SLA violation condition 2103, and outputs it to the SLA compliance rate calculation unit 1032. .
- the SLA allowable range is information indicating a range of an amount of violation (amount of reference value violation) with respect to the monitoring reference value 2102 that is allowable in the SLA, that is, does not violate the SLA even if it occurs.
- the amount of violation with respect to the monitoring reference value 2102 corresponds to the amount of monitoring data that does not satisfy the monitoring reference value 2102, and is indicated by the number of violations or time. Note that the amount of violation with respect to the monitoring reference value 2102 may be indicated by the ratio of the number of violations or time to the monitoring reference value 2102. For example, when the monitoring data is an information processing amount or a communication amount, the amount of violation with respect to the monitoring reference value 2102 may be indicated by an insufficient information processing amount or a communication amount.
- the amount of violation with respect to the monitoring reference value 2102 may be indicated by the ratio of the information processing amount or communication amount that is insufficient or exceeded to the monitoring reference value 2102.
- the SLA compliance rate calculation unit 1032 calculates the number of occurrences of the reference value violation based on the presence or absence of the reference value violation 2204 included in the monitoring log record 2206 shown in FIG. For example, the SLA compliance rate calculation unit 1032 calculates the number of occurrences of reference value violations in the range from the start time of the monitoring period 2106 (for example, every day at midnight) to the time for calculating the SLA compliance rate.
- the SLA compliance rate calculation unit 1032 may calculate the number of occurrences of violation of the reference value in a specific range input from an input unit (not shown) connected to the quality evaluation apparatus 1000. Next, the SLA compliance rate calculation unit 1032 calculates and outputs the SLA compliance rate based on the calculated number of occurrences of violation of the reference value and the SLA allowable range acquired from the SLA allowable range calculation unit 1031.
- the SLA compliance rate is a ratio of the amount of violation of the reference value that has already occurred to the range of the amount of violation of the reference value indicated by the SLA tolerance.
- the amount of violation of the reference value that has already occurred is, for example, a reference value that has occurred from a certain specific time (for example, monitoring start time) to another specific time (for example, the current time during service provision).
- An input unit (not shown) of the quality evaluation apparatus 1000 receives an input of the SLA definition 2100 (step A101).
- the input unit records the received SLA definition 2100 in the SLA definition storage unit 1021.
- Step A102 This completes the description of the operation of recording the SLA definition 2100 in the SLA definition storage unit 1021.
- FIG. 6 is a flowchart showing the overall operation of the quality evaluation apparatus 1000 that executes monitoring and calculates the SLA compliance rate.
- the monitoring unit 1011 executes monitoring of the monitoring target system based on the SLA definition 2100 (step B101).
- the monitoring unit 1011 generates a monitoring log record 2206 and a monitoring log total record 2307 based on the executed monitoring. (Step B102). Specific examples of monitoring execution and the generated monitoring log record 2206 will be described in the following (1) to (3).
- the monitoring unit 1011 performs monitoring as follows in response to the SLA definition record 2107 whose service level item 2101 is “service time”.
- the monitoring unit 1011 transmits a ping (pin) to the monitoring target system at, for example, 00 seconds per minute. Note that 00 seconds per minute is based on “every minute” indicated by a monitoring interval 2105.
- the transmission of the ping is based on “ping” indicated by the monitoring method 2104.
- the monitoring unit 1011 determines that the service is operating in the corresponding monitoring section.
- the corresponding monitoring section is a section of a time that is back by the time (for example, one minute) indicated by the monitoring interval 2105 from the reception time of the response to ping.
- the monitoring unit 1011 considers that the service is not stopped in the monitoring target system, for example, for one minute in the monitoring section, and is in an operating state.
- the monitoring unit 1011 generates a monitoring log record 2206 including “ ⁇ ” as the monitoring result 2203 and “None” as the reference value violation presence or absence 2204.
- the monitoring unit 1011 determines whether the service is stopped or an abnormality has occurred in the monitoring target system.
- the monitoring unit 1011 considers that the monitoring target system is in a stopped state for, for example, one minute in the monitoring section. Then, the monitoring unit 1011 generates a monitoring log record 2206 including “ ⁇ ” as the monitoring result 2203 and “Yes” as the presence or absence of reference value violation 2204.
- the monitoring unit 1011 performs monitoring as follows in response to the SLA definition record 2107 in which the service level item 2101 is “service availability”.
- the monitoring unit 1011 transmits a ping (pin) to the monitoring target system at 00 seconds every 5 minutes, for example. Note that 00 seconds every 5 minutes is based on “every 5 minutes” indicated by a monitoring interval 2105. The transmission of the ping is based on “ping” indicated by the monitoring method 2104.
- the monitoring unit 1011 determines that the service is operating in the corresponding monitoring section. Note that the corresponding monitoring section is a section of time that is back by the time (for example, 5 minutes) indicated by the monitoring interval 2105 from the reception time of the response to ping.
- the monitoring unit 1011 considers that the service in the monitoring target system has not been stopped and is in an operating state during the monitoring section (for example, for 5 minutes). Then, the monitoring unit 1011 records in a memory (not shown) in the monitoring unit 1011 that the monitoring target system is operating normally during the monitoring section. On the other hand, if the monitoring unit 1011 does not receive a response to the ping from the monitoring target system within a predetermined time, the monitoring unit 1011 is normal such that the service is stopped or an abnormality has occurred in the monitoring target system. Judge that it is not in operation. That is, the monitoring unit 1011 considers that the monitoring target system is in a stopped state during the monitoring section.
- the monitoring unit 1011 records in the memory in the monitoring unit 1011 that the monitoring target system is not operating normally during the monitoring section.
- the monitoring unit 1011 generates a monitoring log record 2206 including the section operation rate and the presence / absence of a reference value violation 2204 determined based on the monitoring reference value 2102 as the monitoring result 2203.
- the section operation rate is a ratio of time during which the operation is normally performed to the time from the monitoring start time to the calculation time.
- the monitoring unit 1011 calculates based on, for example, a record of the operation of the monitoring target system recorded in a memory in the monitoring unit 1011. Further, the monitoring unit 1011 compares the calculated section monitoring rate with the monitoring reference value 2102 to determine the presence / absence 2204 of the reference value violation.
- the monitoring unit 1011 determines whether the reference value violation 2204 is “present”. (3) For example, the monitoring unit 1011 performs monitoring as follows in response to the SLA definition record 2107 whose service level item 2101 is “response time”. First, the monitoring unit 1011 transmits a ping to the monitoring target system at 00 seconds every 5 minutes, for example. Note that 00 seconds every 5 minutes is based on “every 5 minutes” indicated by a monitoring interval 2105. The transmission of the ping is based on “ping” indicated by the monitoring method 2104.
- the monitoring unit 1011 generates a monitoring log record 2206 including a response time to ping from the monitoring target system as the monitoring result 2203 and a reference value violation presence / absence 2204 determined based on the monitoring reference value 2102.
- the monitoring unit 1011 sets the monitoring result 2203 as “unmeasurable” or an exceptional value separately defined in the SLA definition 2100.
- the monitoring unit 1011 compares the response time with the monitoring reference value 2102 to determine whether or not there is a reference value violation 2204. That is, if the response time is not “within 3 seconds” of the monitoring reference value 2102, the monitoring unit 1011 determines that the reference value violation 2204 is “present”.
- the monitoring unit 1011 records the generated monitoring log record 2206 in the monitoring log 2200 and the generated monitoring log total record 2307 in the monitoring log total recording 2300 (step B103).
- the SLA allowable range calculation unit 1031 calculates the SLA allowable range based on the SLA definition 2100 recorded in the SLA definition storage unit 1021, and outputs it to the SLA compliance rate calculation unit 1032 (step B104).
- the SLA compliance rate calculation unit 1032 calculates and outputs the SLA compliance rate based on the monitoring log 2200 and the SLA allowable range acquired from the SLA allowable range calculation unit 1031 (step B105).
- the communication means acquires the SLA compliance rate from the SLA compliance rate calculation unit 1032 and transmits the SLA compliance rate to the terminal device (not shown) via the network (not shown) (step) B106).
- the SLA compliance rate display means may acquire the SLA compliance rate from the SLA compliance rate calculation unit 1032 and display it on the display (not shown).
- movement of the quality evaluation apparatus 1000 whole which performs monitoring and calculates a SLA compliance rate.
- FIG. 7 is a flowchart showing the operation of the monitoring unit 1011.
- the monitoring unit 1011 acquires the SLA definition 2100 from the SLA definition storage unit 1021 (step C101). Next, the monitoring unit 1011 performs monitoring of the monitoring target system for the service level item 2101 included in each SLA definition record 2107 of the acquired SLA definition storage unit 1021 based on the corresponding monitoring interval 2105 and monitoring method 2104. To do. Subsequently, the monitoring unit 1011 generates a corresponding monitoring result 2203 based on the monitoring result. (Step C102). Next, the monitoring unit 1011 generates a monitoring log record 2206 including the generated monitoring result 2203 and the presence or absence of a reference value violation 2204 determined based on the monitoring result 2203 and the monitoring reference value 2102 (step C103).
- the monitoring unit 1011 records the generated monitoring log record 2206 in the log storage unit 1022 (step C104).
- the monitoring unit 1011 generates a monitoring log total record 2307 (Step C105).
- the monitoring unit 1011 outputs the generated monitoring log total record 2307 to the log storage unit 1022 (C106).
- the monitoring unit 1011 determines whether each monitoring period 2106 is completed. When the monitoring period 2106 is completed, the monitoring unit 1011 generates a monitoring log total record 2307. Furthermore, when the log total record 2307 is generated, the monitoring unit 1011 outputs this monitor log total record 2307. Further, the monitoring unit 1011 may always generate the monitoring log total record 2307 in step C105.
- the monitoring unit 1011 may output the generated monitoring log total record 2307.
- the above is the description of the operation of the monitoring unit 1011.
- the operation of the SLA allowable range calculation unit 1031 corresponding to step B104 of FIG. 6 will be described in detail with reference to FIG.
- FIG. 8 is a flowchart showing the operation of the SLA allowable range calculation unit 1031.
- the SLA allowable range calculation unit 1031 acquires the monitoring interval 2105 of the SLA definition record 2107 corresponding to the service level item 2101 for calculating the SLA allowable range from the SLA definition storage unit 1021 (step D101).
- the SLA allowable range calculation unit 1031 acquires the monitoring period 2106 from the corresponding SLA definition record 2107 (step D102).
- the SLA allowable range calculation unit 1031 calculates the total number of monitoring within the monitoring period 2106 based on the acquired monitoring period 2106 and the monitoring interval 2105 (step D103). For example, if the monitoring period 2106 is 1 day and the monitoring interval 2105 is 1 minute, the SLA allowable range calculation unit 1031 calculates the total number of monitoring calls “1440” ((24 ⁇ 60) minutes ⁇ 1 minute).
- the SLA allowable range calculation unit 1031 acquires the SLA violation condition 2103 from the corresponding SLA definition record 2107 (step D104).
- the SLA allowable range calculation unit 1031 calculates and outputs an SLA allowable range based on the acquired SLA violation condition 2103 and the calculated total number of monitoring calls Call (step D105). For example, if the monitoring reference value 2102 is 98%, violation of the reference value is allowed up to 2%. Therefore, for example, when the total number of calls Call is “1440” times, the SLA allowable range calculation unit 1031 calculates the SLA allowable range as “28.8” (1440 ⁇ 0.02) times. When time is used as the SLA allowable range, if the total number of monitoring Call is “1” days, that is, “1440”, “28.8” is the SLA allowable range. The operation of the SLA allowable range calculation unit 1031 has been described above.
- FIG. 9 is a flowchart showing the operation of the SLA compliance rate calculation unit 1032.
- the SLA compliance rate calculation unit 1032 determines the reference value violation amount (the number of reference value violations or the number of reference value violations) based on the presence or absence of reference value violation 2204 in the monitoring log 2200 as shown in FIG. Time) is calculated (step E101).
- the SLA compliance rate calculation unit 1032 acquires the SLA allowable range output by the SLA allowable range calculation unit 1031.
- the SLA compliance rate calculation unit 1032 calculates and outputs the SLA compliance rate based on the calculated reference value violation amount and the acquired SLA allowable range (step E103).
- the SLA compliance rate is calculated as a ratio of the reference value violation amount to the SLA allowable range. For example, it is assumed that the number of violations of the reference value from the start of the monitoring period to the time of calculating the SLA compliance rate is 10 times, and the SLA allowable range for violation of the reference value is “28.8 ⁇ 29 times”. In this case, the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate as “66% ((29-10) / 29 * 100)”.
- the monitoring unit 1011 executes the monitoring operation corresponding to the corresponding service level item 2101 based on the monitoring interval 2105 defined in the SLA definition 2100.
- the monitoring unit 1011 considers that the violation has continued during the monitoring interval 2105 (for example, 1 minute). Therefore, the occurrence time of the reference value violation can be obtained as the product of the number of occurrences of the reference value violation and the monitoring interval 2105.
- the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate as “66% ((29-10) / 29 * 100)”.
- the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate as follows. For example, it is assumed that the number of violations of the reference value from the start of the monitoring period to the time of calculating the SLA compliance rate is 35, and the SLA allowable range for violation of the reference value is “28.8 ⁇ 29”.
- the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate as “ ⁇ 17% ((29-35) / 29 * 100.” That is, the SLA compliance rate calculation unit 1032 indicates that the number of violations of the reference value is When the SLA allowable range is exceeded, the SLA compliance rate is calculated as a negative value, and the degree of SLA violation is calculated as the absolute value. The same applies to the case where the SLA allowable range is indicated by time, and the reference value violation time exceeds the SLA allowable range. The above is the description of the operation of the SLA compliance rate calculation unit 1032. In the present embodiment, as shown in the flowchart of FIG.
- the monitoring unit 1011 performs monitoring
- the SLA allowable range calculation unit 1031 calculates the SLA allowable range
- the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate. Operate as a series of operations synchronously. This is an example and may be as follows, for example.
- the SLA allowable range calculation unit 1031 calculates the SLA allowable range, and adds storage unit (not shown, for example, an SLA allowable range item to the SLA definition structure) You may make it do).
- Each of the monitoring unit 1011 and the SLA compliance rate calculating unit 1032 sets a timer (not shown) so that an interrupt is notified at a necessary timing based on the SLA definition 2100, and operates using the notified interrupt as a trigger.
- the SLA compliance rate display means may display the SLA compliance rate acquired from the SLA compliance rate calculation unit 1032 on a display (not shown) in time series. Thereby, it is possible to monitor in detail the state change of the service level item 2101 until the SLA violation. Further, the SLA compliance rate display means (not shown) displays a warning when the SLA compliance rate acquired from the SLA compliance rate calculation unit 1032 becomes 0%, assuming that an SLA violation has occurred provisionally. It may be.
- the monitoring unit 1011 outputs a monitoring log record 2206 including the monitoring result 2203 generated based on the result of executing the monitoring operation.
- a monitoring log record 2206 including the monitoring result 2203 generated based on the result of executing the monitoring operation.
- the monitoring unit 1011 directly outputs the result of executing the monitoring operation to at least one of the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032.
- the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032 generate a monitoring result 2203 based on the result of executing the received monitoring operation.
- the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032 determine whether there is a violation of the reference value based on the generated monitoring result 2203 and the monitoring reference value 2102.
- the SLA compliance rate calculation unit 1032 calculates the value of the reference value violation based on the determined presence or absence of the reference value violation. Based on the monitoring result 2203 and the reference value violation value calculated in this way, the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032 operate substantially the same as the operations shown in the flowcharts of FIGS. I do.
- the first effect of the present embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision.
- the reason is that it is configured to include the following elements.
- the SLA allowable range calculation unit 1031 calculates the total number of monitoring within the period indicated by the monitoring period 2106, and calculates the SLA allowable range based on the total number of monitoring and the SLA violation condition 2103.
- the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate based on the SLA allowable range and the reference value violation amount from the start of the monitoring period to a specific time.
- the second effect of the present embodiment is that it becomes possible to monitor in detail the state change of the service level item 2101 until the SLA violation.
- the third effect of the present embodiment is that when the SLA compliance rate becomes 0%, it is considered that an SLA violation has occurred tentatively, and even during the monitoring period 2106, the SLA violation has a high probability at the end of the monitoring period. It is possible to quickly detect the case determined to be and issue a warning. The reason is that even when no SLA violation has occurred (when the SLA compliance rate is 0%), the SLA compliance rate calculation unit 1032 calculates and outputs the SLA compliance rate.
- the fourth effect of the present embodiment is that the SLA compliance status can be continuously indicated even when the allowable range changes, for example, when the violation standard is changed depending on the time zone due to power consumption limitation.
- the reason is that the execution of monitoring by the monitoring unit 1011, the calculation of the SLA allowable range by the SLA allowable range calculating unit 1031, and the calculation of the SLA compliance rate by the SLA compliance rate calculating unit 1032 operate as a series of operations in synchronization. It is because it tried to do.
- the quality evaluation apparatus 3000 according to the second embodiment includes an SLA allowable range calculation unit 1031 and an SLA compliance rate calculation unit 1032.
- the SLA allowable range calculation unit 1031 calculates the total number of monitoring based on the corresponding monitoring interval 2105 and monitoring period 2106. Subsequently, the SLA allowable range calculation unit 1031 determines the allowable amount of monitoring data that does not satisfy the monitoring reference value 2102 that is the reference value of monitoring data based on the calculated total number of monitoring and the corresponding SLA violation condition 2103.
- An SLA allowable range indicating a possible range is calculated and output.
- the SLA compliance rate calculation unit 1032 calculates the compliance rate with respect to the SLA violation condition 2103 at any point in the middle of the monitoring period 2106 based on the recording of monitoring data and the SLA allowable range output by the SLA allowable range calculation unit 1031. Calculate and output the indicated SLA compliance rate.
- the SLA compliance rate is a ratio of the amount of monitoring data that does not satisfy the monitoring reference value 2102 to the SLA allowable range.
- the SLA compliance rate calculation unit 1032 calculates the amount of monitoring data that does not satisfy the monitoring reference value 2102 based on, for example, the recording of monitoring data during a period in which the SLA compliance rate is to be calculated.
- the period for which the SLA compliance rate is to be calculated is, for example, a period from the time when monitoring starts to the current time.
- the effect of this embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision.
- the reason is that it is configured to include the following elements.
- the SLA allowable range calculation unit 1031 calculates the total number of monitoring within the period indicated by the monitoring period 2106, and calculates the SLA allowable range based on the total number of monitoring and the SLA violation condition 2103.
- the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate based on the record of the monitoring data and the SLA allowable range.
- FIG. 11 is a block diagram showing a configuration of a quality evaluation apparatus 4000 according to the third embodiment of the present invention. As illustrated in FIG. 11, the quality evaluation apparatus 4000 according to the third embodiment further includes a total monitoring number estimation unit 4011 as compared with the quality evaluation apparatus 3000 according to the second embodiment.
- FIG. 12 is a diagram illustrating an example of the SLA definition 2400.
- the SLA definition 2400 includes at least one SLA definition record 2401 in which the monitoring interval 2105 indicates “irregular”.
- the SLA definition 2400 may include an SLA definition record 2107 similar to the SLA definition 2100 in FIG.
- the total monitoring number estimation unit 4011 calculates and outputs the total number of monitoring for the service level item 2101 whose monitoring interval 2105 is irregular as shown in the monitoring interval 2105 of the SLA definition record 2401 shown in FIG. Specifically, the total monitoring number estimation unit 4011 calculates and outputs the total number of monitoring in the monitoring period 2106 shown in FIG. 2 based on, for example, the number of transactions 4305 in the monitoring log total 4300 shown in FIG.
- FIG. 13 is a diagram showing an example of a monitoring log total recording (also called operation history) 4300. Referring to FIG.
- the monitoring log total record 4300 includes a monitoring log total record 4307 including at least a monitoring period 2302, a report date and time 2303, an SLA maintenance status 2306, and the number of transactions 4305.
- the transaction number 4305 indicates the total number of transactions that have occurred in the monitoring target system during the period indicated by the corresponding monitoring period 2302. Note that the monitoring period 2302, the reporting date 2303, and the SLA maintenance status 2306 are the same as those shown in FIG. Next, the operation of this embodiment will be described with reference to FIG.
- FIG. 14 is a flowchart showing the operation of the total monitoring number estimation unit 4011 of this embodiment.
- the total monitoring number estimation unit 4011 acquires the monitoring interval 2105 included in each SLA definition record 2401 of the SLA definition 2400 (step F101).
- the total monitoring number estimation unit 4011 determines whether or not the monitoring interval 2105 indicates irregularity. (Step F102). If no irregularity is indicated (NO in step F102), the process proceeds to D102 of FIG. If it indicates irregular (YES in step F102), the total monitoring number estimation unit 4011 acquires the total number of monitoring for each past monitoring period 2302 shown in FIG. 13 (step F103). For example, the total monitoring number estimation unit 4011 acquires the number of transactions 4305 from the monitoring log total recording 4300 as shown in FIG. 13 recorded in the log storage unit 1022 as the total number of monitoring for each past monitoring period 2302. .
- the total number of monitoring for each past monitoring period 2302 that is acquired by the total monitoring number estimation unit 4011 in step F103 is, for example, one of the SLA violation condition 2103 and the monitoring interval 2105 of the SLA definition record 2401 shown in FIG. Defined.
- the total monitoring number estimation unit 4011 determines all the monitoring intervals 2302 in the past.
- the transaction number 4305 is acquired as the monitoring number.
- the total monitoring number estimation unit 4011 refers to the monitoring log total recording 4300 illustrated in FIG.
- the number of transactions 4305 indicates the number of times of monitoring in the past monitoring period 2302.
- the total monitoring number estimation unit 4011 may directly calculate the number of monitoring times in the past monitoring period 2302 based on the monitoring log (also referred to as operation history) 2200 shown in FIG.
- the monitoring unit 1011 outputs a monitoring log record 2206 including the number of transactions processed in the monitoring target system to the total monitoring number estimation unit 4011.
- the quality evaluation apparatus 4000 may calculate the number of times of monitoring in the past monitoring period 2302 as follows. First, the monitoring unit 1011 outputs a monitoring log record (also referred to as an operation history) 2206 including the number of transactions in the monitoring target system to the monitoring log 2200.
- the total monitoring number estimation unit 4011 calculates the total number of transactions in a certain period (past monitoring period 2302) based on the monitoring log record 2206 recorded in the monitoring log 2200 and whose monitoring item 2202 is “number of transactions”. It may be calculated directly.
- the total monitoring number estimation unit 4011 calculates an estimated value of the total number of monitoring in the target period based on the acquired total number of monitoring (transaction number 4305) for each past monitoring period 2302 (step F104).
- the target period is a period from the start of the monitoring period to the end of the monitoring period in the monitoring period 2106 shown in FIG. 12, including the target time for calculating the SLA compliance rate.
- C1, C2, and Ck indicate the total number of monitoring for each past monitoring period 2302. k is the total number of monitoring in the past monitoring period 2302.
- the estimated value of the total number of monitoring is Call and the confidence interval is expressed as a range of the total number of monitoring Call using the t distribution, it is as shown in Equation 1.
- Cave is an average value of the data C of the total number of monitoring in a plurality of past monitoring periods 2302, as shown in Equation 2.
- square of ⁇ is the variance of the data C of the total number of monitoring in a plurality of past monitoring periods 2302, as shown in Equation 3.
- the 95% confidence interval is an interval including 95% of the population estimated from the sample. Also, the 99% confidence interval has higher accuracy (reliability) than the 95% confidence interval.
- the allowable range CP and SLA compliance rate calculation unit 1032 calculated by the SLA allowable range calculation unit 1031 when the total monitoring number estimation unit 4011 calculates the range of the total monitoring number Call is calculated.
- An example of the SLA compliance rate ⁇ to be performed will be specifically described.
- the SLA compliance rate calculation unit 1032 determines that the SLA compliance rate 1032 from the allowable range of reference value violation 24 ⁇ CP ⁇ 30.
- the total monitoring number estimation unit 4011 of this embodiment may be applied to the first embodiment.
- the first effect of the present embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision even for the service level item 2101 for which the number of monitoring is not fixed.
- the reason is that the total monitoring number estimation unit 4011 estimates the total monitoring number based on the monitoring log total record 4300 for the service level item 2101 for which the total monitoring number in the monitoring period 2106 is not fixed (the range of the total monitoring number). ) Is calculated.
- the second effect of the present embodiment is that the SLA compliance status of the first effect is high even when the number of monitoring log total records 4307 in the monitoring log total record 4300 is relatively small (10 or less). It is possible to show that. The reason is that it is configured to include the following elements.
- FIG. 15 is a block diagram showing a configuration of a quality evaluation apparatus 5000 according to the fourth embodiment of the present invention. As illustrated in FIG.
- the quality evaluation apparatus 5000 further includes an SLA violation prediction unit 5011 as compared to the quality evaluation apparatus 3000 according to the second embodiment.
- the SLA violation predicting unit 5011 calculates and outputs the time when the occurrence of the SLA violation is predicted based on the SLA compliance rate output from the SLA compliance rate calculating unit 1032.
- the SLA violation prediction unit 5011 outputs information indicating that there is a risk of an SLA violation when the predicted time is within the time before the end of the current monitoring period.
- Te 100 ⁇ t ⁇ (100 ⁇ ).
- SLA violation occurs within the monitoring period 2106 means that “the time when the SLA violation occurs is within the time before the end of the current monitoring period 2106, 21 hours after the start of monitoring. ".
- the SLA violation prediction unit 5011 outputs, for example, an expected occurrence time of an SLA violation or an expected occurrence time and a warning to a display (not shown) via an SLA violation display unit (not shown). Also, the SLA violation prediction unit 5011 sends, to the terminal device (not shown) via the communication means (not shown) and the network (not shown), the expected occurrence time of the SLA violation, or the expected occurrence time and warning, May be transmitted. Next, the operation of the SLA violation prediction unit 5011 will be described with reference to FIG. FIG.
- step I105 the SLA violation predicting unit 5011 outputs a warning indicating that there is a risk of occurrence of an SLA violation to an output unit (not shown) (step I104).
- step I105 the SLA violation prediction unit 5011 outputs the calculated predicted occurrence time of the SLA violation to an output unit (not shown) (step I105).
- the SLA violation prediction unit 5011 of this embodiment may be applied to the first embodiment and the third embodiment. The effect of this embodiment is that it is possible to output the expected occurrence time of an SLA violation.
- FIG. 17 is a block diagram showing a configuration of a quality evaluation apparatus 6000 according to the fifth embodiment of the present invention. As illustrated in FIG. 17, the quality evaluation apparatus 6000 according to the fifth embodiment further includes an SLA compliance rate aggregation unit 6011 as compared to the quality evaluation apparatus 3000 according to the second embodiment.
- the SLA compliance rate aggregation unit 6011 is based on the SLA compliance rate of each service level item 2101 output from the SLA compliance rate calculation unit 1032, and the overall SLA compliance status of the monitored system and the service level that is the bottleneck The information of item 2101 is output.
- the SLA compliance rate aggregation unit 6011 calculates the overall SLA compliance status of the monitoring target system as follows. For example, it is assumed that the service level item 2101 of each of the server A, the server B, and the server C outputs values of 70%, 30%, and 50% as the SLA compliance rate of “response time”, respectively.
- the SLA compliance rate aggregation unit 6011 calculates the maximum value as 70%, the minimum value as 30%, and the average value as 50% ((70 + 30 + 50) ⁇ 3). That is, when it is predetermined to output an average value as the overall SLA compliance status, the SLA compliance rate aggregation unit 6011 has an overall SLA compliance status of 50%. Further, when it is predetermined to output the minimum value, the overall SLA compliance status is 30%. Further, an item having a minimum SLA compliance rate is an item that is a bottleneck in SLA maintenance.
- the SLA compliance rate aggregation unit 6011 indicates that the SLA compliance rate of the response time of the server A is 30% and the response time of the server A is a bottleneck as information on the service level item 2101 that is a bottleneck. Is output.
- the SLA compliance rate aggregating unit 6011 displays, via a SLA violation display unit (not shown), information on the overall SLA compliance status of the monitored system and information on the service level item 2101 that is the bottleneck. (Shown).
- the SLA compliance rate aggregation unit 6011 sends the overall SLA compliance status of the monitoring target system and the bottle to the terminal device (not shown) via, for example, a communication unit (not shown) and a network (not shown).
- FIG. 18 is a flowchart showing the operation of the SLA compliance rate aggregation unit 6011.
- the SLA compliance rate aggregation unit 6011 acquires a plurality of SLA compliance rates output from the SLA compliance rate calculation unit 1032 (step K101).
- the SLA compliance rate aggregation unit 6011 aggregates the acquired plurality of SLA compliance rates, calculates the maximum value, the minimum value, and the average value and outputs them (step K102).
- the minimum value of the SLA compliance rate indicates how close the SLA compliance status of the service level item 2101 taking the minimum value among the plurality of service level items 2101 is close to the SLA violation.
- the average value of the SLA compliance rate is an index indicating how much a plurality of service level items 2101 are observed in the monitoring target system.
- the SLA compliance rate aggregation unit 6011 outputs information on the service level item 2101 that is a bottleneck in addition to the overall SLA compliance status such as an average value, a minimum value, and a maximum value (step K103).
- a service level item 2101 that is a bottleneck is a service level item 2101 that takes the lowest SLA compliance rate among a plurality of SLA compliance rates.
- the above is the description of the operation of the SLA compliance rate aggregation unit 6011.
- the first effect of the present embodiment is that it becomes easy to collectively monitor the SLA compliance status for each of the plurality of service level items 2101. The reason is that the SLA compliance rate aggregation unit 6011 outputs a result of aggregating a plurality of SLA compliance rates.
- the second effect of the present embodiment is that it is possible to take measures to prevent the service level item 2101 that is a bottleneck from being an SLA violation. The reason is that the SLA compliance rate aggregation unit 6011 outputs the information of the service level item 2101 that is a bottleneck.
- the SLA compliance rate aggregation unit 6011 of this embodiment may be applied to the first embodiment, the third embodiment, and the fourth embodiment.
- FIG. 19 is a block diagram illustrating a configuration of a quality evaluation apparatus 7000 that causes a computer to execute predetermined processing using a program.
- the quality evaluation device 7000 includes a CPU (Central Processing Unit) 7100, a disk device 7200, a storage unit 7300, a communication unit 7500, an input unit 7600, and an output unit 7700.
- the CPU 7100 expands the program stored in the disk device 7200, for example, in the storage unit 7300, and executes predetermined processing based on the expanded program.
- CPU Central Processing Unit
- the disk device 7200 is, for example, an optical disk, a flexible disk, a magnetic optical disk, an external hard disk, and a semiconductor memory, and includes a nonvolatile storage medium.
- the disk device 7200 stores a program that causes a computer to execute part of the processing of the communication control device in each of the above-described embodiments.
- the disk device 7200 may store an SLA definition, a monitoring log, and a monitoring log total record as the SLA definition storage unit 1021 and the log storage unit 1022.
- the storage unit 7300 stores the program and data generated and referred to in each of the above-described embodiments.
- the CPU 7100, the disk device 7200, and the storage unit 7300 correspond to the SLA allowable range calculation unit 1031, the SLA compliance rate calculation unit 1032, the total monitoring number estimation unit 4011, the SLA violation prediction unit 5011, and the SLA compliance rate aggregation unit 6011.
- the communication unit 7500 implements an interface with a network, for example.
- the communication unit 7500 may be included as part of the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032.
- the input unit 7600 is realized by, for example, a mouse, a keyboard, a built-in key button, and the like, and is used for input operations.
- the input unit 3073 is not limited to a mouse, a keyboard, and a built-in key button, but may be a touch panel, an accelerometer, a gyro sensor, a camera, or the like.
- the output unit 7700 is realized by a display, for example, and is used for confirming the output.
- FIG. 20 is a block diagram illustrating an example of a non-volatile storage medium on which a program is recorded.
- the recording medium 7400 may be a non-volatile recording medium that stores information non-temporarily.
- the quality evaluation device 7000 may include a recording medium 7400 supplied from the outside.
- the CPU 7100 may read and execute the program code stored in the recording medium 7400.
- the CPU 7100 may store the code of the program stored in the recording medium 7400 in the storage unit 7300, the disk device 7200, or both. That is, this embodiment includes an embodiment of a recording medium 7400 that stores a program (software) executed by the quality evaluation apparatus 7000 (CPU 7100) temporarily or non-temporarily.
- this invention was demonstrated with reference to each embodiment and an Example, this invention is not limited to the said embodiment and Example.
- Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
- Each component described in each of the above embodiments does not necessarily have to be individually independent.
- each component a plurality of components may be realized as one module, or one component may be realized as a plurality of modules.
- Each component is configured such that a component is a part of another component, or a part of a component overlaps a part of another component. Also good.
- each component and a module that realizes each component may be realized by hardware as long as necessary, or may be realized by a computer and a program. It may be realized by mixing hardware modules, computers, and programs.
- the program is provided by being recorded on a non-volatile computer-readable recording medium such as a magnetic disk or a semiconductor memory, and read by the computer when the computer is started up.
- the read program causes the computer to function as a component in each of the above-described embodiments by controlling the operation of the computer.
- a plurality of operations are described in order in the form of a flowchart, but the described order does not limit the order in which the plurality of operations are executed. For this reason, when each embodiment is implemented, the order of the plurality of operations can be changed within a range that does not hinder the contents.
- a plurality of operations are not limited to being executed at different timings. For example, another operation may occur during the execution of a certain operation, or the execution timing of a certain operation and another operation may partially or entirely overlap.
- the present invention can be applied to usage monitoring and prediction of service level violations in operation management.
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Debugging And Monitoring (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
The present invention provides a quality evaluation apparatus capable of showing the state of SLA compliance at a specific point of time during provision of service. The quality evaluation apparatus is provided with: an acceptable range calculating means for calculating the acceptable range for the quantity of instances of monitoring data not satisfying a monitoring standard value, which is the standard value for the monitoring data, said acceptable range being calculated on the basis of both a violating condition defining a condition of operation violation by the object to be monitored, and a total monitoring count for monitoring for the violating condition, said total monitoring count being calculated from the monitoring data acquisition interval and the monitoring period; and a compliance rate calculating means for calculating a compliance rate with respect to the violating condition at an arbitrary point of time during the monitoring period, on the basis of the monitoring data and the acceptable range.
Description
本発明は、サービスの品質を評価する品質評価装置、品質評価方法及びそのためのプログラムに関する。
The present invention relates to a quality evaluation apparatus, a quality evaluation method, and a program for evaluating the quality of service.
IT(Information Technology)分野において、SaaS(Software as a Service)などに代表される、サービスを中心とした契約が増加しつつある。
こうした契約においては、サービスの品質を保証する手段として、SLA(Service Level Agreement、サービスレベル契約)が用いられる。SLAは、サービスの提供者と利用者との間の、1つ以上のサービスレベル項目それぞれについての、サービス水準(例えば、サービスの内容、範囲及び品質)に対する定量的かつ明示的な合意の契約である。
SLAにおけるサービスレベル項目のサービス水準は、例えば、「サービス稼働率が99.9%以上であること」、「障害発生時の平均復旧時間が12時間以内であること」である。
非特許文献1は、SaaSに関するSLAを交わす際に、サービスレベル項目及びそのサービス水準を決定するための参考となる情報を示す。
また、SLAで交わされる各サービスレベル項目のサービス水準は、サービスの品質を評価するために用いられることもある。
特許文献1は、サービス評価システムの一例を開示する。
特許文献1のサービス評価システムは、まず、予め与えられたSLA定義情報を、監視項目に変換する。ここで、SLA定義情報は、サービスレベル項目とそのサービス水準の定義情報である。また、監視項目は、設定値及び監視方法である。
次に、サービス評価システムは、ソフトウェアサービスプロバイダのソフトウェアサービスにおける個別の項目(例えば、稼動状況、応答状況及び接続ユーザ数)について監視を行い、履歴を記録する。
次に、サービス評価システムは、記録した履歴を解析し、予め定められた期間(例えば、前日の0時から24時)の履歴に基づいて解析した結果を利用実績として記録する。
次に、サービス評価システムは、設定値と利用実績とを比較して、SLA違反の可能性の有無を判定する。 In the IT (Information Technology) field, contracts centered on services, such as SaaS (Software as a Service), are increasing.
In such a contract, a service level agreement (SLA) is used as a means for guaranteeing the quality of service. An SLA is a contract between a service provider and a user for a quantitative and explicit agreement on service levels (eg, service content, scope and quality) for each of one or more service level items. is there.
The service level of the service level item in the SLA is, for example, “the service operation rate is 99.9% or more” and “the average recovery time when a failure occurs is within 12 hours”.
Non-Patent Document 1 shows service level items and reference information for determining the service level when exchanging SLA related to SaaS.
Further, the service level of each service level item exchanged in the SLA may be used for evaluating the quality of the service.
Patent Document 1 discloses an example of a service evaluation system.
The service evaluation system disclosed in Patent Document 1 first converts previously provided SLA definition information into monitoring items. Here, the SLA definition information is a service level item and definition information of the service level. The monitoring items are a set value and a monitoring method.
Next, the service evaluation system monitors individual items (for example, operation status, response status, and number of connected users) in the software service of the software service provider, and records a history.
Next, the service evaluation system analyzes the recorded history, and records the result of analysis based on the history of a predetermined period (for example, from 0:00 to 24:00 on the previous day) as a usage record.
Next, the service evaluation system compares the set value with the usage record to determine whether there is a possibility of SLA violation.
こうした契約においては、サービスの品質を保証する手段として、SLA(Service Level Agreement、サービスレベル契約)が用いられる。SLAは、サービスの提供者と利用者との間の、1つ以上のサービスレベル項目それぞれについての、サービス水準(例えば、サービスの内容、範囲及び品質)に対する定量的かつ明示的な合意の契約である。
SLAにおけるサービスレベル項目のサービス水準は、例えば、「サービス稼働率が99.9%以上であること」、「障害発生時の平均復旧時間が12時間以内であること」である。
非特許文献1は、SaaSに関するSLAを交わす際に、サービスレベル項目及びそのサービス水準を決定するための参考となる情報を示す。
また、SLAで交わされる各サービスレベル項目のサービス水準は、サービスの品質を評価するために用いられることもある。
特許文献1は、サービス評価システムの一例を開示する。
特許文献1のサービス評価システムは、まず、予め与えられたSLA定義情報を、監視項目に変換する。ここで、SLA定義情報は、サービスレベル項目とそのサービス水準の定義情報である。また、監視項目は、設定値及び監視方法である。
次に、サービス評価システムは、ソフトウェアサービスプロバイダのソフトウェアサービスにおける個別の項目(例えば、稼動状況、応答状況及び接続ユーザ数)について監視を行い、履歴を記録する。
次に、サービス評価システムは、記録した履歴を解析し、予め定められた期間(例えば、前日の0時から24時)の履歴に基づいて解析した結果を利用実績として記録する。
次に、サービス評価システムは、設定値と利用実績とを比較して、SLA違反の可能性の有無を判定する。 In the IT (Information Technology) field, contracts centered on services, such as SaaS (Software as a Service), are increasing.
In such a contract, a service level agreement (SLA) is used as a means for guaranteeing the quality of service. An SLA is a contract between a service provider and a user for a quantitative and explicit agreement on service levels (eg, service content, scope and quality) for each of one or more service level items. is there.
The service level of the service level item in the SLA is, for example, “the service operation rate is 99.9% or more” and “the average recovery time when a failure occurs is within 12 hours”.
Non-Patent Document 1 shows service level items and reference information for determining the service level when exchanging SLA related to SaaS.
Further, the service level of each service level item exchanged in the SLA may be used for evaluating the quality of the service.
Patent Document 1 discloses an example of a service evaluation system.
The service evaluation system disclosed in Patent Document 1 first converts previously provided SLA definition information into monitoring items. Here, the SLA definition information is a service level item and definition information of the service level. The monitoring items are a set value and a monitoring method.
Next, the service evaluation system monitors individual items (for example, operation status, response status, and number of connected users) in the software service of the software service provider, and records a history.
Next, the service evaluation system analyzes the recorded history, and records the result of analysis based on the history of a predetermined period (for example, from 0:00 to 24:00 on the previous day) as a usage record.
Next, the service evaluation system compares the set value with the usage record to determine whether there is a possibility of SLA violation.
上述した特許文献1に記載されたサービス評価システムは、監視対象システムのSLA遵守状況を示すことができないという問題点を有していた。ここで、SLA遵守状況は、監視対象システムが、サービス提供中の特定の時点において、SLA違反発生に対してどの程度近づいているのかを示し、また、SLAをどの程度違反しているかを示す、情報である。
その理由は、特許文献1のサービス評価システムは、予め定めた期間(監視期間)の実績とSLA定義に対応する設定値とを比較して、SLA違反があったか否かを判定していたためである。
具体的には、特許文献1のサービス評価システムにおいて、SLA定義情報が、例えば「24時間毎の監視期間において、全体の応答時間の内98%で、サービスレベル項目の基準値である、1つの応答時間が3秒以内を遵守する。」であったとする。ここで、その応答時間は、例えば、あるサービス利用端末があるサービスプロバイダにある要求を送信してから、その要求への応答を得るまでの、1回の動作の時間である。即ち、「全体の応答時間の内98%」とは、「100回の要求(応答)に対応する100個の応答時間の内、98個の応答時間」を示す。
この場合、例えば監視開始から11時間の時点において、基準値違反(応答時間が3秒を超えること)の発生回数が応答の回数全体の内1.5%であった場合と、0.5%であった場合とでは、前者の方がよりSLA違反発生に近づいている。即ち、監視途中の基準値違反の発生回数あるいはその発生率は、SLA遵守状況を示す情報である。しかし、特許文献1のサービス評価システムは、このような情報を示すことができない。
[発明の目的]
本発明の目的は、上述した問題点を解決する品質評価装置、品質評価方法及びそのためのプログラムを提供することにある。 The service evaluation system described in Patent Document 1 described above has a problem that it cannot indicate the SLA compliance status of the monitoring target system. Here, the SLA compliance status indicates how close the monitored system is to the occurrence of SLA violation at a specific time point during service provision, and indicates how much the SLA is violated. Information.
The reason for this is that the service evaluation system of Patent Document 1 compares the result of a predetermined period (monitoring period) with the set value corresponding to the SLA definition to determine whether there has been an SLA violation. .
Specifically, in the service evaluation system disclosed in Patent Document 1, the SLA definition information includes, for example, “one of the service level item reference values in 98% of the total response time in a monitoring period of 24 hours”. The response time is within 3 seconds. ” Here, the response time is, for example, the time of one operation from when a certain service using terminal transmits a certain request to a certain service provider until obtaining a response to the request. That is, “98% of the total response time” indicates “98 response times out of 100 response times corresponding to 100 requests (responses)”.
In this case, for example, at 11 hours from the start of monitoring, the number of occurrences of violation of the reference value (response time exceeding 3 seconds) is 1.5% of the total number of responses, and 0.5% The former is closer to the occurrence of SLA violation. That is, the number of occurrences of the reference value violation during monitoring or the occurrence rate thereof is information indicating the SLA compliance status. However, the service evaluation system of Patent Document 1 cannot show such information.
[Object of the invention]
An object of the present invention is to provide a quality evaluation apparatus, a quality evaluation method, and a program therefor that solve the above-described problems.
その理由は、特許文献1のサービス評価システムは、予め定めた期間(監視期間)の実績とSLA定義に対応する設定値とを比較して、SLA違反があったか否かを判定していたためである。
具体的には、特許文献1のサービス評価システムにおいて、SLA定義情報が、例えば「24時間毎の監視期間において、全体の応答時間の内98%で、サービスレベル項目の基準値である、1つの応答時間が3秒以内を遵守する。」であったとする。ここで、その応答時間は、例えば、あるサービス利用端末があるサービスプロバイダにある要求を送信してから、その要求への応答を得るまでの、1回の動作の時間である。即ち、「全体の応答時間の内98%」とは、「100回の要求(応答)に対応する100個の応答時間の内、98個の応答時間」を示す。
この場合、例えば監視開始から11時間の時点において、基準値違反(応答時間が3秒を超えること)の発生回数が応答の回数全体の内1.5%であった場合と、0.5%であった場合とでは、前者の方がよりSLA違反発生に近づいている。即ち、監視途中の基準値違反の発生回数あるいはその発生率は、SLA遵守状況を示す情報である。しかし、特許文献1のサービス評価システムは、このような情報を示すことができない。
[発明の目的]
本発明の目的は、上述した問題点を解決する品質評価装置、品質評価方法及びそのためのプログラムを提供することにある。 The service evaluation system described in Patent Document 1 described above has a problem that it cannot indicate the SLA compliance status of the monitoring target system. Here, the SLA compliance status indicates how close the monitored system is to the occurrence of SLA violation at a specific time point during service provision, and indicates how much the SLA is violated. Information.
The reason for this is that the service evaluation system of Patent Document 1 compares the result of a predetermined period (monitoring period) with the set value corresponding to the SLA definition to determine whether there has been an SLA violation. .
Specifically, in the service evaluation system disclosed in Patent Document 1, the SLA definition information includes, for example, “one of the service level item reference values in 98% of the total response time in a monitoring period of 24 hours”. The response time is within 3 seconds. ” Here, the response time is, for example, the time of one operation from when a certain service using terminal transmits a certain request to a certain service provider until obtaining a response to the request. That is, “98% of the total response time” indicates “98 response times out of 100 response times corresponding to 100 requests (responses)”.
In this case, for example, at 11 hours from the start of monitoring, the number of occurrences of violation of the reference value (response time exceeding 3 seconds) is 1.5% of the total number of responses, and 0.5% The former is closer to the occurrence of SLA violation. That is, the number of occurrences of the reference value violation during monitoring or the occurrence rate thereof is information indicating the SLA compliance status. However, the service evaluation system of Patent Document 1 cannot show such information.
[Object of the invention]
An object of the present invention is to provide a quality evaluation apparatus, a quality evaluation method, and a program therefor that solve the above-described problems.
本発明の品質評価装置は、監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する許容範囲算出手段と、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する遵守率算出手段と、を含む。
本発明の品質評価方法は、コンピュータが、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力し、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する。
本発明の不揮発性記憶媒体に記録されたプログラムは、コンピュータに、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する処理と、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する処理とを実行させる。 The quality evaluation apparatus according to the present invention includes a violation condition that defines a condition for a violation operation to be monitored, a monitoring data acquisition interval corresponding to the violation condition, and a total monitoring number calculated based on a monitoring period corresponding to the violation condition. And an allowable range calculating means for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is the reference value of the monitoring data, and
Compliance rate calculation means for calculating and outputting a compliance rate for the violation condition at an arbitrary time point during the monitoring period based on the monitoring data and the allowable range.
In the quality evaluation method of the present invention, the computer
The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Calculate and output an allowable range indicating the allowable range of the amount of monitoring data that does not meet the monitoring reference value, which is the data reference value,
Based on the monitoring data and the allowable range, a compliance rate with respect to the violation condition at an arbitrary point in the monitoring period is calculated and output.
The program recorded in the nonvolatile storage medium of the present invention is stored in a computer.
The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Processing for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is the data reference value;
Based on the monitoring data and the allowable range, a compliance rate with respect to the violation condition at an arbitrary point in the monitoring period is calculated and output.
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する遵守率算出手段と、を含む。
本発明の品質評価方法は、コンピュータが、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力し、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する。
本発明の不揮発性記憶媒体に記録されたプログラムは、コンピュータに、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する処理と、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する処理とを実行させる。 The quality evaluation apparatus according to the present invention includes a violation condition that defines a condition for a violation operation to be monitored, a monitoring data acquisition interval corresponding to the violation condition, and a total monitoring number calculated based on a monitoring period corresponding to the violation condition. And an allowable range calculating means for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is the reference value of the monitoring data, and
Compliance rate calculation means for calculating and outputting a compliance rate for the violation condition at an arbitrary time point during the monitoring period based on the monitoring data and the allowable range.
In the quality evaluation method of the present invention, the computer
The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Calculate and output an allowable range indicating the allowable range of the amount of monitoring data that does not meet the monitoring reference value, which is the data reference value,
Based on the monitoring data and the allowable range, a compliance rate with respect to the violation condition at an arbitrary point in the monitoring period is calculated and output.
The program recorded in the nonvolatile storage medium of the present invention is stored in a computer.
The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Processing for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is the data reference value;
Based on the monitoring data and the allowable range, a compliance rate with respect to the violation condition at an arbitrary point in the monitoring period is calculated and output.
本発明は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能にする効果がある。
The present invention has an effect of making it possible to indicate the SLA compliance status at a specific time point during service provision.
[第1の実施形態]
図1は、本発明の第1の実施形態に係る品質評価装置1000の構成を示すブロック図である。
図1に示すように、第1の実施形態に係る品質評価装置1000は、監視部1011と、SLA定義記憶部1021と、ログ記憶部1022と、SLA違反範囲算出部1031と、SLA遵守率算出部1032とを備えている。
監視部1011は、SLA定義に基づいて、監視対象システム(不図示)に対する監視を実行し、その監視の結果である監視データを取得する。
図2は、SLA定義2100の例を示す図である。図2を参照すると、SLA定義2100は、1以上のSLA定義レコード2107で構成される。SLA定義レコード2107は、サービスレベル項目2101、監視基準値2102、SLA違反条件(違反条件とも呼ばれる)2103、監視方法2104、監視間隔(取得間隔とも呼ばれる)2105及び監視期間2106を含む。
サービスレベル項目2101は、SLAとして監視する項目を示す。監視基準値2102は、対応するサービスレベル項目2101の満たすべき値を示す。SLA違反条件2103は、対応するサービスレベル項目2101がSLA違反と判定される条件を示す。監視方法2104は、対応するサービスレベル項目2101を監視するための方法(手段)を示す。監視間隔2105は、対応するサービスレベル項目2101の監視を実行する間隔を示す。監視期間2106は、SLA違反の有無を判定する監視期間を示す。
監視対象システムは、例えば、サーバ単体や複数のサーバで構成されるWEB三層システム、及びデータセンターである。
監視対象システムに対して実行する監視の項目(サービスレベル項目2101)は、例えば、サービス時間、稼働率などの可用性、平均復旧時間や障害通知時間などの信頼性、及び、応答時間やCPU使用率やバッチ処理時間などの性能に関する情報である。
即ち、監視部1011は、SLA定義レコード2107の情報に基づいて、サービスレベル項目2101に対する監視動作を実行する。具体的には、監視部1011は、あるサービスレベル項目2101に対応する監視方法2104で示される監視方法を用いて、及び対応する監視間隔2105の時間間隔で監視動作を実行し、監視データを取得する。例えば、監視部1011は、サービスレベル項目2101が「サービス稼働率」に対応する、監視方法2104で示される「ping」を用いて、監視間隔2105で示される「5分毎」に、監視動作を実行し、監視データを取得する。
また、監視部1011は、監視動作を実行するたびに、取得した監視データに基づいて、サービスレベル項目2101に係る監視ログを生成し、ログ記憶部1022へ出力する。尚、その監視データは、その1回の監視動作の実行で取得した監視データである。
また、監視部1011は、監視期間2106の区切り毎に、取得した監視データに基づいて、サービスレベル項目2101についての監視ログ集計記録を生成し、ログ記憶部1022へ出力する。尚、その監視データは、監視期間2106の前回の区切りから今回の区切りまでの間に取得した全ての監視データである。
尚、監視部1011は、監視ログレコード2206をSLA許容範囲算出部1031及びSLA遵守率算出部1032へ出力してもよい。同様に、監視部1011は、監視ログ集計レコード2307をSLA許容範囲算出部1031及びSLA遵守率算出部1032へ出力してもよい。この場合、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、監視ログ2200及び監視ログ集計記録2300を、図示しない記憶手段に記憶してもよい。
図3は、監視ログ2200の例を示す図である。図3を参照すると、監視ログ2200は、監視日時2201、監視項目2202、監視結果2203及び基準値違反の有無2204を少なくとも含む、監視ログレコード2206によって構成される。
監視日時2201は、監視部1011が監視動作を実行した日時を示す。
監視項目2202は、監視部1011が実行した監視動作の項目を示す。監視項目2202の内容がサービスレベル項目2101の内容と一致する場合、その監視項目2202を含む監視ログレコード2206は、そのサービスレベル項目2101を含むSLA定義レコード2107に対応する。即ち、その監視ログレコード2206は、そのSLA定義レコード2107に基づいて、監視部1011が実行した監視動作についての監視ログレコード2206である。
監視結果2203は、監視部1011が、監視動作を実行して取得した監視データに基づいて、生成した、監視動作の結果を示す情報である。
例えば、図3を参照すると、監視項目2202が「サービス時間」である監視ログレコード2206に含まれる監視結果2203は、「○」である。これは、監視部1011による監視動作の結果が、正常であったことを示す。即ち、監視結果2203は、「○」である場合、監視間隔2105に示される時間間隔の間(例えば、2010/2/15,14:59から2010/2/15,15:00まで)、監視対象システムのサービスが正常に稼働していたとすること、を示す。
一方、監視対象システムのサービスの稼働が正常でない時間があった場合、監視結果2203は、例えば、その稼働が確認されなかった時間に対応する100%未満の値である。
また、監視項目2202が「サービス稼働率」の監視ログレコード2206に含まれる監視結果2203は、「100%」である。これは、監視部1011が、監視期間2106に基づく監視開始の時刻からサービス稼働率を算出する時刻までに発生した予定外停止時間に基づき、算出したサービス稼働率である。例えば、監視期間2106に基づく監視開始の時刻が「2010/2/15,14:00」、サービス稼働率を算出する時刻が「2010/2/15,15:20」の場合、監視期間2106に基づく監視開始の時刻からサービス稼働率を算出する時刻まで監視時間は、100分である。例えば、監視開始の時刻からサービス稼働率を算出する時刻までの監視時間が100分であって、そのうち予定外停止時間が10分であった場合、監視結果2203は、「90%」である。
また、監視項目2202が「応答時間」の監視ログレコード2206に含まれる監視結果2203は、「5秒」である。ここで、監視項目2202が「応答時間」の監視ログレコード2206は、サービスレベル項目2101が「応答時間」であるSLA定義レコード2107に対応する。即ち、この監視結果2203の「5秒」は、監視部1011が、対応するSLA定義レコード2107に含まれる監視方法2104の「ping」に基づき、pingを利用して計測した応答時間である。
また、監視項目2202が「トランザクション数」の監視ログレコード2206に含まれる監視結果2203は、「300」である。これは、監視部1011が計数した、例えば、サービス稼働率の監視時間中に発生した、トランザクション数である。
基準値違反の有無2204は、対応する監視結果2203が対応する監視基準値2102に違反したか(この場合、「有」)、違反していないか(この場合、「無」)を示す。
尚、基準値違反の有無2204が「有」である監視ログレコード2206は、監視基準を満たさない監視データに対応する。例えば、図3に示す監視項目2202が「応答時間」の監視結果2203である「5秒」は、図2に示すサービスレベル項目2101が「応答時間」の監視基準値2102である「3秒以内」を満たさない。したがって、図3に示す監視項目2202が「応答時間」の基準値違反の有無2204は、「有」である。
図4は、監視ログ集計記録2300の例を示す図である。図4を参照すると、監視ログ集計記録2300は、監視期間2302、報告日時2303及びSLA維持状況2306を少なくとも含む、監視ログ集計レコード2307により構成される。
SLA維持状況2306は、「○」である場合、図2に示すようなSLA定義2100で定義された全てのSLA定義レコード2107において、SLA違反条件2103に該当するサービスレベル項目2101が1つもないことを示す。また、SLA維持状況2306は、「×」である場合、サービスレベル項目2101のうちいずれか1つ以上がSLA違反条件2103に該当していることを示す。
SLA定義記憶部1021は、SLA定義2100を記憶する。
ログ記憶部1022は、監視ログ2200及び監視ログ集計記録2300を記憶する。
SLA許容範囲算出部1031は、SLA定義2100の監視間隔2105及び監視期間2106に基づいて全監視数を算出する。続けて、SLA許容範囲算出部1031は算出した全監視数と、対応するSLA違反条件2103とに基づいて、SLA許容範囲(許容範囲とも呼ばれる)を生成し、SLA遵守率算出部1032に出力する。SLA許容範囲は、SLAにおいて許容可能な、即ち発生してもSLA違反とはならない、監視基準値2102に対する違反の量(基準値違反の量)の範囲を示す情報である。監視基準値2102に対する違反の量は、即ち、監視基準値2102を満たさない監視データの量に対応するものであり、違反の回数あるいは時間で示される。尚、監視基準値2102に対する違反の量は、その違反の回数あるいは時間の、監視基準値2102に対する比率で示されてもよい。また、例えば、監視データが情報処理量や通信量である場合、監視基準値2102に対する違反の量は、不足しているまたは超過した情報処理量や通信量で示されてもよい。あるいは、監視基準値2102に対する違反の量は、その不足しているまたは超過した情報処理量や通信量の、監視基準値2102に対する比率で示されてもよい。
SLA遵守率算出部1032は、監視装置1011が出力する図3に示す監視ログレコード2206に含まれる基準値違反の有無2204に基づいて、基準値違反の発生回数を算出する。
SLA遵守率算出部1032は、例えば、監視期間2106の開始時刻(例えば、毎日午前0時)からSLA遵守率を算出する時刻までの範囲の、基準値違反の発生回数を算出する。また、SLA遵守率算出部1032は、品質評価装置1000に接続された入力手段(不図示)から入力された、特定の範囲の基準値違反の発生回数を算出してもよい。
次に、SLA遵守率算出部1032は、算出した基準値違反の発生回数と、SLA許容範囲算出部1031から取得したSLA許容範囲に基づいて、SLA遵守率を算出し、出力する。
SLA遵守率は、SLA許容範囲で示される基準値違反の量の範囲に対する、既に発生した基準値違反の量の比率である。ここで、既に発生した基準値違反の量は、例えば、ある特定の時点(例えば、監視開始時刻)から他の特定の時点(例えば、サービス提供中の現在時刻)までに発生している基準値違反の量である。即ち、SLA遵守率は、サービス提供中の特定の時点において、どの程度SLA違反に近いか、あるいはSLAをどの程度違反しているかを示す。
次に、図1~図9を参照して、本実施形態の動作について詳細に説明する。
まず、SLA定義記憶部1021にSLA定義2100を記録する動作について説明する。図5は、本実施形態における、SLA定義記憶部1021にSLA定義2100を記録する動作を示すフローチャートである。
品質評価装置1000の図示しない入力手段は、SLA定義2100の入力を受け付ける(ステップA101)。
次に、入力手段は、受け付けたSLA定義2100をSLA定義記憶部1021へ記録する。(ステップA102)
以上が、SLA定義記憶部1021にSLA定義2100を記録する動作の説明である。
次に、監視を実行し、SLA遵守率を算出する品質評価装置1000全体の動作について説明する。図6は、監視を実行し、SLA遵守率を算出する品質評価装置1000全体の動作を示すフローチャートである。
まず、監視部1011は、SLA定義2100に基づき、監視対象システムの監視を実行する(ステップB101)。
次に、監視部1011は、実行した監視に基づいて、監視ログレコード2206及び監視ログ集計レコード2307を生成する。(ステップB102)。
具体的な、監視の実行と生成される監視ログレコード2206の例を、以下の(1)−(3)に説明する。
(1)監視部1011は、例えば、サービスレベル項目2101が「サービス時間」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、毎分00秒に監視対象システムに対してping(ピン)を送信する。尚、毎分00秒は、監視間隔2105で示される「1分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信した場合、対応する監視区間において、サービスが稼働していると判断する。尚、対応する監視区間は、pingに対する応答の受信時刻から、監視間隔2105で示される時間(例えば、1分)だけ遡った時刻の区間である。
即ち、監視部1011は、その監視区間の、例えば1分間は、監視対象システムにおいてサービスの停止がなく、稼働状態にあったと見なす。そして、監視部1011は、監視結果2203として“○”及び基準値違反の有無2204として「無」を含む監視ログレコード2206を生成する。
一方、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信しなかった場合、監視対象システムにおいて、サービスが停止している、あるいは異常が発生しているなど、正常な稼働状態にないと判断する。すなわち、監視部1011は、その監視区間の、例えば1分間は、監視対象システムが停止状態にあったと見なす。そして、監視部1011は、監視結果2203として“×”及び基準値違反の有無2204として「有」を含む監視ログレコード2206を生成する。
(2)監視部1011は、例えば、サービスレベル項目2101が「サービス稼働率」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、5分毎の00秒に監視対象システムに対してping(ピン)を送信する。尚、5分毎の00秒は、監視間隔2105で示される「5分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信した場合、対応する監視区間において、サービスが稼働していると判断する。尚、対応する監視区間は、pingに対する応答の受信時刻から、監視間隔2105で示される時間(例えば、5分)だけ遡った時刻の区間である。
すなわち、監視部1011は、その監視区間中(例えば5分間)、監視対象システムにおけるサービスの停止がなく、稼働状態にあったと見なす。そして、監視部1011は、監視部1011内のメモリ(不図示)に、監視対象システムがその監視区間中においては正常に稼働していたことを記録する。
一方、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信しなかった場合、監視対象システムにおいて、サービスが停止している、あるいは異常が発生しているなど、正常な稼働状態にないと判断する。すなわち、監視部1011は、その監視区間中、監視対象システムが停止状態にあったと見なす。そして、監視部1011は、監視部1011内のメモリに、監視対象システムがその監視区間中においては正常に稼働していなかったことを記録する。
次に、監視部1011は、監視結果2203として区間稼働率と、監視基準値2102に基づいて決定した基準値違反の有無2204とを含む監視ログレコード2206を生成する。尚、区間稼働率は、監視開始時刻から算出時刻までの時間に対する、正常に稼働していた時間の割合である。監視部1011は、例えば監視部1011内のメモリに記録された、監視対象システムの稼働の記録に基づいて算出する。
また、監視部1011は、算出した区間監視率と監視基準値2102とを比較して基準値違反の有無2204を決定する。即ち、監視部1011は、算出した区間監視率が監視基準値2102の「99.9%」に満たない場合、基準値違反の有無2204を「有」と決定する。
(3)監視部1011は、例えば、サービスレベル項目2101が「応答時間」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、5分毎の00秒に監視対象システムに対してpingを送信する。尚、5分毎の00秒は、監視間隔2105で示される「5分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視結果2203として監視対象システムからのpingに対する応答時間と、監視基準値2102に基づいて決定した基準値違反の有無2204とを含む監視ログレコード2206を生成する。
尚、監視対象システムから所定時間内にpingに対する応答がない場合、監視部1011は、監視結果2203を「測定不能」、あるいはSLA定義2100に別途定義された例外値とする。
また、監視部1011は、その応答時間と監視基準値2102とを比較して基準値違反の有無2204を決定する。即ち、監視部1011は、その応答時間が監視基準値2102の「3秒以内」でなかった場合、基準値違反の有無2204を「有」と決定する。
以上が、具体的な、監視の実行と生成される監視ログレコード2206の例である。
次に、監視部1011は、生成した監視ログレコード2206を監視ログ2200に、生成した監視ログ集計レコード2307を監視ログ集計記録2300に、記録する(ステップB103)。
次に、SLA許容範囲算出部1031は、SLA定義記憶部1021に記録されたSLA定義2100に基づいて、SLA許容範囲を算出し、SLA遵守率算出部1032に出力する(ステップB104)。
次に、SLA遵守率算出部1032は、監視ログ2200とSLA許容範囲算出部1031から取得したSLA許容範囲とに基づいて、SLA遵守率を算出し、出力する(ステップB105)。
次に、通信手段(不図示)は、SLA遵守率算出部1032からSLA遵守率を取得した、ネットワーク(不図示)を経由して、端末装置(不図示)にSLA遵守率を送信する(ステップB106)。また、例えばSLA遵守率表示手段(不図示)が、SLA遵守率算出部1032からSLA遵守率を取得して、ディスプレイ(不図示)に表示するようにしてもよい。
以上が、監視を実行し、SLA遵守率を算出する、品質評価装置1000全体の動作の説明である。
次に、図7を参照して、図6のステップB101、ステップB102及びステップB103に対応する、監視動作について詳細に説明する。図7は、監視部1011の動作を示すフローチャートである。
まず、監視部1011は、SLA定義記憶部1021からSLA定義2100を取得する(ステップC101)。
次に、監視部1011は、取得したSLA定義記憶部1021の各SLA定義レコード2107に含まれるサービスレベル項目2101について、対応する監視間隔2105及び監視方法2104に基づいて、監視対象システムの監視を実行する。続けて、監視部1011は、監視を実行した結果に基づいて対応する監視結果2203を生成する。(ステップC102)。
次に、監視部1011は、生成した監視結果2203と、監視結果2203及び監視基準値2102に基づいて決定した基準値違反の有無2204とを含む、監視ログレコード2206を生成する(ステップC103)。
次に、監視部1011は、生成した監視ログレコード2206を、ログ記憶部1022へ記録する(ステップC104)。
次に、監視部1011は、監視ログ集計レコード2307を生成する(ステップC105)。
次に、監視部1011は、生成した監視ログ集計レコード2307をログ記憶部1022へ出力する(C106)
尚、監視部1011は、ステップC105において、各監視期間2106の完了時であるかを判定する。そして、各監視期間2106の完了時である場合に、監視部1011は監視ログ集計レコード2307を生成する。更に、ログ集計レコード2307を生成した場合に、監視部1011は、この監視ログ集計レコード2307を出力する。
また、監視部1011は、ステップC105において、常に監視ログ集計レコード2307を生成するようにしてもよい。この場合、生成したSLA維持状況2306が「×」である場合に、監視部1011は、生成した監視ログ集計レコード2307を出力するようにしてもよい。
以上が、監視部1011の動作についての説明である。
次に、図8を参照して、図6のステップB104に対応する、SLA許容範囲算出部1031の動作について詳細に説明する。図8は、SLA許容範囲算出部1031の動作を示すフローチャートである。
まず、SLA許容範囲算出部1031は、SLA定義記憶部1021より、SLA許容範囲を算出するサービスレベル項目2101に対応するSLA定義レコード2107の監視間隔2105を取得する(ステップD101)。
次に、SLA許容範囲算出部1031は、対応するSLA定義レコード2107から、監視期間2106を取得する(ステップD102)。
次に、SLA許容範囲算出部1031は、取得した監視期間2106と監視間隔2105とに基づいて、監視期間2106の期間内の全監視数を算出する(ステップD103)。例えば、監視期間2106が1日、監視間隔2105が1分ならば、SLA許容範囲算出部1031は、全監視数Callを「1440」((24×60)分÷1分)と算出する。
次に、SLA許容範囲算出部1031は、対応するSLA定義レコード2107からSLA違反条件2103を取得する(ステップD104)。
次に、SLA許容範囲算出部1031は、取得したSLA違反条件2103と、算出した全監視数Callとに基づいて、SLA許容範囲を算出し、出力する(ステップD105)。
例えば、監視基準値2102が98%である場合、2%までは基準値違反が許容される。したがって、例えば全監視数Callが「1440」回である場合、SLA許容範囲算出部1031は、SLA許容範囲を「28.8」(1440×0.02)回と算出する。また、SLA許容範囲として時間を用いる場合、全監視数Callが「1」日、すなわち、「1440」分である場合、「28.8」分がSLA許容範囲となる。
以上が、SLA許容範囲算出部1031の動作についての説明である。
次に、図9を参照して、図6のステップB105に対応する、SLA遵守率算出部1032の動作について詳細に説明する。図9は、SLA遵守率算出部1032の動作を示すフローチャートである。
まず、SLA遵守率算出部1032は、ログ記憶部1022に記録された、図3に示すような監視ログ2200における基準値違反の有無2204に基づいて、基準値違反量(基準値違反の回数あるいは時間)を算出する(ステップE101)。
次に、SLA遵守率算出部1032は、SLA許容範囲算出部1031が出力したSLA許容範囲を取得する。(ステップE102)
次に、SLA遵守率算出部1032は、算出した基準値違反量と、取得したSLA許容範囲とに基づき、SLA遵守率を算出し、出力する(ステップE103)。SLA遵守率は、SLA許容範囲に対する基準値違反量の比率として算出される。
例えば、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が10回であり、基準値違反のSLA許容範囲が「28.8≒29回」であるとする。この場合、SLA遵守率算出部1032は、SLA遵守率を「66%((29−10)/29*100)」と算出する。
また、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が2回であり、基準値違反のSLA許容範囲が「28.8≒29分」であるとする。
ここで、上述したとおり、監視部1011は、SLA定義2100に定義された監視間隔2105に基づき、対応するサービスレベル項目2101に対応する監視動作を実行する。そして、基準値違反が発生した場合、監視部1011は、その違反が監視間隔2105の時間間隔の間(例えば1分間)継続したものと見なす。したがって、基準値違反の発生時間は、基準値違反の発生回数と、監視間隔2105の積として求めることができる。例えば、基準値違反の発生回数が2回、監視間隔2105が「5分」の場合、基準値違反の時間は10分である。
この場合、SLA遵守率算出部1032は、SLA遵守率を「66%((29−10)/29*100)」と算出する。
また、基準値違反の回数がSLA許容範囲を超過した場合、SLA遵守率算出部1032は、以下のようにSLA遵守率を算出する。例えば、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が35回であり、基準値違反のSLA許容範囲が「28.8≒29回」であるとする。
この場合、SLA遵守率算出部1032は、SLA遵守率を「−17%((29−35)/29*100」と算出する。即ち、SLA遵守率算出部1032は、基準値違反の回数がSLA許容範囲を超過した場合、SLA遵守率を負の値として算出し、SLA違反の程度を絶対値の大きさとして算出する。
また、SLA許容範囲が時間で示され、基準値違反の時間がSLA許容範囲を超過した場合についても同様である。
以上が、SLA遵守率算出部1032の動作についての説明である。
尚、本実施形態では、図6のフローチャートで示すように監視部1011による監視の実行と、SLA許容範囲算出部1031によるSLA許容範囲の算出と、SLA遵守率算出部1032によるSLA遵守率の算出とが、同期して一連の動作として動作する。これは、一例であり、例えば、以下のようにしてもよい。
SLA許容範囲算出部1031は、品質評価装置1000のSLA定義2100の内容が更新された時に、SLA許容範囲を算出し、記憶手段(不図示、例えばSLA定義の構造にSLA許容範囲の項目を追加するようにしてもよい)に記録する。監視部1011及びSLA遵守率算出部1032それぞれは、SLA定義2100に基づいて必要なタイミングで割り込みが通知されるようにタイマー(不図示)を設定し、通知された割り込みを契機として動作する。
また、SLA遵守率表示手段(不図示)は、SLA遵守率算出部1032から取得したSLA遵守率を、時系列的にディスプレイ(不図示)に表示するようにしてもよい。これにより、SLA違反に至るまでのサービスレベル項目2101の状態変化を詳細に監視することが可能である。
また、SLA遵守率表示手段(不図示)は、SLA遵守率算出部1032から取得したSLA遵守率が0%となった場合に、暫定的にSLA違反が発生したと見なして警告を表示するようにしてもよい。こうすることで、監視期間2106の途中であっても監視期間終了時に高い確率でSLA違反と判定される可能性を早期に検出し、警告を行うことが可能となる。
また、本実施形態では、監視部1011が、監視動作を実行した結果に基づいて生成した、監視結果2203を含む監視ログレコード2206を出力する。これは、本実施形態の一例であり、例えば、以下のようにしてもよい。
まず、監視部1011は、監視動作を実行した結果を、SLA許容範囲算出部1031及びSLA遵守率算出部1032の内の少なくともいずれか一方へ、直接出力する。
次に、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、受け取った監視動作を実行した結果に基づき、監視結果2203を生成する。次に、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、生成した監視結果2203と、監視基準値2102とに基づき、基準値違反の有無を判定する。次に、SLA遵守率算出部1032は、判定した基準値違反の有無に基づき、基準値違反の値を算出する。
このように算出した監視結果2203及び基準値違反の値に基づき、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、図8及び図9のフローチャートに示す動作と、実質的に同様の動作を行う。
本実施形態の第1の効果は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、SLA許容範囲算出部1031は、監視期間2106で示される期間内の全監視数を算出し、この全監視数とSLA違反条件2103とに基づいてSLA許容範囲を算出する。次に、SLA遵守率算出部1032は、SLA許容範囲と監視期間開始時点から特定の時点までの基準値違反量とに基づいて、SLA遵守率を算出する。
本実施形態の第2の効果は、SLA違反に至るまでのサービスレベル項目2101の状態変化を詳細に監視することが可能になることである。
その理由は、監視部1011が監視を実行するたびに、即ち、監視対象システムの可用性、信頼性などの稼働情報及び性能情報を取得するたびに、SLA遵守率算出部1032がSLA遵守率を算出し、出力するようにしたからである。
本実施形態の第3の効果は、SLA遵守率が0%となった場合に暫定的にSLA違反が発生したと見なし、監視期間2106の途中であっても監視期間終了時に高い確率でSLA違反と判定される事例を素早く検出し、警告を行うことが可能となることである。
その理由は、SLA違反が発生していない場合(SLA遵守率0%の場合)でも、SLA遵守率算出部1032がSLA遵守率を算出し、出力するようにしたからである。
本実施形態の第4の効果は、許容範囲が変化する場合、例えば、電力消費制限で、時間帯によって違反基準を変えるような場合でも、継続してSLA遵守状況を示すことができる。
その理由は、監視部1011による監視の実行と、SLA許容範囲算出部1031によるSLA許容範囲の算出と、SLA遵守率算出部1032によるSLA遵守率の算出とが、同期して一連の動作として動作するようにしたからである。
[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図10は、本発明の第2の実施形態に係る品質評価装置3000の構成を示すブロック図である。
図10に示すように、第2の実施形態に係る品質評価装置3000は、SLA許容範囲算出部1031と、SLA遵守率算出部1032とを含む。
SLA許容範囲算出部1031は、対応する監視間隔2105及び監視期間2106に基づいて、全監視数を算出する。続けて、SLA許容範囲算出部1031は、算出した全監視数と、対応するSLA違反条件2103とに基づいて、監視データの基準値である監視基準値2102を満たさない監視データの量の、許容可能な範囲を示すSLA許容範囲を算出し、出力する。
SLA遵守率算出部1032は、監視データの記録とSLA許容範囲算出部1031が出力するSLA許容範囲とに基づいて、監視期間2106の期間途中における任意の時点の、SLA違反条件2103に対する遵守率を示すSLA遵守率を算出し、出力する。具体的には、SLA遵守率は、SLA許容範囲に対する、監視基準値2102を満たさない監視データの量の、比である。尚、SLA遵守率算出部1032は、例えば、SLA遵守率を算出しようとする期間の、監視データの記録に基づいて、監視基準値2102を満たさない監視データの量を算出する。また、SLA遵守率を算出しようとする期間は、例えば、監視開始時点の時刻から現在時刻までの期間である。
本実施形態の効果は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、SLA許容範囲算出部1031は、監視期間2106で示される期間内の全監視数を算出し、この全監視数とSLA違反条件2103とに基づいてSLA許容範囲を算出する。次に、SLA遵守率算出部1032は、監視データの記録とSLA許容範囲とに基づいてSLA遵守率を算出する。
[第3の実施形態]
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図11は、本発明の第3の実施形態に係る品質評価装置4000の構成を示すブロック図である。
図11に示すように、第3の実施形態に係る品質評価装置4000は、第2の実施形態の品質評価装置3000と比べて全監視数推定部4011を更に含む。
図12は、SLA定義2400の例を示す図である。SLA定義2400は、監視間隔2105が「不定期」を示す、SLA定義レコード2401を少なくとも1つ含む。尚、SLA定義2400は、図4のSLA定義2100と同様のSLA定義レコード2107を含んでよい。
全監視数推定部4011は、図12に示すSLA定義レコード2401の監視間隔2105に示されるような、監視間隔2105が不定期であるサービスレベル項目2101について、全監視数を算出し、出力する。具体的には、全監視数推定部4011は、例えば図13に示す監視ログ集計4300のトランザクション数4305に基づき、図2に示す監視期間2106における全監視数を算出し、出力する。
図13は、監視ログ集計記録(動作履歴とも呼ばれる)4300の例を示す図である。図13を参照すると、監視ログ集計記録4300は、監視期間2302、報告日時2303、SLA維持状況2306及びトランザクション数4305を少なくとも含む、監視ログ集計レコード4307により構成される。
トランザクション数4305は、対応する監視期間2302で示される期間に、監視対象システムに対して発生した、トランザクションの合計数を示す。
尚、監視期間2302、報告日時2303及びSLA維持状況2306は、図4に示すものと同様である。
次に、図14を参照して本実施形態の動作について説明する。図14は、本実施形態の全監視数推定部4011の動作を示すフローチャートである。
全監視数推定部4011は、SLA定義2400の各SLA定義レコード2401に含まれる監視間隔2105を取得する(ステップF101)。
次に、全監視数推定部4011は、監視間隔2105が不定期を示しているか否かを判定する
(ステップF102)。不定期を示していない場合(ステップF102でNO)、処理は、図8のD102へ進む。
不定期を示している場合(ステップF102でYES)、全監視数推定部4011は、図13に示す、過去の監視期間2302毎の全監視数を取得する(ステップF103)。例えば、全監視数推定部4011は、過去の監視期間2302毎の全監視数として、ログ記憶部1022に記録されている図13に示すような監視ログ集計記録4300から、トランザクション数4305を取得する。
尚、ステップF103において全監視数推定部4011が取得する、過去の監視期間2302毎の全監視数は、例えば、図12に示すSLA定義レコード2401のSLA違反条件2103及び監視間隔2105のいずれかにおいて定義される。本実施形態においては、図12に示すSLA監視レコード2401の監視間隔2105が「トランザクション毎(不定期)」であることに基づいて、全監視数推定部4011は、過去の監視期間2302毎の全監視数として、トランザクション数4305を取得する。
具体的には、全監視数推定部4011は、監視間隔2105が例えば「トランザクション毎(不定期)」である場合、図13に示す監視ログ集計記録4300を参照して、トランザクション数4305を取得する。この場合、トランザクション数4305は、過去の監視期間2302における監視回数を示す。
尚、全監視数推定部4011は、監視部1011から出力される図3に示す監視ログ(動作履歴とも呼ばれる)2200に基づき、過去の監視期間2302における監視回数を直接算出してもよい。この場合、監視部1011は、監視対象システムにおけるトランザクションの処理件数を含む監視ログレコード2206を、全監視数推定部4011に出力する。
また、品質評価装置4000は、次のように過去の監視期間2302における監視回数を算出してもよい。まず、監視部1011が、監視対象システムにおけるトランザクション数を含む、監視ログレコード(動作履歴とも呼ばれる)2206を監視ログ2200に出力する。次に、全監視数推定部4011が、監視ログ2200に記録された、監視項目2202が「トランザクション数」である監視ログレコード2206に基づき、一定期間(過去の監視期間2302)の全トランザクション数を直接算出してもよい。
再び図14において、全監視数推定部4011は、取得した過去の監視期間2302毎の全監視数(トランザクション数4305)に基づいて、対象期間の全監視数の推定値を算出する(ステップF104)。ここで、その対象期間は、SLA遵守率算出の対象時刻を含む、図12に示す監視期間2106の監視期間開始時点から監視期間終了時点までの期間である。
具体的には、全監視数推定部4011は、例えば、以下のようにして全監視数の推定値を算出する。
まず、全監視数推定部4011は、過去の複数の監視期間2302における全監視数のデータC={C1,C2,・・・,Ck}が正規分布であると仮定し、信頼区間を設定する。ここで、C1、C2、及びCkは、過去の監視期間2302毎の全監視数を示す。kは、過去の監視期間2302の全監視数の個数である。
信頼区間は、全監視数の推定値をCallとし、t分布を用いて、全監視数Callの範囲として表すと、式1に示すとおりである。
ここで、Caveは、過去の複数の監視期間2302における全監視数のデータCの平均値であり、式2に示すとおりである。
また、「σの2乗」は、過去の複数の監視期間2302における全監視数のデータCの分散であり、式3に示すとおりである。
また、tは、平均が0、標準偏差が1のt分布から得られる値である。tは、設定する信頼区間により値が異なる。例えば、95%信頼区間の場合、t=2.262であり、99%信頼区間の場合t=3.250である。尚、95%信頼区間とは、サンプルから推定される母集団のうち95%が含まれる区間のことである。また、99%信頼区間の方は、95%信頼区間に比べて、より精度(信頼度)が高い。尚、t分布の値は、例えば、表として全監視数推定部4011内の記憶手段(不図示)に記録されている。
例えば、平均値Cave=1400、分散「σの2乗」=19544、サンプル数k=10の過去の分布があった場合、95%信頼区間を用いると、t=2.262より、Callの上限値及び下限値は、式4に示すとおりとなる。
したがって、1300<Call<1500である。
以上のように、全監視数推定部4011は、全監視数Callの範囲を算出する。
次に、上述の説明のように、全監視数推定部4011が全監視数Callの範囲を算出した場合の、SLA許容範囲算出部1031が算出する許容範囲CP及びSLA遵守率算出部1032が算出するSLA遵守率αの例を、具体的に説明する。
例えば、図12のSLA定義レコード2401の場合、SLA違反条件2103は、「基準値を守れない場合の率が2%以上」である。この場合、基準値違反の量は、2%未満まで許容される。したがって、1300≦Call≦1500の場合では、1300×0.02=26、1500×0.02=30より、基準値違反回数の許容範囲CPは、24<CP<30となる。これは基準値違反を時間で記述した場合においても同様である。
このとき、監視期間開始時点から計算時点までの基準値違反の回数が、10回であったとすると、基準値違反の許容範囲24<CP<30より、SLA遵守率算出部1032は、SLA遵守率αを以下のように算出する。
(25−10)÷25×100=60%、(29−10)÷29×100=66%であり、したがって、61%≦α≦66%。
尚、これは、基準値違反の値を時間で表す場合においても同様である。
本実施形態の全監視数推定部4011は、第1の実施形態に適用してもよい。
本実施形態の第1の効果は、監視数が確定していないサービスレベル項目2101についても、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、全監視数推定部4011が監視期間2106中の全監視数が確定していないサービスレベル項目2101に対し、監視ログ集計記録4300に基づき全監視数の推定値(全監視数の範囲)を算出するようにしたからである。
本実施形態の第2の効果は、監視ログ集計記録4300の監視ログ集計レコード4307の数が比較的少ない場合(10以下)であっても、信頼度の高い、第1の効果のSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、全監視数推定部4011が、t分布を用いた信頼区間を設定し、この信頼区間に対応する全監視数の推定値を算出する。次に、SLA許容範囲算出部1031が、その全監視数の推定値に基づいて、許容範囲を算出する。次に、SLA遵守率算出部1032が、その許容範囲に基づいてSLA遵守率を算出する。
[第4の実施形態]
次に、本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図15は、本発明の第4の実施形態に係る品質評価装置5000の構成を示すブロック図である。
図15に示すように、第4の実施形態に係る品質評価装置5000は、第2の実施形態の品質評価装置3000に比べて、SLA違反予測部5011を更に含む。
SLA違反予測部5011は、SLA遵守率算出部1032より出力されるSLA遵守率に基づき、SLA違反の発生が予測される時刻を算出し、出力する。また、SLA違反予測部5011は、予測される時刻が現在の監視期間が終了する前の時刻内であった場合に、SLA違反が発生する危険があることを示す情報を出力する。
監視開始からの経過時刻t、SLA違反の予測発生時刻Te、SLA遵守率αとすると、SLA違反予測部5011は、Te=100×t÷(100−α)を算出する。続けて、SLA違反予測部5011は、算出した予測発生時刻Teを出力する。
例えば、監視開始から1時間経過した時点での遵守率αが95%である場合、SLA違反予測部5011は、Te=100×1÷(100−95)=20を算出する。即ち、この場合のSLA違反の予想発生時刻は、監視開始から20時間後である。
更に、例えば、あるSLA定義レコード2107の監視期間2106が24時間であった場合、監視期間2106内にSLA違反が発生する可能性があるため、その危険があることを示す情報(警告)を出力する。ここで、「監視期間2106内にSLA違反が発生する」とは、「SLA違反の発生する時刻が、現在の監視期間2106が終了する前の時刻内である、監視開始から21時間後である」ことを示す。
SLA違反予測部5011は、例えば、SLA違反表示部(不図示)を経由して、SLA違反の予想発生時刻、あるいは予想発生時刻と警告とを、ディスプレイ(不図示)に出力する。また、SLA違反予測部5011は、例えば、通信手段(不図示)及びネットワーク(不図示)を経由して、端末装置(不図示)に、SLA違反の予想発生時刻、あるいは予想発生時刻と警告とを送信するようにしてもよい。
次に、図16を参照して、SLA違反予測部5011の動作を説明する。図16は、SLA違反予測部5011の動作を示すフローチャートである。
SLA違反予測部5011は、SLA遵守率算出部1032からSLA遵守率を取得する(ステップI101)。
次に、SLA違反予測部5011は、取得したSLA遵守率に基づいて、SLA違反予想発生時刻を算出する(ステップI102)。SLA違反予測部5011は、例えば、以下の式を用いて、SLA違反の予想発生時刻Teを算出する。Te=100×t÷(100−α)。ここで、tは監視時点の時刻、αはSLA遵守率である。
更に、SLA違反予測部5011は、算出したSLA違反の予想発生時刻Teが現在の監視期間2106内に含まれるか否かの判定を行う(ステップI103)。現在の監視期間2106内に含まれない場合(ステップI103でNO)、処理はステップI105へ進む。
現在の監視期間2106内に含まれる場合(ステップI103でYES)、SLA違反予測部5011は、図示しない出力手段へSLA違反が発生する危険があることを示す警告を出力する(ステップI104)。
ステップI105において、SLA違反予測部5011は、算出したSLA違反の予想発生時刻を図示しない出力手段へ出力する(ステップI105)。
以上が、SLA違反予測部5011の動作についての説明である。
尚、本実施形態のSLA違反予測部5011は、第1の実施形態及び第3の実施形態に適用してもよい。
本実施形態の効果は、SLA違反の予想発生時刻を出力することが可能になる点である。
その理由は、SLA違反予測部5011が、SLA遵守率に基づき、SLA違反予想発生時刻を算出するようにしたからである。
[第5の実施形態]
次に、本発明の第5の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図17は、本発明の第5の実施形態に係る品質評価装置6000の構成を示すブロック図である。
図17に示すように、第5の実施形態に係る品質評価装置6000は、第2の実施形態の品質評価装置3000と比べて、SLA遵守率集約部6011を更に含む。
SLA遵守率集約部6011は、SLA遵守率算出部1032より出力される各サービスレベル項目2101のSLA遵守率に基づき、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を出力する。
SLA遵守率集約部6011は、例えば、監視対象システムがサーバA、サーバB、サーバCを含む場合、監視対象システムの全体的なSLA遵守状況を以下のように算出する。
例えば、サーバA、サーバB、サーバCそれぞれのサービスレベル項目2101が「応答時間」のSLA遵守率として、70%、30%、50%という値がそれぞれ出力されたとする。この場合、SLA遵守率集約部6011は、最大値を70%、最小値を30%、平均値を50%((70+30+50)÷3)と、算出する。
即ち、全体的なSLA遵守状況として平均値を出力することを予め定められている場合、SLA遵守率集約部6011は、全体的なSLA遵守状況は50%となる。また、最小値を出力することを予め定められている場合は、全体的なSLA遵守状況は30%となる。更に、SLA遵守率が最小値をとる項目をSLA維持におけるボトルネックとなっている項目とする。
また、SLA遵守率集約部6011は、ボトルネックとなっているサービスレベル項目2101の情報として、サーバAの応答時間のSLA遵守率が30%であり、サーバAの応答時間がボトルネックであることを出力する。
SLA遵守率集約部6011は、SLA違反表示部(不図示)を経由して、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を、ディスプレイ(不図示)に表示する。また、SLA遵守率集約部6011は、例えば、通信手段(不図示)及びネットワーク(不図示)を経由して、端末装置(不図示)に、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を送信するようにしてもよい。
次に、SLA遵守率集約部6011の動作について説明する。図18は、SLA遵守率集約部6011の動作を示すフローチャートである。
まず、SLA遵守率集約部6011は、SLA遵守率算出部1032より出力される複数のSLA遵守率を取得する(ステップK101)。
次に、SLA遵守率集約部6011は、取得した複数のSLA遵守率を集約し、最大値、最小値及び平均値を算出し、出力する(ステップK102)。
尚、SLA遵守率の最小値は、複数のサービスレベル項目2101の内で最小値をとったサービスレベル項目2101のSLA遵守状況が、SLA違反にどの程度近づいているかを示している。また、SLA遵守率の平均値は、監視対象システムにおいて、複数のサービスレベル項目2101がどの程度遵守されているかを示す指標となる。
次に、SLA遵守率集約部6011は、平均値や最小値、最大値などの全体的なSLA遵守状況に加え、ボトルネックとなっているサービスレベル項目2101の情報を出力する(ステップK103)。ボトルネックとなっているサービスレベル項目2101は、複数のSLA遵守率の内の最小値のSLA遵守率をとるサービスレベル項目2101である。
以上が、SLA遵守率集約部6011の動作についての説明である。
本実施形態の第1の効果は、複数のサービスレベル項目2101それぞれに対するSLA遵守状況を、まとめて監視することが容易になる点である。
その理由は、SLA遵守率集約部6011が複数のSLA遵守率を集約した結果を出力するようにしたからである。
本実施形態の第2の効果は、ボトルネックとなっているサービスレベル項目2101がSLA違反となることを防止する対策をとることが可能となる点である。
その理由は、SLA遵守率集約部6011がボトルネックとなっているサービスレベル項目2101の情報を出力するようにしたからである。
本実施形態のSLA遵守率集約部6011は、第1の実施形態、第3の実施形態及び第4の実施形態に適用してもよい。
以上の各実施形態で説明した各構成要素は、例えば、図19に示すように、プログラムにより所定の処理をコンピュータに実行させてもよい。
図19は、プログラムにより所定の処理をコンピュータに実行させる品質評価装置7000の構成を示すブロック図である。図19を参照すると、品質評価装置7000は、CPU(Central Processing Unit)7100、ディスク装置7200、記憶部7300、通信部7500、入力部7600及び出力部7700を含む。
CPU7100は、ディスク装置7200に格納されたプログラムを、例えば記憶部7300に展開し、展開したプログラムに基づいて所定の処理を実行する。
ディスク装置7200は、例えば、光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク及び半導体メモリであって、不揮発性の記憶媒体を含む。ディスク装置7200は、上述の各実施形態における通信制御装置の処理の一部をコンピュータに実行させるプログラムを記憶する。また、ディスク装置7200は、SLA定義記憶部1021及びログ記憶部1022として、SLA定義、監視ログ、監視ログ集計記録を記憶してもよい。
記憶部7300は、そのプログラム及び上述の各実施形態において生成、参照されるデータを記憶する。
CPU7100、ディスク装置7200及び記憶部7300は、SLA許容範囲算出部1031、SLA遵守率算出部1032、全監視数推定部4011、SLA違反予測部5011及びSLA遵守率集約部6011に対応する。
通信部7500は、例えばネットワークとのインタフェースを実現する。通信部7500は、SLA許容範囲算出部1031及びSLA遵守率算出部1032の一部として含まれてよい。
入力部7600は、例えばマウスやキーボード、内蔵のキーボタンなどで実現され、入力操作に用いられる。入力部3073は、マウスやキーボード、内蔵のキーボタンに限らず、例えばタッチパネル、加速度計、ジャイロセンサ、カメラなどでもよい。
出力部7700は、例えばディスプレイで実現され、出力を確認するために用いられる。
図20は、プログラムを記録した不揮発性記憶媒体の例を示すブロック図である。記録媒体7400は、情報を非一時的に記憶する不揮発性記録媒体であってよい。
品質評価装置7000は、外部から供給される記録媒体7400を含むようにしてもよい。CPU7100は、記録媒体7400に格納されたプログラムのコードを読み出して実行するようにしてもよい。あるいは、CPU7100は、記録媒体7400に格納されたプログラムのコードを、記憶部7300、ディスク装置7200またはその両方に格納するようにしてもよい。すなわち、本実施形態は、品質評価装置7000(CPU7100)が実行するプログラム(ソフトウェア)を、一時的にまたは非一時的に、記憶する記録媒体7400の実施形態を含む。
以上、各実施形態及び実施例を参照して本発明を説明したが、本発明は上記実施形態及び実施例に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しえるさまざまな変更をすることができる。
以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されたり、1つの構成要素が複数のモジュールで実現されたりしてもよい。また、各構成要素は、ある構成要素が他の構成要素の一部であったり、ある構成要素の一部と他の構成要素の一部とが重複していたり、といったような構成であってもよい。
以上説明した各実施形態における各構成要素及び各構成要素を実現するモジュールは、必要に応じ可能であれば、ハードウェア的に実現されても良いし、コンピュータ及びプログラムで実現されても良いし、ハードウェア的なモジュールとコンピュータ及びプログラムとの混在により実現されても良い。プログラムは、磁気ディスクや半導体メモリなど、不揮発性のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態における構成要素として機能させる。
また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。
更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよい。
更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作の全ての関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更されて良い。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年7月25日に出願された日本出願特願2011−162312を基礎とする優先権を主張し、その開示の全てをここに取り込む。 [First Embodiment]
FIG. 1 is a block diagram showing a configuration of a quality evaluation apparatus 1000 according to the first embodiment of the present invention.
As shown in FIG. 1, the quality evaluation apparatus 1000 according to the first embodiment includes amonitoring unit 1011, an SLA definition storage unit 1021, a log storage unit 1022, an SLA violation range calculation unit 1031 and an SLA compliance rate calculation. Part 1032.
Based on the SLA definition, themonitoring unit 1011 performs monitoring on a monitoring target system (not shown) and acquires monitoring data that is a result of the monitoring.
FIG. 2 is a diagram illustrating an example of the SLA definition 2100. Referring to FIG. 2, the SLA definition 2100 is composed of one or more SLA definition records 2107. The SLA definition record 2107 includes a service level item 2101, a monitoring reference value 2102, an SLA violation condition (also called violation condition) 2103, a monitoring method 2104, a monitoring interval (also called an acquisition interval) 2105, and a monitoring period 2106.
A service level item 2101 indicates an item monitored as an SLA. The monitoring reference value 2102 indicates a value that the corresponding service level item 2101 should satisfy. The SLA violation condition 2103 indicates a condition for determining that the corresponding service level item 2101 is an SLA violation. The monitoring method 2104 indicates a method (means) for monitoring the corresponding service level item 2101. A monitoring interval 2105 indicates an interval at which the corresponding service level item 2101 is monitored. The monitoring period 2106 indicates a monitoring period for determining whether there is an SLA violation.
The monitoring target system is, for example, a WEB three-layer system including a single server or a plurality of servers, and a data center.
The monitoring items (service level item 2101) to be executed for the monitored system include, for example, availability such as service time and operation rate, reliability such as average recovery time and failure notification time, response time and CPU usage rate. And performance information such as batch processing time.
That is, themonitoring unit 1011 performs a monitoring operation on the service level item 2101 based on the information in the SLA definition record 2107. Specifically, the monitoring unit 1011 acquires monitoring data by executing a monitoring operation at a time interval corresponding to the monitoring interval 2105 using the monitoring method indicated by the monitoring method 2104 corresponding to a certain service level item 2101. To do. For example, the monitoring unit 1011 performs the monitoring operation at “every 5 minutes” indicated by the monitoring interval 2105 using “ping” indicated by the monitoring method 2104 in which the service level item 2101 corresponds to “service availability”. Execute and get monitoring data.
Further, each time themonitoring unit 1011 executes the monitoring operation, the monitoring unit 1011 generates a monitoring log related to the service level item 2101 based on the acquired monitoring data, and outputs the monitoring log to the log storage unit 1022. The monitoring data is monitoring data acquired by executing the monitoring operation once.
In addition, themonitoring unit 1011 generates a monitoring log total record for the service level item 2101 based on the acquired monitoring data for each segment of the monitoring period 2106, and outputs it to the log storage unit 1022. Note that the monitoring data is all the monitoring data acquired from the previous segment of the monitoring period 2106 to the present segment.
Themonitoring unit 1011 may output the monitoring log record 2206 to the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032. Similarly, the monitoring unit 1011 may output the monitoring log aggregation record 2307 to the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032. In this case, the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032 may store the monitoring log 2200 and the monitoring log total recording 2300 in a storage unit (not shown).
FIG. 3 is a diagram illustrating an example of the monitoring log 2200. Referring to FIG. 3, the monitoring log 2200 includes a monitoring log record 2206 including at least a monitoring date / time 2201, a monitoring item 2202, a monitoring result 2203, and a reference value violation presence / absence 2204.
The monitoring date / time 2201 indicates the date / time when themonitoring unit 1011 executed the monitoring operation.
A monitoring item 2202 indicates an item of monitoring operation executed by themonitoring unit 1011. When the content of the monitoring item 2202 matches the content of the service level item 2101, the monitoring log record 2206 including the monitoring item 2202 corresponds to the SLA definition record 2107 including the service level item 2101. That is, the monitoring log record 2206 is a monitoring log record 2206 for the monitoring operation executed by the monitoring unit 1011 based on the SLA definition record 2107.
The monitoring result 2203 is information indicating the result of the monitoring operation generated by themonitoring unit 1011 based on the monitoring data acquired by executing the monitoring operation.
For example, referring to FIG. 3, the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “service time” is “◯”. This indicates that the result of the monitoring operation by themonitoring unit 1011 is normal. That is, when the monitoring result 2203 is “◯”, the monitoring is performed during the time interval indicated by the monitoring interval 2105 (for example, from 2010/2/15, 14:59 to 2010/2/15, 15:00). Indicates that the service of the target system is operating normally.
On the other hand, when there is a time when the operation of the service of the monitoring target system is not normal, the monitoring result 2203 is, for example, a value less than 100% corresponding to the time when the operation is not confirmed.
In addition, the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “service operating rate” is “100%”. This is the service operation rate calculated by themonitoring unit 1011 based on the unscheduled stop time that occurs from the monitoring start time based on the monitoring period 2106 to the time when the service operation rate is calculated. For example, when the monitoring start time based on the monitoring period 2106 is “2010/2/15, 14:00” and the service operation rate calculation time is “2010/2/15, 15:20”, the monitoring period 2106 The monitoring time is 100 minutes from the monitoring start time based on the time when the service availability is calculated. For example, when the monitoring time from the monitoring start time to the time when the service operation rate is calculated is 100 minutes, and the unscheduled stop time is 10 minutes, the monitoring result 2203 is “90%”.
The monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “response time” is “5 seconds”. Here, the monitoring log record 2206 whose monitoring item 2202 is “response time” corresponds to the SLA definition record 2107 whose service level item 2101 is “response time”. That is, “5 seconds” of the monitoring result 2203 is a response time measured by themonitoring unit 1011 using ping based on “ping” of the monitoring method 2104 included in the corresponding SLA definition record 2107.
The monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “number of transactions” is “300”. This is the number of transactions that occurred during the monitoring time of the service availability, for example, counted by themonitoring unit 1011.
Reference value violation presence / absence 2204 indicates whether the corresponding monitoring result 2203 violates the corresponding monitoring reference value 2102 (in this case, “present”) or not (in this case, “none”).
The monitoring log record 2206 in which the presence / absence of the reference value violation 2204 is “Yes” corresponds to the monitoring data that does not satisfy the monitoring reference. For example, “5 seconds” in which the monitoring item 2202 shown in FIG. 3 is the “response time” monitoring result 2203 is “less than 3 seconds” in which the service level item 2101 shown in FIG. 2 is the monitoring reference value 2102 of “response time”. Is not satisfied. Accordingly, the presence or absence of a reference value violation 2204 for the monitoring item 2202 “response time” shown in FIG. 3 is “present”.
FIG. 4 is a diagram illustrating an example of the monitoring log tabulation record 2300. Referring to FIG. 4, the monitoring log total record 2300 includes a monitoring log total record 2307 including at least a monitoring period 2302, a report date and time 2303, and an SLA maintenance status 2306.
When the SLA maintenance status 2306 is “◯”, there is no service level item 2101 corresponding to the SLA violation condition 2103 in all the SLA definition records 2107 defined in the SLA definition 2100 as shown in FIG. Indicates. When the SLA maintenance status 2306 is “x”, it indicates that any one or more of the service level items 2101 corresponds to the SLA violation condition 2103.
The SLAdefinition storage unit 1021 stores an SLA definition 2100.
Thelog storage unit 1022 stores a monitoring log 2200 and a monitoring log total record 2300.
The SLA allowablerange calculation unit 1031 calculates the total number of monitoring based on the monitoring interval 2105 and the monitoring period 2106 of the SLA definition 2100. Subsequently, the SLA allowable range calculation unit 1031 generates an SLA allowable range (also referred to as an allowable range) based on the calculated total number of monitoring and the corresponding SLA violation condition 2103, and outputs it to the SLA compliance rate calculation unit 1032. . The SLA allowable range is information indicating a range of an amount of violation (amount of reference value violation) with respect to the monitoring reference value 2102 that is allowable in the SLA, that is, does not violate the SLA even if it occurs. The amount of violation with respect to the monitoring reference value 2102 corresponds to the amount of monitoring data that does not satisfy the monitoring reference value 2102, and is indicated by the number of violations or time. Note that the amount of violation with respect to the monitoring reference value 2102 may be indicated by the ratio of the number of violations or time to the monitoring reference value 2102. For example, when the monitoring data is an information processing amount or a communication amount, the amount of violation with respect to the monitoring reference value 2102 may be indicated by an insufficient information processing amount or a communication amount. Alternatively, the amount of violation with respect to the monitoring reference value 2102 may be indicated by the ratio of the information processing amount or communication amount that is insufficient or exceeded to the monitoring reference value 2102.
The SLA compliancerate calculation unit 1032 calculates the number of occurrences of the reference value violation based on the presence or absence of the reference value violation 2204 included in the monitoring log record 2206 shown in FIG.
For example, the SLA compliancerate calculation unit 1032 calculates the number of occurrences of reference value violations in the range from the start time of the monitoring period 2106 (for example, every day at midnight) to the time for calculating the SLA compliance rate. Further, the SLA compliance rate calculation unit 1032 may calculate the number of occurrences of violation of the reference value in a specific range input from an input unit (not shown) connected to the quality evaluation apparatus 1000.
Next, the SLA compliancerate calculation unit 1032 calculates and outputs the SLA compliance rate based on the calculated number of occurrences of violation of the reference value and the SLA allowable range acquired from the SLA allowable range calculation unit 1031.
The SLA compliance rate is a ratio of the amount of violation of the reference value that has already occurred to the range of the amount of violation of the reference value indicated by the SLA tolerance. Here, the amount of violation of the reference value that has already occurred is, for example, a reference value that has occurred from a certain specific time (for example, monitoring start time) to another specific time (for example, the current time during service provision). The amount of violations. That is, the SLA compliance rate indicates how close to the SLA violation or how much the SLA is violated at a specific point in time during service provision.
Next, the operation of the present embodiment will be described in detail with reference to FIGS.
First, an operation for recording the SLA definition 2100 in the SLAdefinition storage unit 1021 will be described. FIG. 5 is a flowchart showing an operation of recording the SLA definition 2100 in the SLA definition storage unit 1021 in the present embodiment.
An input unit (not shown) of the quality evaluation apparatus 1000 receives an input of the SLA definition 2100 (step A101).
Next, the input unit records the received SLA definition 2100 in the SLAdefinition storage unit 1021. (Step A102)
This completes the description of the operation of recording the SLA definition 2100 in the SLAdefinition storage unit 1021.
Next, the overall operation of the quality evaluation apparatus 1000 that executes monitoring and calculates the SLA compliance rate will be described. FIG. 6 is a flowchart showing the overall operation of the quality evaluation apparatus 1000 that executes monitoring and calculates the SLA compliance rate.
First, themonitoring unit 1011 executes monitoring of the monitoring target system based on the SLA definition 2100 (step B101).
Next, themonitoring unit 1011 generates a monitoring log record 2206 and a monitoring log total record 2307 based on the executed monitoring. (Step B102).
Specific examples of monitoring execution and the generated monitoring log record 2206 will be described in the following (1) to (3).
(1) For example, themonitoring unit 1011 performs monitoring as follows in response to the SLA definition record 2107 whose service level item 2101 is “service time”.
First, themonitoring unit 1011 transmits a ping (pin) to the monitoring target system at, for example, 00 seconds per minute. Note that 00 seconds per minute is based on “every minute” indicated by a monitoring interval 2105. The transmission of the ping is based on “ping” indicated by the monitoring method 2104.
Next, when themonitoring unit 1011 receives a response to the ping from the monitoring target system within a predetermined time, the monitoring unit 1011 determines that the service is operating in the corresponding monitoring section. Note that the corresponding monitoring section is a section of a time that is back by the time (for example, one minute) indicated by the monitoring interval 2105 from the reception time of the response to ping.
In other words, themonitoring unit 1011 considers that the service is not stopped in the monitoring target system, for example, for one minute in the monitoring section, and is in an operating state. Then, the monitoring unit 1011 generates a monitoring log record 2206 including “◯” as the monitoring result 2203 and “None” as the reference value violation presence or absence 2204.
On the other hand, if themonitoring unit 1011 does not receive a response to the ping from the monitoring target system within a predetermined time, the monitoring unit 1011 is normal such that the service is stopped or an abnormality has occurred in the monitoring target system. Judge that it is not in operation. In other words, the monitoring unit 1011 considers that the monitoring target system is in a stopped state for, for example, one minute in the monitoring section. Then, the monitoring unit 1011 generates a monitoring log record 2206 including “×” as the monitoring result 2203 and “Yes” as the presence or absence of reference value violation 2204.
(2) For example, themonitoring unit 1011 performs monitoring as follows in response to the SLA definition record 2107 in which the service level item 2101 is “service availability”.
First, themonitoring unit 1011 transmits a ping (pin) to the monitoring target system at 00 seconds every 5 minutes, for example. Note that 00 seconds every 5 minutes is based on “every 5 minutes” indicated by a monitoring interval 2105. The transmission of the ping is based on “ping” indicated by the monitoring method 2104.
Next, when themonitoring unit 1011 receives a response to the ping from the monitoring target system within a predetermined time, the monitoring unit 1011 determines that the service is operating in the corresponding monitoring section. Note that the corresponding monitoring section is a section of time that is back by the time (for example, 5 minutes) indicated by the monitoring interval 2105 from the reception time of the response to ping.
That is, themonitoring unit 1011 considers that the service in the monitoring target system has not been stopped and is in an operating state during the monitoring section (for example, for 5 minutes). Then, the monitoring unit 1011 records in a memory (not shown) in the monitoring unit 1011 that the monitoring target system is operating normally during the monitoring section.
On the other hand, if themonitoring unit 1011 does not receive a response to the ping from the monitoring target system within a predetermined time, the monitoring unit 1011 is normal such that the service is stopped or an abnormality has occurred in the monitoring target system. Judge that it is not in operation. That is, the monitoring unit 1011 considers that the monitoring target system is in a stopped state during the monitoring section. Then, the monitoring unit 1011 records in the memory in the monitoring unit 1011 that the monitoring target system is not operating normally during the monitoring section.
Next, themonitoring unit 1011 generates a monitoring log record 2206 including the section operation rate and the presence / absence of a reference value violation 2204 determined based on the monitoring reference value 2102 as the monitoring result 2203. The section operation rate is a ratio of time during which the operation is normally performed to the time from the monitoring start time to the calculation time. The monitoring unit 1011 calculates based on, for example, a record of the operation of the monitoring target system recorded in a memory in the monitoring unit 1011.
Further, themonitoring unit 1011 compares the calculated section monitoring rate with the monitoring reference value 2102 to determine the presence / absence 2204 of the reference value violation. That is, when the calculated section monitoring rate is less than “99.9%” of the monitoring reference value 2102, the monitoring unit 1011 determines whether the reference value violation 2204 is “present”.
(3) For example, themonitoring unit 1011 performs monitoring as follows in response to the SLA definition record 2107 whose service level item 2101 is “response time”.
First, themonitoring unit 1011 transmits a ping to the monitoring target system at 00 seconds every 5 minutes, for example. Note that 00 seconds every 5 minutes is based on “every 5 minutes” indicated by a monitoring interval 2105. The transmission of the ping is based on “ping” indicated by the monitoring method 2104.
Next, themonitoring unit 1011 generates a monitoring log record 2206 including a response time to ping from the monitoring target system as the monitoring result 2203 and a reference value violation presence / absence 2204 determined based on the monitoring reference value 2102.
When there is no response to the ping from the monitoring target system within a predetermined time, themonitoring unit 1011 sets the monitoring result 2203 as “unmeasurable” or an exceptional value separately defined in the SLA definition 2100.
In addition, themonitoring unit 1011 compares the response time with the monitoring reference value 2102 to determine whether or not there is a reference value violation 2204. That is, if the response time is not “within 3 seconds” of the monitoring reference value 2102, the monitoring unit 1011 determines that the reference value violation 2204 is “present”.
The above is a specific example of the execution of monitoring and the generated monitoring log record 2206.
Next, themonitoring unit 1011 records the generated monitoring log record 2206 in the monitoring log 2200 and the generated monitoring log total record 2307 in the monitoring log total recording 2300 (step B103).
Next, the SLA allowablerange calculation unit 1031 calculates the SLA allowable range based on the SLA definition 2100 recorded in the SLA definition storage unit 1021, and outputs it to the SLA compliance rate calculation unit 1032 (step B104).
Next, the SLA compliancerate calculation unit 1032 calculates and outputs the SLA compliance rate based on the monitoring log 2200 and the SLA allowable range acquired from the SLA allowable range calculation unit 1031 (step B105).
Next, the communication means (not shown) acquires the SLA compliance rate from the SLA compliancerate calculation unit 1032 and transmits the SLA compliance rate to the terminal device (not shown) via the network (not shown) (step) B106). Further, for example, the SLA compliance rate display means (not shown) may acquire the SLA compliance rate from the SLA compliance rate calculation unit 1032 and display it on the display (not shown).
The above is description of operation | movement of the quality evaluation apparatus 1000 whole which performs monitoring and calculates a SLA compliance rate.
Next, with reference to FIG. 7, the monitoring operation corresponding to Step B101, Step B102, and Step B103 of FIG. 6 will be described in detail. FIG. 7 is a flowchart showing the operation of themonitoring unit 1011.
First, themonitoring unit 1011 acquires the SLA definition 2100 from the SLA definition storage unit 1021 (step C101).
Next, themonitoring unit 1011 performs monitoring of the monitoring target system for the service level item 2101 included in each SLA definition record 2107 of the acquired SLA definition storage unit 1021 based on the corresponding monitoring interval 2105 and monitoring method 2104. To do. Subsequently, the monitoring unit 1011 generates a corresponding monitoring result 2203 based on the monitoring result. (Step C102).
Next, themonitoring unit 1011 generates a monitoring log record 2206 including the generated monitoring result 2203 and the presence or absence of a reference value violation 2204 determined based on the monitoring result 2203 and the monitoring reference value 2102 (step C103).
Next, themonitoring unit 1011 records the generated monitoring log record 2206 in the log storage unit 1022 (step C104).
Next, themonitoring unit 1011 generates a monitoring log total record 2307 (Step C105).
Next, themonitoring unit 1011 outputs the generated monitoring log total record 2307 to the log storage unit 1022 (C106).
In step C105, themonitoring unit 1011 determines whether each monitoring period 2106 is completed. When the monitoring period 2106 is completed, the monitoring unit 1011 generates a monitoring log total record 2307. Furthermore, when the log total record 2307 is generated, the monitoring unit 1011 outputs this monitor log total record 2307.
Further, themonitoring unit 1011 may always generate the monitoring log total record 2307 in step C105. In this case, when the generated SLA maintenance status 2306 is “x”, the monitoring unit 1011 may output the generated monitoring log total record 2307.
The above is the description of the operation of themonitoring unit 1011.
Next, the operation of the SLA allowablerange calculation unit 1031 corresponding to step B104 of FIG. 6 will be described in detail with reference to FIG. FIG. 8 is a flowchart showing the operation of the SLA allowable range calculation unit 1031.
First, the SLA allowablerange calculation unit 1031 acquires the monitoring interval 2105 of the SLA definition record 2107 corresponding to the service level item 2101 for calculating the SLA allowable range from the SLA definition storage unit 1021 (step D101).
Next, the SLA allowablerange calculation unit 1031 acquires the monitoring period 2106 from the corresponding SLA definition record 2107 (step D102).
Next, the SLA allowablerange calculation unit 1031 calculates the total number of monitoring within the monitoring period 2106 based on the acquired monitoring period 2106 and the monitoring interval 2105 (step D103). For example, if the monitoring period 2106 is 1 day and the monitoring interval 2105 is 1 minute, the SLA allowable range calculation unit 1031 calculates the total number of monitoring calls “1440” ((24 × 60) minutes ÷ 1 minute).
Next, the SLA allowablerange calculation unit 1031 acquires the SLA violation condition 2103 from the corresponding SLA definition record 2107 (step D104).
Next, the SLA allowablerange calculation unit 1031 calculates and outputs an SLA allowable range based on the acquired SLA violation condition 2103 and the calculated total number of monitoring calls Call (step D105).
For example, if the monitoring reference value 2102 is 98%, violation of the reference value is allowed up to 2%. Therefore, for example, when the total number of calls Call is “1440” times, the SLA allowablerange calculation unit 1031 calculates the SLA allowable range as “28.8” (1440 × 0.02) times. When time is used as the SLA allowable range, if the total number of monitoring Call is “1” days, that is, “1440”, “28.8” is the SLA allowable range.
The operation of the SLA allowablerange calculation unit 1031 has been described above.
Next, the operation of the SLA compliancerate calculation unit 1032 corresponding to step B105 of FIG. 6 will be described in detail with reference to FIG. FIG. 9 is a flowchart showing the operation of the SLA compliance rate calculation unit 1032.
First, the SLA compliancerate calculation unit 1032 determines the reference value violation amount (the number of reference value violations or the number of reference value violations) based on the presence or absence of reference value violation 2204 in the monitoring log 2200 as shown in FIG. Time) is calculated (step E101).
Next, the SLA compliancerate calculation unit 1032 acquires the SLA allowable range output by the SLA allowable range calculation unit 1031. (Step E102)
Next, the SLA compliancerate calculation unit 1032 calculates and outputs the SLA compliance rate based on the calculated reference value violation amount and the acquired SLA allowable range (step E103). The SLA compliance rate is calculated as a ratio of the reference value violation amount to the SLA allowable range.
For example, it is assumed that the number of violations of the reference value from the start of the monitoring period to the time of calculating the SLA compliance rate is 10 times, and the SLA allowable range for violation of the reference value is “28.8≈29 times”. In this case, the SLA compliancerate calculation unit 1032 calculates the SLA compliance rate as “66% ((29-10) / 29 * 100)”.
Further, it is assumed that the number of violations of the reference value from the start of the monitoring period to the time of calculating the SLA compliance rate is 2, and the SLA allowable range for violation of the reference value is “28.8≈29 minutes”.
Here, as described above, themonitoring unit 1011 executes the monitoring operation corresponding to the corresponding service level item 2101 based on the monitoring interval 2105 defined in the SLA definition 2100. When the reference value violation occurs, the monitoring unit 1011 considers that the violation has continued during the monitoring interval 2105 (for example, 1 minute). Therefore, the occurrence time of the reference value violation can be obtained as the product of the number of occurrences of the reference value violation and the monitoring interval 2105. For example, when the reference value violation occurs twice and the monitoring interval 2105 is “5 minutes”, the reference value violation time is 10 minutes.
In this case, the SLA compliancerate calculation unit 1032 calculates the SLA compliance rate as “66% ((29-10) / 29 * 100)”.
When the number of violations of the reference value exceeds the SLA allowable range, the SLA compliancerate calculation unit 1032 calculates the SLA compliance rate as follows. For example, it is assumed that the number of violations of the reference value from the start of the monitoring period to the time of calculating the SLA compliance rate is 35, and the SLA allowable range for violation of the reference value is “28.8≈29”.
In this case, the SLA compliancerate calculation unit 1032 calculates the SLA compliance rate as “−17% ((29-35) / 29 * 100.” That is, the SLA compliance rate calculation unit 1032 indicates that the number of violations of the reference value is When the SLA allowable range is exceeded, the SLA compliance rate is calculated as a negative value, and the degree of SLA violation is calculated as the absolute value.
The same applies to the case where the SLA allowable range is indicated by time, and the reference value violation time exceeds the SLA allowable range.
The above is the description of the operation of the SLA compliancerate calculation unit 1032.
In the present embodiment, as shown in the flowchart of FIG. 6, themonitoring unit 1011 performs monitoring, the SLA allowable range calculation unit 1031 calculates the SLA allowable range, and the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate. Operate as a series of operations synchronously. This is an example and may be as follows, for example.
When the content of the SLA definition 2100 of the quality evaluation apparatus 1000 is updated, the SLA allowablerange calculation unit 1031 calculates the SLA allowable range, and adds storage unit (not shown, for example, an SLA allowable range item to the SLA definition structure) You may make it do). Each of the monitoring unit 1011 and the SLA compliance rate calculating unit 1032 sets a timer (not shown) so that an interrupt is notified at a necessary timing based on the SLA definition 2100, and operates using the notified interrupt as a trigger.
The SLA compliance rate display means (not shown) may display the SLA compliance rate acquired from the SLA compliancerate calculation unit 1032 on a display (not shown) in time series. Thereby, it is possible to monitor in detail the state change of the service level item 2101 until the SLA violation.
Further, the SLA compliance rate display means (not shown) displays a warning when the SLA compliance rate acquired from the SLA compliancerate calculation unit 1032 becomes 0%, assuming that an SLA violation has occurred provisionally. It may be. In this way, even in the middle of the monitoring period 2106, it is possible to detect at an early stage the possibility of being determined as an SLA violation with a high probability at the end of the monitoring period, and to issue a warning.
In this embodiment, themonitoring unit 1011 outputs a monitoring log record 2206 including the monitoring result 2203 generated based on the result of executing the monitoring operation. This is an example of the present embodiment, and may be as follows, for example.
First, themonitoring unit 1011 directly outputs the result of executing the monitoring operation to at least one of the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032.
Next, the SLA allowablerange calculation unit 1031 and the SLA compliance rate calculation unit 1032 generate a monitoring result 2203 based on the result of executing the received monitoring operation. Next, the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032 determine whether there is a violation of the reference value based on the generated monitoring result 2203 and the monitoring reference value 2102. Next, the SLA compliance rate calculation unit 1032 calculates the value of the reference value violation based on the determined presence or absence of the reference value violation.
Based on the monitoring result 2203 and the reference value violation value calculated in this way, the SLA allowablerange calculation unit 1031 and the SLA compliance rate calculation unit 1032 operate substantially the same as the operations shown in the flowcharts of FIGS. I do.
The first effect of the present embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision.
The reason is that it is configured to include the following elements. First, the SLA allowablerange calculation unit 1031 calculates the total number of monitoring within the period indicated by the monitoring period 2106, and calculates the SLA allowable range based on the total number of monitoring and the SLA violation condition 2103. Next, the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate based on the SLA allowable range and the reference value violation amount from the start of the monitoring period to a specific time.
The second effect of the present embodiment is that it becomes possible to monitor in detail the state change of the service level item 2101 until the SLA violation.
The reason is that the SLA compliancerate calculation unit 1032 calculates the SLA compliance rate every time the monitoring unit 1011 executes monitoring, that is, every time operation information and performance information such as availability and reliability of the monitored system are acquired. This is because the output is made.
The third effect of the present embodiment is that when the SLA compliance rate becomes 0%, it is considered that an SLA violation has occurred tentatively, and even during the monitoring period 2106, the SLA violation has a high probability at the end of the monitoring period. It is possible to quickly detect the case determined to be and issue a warning.
The reason is that even when no SLA violation has occurred (when the SLA compliance rate is 0%), the SLA compliancerate calculation unit 1032 calculates and outputs the SLA compliance rate.
The fourth effect of the present embodiment is that the SLA compliance status can be continuously indicated even when the allowable range changes, for example, when the violation standard is changed depending on the time zone due to power consumption limitation.
The reason is that the execution of monitoring by themonitoring unit 1011, the calculation of the SLA allowable range by the SLA allowable range calculating unit 1031, and the calculation of the SLA compliance rate by the SLA compliance rate calculating unit 1032 operate as a series of operations in synchronization. It is because it tried to do.
[Second Embodiment]
Next, a second embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 10 is a block diagram showing a configuration of a quality evaluation apparatus 3000 according to the second embodiment of the present invention.
As shown in FIG. 10, the quality evaluation apparatus 3000 according to the second embodiment includes an SLA allowablerange calculation unit 1031 and an SLA compliance rate calculation unit 1032.
The SLA allowablerange calculation unit 1031 calculates the total number of monitoring based on the corresponding monitoring interval 2105 and monitoring period 2106. Subsequently, the SLA allowable range calculation unit 1031 determines the allowable amount of monitoring data that does not satisfy the monitoring reference value 2102 that is the reference value of monitoring data based on the calculated total number of monitoring and the corresponding SLA violation condition 2103. An SLA allowable range indicating a possible range is calculated and output.
The SLA compliancerate calculation unit 1032 calculates the compliance rate with respect to the SLA violation condition 2103 at any point in the middle of the monitoring period 2106 based on the recording of monitoring data and the SLA allowable range output by the SLA allowable range calculation unit 1031. Calculate and output the indicated SLA compliance rate. Specifically, the SLA compliance rate is a ratio of the amount of monitoring data that does not satisfy the monitoring reference value 2102 to the SLA allowable range. Note that the SLA compliance rate calculation unit 1032 calculates the amount of monitoring data that does not satisfy the monitoring reference value 2102 based on, for example, the recording of monitoring data during a period in which the SLA compliance rate is to be calculated. Further, the period for which the SLA compliance rate is to be calculated is, for example, a period from the time when monitoring starts to the current time.
The effect of this embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision.
The reason is that it is configured to include the following elements. First, the SLA allowablerange calculation unit 1031 calculates the total number of monitoring within the period indicated by the monitoring period 2106, and calculates the SLA allowable range based on the total number of monitoring and the SLA violation condition 2103. Next, the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate based on the record of the monitoring data and the SLA allowable range.
[Third Embodiment]
Next, a third embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 11 is a block diagram showing a configuration of a quality evaluation apparatus 4000 according to the third embodiment of the present invention.
As illustrated in FIG. 11, the quality evaluation apparatus 4000 according to the third embodiment further includes a total monitoringnumber estimation unit 4011 as compared with the quality evaluation apparatus 3000 according to the second embodiment.
FIG. 12 is a diagram illustrating an example of the SLA definition 2400. The SLA definition 2400 includes at least one SLA definition record 2401 in which the monitoring interval 2105 indicates “irregular”. The SLA definition 2400 may include an SLA definition record 2107 similar to the SLA definition 2100 in FIG.
The total monitoringnumber estimation unit 4011 calculates and outputs the total number of monitoring for the service level item 2101 whose monitoring interval 2105 is irregular as shown in the monitoring interval 2105 of the SLA definition record 2401 shown in FIG. Specifically, the total monitoring number estimation unit 4011 calculates and outputs the total number of monitoring in the monitoring period 2106 shown in FIG. 2 based on, for example, the number of transactions 4305 in the monitoring log total 4300 shown in FIG.
FIG. 13 is a diagram showing an example of a monitoring log total recording (also called operation history) 4300. Referring to FIG. 13, the monitoring log total record 4300 includes a monitoring log total record 4307 including at least a monitoring period 2302, a report date and time 2303, an SLA maintenance status 2306, and the number of transactions 4305.
The transaction number 4305 indicates the total number of transactions that have occurred in the monitoring target system during the period indicated by the corresponding monitoring period 2302.
Note that the monitoring period 2302, the reporting date 2303, and the SLA maintenance status 2306 are the same as those shown in FIG.
Next, the operation of this embodiment will be described with reference to FIG. FIG. 14 is a flowchart showing the operation of the total monitoringnumber estimation unit 4011 of this embodiment.
The total monitoringnumber estimation unit 4011 acquires the monitoring interval 2105 included in each SLA definition record 2401 of the SLA definition 2400 (step F101).
Next, the total monitoringnumber estimation unit 4011 determines whether or not the monitoring interval 2105 indicates irregularity.
(Step F102). If no irregularity is indicated (NO in step F102), the process proceeds to D102 of FIG.
If it indicates irregular (YES in step F102), the total monitoringnumber estimation unit 4011 acquires the total number of monitoring for each past monitoring period 2302 shown in FIG. 13 (step F103). For example, the total monitoring number estimation unit 4011 acquires the number of transactions 4305 from the monitoring log total recording 4300 as shown in FIG. 13 recorded in the log storage unit 1022 as the total number of monitoring for each past monitoring period 2302. .
Note that the total number of monitoring for each past monitoring period 2302 that is acquired by the total monitoringnumber estimation unit 4011 in step F103 is, for example, one of the SLA violation condition 2103 and the monitoring interval 2105 of the SLA definition record 2401 shown in FIG. Defined. In the present embodiment, based on the fact that the monitoring interval 2105 of the SLA monitoring record 2401 shown in FIG. 12 is “per transaction (irregular)”, the total monitoring number estimation unit 4011 determines all the monitoring intervals 2302 in the past. The transaction number 4305 is acquired as the monitoring number.
Specifically, when the monitoring interval 2105 is “per transaction (irregular)”, for example, the total monitoringnumber estimation unit 4011 refers to the monitoring log total recording 4300 illustrated in FIG. 13 and acquires the transaction number 4305. . In this case, the number of transactions 4305 indicates the number of times of monitoring in the past monitoring period 2302.
Note that the total monitoringnumber estimation unit 4011 may directly calculate the number of monitoring times in the past monitoring period 2302 based on the monitoring log (also referred to as operation history) 2200 shown in FIG. In this case, the monitoring unit 1011 outputs a monitoring log record 2206 including the number of transactions processed in the monitoring target system to the total monitoring number estimation unit 4011.
Moreover, the quality evaluation apparatus 4000 may calculate the number of times of monitoring in the past monitoring period 2302 as follows. First, themonitoring unit 1011 outputs a monitoring log record (also referred to as an operation history) 2206 including the number of transactions in the monitoring target system to the monitoring log 2200. Next, the total monitoring number estimation unit 4011 calculates the total number of transactions in a certain period (past monitoring period 2302) based on the monitoring log record 2206 recorded in the monitoring log 2200 and whose monitoring item 2202 is “number of transactions”. It may be calculated directly.
In FIG. 14 again, the total monitoringnumber estimation unit 4011 calculates an estimated value of the total number of monitoring in the target period based on the acquired total number of monitoring (transaction number 4305) for each past monitoring period 2302 (step F104). . Here, the target period is a period from the start of the monitoring period to the end of the monitoring period in the monitoring period 2106 shown in FIG. 12, including the target time for calculating the SLA compliance rate.
Specifically, the total monitoringnumber estimation unit 4011 calculates an estimated value of the total monitoring number as follows, for example.
First, the total monitoringnumber estimation unit 4011 assumes that the data C = {C1, C2,..., Ck} of all the monitoring numbers in a plurality of past monitoring periods 2302 has a normal distribution, and sets a confidence interval. . Here, C1, C2, and Ck indicate the total number of monitoring for each past monitoring period 2302. k is the total number of monitoring in the past monitoring period 2302.
When the estimated value of the total number of monitoring is Call and the confidence interval is expressed as a range of the total number of monitoring Call using the t distribution, it is as shown in Equation 1.
Here, Cave is an average value of the data C of the total number of monitoring in a plurality of past monitoring periods 2302, as shown in Equation 2.
Further, “square of σ” is the variance of the data C of the total number of monitoring in a plurality of past monitoring periods 2302, as shown in Equation 3.
Further, t is a value obtained from a t distribution having an average of 0 and a standard deviation of 1. The value of t varies depending on the confidence interval to be set. For example, for a 95% confidence interval, t = 2.262, and for a 99% confidence interval, t = 3.250. The 95% confidence interval is an interval including 95% of the population estimated from the sample. Also, the 99% confidence interval has higher accuracy (reliability) than the 95% confidence interval. Note that the value of the t distribution is recorded in a storage unit (not shown) in the total monitoringnumber estimation unit 4011 as a table, for example.
For example, if there is a past distribution with an average value Cave = 1400, a variance “square of σ” = 19544, and the number of samples k = 10, using the 95% confidence interval, from t = 2.262, the upper limit of Call Values and lower limits are as shown in Equation 4.
Therefore, 1300 <Call <1500.
As described above, the total monitoringnumber estimation unit 4011 calculates the range of the total monitoring number Call.
Next, as described above, the allowable range CP and SLA compliancerate calculation unit 1032 calculated by the SLA allowable range calculation unit 1031 when the total monitoring number estimation unit 4011 calculates the range of the total monitoring number Call is calculated. An example of the SLA compliance rate α to be performed will be specifically described.
For example, in the case of the SLA definition record 2401 in FIG. 12, the SLA violation condition 2103 is “the rate when the reference value cannot be observed is 2% or more”. In this case, the amount of violation of the reference value is allowed to be less than 2%. Therefore, in the case of 1300 ≦ Call ≦ 1500, the allowable range CP of the number of violations of the reference value is 24 <CP <30 from 1300 × 0.02 = 26 and 1500 × 0.02 = 30. The same applies when the violation of the reference value is described in terms of time.
At this time, if the number of violations of the reference value from the start of the monitoring period to the calculation time is 10, the SLA compliancerate calculation unit 1032 determines that the SLA compliance rate 1032 from the allowable range of reference value violation 24 <CP <30. α is calculated as follows.
(25-10) ÷ 25 × 100 = 60%, (29-10) ÷ 29 × 100 = 66%, and therefore 61% ≦ α ≦ 66%.
This also applies to the case where the reference value violation value is expressed in time.
The total monitoringnumber estimation unit 4011 of this embodiment may be applied to the first embodiment.
The first effect of the present embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision even for the service level item 2101 for which the number of monitoring is not fixed.
The reason is that the total monitoringnumber estimation unit 4011 estimates the total monitoring number based on the monitoring log total record 4300 for the service level item 2101 for which the total monitoring number in the monitoring period 2106 is not fixed (the range of the total monitoring number). ) Is calculated.
The second effect of the present embodiment is that the SLA compliance status of the first effect is high even when the number of monitoring log total records 4307 in the monitoring log total record 4300 is relatively small (10 or less). It is possible to show that.
The reason is that it is configured to include the following elements. First, the total monitoringnumber estimation unit 4011 sets a confidence interval using the t distribution, and calculates an estimated value of the total number of monitoring corresponding to this confidence interval. Next, the SLA allowable range calculation unit 1031 calculates the allowable range based on the estimated value of the total number of monitoring. Next, the SLA compliance rate calculation unit 1032 calculates the SLA compliance rate based on the allowable range.
[Fourth Embodiment]
Next, a fourth embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 15 is a block diagram showing a configuration of a quality evaluation apparatus 5000 according to the fourth embodiment of the present invention.
As illustrated in FIG. 15, the quality evaluation apparatus 5000 according to the fourth embodiment further includes an SLAviolation prediction unit 5011 as compared to the quality evaluation apparatus 3000 according to the second embodiment.
The SLAviolation predicting unit 5011 calculates and outputs the time when the occurrence of the SLA violation is predicted based on the SLA compliance rate output from the SLA compliance rate calculating unit 1032. In addition, the SLA violation prediction unit 5011 outputs information indicating that there is a risk of an SLA violation when the predicted time is within the time before the end of the current monitoring period.
When the elapsed time t from the start of monitoring, the predicted occurrence time Te of SLA violation, and the SLA compliance rate α, the SLAviolation prediction unit 5011 calculates Te = 100 × t ÷ (100−α). Subsequently, the SLA violation prediction unit 5011 outputs the calculated prediction occurrence time Te.
For example, when the compliance rate α at the time when one hour has elapsed from the start of monitoring is 95%, the SLAviolation prediction unit 5011 calculates Te = 100 × 1 ÷ (100−95) = 20. That is, the expected occurrence time of the SLA violation in this case is 20 hours after the start of monitoring.
Furthermore, for example, when the monitoring period 2106 of a certain SLA definition record 2107 is 24 hours, there is a possibility that an SLA violation may occur within the monitoring period 2106, so information (warning) indicating that there is a risk is output. To do. Here, “SLA violation occurs within the monitoring period 2106” means that “the time when the SLA violation occurs is within the time before the end of the current monitoring period 2106, 21 hours after the start of monitoring. ".
The SLAviolation prediction unit 5011 outputs, for example, an expected occurrence time of an SLA violation or an expected occurrence time and a warning to a display (not shown) via an SLA violation display unit (not shown). Also, the SLA violation prediction unit 5011 sends, to the terminal device (not shown) via the communication means (not shown) and the network (not shown), the expected occurrence time of the SLA violation, or the expected occurrence time and warning, May be transmitted.
Next, the operation of the SLAviolation prediction unit 5011 will be described with reference to FIG. FIG. 16 is a flowchart showing the operation of the SLA violation prediction unit 5011.
The SLAviolation prediction unit 5011 acquires the SLA compliance rate from the SLA compliance rate calculation unit 1032 (step I101).
Next, the SLAviolation prediction unit 5011 calculates a predicted SLA violation occurrence time based on the acquired SLA compliance rate (step I102). The SLA violation prediction unit 5011 calculates the expected occurrence time Te of SLA violation using the following formula, for example. Te = 100 × t ÷ (100−α). Here, t is the time at the time of monitoring, and α is the SLA compliance rate.
Further, the SLAviolation prediction unit 5011 determines whether or not the calculated predicted occurrence time Te of SLA violation is included in the current monitoring period 2106 (step I103). If it is not included in the current monitoring period 2106 (NO in step I103), the process proceeds to step I105.
When included in the current monitoring period 2106 (YES in step I103), the SLAviolation predicting unit 5011 outputs a warning indicating that there is a risk of occurrence of an SLA violation to an output unit (not shown) (step I104).
In step I105, the SLAviolation prediction unit 5011 outputs the calculated predicted occurrence time of the SLA violation to an output unit (not shown) (step I105).
The above is the description of the operation of the SLAviolation prediction unit 5011.
Note that the SLAviolation prediction unit 5011 of this embodiment may be applied to the first embodiment and the third embodiment.
The effect of this embodiment is that it is possible to output the expected occurrence time of an SLA violation.
The reason is that the SLAviolation prediction unit 5011 calculates the SLA violation predicted occurrence time based on the SLA compliance rate.
[Fifth Embodiment]
Next, a fifth embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 17 is a block diagram showing a configuration of a quality evaluation apparatus 6000 according to the fifth embodiment of the present invention.
As illustrated in FIG. 17, the quality evaluation apparatus 6000 according to the fifth embodiment further includes an SLA compliancerate aggregation unit 6011 as compared to the quality evaluation apparatus 3000 according to the second embodiment.
The SLA compliancerate aggregation unit 6011 is based on the SLA compliance rate of each service level item 2101 output from the SLA compliance rate calculation unit 1032, and the overall SLA compliance status of the monitored system and the service level that is the bottleneck The information of item 2101 is output.
For example, when the monitoring target system includes server A, server B, and server C, the SLA compliancerate aggregation unit 6011 calculates the overall SLA compliance status of the monitoring target system as follows.
For example, it is assumed that the service level item 2101 of each of the server A, the server B, and the server C outputs values of 70%, 30%, and 50% as the SLA compliance rate of “response time”, respectively. In this case, the SLA compliancerate aggregation unit 6011 calculates the maximum value as 70%, the minimum value as 30%, and the average value as 50% ((70 + 30 + 50) ÷ 3).
That is, when it is predetermined to output an average value as the overall SLA compliance status, the SLA compliancerate aggregation unit 6011 has an overall SLA compliance status of 50%. Further, when it is predetermined to output the minimum value, the overall SLA compliance status is 30%. Further, an item having a minimum SLA compliance rate is an item that is a bottleneck in SLA maintenance.
In addition, the SLA compliancerate aggregation unit 6011 indicates that the SLA compliance rate of the response time of the server A is 30% and the response time of the server A is a bottleneck as information on the service level item 2101 that is a bottleneck. Is output.
The SLA compliancerate aggregating unit 6011 displays, via a SLA violation display unit (not shown), information on the overall SLA compliance status of the monitored system and information on the service level item 2101 that is the bottleneck. (Shown). In addition, the SLA compliance rate aggregation unit 6011 sends the overall SLA compliance status of the monitoring target system and the bottle to the terminal device (not shown) via, for example, a communication unit (not shown) and a network (not shown). Information on the service level item 2101 which is a bottleneck may be transmitted.
Next, the operation of the SLA compliancerate aggregation unit 6011 will be described. FIG. 18 is a flowchart showing the operation of the SLA compliance rate aggregation unit 6011.
First, the SLA compliancerate aggregation unit 6011 acquires a plurality of SLA compliance rates output from the SLA compliance rate calculation unit 1032 (step K101).
Next, the SLA compliancerate aggregation unit 6011 aggregates the acquired plurality of SLA compliance rates, calculates the maximum value, the minimum value, and the average value and outputs them (step K102).
The minimum value of the SLA compliance rate indicates how close the SLA compliance status of the service level item 2101 taking the minimum value among the plurality of service level items 2101 is close to the SLA violation. In addition, the average value of the SLA compliance rate is an index indicating how much a plurality of service level items 2101 are observed in the monitoring target system.
Next, the SLA compliancerate aggregation unit 6011 outputs information on the service level item 2101 that is a bottleneck in addition to the overall SLA compliance status such as an average value, a minimum value, and a maximum value (step K103). A service level item 2101 that is a bottleneck is a service level item 2101 that takes the lowest SLA compliance rate among a plurality of SLA compliance rates.
The above is the description of the operation of the SLA compliancerate aggregation unit 6011.
The first effect of the present embodiment is that it becomes easy to collectively monitor the SLA compliance status for each of the plurality of service level items 2101.
The reason is that the SLA compliancerate aggregation unit 6011 outputs a result of aggregating a plurality of SLA compliance rates.
The second effect of the present embodiment is that it is possible to take measures to prevent the service level item 2101 that is a bottleneck from being an SLA violation.
The reason is that the SLA compliancerate aggregation unit 6011 outputs the information of the service level item 2101 that is a bottleneck.
The SLA compliancerate aggregation unit 6011 of this embodiment may be applied to the first embodiment, the third embodiment, and the fourth embodiment.
Each component described in each of the above embodiments may cause a computer to execute a predetermined process by a program as shown in FIG. 19, for example.
FIG. 19 is a block diagram illustrating a configuration of a quality evaluation apparatus 7000 that causes a computer to execute predetermined processing using a program. Referring to FIG. 19, the quality evaluation device 7000 includes a CPU (Central Processing Unit) 7100, adisk device 7200, a storage unit 7300, a communication unit 7500, an input unit 7600, and an output unit 7700.
TheCPU 7100 expands the program stored in the disk device 7200, for example, in the storage unit 7300, and executes predetermined processing based on the expanded program.
Thedisk device 7200 is, for example, an optical disk, a flexible disk, a magnetic optical disk, an external hard disk, and a semiconductor memory, and includes a nonvolatile storage medium. The disk device 7200 stores a program that causes a computer to execute part of the processing of the communication control device in each of the above-described embodiments. The disk device 7200 may store an SLA definition, a monitoring log, and a monitoring log total record as the SLA definition storage unit 1021 and the log storage unit 1022.
Thestorage unit 7300 stores the program and data generated and referred to in each of the above-described embodiments.
TheCPU 7100, the disk device 7200, and the storage unit 7300 correspond to the SLA allowable range calculation unit 1031, the SLA compliance rate calculation unit 1032, the total monitoring number estimation unit 4011, the SLA violation prediction unit 5011, and the SLA compliance rate aggregation unit 6011.
Thecommunication unit 7500 implements an interface with a network, for example. The communication unit 7500 may be included as part of the SLA allowable range calculation unit 1031 and the SLA compliance rate calculation unit 1032.
Theinput unit 7600 is realized by, for example, a mouse, a keyboard, a built-in key button, and the like, and is used for input operations. The input unit 3073 is not limited to a mouse, a keyboard, and a built-in key button, but may be a touch panel, an accelerometer, a gyro sensor, a camera, or the like.
Theoutput unit 7700 is realized by a display, for example, and is used for confirming the output.
FIG. 20 is a block diagram illustrating an example of a non-volatile storage medium on which a program is recorded. The recording medium 7400 may be a non-volatile recording medium that stores information non-temporarily.
The quality evaluation device 7000 may include a recording medium 7400 supplied from the outside. TheCPU 7100 may read and execute the program code stored in the recording medium 7400. Alternatively, the CPU 7100 may store the code of the program stored in the recording medium 7400 in the storage unit 7300, the disk device 7200, or both. That is, this embodiment includes an embodiment of a recording medium 7400 that stores a program (software) executed by the quality evaluation apparatus 7000 (CPU 7100) temporarily or non-temporarily.
As mentioned above, although this invention was demonstrated with reference to each embodiment and an Example, this invention is not limited to the said embodiment and Example. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
Each component described in each of the above embodiments does not necessarily have to be individually independent. For example, in each component, a plurality of components may be realized as one module, or one component may be realized as a plurality of modules. Each component is configured such that a component is a part of another component, or a part of a component overlaps a part of another component. Also good.
In the embodiments described above, each component and a module that realizes each component may be realized by hardware as long as necessary, or may be realized by a computer and a program. It may be realized by mixing hardware modules, computers, and programs. The program is provided by being recorded on a non-volatile computer-readable recording medium such as a magnetic disk or a semiconductor memory, and read by the computer when the computer is started up. The read program causes the computer to function as a component in each of the above-described embodiments by controlling the operation of the computer.
Further, in each of the embodiments described above, a plurality of operations are described in order in the form of a flowchart, but the described order does not limit the order in which the plurality of operations are executed. For this reason, when each embodiment is implemented, the order of the plurality of operations can be changed within a range that does not hinder the contents.
Furthermore, in each embodiment described above, a plurality of operations are not limited to being executed at different timings. For example, another operation may occur during the execution of a certain operation, or the execution timing of a certain operation and another operation may partially or entirely overlap.
Furthermore, in each of the embodiments described above, a certain operation is described as a trigger for another operation, but the description does not limit all relationships between the certain operation and the other operations. For this reason, when each embodiment is implemented, the relationship between the plurality of operations can be changed within a range that does not hinder the contents. The specific description of each operation of each component does not limit each operation of each component. For this reason, each specific operation | movement of each component may be changed in the range which does not cause trouble with respect to a functional, performance, and other characteristic in implementing each embodiment.
While the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
This application claims the priority on the basis of Japanese application Japanese Patent Application No. 2011-162312 for which it applied on July 25, 2011, and takes in those the indications of all here.
図1は、本発明の第1の実施形態に係る品質評価装置1000の構成を示すブロック図である。
図1に示すように、第1の実施形態に係る品質評価装置1000は、監視部1011と、SLA定義記憶部1021と、ログ記憶部1022と、SLA違反範囲算出部1031と、SLA遵守率算出部1032とを備えている。
監視部1011は、SLA定義に基づいて、監視対象システム(不図示)に対する監視を実行し、その監視の結果である監視データを取得する。
図2は、SLA定義2100の例を示す図である。図2を参照すると、SLA定義2100は、1以上のSLA定義レコード2107で構成される。SLA定義レコード2107は、サービスレベル項目2101、監視基準値2102、SLA違反条件(違反条件とも呼ばれる)2103、監視方法2104、監視間隔(取得間隔とも呼ばれる)2105及び監視期間2106を含む。
サービスレベル項目2101は、SLAとして監視する項目を示す。監視基準値2102は、対応するサービスレベル項目2101の満たすべき値を示す。SLA違反条件2103は、対応するサービスレベル項目2101がSLA違反と判定される条件を示す。監視方法2104は、対応するサービスレベル項目2101を監視するための方法(手段)を示す。監視間隔2105は、対応するサービスレベル項目2101の監視を実行する間隔を示す。監視期間2106は、SLA違反の有無を判定する監視期間を示す。
監視対象システムは、例えば、サーバ単体や複数のサーバで構成されるWEB三層システム、及びデータセンターである。
監視対象システムに対して実行する監視の項目(サービスレベル項目2101)は、例えば、サービス時間、稼働率などの可用性、平均復旧時間や障害通知時間などの信頼性、及び、応答時間やCPU使用率やバッチ処理時間などの性能に関する情報である。
即ち、監視部1011は、SLA定義レコード2107の情報に基づいて、サービスレベル項目2101に対する監視動作を実行する。具体的には、監視部1011は、あるサービスレベル項目2101に対応する監視方法2104で示される監視方法を用いて、及び対応する監視間隔2105の時間間隔で監視動作を実行し、監視データを取得する。例えば、監視部1011は、サービスレベル項目2101が「サービス稼働率」に対応する、監視方法2104で示される「ping」を用いて、監視間隔2105で示される「5分毎」に、監視動作を実行し、監視データを取得する。
また、監視部1011は、監視動作を実行するたびに、取得した監視データに基づいて、サービスレベル項目2101に係る監視ログを生成し、ログ記憶部1022へ出力する。尚、その監視データは、その1回の監視動作の実行で取得した監視データである。
また、監視部1011は、監視期間2106の区切り毎に、取得した監視データに基づいて、サービスレベル項目2101についての監視ログ集計記録を生成し、ログ記憶部1022へ出力する。尚、その監視データは、監視期間2106の前回の区切りから今回の区切りまでの間に取得した全ての監視データである。
尚、監視部1011は、監視ログレコード2206をSLA許容範囲算出部1031及びSLA遵守率算出部1032へ出力してもよい。同様に、監視部1011は、監視ログ集計レコード2307をSLA許容範囲算出部1031及びSLA遵守率算出部1032へ出力してもよい。この場合、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、監視ログ2200及び監視ログ集計記録2300を、図示しない記憶手段に記憶してもよい。
図3は、監視ログ2200の例を示す図である。図3を参照すると、監視ログ2200は、監視日時2201、監視項目2202、監視結果2203及び基準値違反の有無2204を少なくとも含む、監視ログレコード2206によって構成される。
監視日時2201は、監視部1011が監視動作を実行した日時を示す。
監視項目2202は、監視部1011が実行した監視動作の項目を示す。監視項目2202の内容がサービスレベル項目2101の内容と一致する場合、その監視項目2202を含む監視ログレコード2206は、そのサービスレベル項目2101を含むSLA定義レコード2107に対応する。即ち、その監視ログレコード2206は、そのSLA定義レコード2107に基づいて、監視部1011が実行した監視動作についての監視ログレコード2206である。
監視結果2203は、監視部1011が、監視動作を実行して取得した監視データに基づいて、生成した、監視動作の結果を示す情報である。
例えば、図3を参照すると、監視項目2202が「サービス時間」である監視ログレコード2206に含まれる監視結果2203は、「○」である。これは、監視部1011による監視動作の結果が、正常であったことを示す。即ち、監視結果2203は、「○」である場合、監視間隔2105に示される時間間隔の間(例えば、2010/2/15,14:59から2010/2/15,15:00まで)、監視対象システムのサービスが正常に稼働していたとすること、を示す。
一方、監視対象システムのサービスの稼働が正常でない時間があった場合、監視結果2203は、例えば、その稼働が確認されなかった時間に対応する100%未満の値である。
また、監視項目2202が「サービス稼働率」の監視ログレコード2206に含まれる監視結果2203は、「100%」である。これは、監視部1011が、監視期間2106に基づく監視開始の時刻からサービス稼働率を算出する時刻までに発生した予定外停止時間に基づき、算出したサービス稼働率である。例えば、監視期間2106に基づく監視開始の時刻が「2010/2/15,14:00」、サービス稼働率を算出する時刻が「2010/2/15,15:20」の場合、監視期間2106に基づく監視開始の時刻からサービス稼働率を算出する時刻まで監視時間は、100分である。例えば、監視開始の時刻からサービス稼働率を算出する時刻までの監視時間が100分であって、そのうち予定外停止時間が10分であった場合、監視結果2203は、「90%」である。
また、監視項目2202が「応答時間」の監視ログレコード2206に含まれる監視結果2203は、「5秒」である。ここで、監視項目2202が「応答時間」の監視ログレコード2206は、サービスレベル項目2101が「応答時間」であるSLA定義レコード2107に対応する。即ち、この監視結果2203の「5秒」は、監視部1011が、対応するSLA定義レコード2107に含まれる監視方法2104の「ping」に基づき、pingを利用して計測した応答時間である。
また、監視項目2202が「トランザクション数」の監視ログレコード2206に含まれる監視結果2203は、「300」である。これは、監視部1011が計数した、例えば、サービス稼働率の監視時間中に発生した、トランザクション数である。
基準値違反の有無2204は、対応する監視結果2203が対応する監視基準値2102に違反したか(この場合、「有」)、違反していないか(この場合、「無」)を示す。
尚、基準値違反の有無2204が「有」である監視ログレコード2206は、監視基準を満たさない監視データに対応する。例えば、図3に示す監視項目2202が「応答時間」の監視結果2203である「5秒」は、図2に示すサービスレベル項目2101が「応答時間」の監視基準値2102である「3秒以内」を満たさない。したがって、図3に示す監視項目2202が「応答時間」の基準値違反の有無2204は、「有」である。
図4は、監視ログ集計記録2300の例を示す図である。図4を参照すると、監視ログ集計記録2300は、監視期間2302、報告日時2303及びSLA維持状況2306を少なくとも含む、監視ログ集計レコード2307により構成される。
SLA維持状況2306は、「○」である場合、図2に示すようなSLA定義2100で定義された全てのSLA定義レコード2107において、SLA違反条件2103に該当するサービスレベル項目2101が1つもないことを示す。また、SLA維持状況2306は、「×」である場合、サービスレベル項目2101のうちいずれか1つ以上がSLA違反条件2103に該当していることを示す。
SLA定義記憶部1021は、SLA定義2100を記憶する。
ログ記憶部1022は、監視ログ2200及び監視ログ集計記録2300を記憶する。
SLA許容範囲算出部1031は、SLA定義2100の監視間隔2105及び監視期間2106に基づいて全監視数を算出する。続けて、SLA許容範囲算出部1031は算出した全監視数と、対応するSLA違反条件2103とに基づいて、SLA許容範囲(許容範囲とも呼ばれる)を生成し、SLA遵守率算出部1032に出力する。SLA許容範囲は、SLAにおいて許容可能な、即ち発生してもSLA違反とはならない、監視基準値2102に対する違反の量(基準値違反の量)の範囲を示す情報である。監視基準値2102に対する違反の量は、即ち、監視基準値2102を満たさない監視データの量に対応するものであり、違反の回数あるいは時間で示される。尚、監視基準値2102に対する違反の量は、その違反の回数あるいは時間の、監視基準値2102に対する比率で示されてもよい。また、例えば、監視データが情報処理量や通信量である場合、監視基準値2102に対する違反の量は、不足しているまたは超過した情報処理量や通信量で示されてもよい。あるいは、監視基準値2102に対する違反の量は、その不足しているまたは超過した情報処理量や通信量の、監視基準値2102に対する比率で示されてもよい。
SLA遵守率算出部1032は、監視装置1011が出力する図3に示す監視ログレコード2206に含まれる基準値違反の有無2204に基づいて、基準値違反の発生回数を算出する。
SLA遵守率算出部1032は、例えば、監視期間2106の開始時刻(例えば、毎日午前0時)からSLA遵守率を算出する時刻までの範囲の、基準値違反の発生回数を算出する。また、SLA遵守率算出部1032は、品質評価装置1000に接続された入力手段(不図示)から入力された、特定の範囲の基準値違反の発生回数を算出してもよい。
次に、SLA遵守率算出部1032は、算出した基準値違反の発生回数と、SLA許容範囲算出部1031から取得したSLA許容範囲に基づいて、SLA遵守率を算出し、出力する。
SLA遵守率は、SLA許容範囲で示される基準値違反の量の範囲に対する、既に発生した基準値違反の量の比率である。ここで、既に発生した基準値違反の量は、例えば、ある特定の時点(例えば、監視開始時刻)から他の特定の時点(例えば、サービス提供中の現在時刻)までに発生している基準値違反の量である。即ち、SLA遵守率は、サービス提供中の特定の時点において、どの程度SLA違反に近いか、あるいはSLAをどの程度違反しているかを示す。
次に、図1~図9を参照して、本実施形態の動作について詳細に説明する。
まず、SLA定義記憶部1021にSLA定義2100を記録する動作について説明する。図5は、本実施形態における、SLA定義記憶部1021にSLA定義2100を記録する動作を示すフローチャートである。
品質評価装置1000の図示しない入力手段は、SLA定義2100の入力を受け付ける(ステップA101)。
次に、入力手段は、受け付けたSLA定義2100をSLA定義記憶部1021へ記録する。(ステップA102)
以上が、SLA定義記憶部1021にSLA定義2100を記録する動作の説明である。
次に、監視を実行し、SLA遵守率を算出する品質評価装置1000全体の動作について説明する。図6は、監視を実行し、SLA遵守率を算出する品質評価装置1000全体の動作を示すフローチャートである。
まず、監視部1011は、SLA定義2100に基づき、監視対象システムの監視を実行する(ステップB101)。
次に、監視部1011は、実行した監視に基づいて、監視ログレコード2206及び監視ログ集計レコード2307を生成する。(ステップB102)。
具体的な、監視の実行と生成される監視ログレコード2206の例を、以下の(1)−(3)に説明する。
(1)監視部1011は、例えば、サービスレベル項目2101が「サービス時間」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、毎分00秒に監視対象システムに対してping(ピン)を送信する。尚、毎分00秒は、監視間隔2105で示される「1分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信した場合、対応する監視区間において、サービスが稼働していると判断する。尚、対応する監視区間は、pingに対する応答の受信時刻から、監視間隔2105で示される時間(例えば、1分)だけ遡った時刻の区間である。
即ち、監視部1011は、その監視区間の、例えば1分間は、監視対象システムにおいてサービスの停止がなく、稼働状態にあったと見なす。そして、監視部1011は、監視結果2203として“○”及び基準値違反の有無2204として「無」を含む監視ログレコード2206を生成する。
一方、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信しなかった場合、監視対象システムにおいて、サービスが停止している、あるいは異常が発生しているなど、正常な稼働状態にないと判断する。すなわち、監視部1011は、その監視区間の、例えば1分間は、監視対象システムが停止状態にあったと見なす。そして、監視部1011は、監視結果2203として“×”及び基準値違反の有無2204として「有」を含む監視ログレコード2206を生成する。
(2)監視部1011は、例えば、サービスレベル項目2101が「サービス稼働率」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、5分毎の00秒に監視対象システムに対してping(ピン)を送信する。尚、5分毎の00秒は、監視間隔2105で示される「5分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信した場合、対応する監視区間において、サービスが稼働していると判断する。尚、対応する監視区間は、pingに対する応答の受信時刻から、監視間隔2105で示される時間(例えば、5分)だけ遡った時刻の区間である。
すなわち、監視部1011は、その監視区間中(例えば5分間)、監視対象システムにおけるサービスの停止がなく、稼働状態にあったと見なす。そして、監視部1011は、監視部1011内のメモリ(不図示)に、監視対象システムがその監視区間中においては正常に稼働していたことを記録する。
一方、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信しなかった場合、監視対象システムにおいて、サービスが停止している、あるいは異常が発生しているなど、正常な稼働状態にないと判断する。すなわち、監視部1011は、その監視区間中、監視対象システムが停止状態にあったと見なす。そして、監視部1011は、監視部1011内のメモリに、監視対象システムがその監視区間中においては正常に稼働していなかったことを記録する。
次に、監視部1011は、監視結果2203として区間稼働率と、監視基準値2102に基づいて決定した基準値違反の有無2204とを含む監視ログレコード2206を生成する。尚、区間稼働率は、監視開始時刻から算出時刻までの時間に対する、正常に稼働していた時間の割合である。監視部1011は、例えば監視部1011内のメモリに記録された、監視対象システムの稼働の記録に基づいて算出する。
また、監視部1011は、算出した区間監視率と監視基準値2102とを比較して基準値違反の有無2204を決定する。即ち、監視部1011は、算出した区間監視率が監視基準値2102の「99.9%」に満たない場合、基準値違反の有無2204を「有」と決定する。
(3)監視部1011は、例えば、サービスレベル項目2101が「応答時間」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、5分毎の00秒に監視対象システムに対してpingを送信する。尚、5分毎の00秒は、監視間隔2105で示される「5分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視結果2203として監視対象システムからのpingに対する応答時間と、監視基準値2102に基づいて決定した基準値違反の有無2204とを含む監視ログレコード2206を生成する。
尚、監視対象システムから所定時間内にpingに対する応答がない場合、監視部1011は、監視結果2203を「測定不能」、あるいはSLA定義2100に別途定義された例外値とする。
また、監視部1011は、その応答時間と監視基準値2102とを比較して基準値違反の有無2204を決定する。即ち、監視部1011は、その応答時間が監視基準値2102の「3秒以内」でなかった場合、基準値違反の有無2204を「有」と決定する。
以上が、具体的な、監視の実行と生成される監視ログレコード2206の例である。
次に、監視部1011は、生成した監視ログレコード2206を監視ログ2200に、生成した監視ログ集計レコード2307を監視ログ集計記録2300に、記録する(ステップB103)。
次に、SLA許容範囲算出部1031は、SLA定義記憶部1021に記録されたSLA定義2100に基づいて、SLA許容範囲を算出し、SLA遵守率算出部1032に出力する(ステップB104)。
次に、SLA遵守率算出部1032は、監視ログ2200とSLA許容範囲算出部1031から取得したSLA許容範囲とに基づいて、SLA遵守率を算出し、出力する(ステップB105)。
次に、通信手段(不図示)は、SLA遵守率算出部1032からSLA遵守率を取得した、ネットワーク(不図示)を経由して、端末装置(不図示)にSLA遵守率を送信する(ステップB106)。また、例えばSLA遵守率表示手段(不図示)が、SLA遵守率算出部1032からSLA遵守率を取得して、ディスプレイ(不図示)に表示するようにしてもよい。
以上が、監視を実行し、SLA遵守率を算出する、品質評価装置1000全体の動作の説明である。
次に、図7を参照して、図6のステップB101、ステップB102及びステップB103に対応する、監視動作について詳細に説明する。図7は、監視部1011の動作を示すフローチャートである。
まず、監視部1011は、SLA定義記憶部1021からSLA定義2100を取得する(ステップC101)。
次に、監視部1011は、取得したSLA定義記憶部1021の各SLA定義レコード2107に含まれるサービスレベル項目2101について、対応する監視間隔2105及び監視方法2104に基づいて、監視対象システムの監視を実行する。続けて、監視部1011は、監視を実行した結果に基づいて対応する監視結果2203を生成する。(ステップC102)。
次に、監視部1011は、生成した監視結果2203と、監視結果2203及び監視基準値2102に基づいて決定した基準値違反の有無2204とを含む、監視ログレコード2206を生成する(ステップC103)。
次に、監視部1011は、生成した監視ログレコード2206を、ログ記憶部1022へ記録する(ステップC104)。
次に、監視部1011は、監視ログ集計レコード2307を生成する(ステップC105)。
次に、監視部1011は、生成した監視ログ集計レコード2307をログ記憶部1022へ出力する(C106)
尚、監視部1011は、ステップC105において、各監視期間2106の完了時であるかを判定する。そして、各監視期間2106の完了時である場合に、監視部1011は監視ログ集計レコード2307を生成する。更に、ログ集計レコード2307を生成した場合に、監視部1011は、この監視ログ集計レコード2307を出力する。
また、監視部1011は、ステップC105において、常に監視ログ集計レコード2307を生成するようにしてもよい。この場合、生成したSLA維持状況2306が「×」である場合に、監視部1011は、生成した監視ログ集計レコード2307を出力するようにしてもよい。
以上が、監視部1011の動作についての説明である。
次に、図8を参照して、図6のステップB104に対応する、SLA許容範囲算出部1031の動作について詳細に説明する。図8は、SLA許容範囲算出部1031の動作を示すフローチャートである。
まず、SLA許容範囲算出部1031は、SLA定義記憶部1021より、SLA許容範囲を算出するサービスレベル項目2101に対応するSLA定義レコード2107の監視間隔2105を取得する(ステップD101)。
次に、SLA許容範囲算出部1031は、対応するSLA定義レコード2107から、監視期間2106を取得する(ステップD102)。
次に、SLA許容範囲算出部1031は、取得した監視期間2106と監視間隔2105とに基づいて、監視期間2106の期間内の全監視数を算出する(ステップD103)。例えば、監視期間2106が1日、監視間隔2105が1分ならば、SLA許容範囲算出部1031は、全監視数Callを「1440」((24×60)分÷1分)と算出する。
次に、SLA許容範囲算出部1031は、対応するSLA定義レコード2107からSLA違反条件2103を取得する(ステップD104)。
次に、SLA許容範囲算出部1031は、取得したSLA違反条件2103と、算出した全監視数Callとに基づいて、SLA許容範囲を算出し、出力する(ステップD105)。
例えば、監視基準値2102が98%である場合、2%までは基準値違反が許容される。したがって、例えば全監視数Callが「1440」回である場合、SLA許容範囲算出部1031は、SLA許容範囲を「28.8」(1440×0.02)回と算出する。また、SLA許容範囲として時間を用いる場合、全監視数Callが「1」日、すなわち、「1440」分である場合、「28.8」分がSLA許容範囲となる。
以上が、SLA許容範囲算出部1031の動作についての説明である。
次に、図9を参照して、図6のステップB105に対応する、SLA遵守率算出部1032の動作について詳細に説明する。図9は、SLA遵守率算出部1032の動作を示すフローチャートである。
まず、SLA遵守率算出部1032は、ログ記憶部1022に記録された、図3に示すような監視ログ2200における基準値違反の有無2204に基づいて、基準値違反量(基準値違反の回数あるいは時間)を算出する(ステップE101)。
次に、SLA遵守率算出部1032は、SLA許容範囲算出部1031が出力したSLA許容範囲を取得する。(ステップE102)
次に、SLA遵守率算出部1032は、算出した基準値違反量と、取得したSLA許容範囲とに基づき、SLA遵守率を算出し、出力する(ステップE103)。SLA遵守率は、SLA許容範囲に対する基準値違反量の比率として算出される。
例えば、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が10回であり、基準値違反のSLA許容範囲が「28.8≒29回」であるとする。この場合、SLA遵守率算出部1032は、SLA遵守率を「66%((29−10)/29*100)」と算出する。
また、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が2回であり、基準値違反のSLA許容範囲が「28.8≒29分」であるとする。
ここで、上述したとおり、監視部1011は、SLA定義2100に定義された監視間隔2105に基づき、対応するサービスレベル項目2101に対応する監視動作を実行する。そして、基準値違反が発生した場合、監視部1011は、その違反が監視間隔2105の時間間隔の間(例えば1分間)継続したものと見なす。したがって、基準値違反の発生時間は、基準値違反の発生回数と、監視間隔2105の積として求めることができる。例えば、基準値違反の発生回数が2回、監視間隔2105が「5分」の場合、基準値違反の時間は10分である。
この場合、SLA遵守率算出部1032は、SLA遵守率を「66%((29−10)/29*100)」と算出する。
また、基準値違反の回数がSLA許容範囲を超過した場合、SLA遵守率算出部1032は、以下のようにSLA遵守率を算出する。例えば、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が35回であり、基準値違反のSLA許容範囲が「28.8≒29回」であるとする。
この場合、SLA遵守率算出部1032は、SLA遵守率を「−17%((29−35)/29*100」と算出する。即ち、SLA遵守率算出部1032は、基準値違反の回数がSLA許容範囲を超過した場合、SLA遵守率を負の値として算出し、SLA違反の程度を絶対値の大きさとして算出する。
また、SLA許容範囲が時間で示され、基準値違反の時間がSLA許容範囲を超過した場合についても同様である。
以上が、SLA遵守率算出部1032の動作についての説明である。
尚、本実施形態では、図6のフローチャートで示すように監視部1011による監視の実行と、SLA許容範囲算出部1031によるSLA許容範囲の算出と、SLA遵守率算出部1032によるSLA遵守率の算出とが、同期して一連の動作として動作する。これは、一例であり、例えば、以下のようにしてもよい。
SLA許容範囲算出部1031は、品質評価装置1000のSLA定義2100の内容が更新された時に、SLA許容範囲を算出し、記憶手段(不図示、例えばSLA定義の構造にSLA許容範囲の項目を追加するようにしてもよい)に記録する。監視部1011及びSLA遵守率算出部1032それぞれは、SLA定義2100に基づいて必要なタイミングで割り込みが通知されるようにタイマー(不図示)を設定し、通知された割り込みを契機として動作する。
また、SLA遵守率表示手段(不図示)は、SLA遵守率算出部1032から取得したSLA遵守率を、時系列的にディスプレイ(不図示)に表示するようにしてもよい。これにより、SLA違反に至るまでのサービスレベル項目2101の状態変化を詳細に監視することが可能である。
また、SLA遵守率表示手段(不図示)は、SLA遵守率算出部1032から取得したSLA遵守率が0%となった場合に、暫定的にSLA違反が発生したと見なして警告を表示するようにしてもよい。こうすることで、監視期間2106の途中であっても監視期間終了時に高い確率でSLA違反と判定される可能性を早期に検出し、警告を行うことが可能となる。
また、本実施形態では、監視部1011が、監視動作を実行した結果に基づいて生成した、監視結果2203を含む監視ログレコード2206を出力する。これは、本実施形態の一例であり、例えば、以下のようにしてもよい。
まず、監視部1011は、監視動作を実行した結果を、SLA許容範囲算出部1031及びSLA遵守率算出部1032の内の少なくともいずれか一方へ、直接出力する。
次に、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、受け取った監視動作を実行した結果に基づき、監視結果2203を生成する。次に、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、生成した監視結果2203と、監視基準値2102とに基づき、基準値違反の有無を判定する。次に、SLA遵守率算出部1032は、判定した基準値違反の有無に基づき、基準値違反の値を算出する。
このように算出した監視結果2203及び基準値違反の値に基づき、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、図8及び図9のフローチャートに示す動作と、実質的に同様の動作を行う。
本実施形態の第1の効果は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、SLA許容範囲算出部1031は、監視期間2106で示される期間内の全監視数を算出し、この全監視数とSLA違反条件2103とに基づいてSLA許容範囲を算出する。次に、SLA遵守率算出部1032は、SLA許容範囲と監視期間開始時点から特定の時点までの基準値違反量とに基づいて、SLA遵守率を算出する。
本実施形態の第2の効果は、SLA違反に至るまでのサービスレベル項目2101の状態変化を詳細に監視することが可能になることである。
その理由は、監視部1011が監視を実行するたびに、即ち、監視対象システムの可用性、信頼性などの稼働情報及び性能情報を取得するたびに、SLA遵守率算出部1032がSLA遵守率を算出し、出力するようにしたからである。
本実施形態の第3の効果は、SLA遵守率が0%となった場合に暫定的にSLA違反が発生したと見なし、監視期間2106の途中であっても監視期間終了時に高い確率でSLA違反と判定される事例を素早く検出し、警告を行うことが可能となることである。
その理由は、SLA違反が発生していない場合(SLA遵守率0%の場合)でも、SLA遵守率算出部1032がSLA遵守率を算出し、出力するようにしたからである。
本実施形態の第4の効果は、許容範囲が変化する場合、例えば、電力消費制限で、時間帯によって違反基準を変えるような場合でも、継続してSLA遵守状況を示すことができる。
その理由は、監視部1011による監視の実行と、SLA許容範囲算出部1031によるSLA許容範囲の算出と、SLA遵守率算出部1032によるSLA遵守率の算出とが、同期して一連の動作として動作するようにしたからである。
[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図10は、本発明の第2の実施形態に係る品質評価装置3000の構成を示すブロック図である。
図10に示すように、第2の実施形態に係る品質評価装置3000は、SLA許容範囲算出部1031と、SLA遵守率算出部1032とを含む。
SLA許容範囲算出部1031は、対応する監視間隔2105及び監視期間2106に基づいて、全監視数を算出する。続けて、SLA許容範囲算出部1031は、算出した全監視数と、対応するSLA違反条件2103とに基づいて、監視データの基準値である監視基準値2102を満たさない監視データの量の、許容可能な範囲を示すSLA許容範囲を算出し、出力する。
SLA遵守率算出部1032は、監視データの記録とSLA許容範囲算出部1031が出力するSLA許容範囲とに基づいて、監視期間2106の期間途中における任意の時点の、SLA違反条件2103に対する遵守率を示すSLA遵守率を算出し、出力する。具体的には、SLA遵守率は、SLA許容範囲に対する、監視基準値2102を満たさない監視データの量の、比である。尚、SLA遵守率算出部1032は、例えば、SLA遵守率を算出しようとする期間の、監視データの記録に基づいて、監視基準値2102を満たさない監視データの量を算出する。また、SLA遵守率を算出しようとする期間は、例えば、監視開始時点の時刻から現在時刻までの期間である。
本実施形態の効果は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、SLA許容範囲算出部1031は、監視期間2106で示される期間内の全監視数を算出し、この全監視数とSLA違反条件2103とに基づいてSLA許容範囲を算出する。次に、SLA遵守率算出部1032は、監視データの記録とSLA許容範囲とに基づいてSLA遵守率を算出する。
[第3の実施形態]
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図11は、本発明の第3の実施形態に係る品質評価装置4000の構成を示すブロック図である。
図11に示すように、第3の実施形態に係る品質評価装置4000は、第2の実施形態の品質評価装置3000と比べて全監視数推定部4011を更に含む。
図12は、SLA定義2400の例を示す図である。SLA定義2400は、監視間隔2105が「不定期」を示す、SLA定義レコード2401を少なくとも1つ含む。尚、SLA定義2400は、図4のSLA定義2100と同様のSLA定義レコード2107を含んでよい。
全監視数推定部4011は、図12に示すSLA定義レコード2401の監視間隔2105に示されるような、監視間隔2105が不定期であるサービスレベル項目2101について、全監視数を算出し、出力する。具体的には、全監視数推定部4011は、例えば図13に示す監視ログ集計4300のトランザクション数4305に基づき、図2に示す監視期間2106における全監視数を算出し、出力する。
図13は、監視ログ集計記録(動作履歴とも呼ばれる)4300の例を示す図である。図13を参照すると、監視ログ集計記録4300は、監視期間2302、報告日時2303、SLA維持状況2306及びトランザクション数4305を少なくとも含む、監視ログ集計レコード4307により構成される。
トランザクション数4305は、対応する監視期間2302で示される期間に、監視対象システムに対して発生した、トランザクションの合計数を示す。
尚、監視期間2302、報告日時2303及びSLA維持状況2306は、図4に示すものと同様である。
次に、図14を参照して本実施形態の動作について説明する。図14は、本実施形態の全監視数推定部4011の動作を示すフローチャートである。
全監視数推定部4011は、SLA定義2400の各SLA定義レコード2401に含まれる監視間隔2105を取得する(ステップF101)。
次に、全監視数推定部4011は、監視間隔2105が不定期を示しているか否かを判定する
(ステップF102)。不定期を示していない場合(ステップF102でNO)、処理は、図8のD102へ進む。
不定期を示している場合(ステップF102でYES)、全監視数推定部4011は、図13に示す、過去の監視期間2302毎の全監視数を取得する(ステップF103)。例えば、全監視数推定部4011は、過去の監視期間2302毎の全監視数として、ログ記憶部1022に記録されている図13に示すような監視ログ集計記録4300から、トランザクション数4305を取得する。
尚、ステップF103において全監視数推定部4011が取得する、過去の監視期間2302毎の全監視数は、例えば、図12に示すSLA定義レコード2401のSLA違反条件2103及び監視間隔2105のいずれかにおいて定義される。本実施形態においては、図12に示すSLA監視レコード2401の監視間隔2105が「トランザクション毎(不定期)」であることに基づいて、全監視数推定部4011は、過去の監視期間2302毎の全監視数として、トランザクション数4305を取得する。
具体的には、全監視数推定部4011は、監視間隔2105が例えば「トランザクション毎(不定期)」である場合、図13に示す監視ログ集計記録4300を参照して、トランザクション数4305を取得する。この場合、トランザクション数4305は、過去の監視期間2302における監視回数を示す。
尚、全監視数推定部4011は、監視部1011から出力される図3に示す監視ログ(動作履歴とも呼ばれる)2200に基づき、過去の監視期間2302における監視回数を直接算出してもよい。この場合、監視部1011は、監視対象システムにおけるトランザクションの処理件数を含む監視ログレコード2206を、全監視数推定部4011に出力する。
また、品質評価装置4000は、次のように過去の監視期間2302における監視回数を算出してもよい。まず、監視部1011が、監視対象システムにおけるトランザクション数を含む、監視ログレコード(動作履歴とも呼ばれる)2206を監視ログ2200に出力する。次に、全監視数推定部4011が、監視ログ2200に記録された、監視項目2202が「トランザクション数」である監視ログレコード2206に基づき、一定期間(過去の監視期間2302)の全トランザクション数を直接算出してもよい。
再び図14において、全監視数推定部4011は、取得した過去の監視期間2302毎の全監視数(トランザクション数4305)に基づいて、対象期間の全監視数の推定値を算出する(ステップF104)。ここで、その対象期間は、SLA遵守率算出の対象時刻を含む、図12に示す監視期間2106の監視期間開始時点から監視期間終了時点までの期間である。
具体的には、全監視数推定部4011は、例えば、以下のようにして全監視数の推定値を算出する。
まず、全監視数推定部4011は、過去の複数の監視期間2302における全監視数のデータC={C1,C2,・・・,Ck}が正規分布であると仮定し、信頼区間を設定する。ここで、C1、C2、及びCkは、過去の監視期間2302毎の全監視数を示す。kは、過去の監視期間2302の全監視数の個数である。
信頼区間は、全監視数の推定値をCallとし、t分布を用いて、全監視数Callの範囲として表すと、式1に示すとおりである。
ここで、Caveは、過去の複数の監視期間2302における全監視数のデータCの平均値であり、式2に示すとおりである。
また、「σの2乗」は、過去の複数の監視期間2302における全監視数のデータCの分散であり、式3に示すとおりである。
また、tは、平均が0、標準偏差が1のt分布から得られる値である。tは、設定する信頼区間により値が異なる。例えば、95%信頼区間の場合、t=2.262であり、99%信頼区間の場合t=3.250である。尚、95%信頼区間とは、サンプルから推定される母集団のうち95%が含まれる区間のことである。また、99%信頼区間の方は、95%信頼区間に比べて、より精度(信頼度)が高い。尚、t分布の値は、例えば、表として全監視数推定部4011内の記憶手段(不図示)に記録されている。
例えば、平均値Cave=1400、分散「σの2乗」=19544、サンプル数k=10の過去の分布があった場合、95%信頼区間を用いると、t=2.262より、Callの上限値及び下限値は、式4に示すとおりとなる。
したがって、1300<Call<1500である。
以上のように、全監視数推定部4011は、全監視数Callの範囲を算出する。
次に、上述の説明のように、全監視数推定部4011が全監視数Callの範囲を算出した場合の、SLA許容範囲算出部1031が算出する許容範囲CP及びSLA遵守率算出部1032が算出するSLA遵守率αの例を、具体的に説明する。
例えば、図12のSLA定義レコード2401の場合、SLA違反条件2103は、「基準値を守れない場合の率が2%以上」である。この場合、基準値違反の量は、2%未満まで許容される。したがって、1300≦Call≦1500の場合では、1300×0.02=26、1500×0.02=30より、基準値違反回数の許容範囲CPは、24<CP<30となる。これは基準値違反を時間で記述した場合においても同様である。
このとき、監視期間開始時点から計算時点までの基準値違反の回数が、10回であったとすると、基準値違反の許容範囲24<CP<30より、SLA遵守率算出部1032は、SLA遵守率αを以下のように算出する。
(25−10)÷25×100=60%、(29−10)÷29×100=66%であり、したがって、61%≦α≦66%。
尚、これは、基準値違反の値を時間で表す場合においても同様である。
本実施形態の全監視数推定部4011は、第1の実施形態に適用してもよい。
本実施形態の第1の効果は、監視数が確定していないサービスレベル項目2101についても、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、全監視数推定部4011が監視期間2106中の全監視数が確定していないサービスレベル項目2101に対し、監視ログ集計記録4300に基づき全監視数の推定値(全監視数の範囲)を算出するようにしたからである。
本実施形態の第2の効果は、監視ログ集計記録4300の監視ログ集計レコード4307の数が比較的少ない場合(10以下)であっても、信頼度の高い、第1の効果のSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、全監視数推定部4011が、t分布を用いた信頼区間を設定し、この信頼区間に対応する全監視数の推定値を算出する。次に、SLA許容範囲算出部1031が、その全監視数の推定値に基づいて、許容範囲を算出する。次に、SLA遵守率算出部1032が、その許容範囲に基づいてSLA遵守率を算出する。
[第4の実施形態]
次に、本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図15は、本発明の第4の実施形態に係る品質評価装置5000の構成を示すブロック図である。
図15に示すように、第4の実施形態に係る品質評価装置5000は、第2の実施形態の品質評価装置3000に比べて、SLA違反予測部5011を更に含む。
SLA違反予測部5011は、SLA遵守率算出部1032より出力されるSLA遵守率に基づき、SLA違反の発生が予測される時刻を算出し、出力する。また、SLA違反予測部5011は、予測される時刻が現在の監視期間が終了する前の時刻内であった場合に、SLA違反が発生する危険があることを示す情報を出力する。
監視開始からの経過時刻t、SLA違反の予測発生時刻Te、SLA遵守率αとすると、SLA違反予測部5011は、Te=100×t÷(100−α)を算出する。続けて、SLA違反予測部5011は、算出した予測発生時刻Teを出力する。
例えば、監視開始から1時間経過した時点での遵守率αが95%である場合、SLA違反予測部5011は、Te=100×1÷(100−95)=20を算出する。即ち、この場合のSLA違反の予想発生時刻は、監視開始から20時間後である。
更に、例えば、あるSLA定義レコード2107の監視期間2106が24時間であった場合、監視期間2106内にSLA違反が発生する可能性があるため、その危険があることを示す情報(警告)を出力する。ここで、「監視期間2106内にSLA違反が発生する」とは、「SLA違反の発生する時刻が、現在の監視期間2106が終了する前の時刻内である、監視開始から21時間後である」ことを示す。
SLA違反予測部5011は、例えば、SLA違反表示部(不図示)を経由して、SLA違反の予想発生時刻、あるいは予想発生時刻と警告とを、ディスプレイ(不図示)に出力する。また、SLA違反予測部5011は、例えば、通信手段(不図示)及びネットワーク(不図示)を経由して、端末装置(不図示)に、SLA違反の予想発生時刻、あるいは予想発生時刻と警告とを送信するようにしてもよい。
次に、図16を参照して、SLA違反予測部5011の動作を説明する。図16は、SLA違反予測部5011の動作を示すフローチャートである。
SLA違反予測部5011は、SLA遵守率算出部1032からSLA遵守率を取得する(ステップI101)。
次に、SLA違反予測部5011は、取得したSLA遵守率に基づいて、SLA違反予想発生時刻を算出する(ステップI102)。SLA違反予測部5011は、例えば、以下の式を用いて、SLA違反の予想発生時刻Teを算出する。Te=100×t÷(100−α)。ここで、tは監視時点の時刻、αはSLA遵守率である。
更に、SLA違反予測部5011は、算出したSLA違反の予想発生時刻Teが現在の監視期間2106内に含まれるか否かの判定を行う(ステップI103)。現在の監視期間2106内に含まれない場合(ステップI103でNO)、処理はステップI105へ進む。
現在の監視期間2106内に含まれる場合(ステップI103でYES)、SLA違反予測部5011は、図示しない出力手段へSLA違反が発生する危険があることを示す警告を出力する(ステップI104)。
ステップI105において、SLA違反予測部5011は、算出したSLA違反の予想発生時刻を図示しない出力手段へ出力する(ステップI105)。
以上が、SLA違反予測部5011の動作についての説明である。
尚、本実施形態のSLA違反予測部5011は、第1の実施形態及び第3の実施形態に適用してもよい。
本実施形態の効果は、SLA違反の予想発生時刻を出力することが可能になる点である。
その理由は、SLA違反予測部5011が、SLA遵守率に基づき、SLA違反予想発生時刻を算出するようにしたからである。
[第5の実施形態]
次に、本発明の第5の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図17は、本発明の第5の実施形態に係る品質評価装置6000の構成を示すブロック図である。
図17に示すように、第5の実施形態に係る品質評価装置6000は、第2の実施形態の品質評価装置3000と比べて、SLA遵守率集約部6011を更に含む。
SLA遵守率集約部6011は、SLA遵守率算出部1032より出力される各サービスレベル項目2101のSLA遵守率に基づき、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を出力する。
SLA遵守率集約部6011は、例えば、監視対象システムがサーバA、サーバB、サーバCを含む場合、監視対象システムの全体的なSLA遵守状況を以下のように算出する。
例えば、サーバA、サーバB、サーバCそれぞれのサービスレベル項目2101が「応答時間」のSLA遵守率として、70%、30%、50%という値がそれぞれ出力されたとする。この場合、SLA遵守率集約部6011は、最大値を70%、最小値を30%、平均値を50%((70+30+50)÷3)と、算出する。
即ち、全体的なSLA遵守状況として平均値を出力することを予め定められている場合、SLA遵守率集約部6011は、全体的なSLA遵守状況は50%となる。また、最小値を出力することを予め定められている場合は、全体的なSLA遵守状況は30%となる。更に、SLA遵守率が最小値をとる項目をSLA維持におけるボトルネックとなっている項目とする。
また、SLA遵守率集約部6011は、ボトルネックとなっているサービスレベル項目2101の情報として、サーバAの応答時間のSLA遵守率が30%であり、サーバAの応答時間がボトルネックであることを出力する。
SLA遵守率集約部6011は、SLA違反表示部(不図示)を経由して、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を、ディスプレイ(不図示)に表示する。また、SLA遵守率集約部6011は、例えば、通信手段(不図示)及びネットワーク(不図示)を経由して、端末装置(不図示)に、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を送信するようにしてもよい。
次に、SLA遵守率集約部6011の動作について説明する。図18は、SLA遵守率集約部6011の動作を示すフローチャートである。
まず、SLA遵守率集約部6011は、SLA遵守率算出部1032より出力される複数のSLA遵守率を取得する(ステップK101)。
次に、SLA遵守率集約部6011は、取得した複数のSLA遵守率を集約し、最大値、最小値及び平均値を算出し、出力する(ステップK102)。
尚、SLA遵守率の最小値は、複数のサービスレベル項目2101の内で最小値をとったサービスレベル項目2101のSLA遵守状況が、SLA違反にどの程度近づいているかを示している。また、SLA遵守率の平均値は、監視対象システムにおいて、複数のサービスレベル項目2101がどの程度遵守されているかを示す指標となる。
次に、SLA遵守率集約部6011は、平均値や最小値、最大値などの全体的なSLA遵守状況に加え、ボトルネックとなっているサービスレベル項目2101の情報を出力する(ステップK103)。ボトルネックとなっているサービスレベル項目2101は、複数のSLA遵守率の内の最小値のSLA遵守率をとるサービスレベル項目2101である。
以上が、SLA遵守率集約部6011の動作についての説明である。
本実施形態の第1の効果は、複数のサービスレベル項目2101それぞれに対するSLA遵守状況を、まとめて監視することが容易になる点である。
その理由は、SLA遵守率集約部6011が複数のSLA遵守率を集約した結果を出力するようにしたからである。
本実施形態の第2の効果は、ボトルネックとなっているサービスレベル項目2101がSLA違反となることを防止する対策をとることが可能となる点である。
その理由は、SLA遵守率集約部6011がボトルネックとなっているサービスレベル項目2101の情報を出力するようにしたからである。
本実施形態のSLA遵守率集約部6011は、第1の実施形態、第3の実施形態及び第4の実施形態に適用してもよい。
以上の各実施形態で説明した各構成要素は、例えば、図19に示すように、プログラムにより所定の処理をコンピュータに実行させてもよい。
図19は、プログラムにより所定の処理をコンピュータに実行させる品質評価装置7000の構成を示すブロック図である。図19を参照すると、品質評価装置7000は、CPU(Central Processing Unit)7100、ディスク装置7200、記憶部7300、通信部7500、入力部7600及び出力部7700を含む。
CPU7100は、ディスク装置7200に格納されたプログラムを、例えば記憶部7300に展開し、展開したプログラムに基づいて所定の処理を実行する。
ディスク装置7200は、例えば、光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク及び半導体メモリであって、不揮発性の記憶媒体を含む。ディスク装置7200は、上述の各実施形態における通信制御装置の処理の一部をコンピュータに実行させるプログラムを記憶する。また、ディスク装置7200は、SLA定義記憶部1021及びログ記憶部1022として、SLA定義、監視ログ、監視ログ集計記録を記憶してもよい。
記憶部7300は、そのプログラム及び上述の各実施形態において生成、参照されるデータを記憶する。
CPU7100、ディスク装置7200及び記憶部7300は、SLA許容範囲算出部1031、SLA遵守率算出部1032、全監視数推定部4011、SLA違反予測部5011及びSLA遵守率集約部6011に対応する。
通信部7500は、例えばネットワークとのインタフェースを実現する。通信部7500は、SLA許容範囲算出部1031及びSLA遵守率算出部1032の一部として含まれてよい。
入力部7600は、例えばマウスやキーボード、内蔵のキーボタンなどで実現され、入力操作に用いられる。入力部3073は、マウスやキーボード、内蔵のキーボタンに限らず、例えばタッチパネル、加速度計、ジャイロセンサ、カメラなどでもよい。
出力部7700は、例えばディスプレイで実現され、出力を確認するために用いられる。
図20は、プログラムを記録した不揮発性記憶媒体の例を示すブロック図である。記録媒体7400は、情報を非一時的に記憶する不揮発性記録媒体であってよい。
品質評価装置7000は、外部から供給される記録媒体7400を含むようにしてもよい。CPU7100は、記録媒体7400に格納されたプログラムのコードを読み出して実行するようにしてもよい。あるいは、CPU7100は、記録媒体7400に格納されたプログラムのコードを、記憶部7300、ディスク装置7200またはその両方に格納するようにしてもよい。すなわち、本実施形態は、品質評価装置7000(CPU7100)が実行するプログラム(ソフトウェア)を、一時的にまたは非一時的に、記憶する記録媒体7400の実施形態を含む。
以上、各実施形態及び実施例を参照して本発明を説明したが、本発明は上記実施形態及び実施例に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しえるさまざまな変更をすることができる。
以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されたり、1つの構成要素が複数のモジュールで実現されたりしてもよい。また、各構成要素は、ある構成要素が他の構成要素の一部であったり、ある構成要素の一部と他の構成要素の一部とが重複していたり、といったような構成であってもよい。
以上説明した各実施形態における各構成要素及び各構成要素を実現するモジュールは、必要に応じ可能であれば、ハードウェア的に実現されても良いし、コンピュータ及びプログラムで実現されても良いし、ハードウェア的なモジュールとコンピュータ及びプログラムとの混在により実現されても良い。プログラムは、磁気ディスクや半導体メモリなど、不揮発性のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態における構成要素として機能させる。
また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。
更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよい。
更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作の全ての関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更されて良い。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年7月25日に出願された日本出願特願2011−162312を基礎とする優先権を主張し、その開示の全てをここに取り込む。 [First Embodiment]
FIG. 1 is a block diagram showing a configuration of a quality evaluation apparatus 1000 according to the first embodiment of the present invention.
As shown in FIG. 1, the quality evaluation apparatus 1000 according to the first embodiment includes a
Based on the SLA definition, the
FIG. 2 is a diagram illustrating an example of the SLA definition 2100. Referring to FIG. 2, the SLA definition 2100 is composed of one or more SLA definition records 2107. The SLA definition record 2107 includes a service level item 2101, a monitoring reference value 2102, an SLA violation condition (also called violation condition) 2103, a monitoring method 2104, a monitoring interval (also called an acquisition interval) 2105, and a monitoring period 2106.
A service level item 2101 indicates an item monitored as an SLA. The monitoring reference value 2102 indicates a value that the corresponding service level item 2101 should satisfy. The SLA violation condition 2103 indicates a condition for determining that the corresponding service level item 2101 is an SLA violation. The monitoring method 2104 indicates a method (means) for monitoring the corresponding service level item 2101. A monitoring interval 2105 indicates an interval at which the corresponding service level item 2101 is monitored. The monitoring period 2106 indicates a monitoring period for determining whether there is an SLA violation.
The monitoring target system is, for example, a WEB three-layer system including a single server or a plurality of servers, and a data center.
The monitoring items (service level item 2101) to be executed for the monitored system include, for example, availability such as service time and operation rate, reliability such as average recovery time and failure notification time, response time and CPU usage rate. And performance information such as batch processing time.
That is, the
Further, each time the
In addition, the
The
FIG. 3 is a diagram illustrating an example of the monitoring log 2200. Referring to FIG. 3, the monitoring log 2200 includes a monitoring log record 2206 including at least a monitoring date / time 2201, a monitoring item 2202, a monitoring result 2203, and a reference value violation presence / absence 2204.
The monitoring date / time 2201 indicates the date / time when the
A monitoring item 2202 indicates an item of monitoring operation executed by the
The monitoring result 2203 is information indicating the result of the monitoring operation generated by the
For example, referring to FIG. 3, the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “service time” is “◯”. This indicates that the result of the monitoring operation by the
On the other hand, when there is a time when the operation of the service of the monitoring target system is not normal, the monitoring result 2203 is, for example, a value less than 100% corresponding to the time when the operation is not confirmed.
In addition, the monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “service operating rate” is “100%”. This is the service operation rate calculated by the
The monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “response time” is “5 seconds”. Here, the monitoring log record 2206 whose monitoring item 2202 is “response time” corresponds to the SLA definition record 2107 whose service level item 2101 is “response time”. That is, “5 seconds” of the monitoring result 2203 is a response time measured by the
The monitoring result 2203 included in the monitoring log record 2206 in which the monitoring item 2202 is “number of transactions” is “300”. This is the number of transactions that occurred during the monitoring time of the service availability, for example, counted by the
Reference value violation presence / absence 2204 indicates whether the corresponding monitoring result 2203 violates the corresponding monitoring reference value 2102 (in this case, “present”) or not (in this case, “none”).
The monitoring log record 2206 in which the presence / absence of the reference value violation 2204 is “Yes” corresponds to the monitoring data that does not satisfy the monitoring reference. For example, “5 seconds” in which the monitoring item 2202 shown in FIG. 3 is the “response time” monitoring result 2203 is “less than 3 seconds” in which the service level item 2101 shown in FIG. 2 is the monitoring reference value 2102 of “response time”. Is not satisfied. Accordingly, the presence or absence of a reference value violation 2204 for the monitoring item 2202 “response time” shown in FIG. 3 is “present”.
FIG. 4 is a diagram illustrating an example of the monitoring log tabulation record 2300. Referring to FIG. 4, the monitoring log total record 2300 includes a monitoring log total record 2307 including at least a monitoring period 2302, a report date and time 2303, and an SLA maintenance status 2306.
When the SLA maintenance status 2306 is “◯”, there is no service level item 2101 corresponding to the SLA violation condition 2103 in all the SLA definition records 2107 defined in the SLA definition 2100 as shown in FIG. Indicates. When the SLA maintenance status 2306 is “x”, it indicates that any one or more of the service level items 2101 corresponds to the SLA violation condition 2103.
The SLA
The
The SLA allowable
The SLA compliance
For example, the SLA compliance
Next, the SLA compliance
The SLA compliance rate is a ratio of the amount of violation of the reference value that has already occurred to the range of the amount of violation of the reference value indicated by the SLA tolerance. Here, the amount of violation of the reference value that has already occurred is, for example, a reference value that has occurred from a certain specific time (for example, monitoring start time) to another specific time (for example, the current time during service provision). The amount of violations. That is, the SLA compliance rate indicates how close to the SLA violation or how much the SLA is violated at a specific point in time during service provision.
Next, the operation of the present embodiment will be described in detail with reference to FIGS.
First, an operation for recording the SLA definition 2100 in the SLA
An input unit (not shown) of the quality evaluation apparatus 1000 receives an input of the SLA definition 2100 (step A101).
Next, the input unit records the received SLA definition 2100 in the SLA
This completes the description of the operation of recording the SLA definition 2100 in the SLA
Next, the overall operation of the quality evaluation apparatus 1000 that executes monitoring and calculates the SLA compliance rate will be described. FIG. 6 is a flowchart showing the overall operation of the quality evaluation apparatus 1000 that executes monitoring and calculates the SLA compliance rate.
First, the
Next, the
Specific examples of monitoring execution and the generated monitoring log record 2206 will be described in the following (1) to (3).
(1) For example, the
First, the
Next, when the
In other words, the
On the other hand, if the
(2) For example, the
First, the
Next, when the
That is, the
On the other hand, if the
Next, the
Further, the
(3) For example, the
First, the
Next, the
When there is no response to the ping from the monitoring target system within a predetermined time, the
In addition, the
The above is a specific example of the execution of monitoring and the generated monitoring log record 2206.
Next, the
Next, the SLA allowable
Next, the SLA compliance
Next, the communication means (not shown) acquires the SLA compliance rate from the SLA compliance
The above is description of operation | movement of the quality evaluation apparatus 1000 whole which performs monitoring and calculates a SLA compliance rate.
Next, with reference to FIG. 7, the monitoring operation corresponding to Step B101, Step B102, and Step B103 of FIG. 6 will be described in detail. FIG. 7 is a flowchart showing the operation of the
First, the
Next, the
Next, the
Next, the
Next, the
Next, the
In step C105, the
Further, the
The above is the description of the operation of the
Next, the operation of the SLA allowable
First, the SLA allowable
Next, the SLA allowable
Next, the SLA allowable
Next, the SLA allowable
Next, the SLA allowable
For example, if the monitoring reference value 2102 is 98%, violation of the reference value is allowed up to 2%. Therefore, for example, when the total number of calls Call is “1440” times, the SLA allowable
The operation of the SLA allowable
Next, the operation of the SLA compliance
First, the SLA compliance
Next, the SLA compliance
Next, the SLA compliance
For example, it is assumed that the number of violations of the reference value from the start of the monitoring period to the time of calculating the SLA compliance rate is 10 times, and the SLA allowable range for violation of the reference value is “28.8≈29 times”. In this case, the SLA compliance
Further, it is assumed that the number of violations of the reference value from the start of the monitoring period to the time of calculating the SLA compliance rate is 2, and the SLA allowable range for violation of the reference value is “28.8≈29 minutes”.
Here, as described above, the
In this case, the SLA compliance
When the number of violations of the reference value exceeds the SLA allowable range, the SLA compliance
In this case, the SLA compliance
The same applies to the case where the SLA allowable range is indicated by time, and the reference value violation time exceeds the SLA allowable range.
The above is the description of the operation of the SLA compliance
In the present embodiment, as shown in the flowchart of FIG. 6, the
When the content of the SLA definition 2100 of the quality evaluation apparatus 1000 is updated, the SLA allowable
The SLA compliance rate display means (not shown) may display the SLA compliance rate acquired from the SLA compliance
Further, the SLA compliance rate display means (not shown) displays a warning when the SLA compliance rate acquired from the SLA compliance
In this embodiment, the
First, the
Next, the SLA allowable
Based on the monitoring result 2203 and the reference value violation value calculated in this way, the SLA allowable
The first effect of the present embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision.
The reason is that it is configured to include the following elements. First, the SLA allowable
The second effect of the present embodiment is that it becomes possible to monitor in detail the state change of the service level item 2101 until the SLA violation.
The reason is that the SLA compliance
The third effect of the present embodiment is that when the SLA compliance rate becomes 0%, it is considered that an SLA violation has occurred tentatively, and even during the monitoring period 2106, the SLA violation has a high probability at the end of the monitoring period. It is possible to quickly detect the case determined to be and issue a warning.
The reason is that even when no SLA violation has occurred (when the SLA compliance rate is 0%), the SLA compliance
The fourth effect of the present embodiment is that the SLA compliance status can be continuously indicated even when the allowable range changes, for example, when the violation standard is changed depending on the time zone due to power consumption limitation.
The reason is that the execution of monitoring by the
[Second Embodiment]
Next, a second embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 10 is a block diagram showing a configuration of a quality evaluation apparatus 3000 according to the second embodiment of the present invention.
As shown in FIG. 10, the quality evaluation apparatus 3000 according to the second embodiment includes an SLA allowable
The SLA allowable
The SLA compliance
The effect of this embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision.
The reason is that it is configured to include the following elements. First, the SLA allowable
[Third Embodiment]
Next, a third embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 11 is a block diagram showing a configuration of a quality evaluation apparatus 4000 according to the third embodiment of the present invention.
As illustrated in FIG. 11, the quality evaluation apparatus 4000 according to the third embodiment further includes a total monitoring
FIG. 12 is a diagram illustrating an example of the SLA definition 2400. The SLA definition 2400 includes at least one SLA definition record 2401 in which the monitoring interval 2105 indicates “irregular”. The SLA definition 2400 may include an SLA definition record 2107 similar to the SLA definition 2100 in FIG.
The total monitoring
FIG. 13 is a diagram showing an example of a monitoring log total recording (also called operation history) 4300. Referring to FIG. 13, the monitoring log total record 4300 includes a monitoring log total record 4307 including at least a monitoring period 2302, a report date and time 2303, an SLA maintenance status 2306, and the number of transactions 4305.
The transaction number 4305 indicates the total number of transactions that have occurred in the monitoring target system during the period indicated by the corresponding monitoring period 2302.
Note that the monitoring period 2302, the reporting date 2303, and the SLA maintenance status 2306 are the same as those shown in FIG.
Next, the operation of this embodiment will be described with reference to FIG. FIG. 14 is a flowchart showing the operation of the total monitoring
The total monitoring
Next, the total monitoring
(Step F102). If no irregularity is indicated (NO in step F102), the process proceeds to D102 of FIG.
If it indicates irregular (YES in step F102), the total monitoring
Note that the total number of monitoring for each past monitoring period 2302 that is acquired by the total monitoring
Specifically, when the monitoring interval 2105 is “per transaction (irregular)”, for example, the total monitoring
Note that the total monitoring
Moreover, the quality evaluation apparatus 4000 may calculate the number of times of monitoring in the past monitoring period 2302 as follows. First, the
In FIG. 14 again, the total monitoring
Specifically, the total monitoring
First, the total monitoring
When the estimated value of the total number of monitoring is Call and the confidence interval is expressed as a range of the total number of monitoring Call using the t distribution, it is as shown in Equation 1.
Here, Cave is an average value of the data C of the total number of monitoring in a plurality of past monitoring periods 2302, as shown in Equation 2.
Further, “square of σ” is the variance of the data C of the total number of monitoring in a plurality of past monitoring periods 2302, as shown in Equation 3.
Further, t is a value obtained from a t distribution having an average of 0 and a standard deviation of 1. The value of t varies depending on the confidence interval to be set. For example, for a 95% confidence interval, t = 2.262, and for a 99% confidence interval, t = 3.250. The 95% confidence interval is an interval including 95% of the population estimated from the sample. Also, the 99% confidence interval has higher accuracy (reliability) than the 95% confidence interval. Note that the value of the t distribution is recorded in a storage unit (not shown) in the total monitoring
For example, if there is a past distribution with an average value Cave = 1400, a variance “square of σ” = 19544, and the number of samples k = 10, using the 95% confidence interval, from t = 2.262, the upper limit of Call Values and lower limits are as shown in Equation 4.
Therefore, 1300 <Call <1500.
As described above, the total monitoring
Next, as described above, the allowable range CP and SLA compliance
For example, in the case of the SLA definition record 2401 in FIG. 12, the SLA violation condition 2103 is “the rate when the reference value cannot be observed is 2% or more”. In this case, the amount of violation of the reference value is allowed to be less than 2%. Therefore, in the case of 1300 ≦ Call ≦ 1500, the allowable range CP of the number of violations of the reference value is 24 <CP <30 from 1300 × 0.02 = 26 and 1500 × 0.02 = 30. The same applies when the violation of the reference value is described in terms of time.
At this time, if the number of violations of the reference value from the start of the monitoring period to the calculation time is 10, the SLA compliance
(25-10) ÷ 25 × 100 = 60%, (29-10) ÷ 29 × 100 = 66%, and therefore 61% ≦ α ≦ 66%.
This also applies to the case where the reference value violation value is expressed in time.
The total monitoring
The first effect of the present embodiment is that it is possible to indicate the SLA compliance status at a specific time point during service provision even for the service level item 2101 for which the number of monitoring is not fixed.
The reason is that the total monitoring
The second effect of the present embodiment is that the SLA compliance status of the first effect is high even when the number of monitoring log total records 4307 in the monitoring log total record 4300 is relatively small (10 or less). It is possible to show that.
The reason is that it is configured to include the following elements. First, the total monitoring
[Fourth Embodiment]
Next, a fourth embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 15 is a block diagram showing a configuration of a quality evaluation apparatus 5000 according to the fourth embodiment of the present invention.
As illustrated in FIG. 15, the quality evaluation apparatus 5000 according to the fourth embodiment further includes an SLA
The SLA
When the elapsed time t from the start of monitoring, the predicted occurrence time Te of SLA violation, and the SLA compliance rate α, the SLA
For example, when the compliance rate α at the time when one hour has elapsed from the start of monitoring is 95%, the SLA
Furthermore, for example, when the monitoring period 2106 of a certain SLA definition record 2107 is 24 hours, there is a possibility that an SLA violation may occur within the monitoring period 2106, so information (warning) indicating that there is a risk is output. To do. Here, “SLA violation occurs within the monitoring period 2106” means that “the time when the SLA violation occurs is within the time before the end of the current monitoring period 2106, 21 hours after the start of monitoring. ".
The SLA
Next, the operation of the SLA
The SLA
Next, the SLA
Further, the SLA
When included in the current monitoring period 2106 (YES in step I103), the SLA
In step I105, the SLA
The above is the description of the operation of the SLA
Note that the SLA
The effect of this embodiment is that it is possible to output the expected occurrence time of an SLA violation.
The reason is that the SLA
[Fifth Embodiment]
Next, a fifth embodiment of the present invention will be described in detail with reference to the drawings. Hereinafter, the description overlapping with the above description is omitted as long as the description of the present embodiment is not obscured.
FIG. 17 is a block diagram showing a configuration of a quality evaluation apparatus 6000 according to the fifth embodiment of the present invention.
As illustrated in FIG. 17, the quality evaluation apparatus 6000 according to the fifth embodiment further includes an SLA compliance
The SLA compliance
For example, when the monitoring target system includes server A, server B, and server C, the SLA compliance
For example, it is assumed that the service level item 2101 of each of the server A, the server B, and the server C outputs values of 70%, 30%, and 50% as the SLA compliance rate of “response time”, respectively. In this case, the SLA compliance
That is, when it is predetermined to output an average value as the overall SLA compliance status, the SLA compliance
In addition, the SLA compliance
The SLA compliance
Next, the operation of the SLA compliance
First, the SLA compliance
Next, the SLA compliance
The minimum value of the SLA compliance rate indicates how close the SLA compliance status of the service level item 2101 taking the minimum value among the plurality of service level items 2101 is close to the SLA violation. In addition, the average value of the SLA compliance rate is an index indicating how much a plurality of service level items 2101 are observed in the monitoring target system.
Next, the SLA compliance
The above is the description of the operation of the SLA compliance
The first effect of the present embodiment is that it becomes easy to collectively monitor the SLA compliance status for each of the plurality of service level items 2101.
The reason is that the SLA compliance
The second effect of the present embodiment is that it is possible to take measures to prevent the service level item 2101 that is a bottleneck from being an SLA violation.
The reason is that the SLA compliance
The SLA compliance
Each component described in each of the above embodiments may cause a computer to execute a predetermined process by a program as shown in FIG. 19, for example.
FIG. 19 is a block diagram illustrating a configuration of a quality evaluation apparatus 7000 that causes a computer to execute predetermined processing using a program. Referring to FIG. 19, the quality evaluation device 7000 includes a CPU (Central Processing Unit) 7100, a
The
The
The
The
The
The
The
FIG. 20 is a block diagram illustrating an example of a non-volatile storage medium on which a program is recorded. The recording medium 7400 may be a non-volatile recording medium that stores information non-temporarily.
The quality evaluation device 7000 may include a recording medium 7400 supplied from the outside. The
As mentioned above, although this invention was demonstrated with reference to each embodiment and an Example, this invention is not limited to the said embodiment and Example. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
Each component described in each of the above embodiments does not necessarily have to be individually independent. For example, in each component, a plurality of components may be realized as one module, or one component may be realized as a plurality of modules. Each component is configured such that a component is a part of another component, or a part of a component overlaps a part of another component. Also good.
In the embodiments described above, each component and a module that realizes each component may be realized by hardware as long as necessary, or may be realized by a computer and a program. It may be realized by mixing hardware modules, computers, and programs. The program is provided by being recorded on a non-volatile computer-readable recording medium such as a magnetic disk or a semiconductor memory, and read by the computer when the computer is started up. The read program causes the computer to function as a component in each of the above-described embodiments by controlling the operation of the computer.
Further, in each of the embodiments described above, a plurality of operations are described in order in the form of a flowchart, but the described order does not limit the order in which the plurality of operations are executed. For this reason, when each embodiment is implemented, the order of the plurality of operations can be changed within a range that does not hinder the contents.
Furthermore, in each embodiment described above, a plurality of operations are not limited to being executed at different timings. For example, another operation may occur during the execution of a certain operation, or the execution timing of a certain operation and another operation may partially or entirely overlap.
Furthermore, in each of the embodiments described above, a certain operation is described as a trigger for another operation, but the description does not limit all relationships between the certain operation and the other operations. For this reason, when each embodiment is implemented, the relationship between the plurality of operations can be changed within a range that does not hinder the contents. The specific description of each operation of each component does not limit each operation of each component. For this reason, each specific operation | movement of each component may be changed in the range which does not cause trouble with respect to a functional, performance, and other characteristic in implementing each embodiment.
While the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
This application claims the priority on the basis of Japanese application Japanese Patent Application No. 2011-162312 for which it applied on July 25, 2011, and takes in those the indications of all here.
本発明によれば、運用管理におけるサービスレベル違反の発生監視、予測といった用途に適用できる。
According to the present invention, the present invention can be applied to usage monitoring and prediction of service level violations in operation management.
1000 品質評価装置
1011 監視部
1021 SLA定義記憶部
1022 ログ記憶部
1031 SLA許容範囲算出部
1032 SLA遵守率算出部
2100 SLA定義
2101 サービスレベル項目
2102 監視基準値
2103 SLA違反条件
2104 監視方法
2105 監視間隔
2106 監視期間
2107 SLA定義レコード
2200 監視ログ
2201 監視日時
2202 監視項目
2203 監視結果
2204 基準値違反の有無
2206 監視ログレコード
2300 監視ログ集計記録
2302 監視期間
2303 報告日時
2306 SLA維持状況
2307 監視ログ集計レコード
2400 SLA定義
2401 SLA定義レコード
3000 品質評価装置
4000 品質評価装置
4011 全監視数推定部
5000 品質評価装置
5011 SLA違反予測部
6000 品質評価装置
6011 SLA遵守率集約部 1000Quality Evaluation Apparatus 1011 Monitoring Unit 1021 SLA Definition Storage Unit 1022 Log Storage Unit 1031 SLA Allowable Range Calculation Unit 1032 SLA Compliance Rate Calculation Unit 2100 SLA Definition 2101 Service Level Item 2102 Monitoring Reference Value 2103 SLA Violation Condition 2104 Monitoring Method 2105 Monitoring Interval 2106 Monitoring period 2107 SLA definition record 2200 Monitoring log 2201 Monitoring date 2202 Monitoring item 2203 Monitoring result 2204 Reference value violation 2206 Monitoring log record 2300 Monitoring log total record 2302 Monitoring period 2303 Reporting date 2306 SLA maintenance status 2307 Monitoring log total record 2400 SLA Definition 2401 SLA definition record 3000 Quality evaluation device 4000 Quality evaluation device 4011 Total monitoring number estimation unit 5000 Quality evaluation Price device 5011 SLA violation prediction unit 6000 Quality evaluation device 6011 SLA compliance rate aggregation unit
1011 監視部
1021 SLA定義記憶部
1022 ログ記憶部
1031 SLA許容範囲算出部
1032 SLA遵守率算出部
2100 SLA定義
2101 サービスレベル項目
2102 監視基準値
2103 SLA違反条件
2104 監視方法
2105 監視間隔
2106 監視期間
2107 SLA定義レコード
2200 監視ログ
2201 監視日時
2202 監視項目
2203 監視結果
2204 基準値違反の有無
2206 監視ログレコード
2300 監視ログ集計記録
2302 監視期間
2303 報告日時
2306 SLA維持状況
2307 監視ログ集計レコード
2400 SLA定義
2401 SLA定義レコード
3000 品質評価装置
4000 品質評価装置
4011 全監視数推定部
5000 品質評価装置
5011 SLA違反予測部
6000 品質評価装置
6011 SLA遵守率集約部 1000
Claims (10)
- 監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する許容範囲算出手段と、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する遵守率算出手段と、を含む
品質評価装置。 The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition An allowable range calculating means for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is a data reference value;
Compliant rate calculating means for calculating and outputting a compliance rate for the violation condition at an arbitrary point in the monitoring period based on the monitoring data and the allowable range. - 前記監視対象の動作履歴に基づいて、前記監視期間における全監視回数の推定値を算出し、出力する全監視数推定手段を更に含む、
ことを特徴とする請求項1記載の品質評価装置。 Based on the operation history of the monitoring target, further includes a total monitoring number estimation means for calculating and outputting an estimated value of the total number of monitoring times in the monitoring period,
The quality evaluation apparatus according to claim 1, wherein: - 前記全監視数推定手段は、前記動作履歴に含まれる複数の監視期間の監視数に基づいて、ティー分布(t分布)に基づいた特定の信頼区間に対応する、前記全監視数の範囲を算出し、算出した前記全監視数の範囲を前記全監視回数の推定値として出力する
ことを特徴とする請求項2記載の品質評価装置。 The total monitoring number estimating means calculates a range of the total monitoring number corresponding to a specific confidence interval based on a tee distribution (t distribution) based on the number of monitoring in a plurality of monitoring periods included in the operation history. The quality evaluation device according to claim 2, wherein the calculated range of the total number of monitoring is output as an estimated value of the total number of times of monitoring. - 前記遵守率に基づき、前記違反動作の発生が予測される時刻を算出し、出力する違反予測手段を更に含む
ことを特徴とする請求項1乃至3のいずれかに記載の品質評価装置 The quality evaluation apparatus according to claim 1, further comprising: a violation prediction unit that calculates and outputs a time at which the occurrence of the violation action is predicted based on the compliance rate. - 複数の前記遵守率を集約した情報を生成し、出力する遵守率集約手段を更に含む
ことを特徴とする請求項1乃至4のいずれかに記載の品質評価装置。 The quality evaluation apparatus according to any one of claims 1 to 4, further comprising: a compliance rate aggregation unit that generates and outputs information in which a plurality of compliance rates are aggregated. - コンピュータが、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力し、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する
品質評価方法。 Computer
The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Calculate and output an allowable range indicating the allowable range of the amount of monitoring data that does not meet the monitoring reference value, which is the data reference value,
A quality evaluation method for calculating and outputting a compliance rate with respect to the violation condition at an arbitrary point in the middle of the monitoring period based on the monitoring data and the allowable range. - コンピュータが、
前記監視対象の動作履歴に基づいて、前記監視期間における全監視回数の推定値を算出し、出力する
ことを特徴とする請求項6記載の品質評価方法。 Computer
The quality evaluation method according to claim 6, wherein an estimated value of the total number of monitoring times in the monitoring period is calculated and output based on the operation history of the monitoring target. - 前記全監視回数の推定値の算出は、前記動作履歴に含まれる複数の監視期間の監視数に基づいて、ティー分布(t分布)に基づいた特定の信頼区間に対応する、前記全監視数の範囲を算出し、算出した前記全監視数の範囲を前記全監視回数の推定値として出力する
ことを特徴とする請求項7記載の品質評価方法。 The calculation of the estimated value of the total number of monitoring is based on the number of monitoring in a plurality of monitoring periods included in the operation history, and the total number of monitoring corresponding to a specific confidence interval based on a tee distribution (t distribution). The quality evaluation method according to claim 7, wherein a range is calculated, and the calculated range of the total number of monitoring is output as an estimated value of the total number of monitoring times. - コンピュータが、
前記遵守率に基づき、前記違反動作の発生が予測される時刻を算出し、出力する
ことを特徴とする請求項6乃至8のいずれかに記載の品質評価方法 Computer
The quality evaluation method according to claim 6, wherein a time at which the occurrence of the violating action is predicted is calculated and output based on the compliance rate. - コンピュータに、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する処理と、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する処理とを実行させる
プログラムを記録した不揮発性記録媒体。 On the computer,
The monitoring based on the violation condition that defines the condition of the violation operation to be monitored, and the total number of monitoring calculated based on the monitoring data acquisition interval corresponding to the violation condition and the monitoring period corresponding to the violation condition Processing for calculating and outputting an allowable range indicating an allowable range of the amount of monitoring data that does not satisfy the monitoring reference value that is the data reference value;
A non-volatile recording medium storing a program for calculating and outputting a compliance rate with respect to the violation condition at an arbitrary point in the monitoring period based on the monitoring data and the allowable range.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011162312 | 2011-07-25 | ||
JP2011-162312 | 2011-07-25 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2013015292A1 true WO2013015292A1 (en) | 2013-01-31 |
Family
ID=47601133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2012/068749 WO2013015292A1 (en) | 2011-07-25 | 2012-07-18 | Quality evaluation apparatus, quality evaluation method, and storage medium having program for same stored therein |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2013015292A1 (en) |
WO (1) | WO2013015292A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5571230B1 (en) * | 2013-06-07 | 2014-08-13 | 日本電信電話株式会社 | Evaluation system and evaluation method |
WO2023171382A1 (en) * | 2022-03-07 | 2023-09-14 | ソニーグループ株式会社 | Information processing system, information processing device, and data generating method |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006340050A (en) * | 2005-06-02 | 2006-12-14 | Nec Corp | Abnormality detection system and maintenance system |
JP2009217373A (en) * | 2008-03-07 | 2009-09-24 | Ns Solutions Corp | Information processor, information processing method and program |
WO2009144780A1 (en) * | 2008-05-27 | 2009-12-03 | 富士通株式会社 | System operation management support system, method and apparatus |
WO2011083750A1 (en) * | 2010-01-07 | 2011-07-14 | 日本電気株式会社 | Information processing device, service management method, and service management program |
-
2012
- 2012-07-18 WO PCT/JP2012/068749 patent/WO2013015292A1/en active Application Filing
- 2012-07-18 JP JP2013525732A patent/JPWO2013015292A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006340050A (en) * | 2005-06-02 | 2006-12-14 | Nec Corp | Abnormality detection system and maintenance system |
JP2009217373A (en) * | 2008-03-07 | 2009-09-24 | Ns Solutions Corp | Information processor, information processing method and program |
WO2009144780A1 (en) * | 2008-05-27 | 2009-12-03 | 富士通株式会社 | System operation management support system, method and apparatus |
WO2011083750A1 (en) * | 2010-01-07 | 2011-07-14 | 日本電気株式会社 | Information processing device, service management method, and service management program |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5571230B1 (en) * | 2013-06-07 | 2014-08-13 | 日本電信電話株式会社 | Evaluation system and evaluation method |
WO2023171382A1 (en) * | 2022-03-07 | 2023-09-14 | ソニーグループ株式会社 | Information processing system, information processing device, and data generating method |
Also Published As
Publication number | Publication date |
---|---|
JPWO2013015292A1 (en) | 2015-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11533238B2 (en) | Capacity management of computing resources based on time series analysis | |
US9893963B2 (en) | Dynamic baseline determination for distributed transaction | |
US9965498B2 (en) | Predictive resource management | |
US10558544B2 (en) | Multiple modeling paradigm for predictive analytics | |
US9491247B2 (en) | Automatic capture of detailed analysis information based on remote server analysis | |
US10230611B2 (en) | Dynamic baseline determination for distributed business transaction | |
US20130090950A1 (en) | Policy event management system and method | |
CN107704387B (en) | Method, device, electronic equipment and computer readable medium for system early warning | |
Neukirchner et al. | Monitoring arbitrary activation patterns in real-time systems | |
US20160110653A1 (en) | Method and apparatus for predicting a service call for digital printing equipment from a customer | |
WO2013015292A1 (en) | Quality evaluation apparatus, quality evaluation method, and storage medium having program for same stored therein | |
GB2514833A (en) | Portable computer monitoring | |
JP6018024B2 (en) | CHANGE DETECTION DEVICE, CHANGE DETECTION SYSTEM, CHANGE DETECTION METHOD, AND PROGRAM | |
JP2020035297A (en) | Apparatus state monitor and program | |
JP2019219743A (en) | Load test system | |
JP2006127070A (en) | Proposal type maintenance sales method for industrial personal computer | |
US11556451B2 (en) | Method for analyzing the resource consumption of a computing infrastructure, alert and sizing | |
Bella et al. | A near-miss management system architecture for the forensic investigation of software failures | |
JP2013003896A (en) | Information providing device, information providing method and program | |
US11526381B2 (en) | System and method for infrastructure resource optimization | |
US20240289708A1 (en) | Monitoring and alerting system and method | |
JP2019219744A (en) | Load test system | |
CN114756433A (en) | Data processing method, device, equipment and storage medium | |
TWM596408U (en) | Database Resource Early Warning System | |
CN118210610A (en) | Task execution method and device, electronic equipment and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 12818404 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2013525732 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 12818404 Country of ref document: EP Kind code of ref document: A1 |