WO2011083750A1 - 情報処理装置、サービス管理方法、並びにサービス管理プログラム - Google Patents

情報処理装置、サービス管理方法、並びにサービス管理プログラム Download PDF

Info

Publication number
WO2011083750A1
WO2011083750A1 PCT/JP2010/073874 JP2010073874W WO2011083750A1 WO 2011083750 A1 WO2011083750 A1 WO 2011083750A1 JP 2010073874 W JP2010073874 W JP 2010073874W WO 2011083750 A1 WO2011083750 A1 WO 2011083750A1
Authority
WO
WIPO (PCT)
Prior art keywords
influence
value
service
degree
violation
Prior art date
Application number
PCT/JP2010/073874
Other languages
English (en)
French (fr)
Inventor
悠 吉田
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to JP2011548980A priority Critical patent/JPWO2011083750A1/ja
Priority to US13/520,835 priority patent/US20130073912A1/en
Publication of WO2011083750A1 publication Critical patent/WO2011083750A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management

Definitions

  • the present invention relates to a technology for managing services.
  • the system operation manager detects a service failure (decrease in quality level) caused by a system malfunction, failure, or deterioration, and immediately identifies and deals with the problem location and cause. As a system becomes larger, more service failures occur at the same time. In such a case, the system administrator can determine the impact of each failure on the service recipient so that the impact on the service recipient is minimized. There is a need to accurately grasp and determine the order of actions.
  • Patent Document 1 discloses a technique for determining the degree of satisfaction with service contract information.
  • Patent Document 2 discloses a method of analyzing a computer infrastructure including a plurality of components that provide services.
  • Patent Document 2 a plurality of different service level targets are set for each service recipient for the same service, and the service level objects (SLO) analyzer described in Patent Document 2 is a service component that needs to be corrected. Is identified.
  • SLO service level objects
  • Patent Document 3 discloses a method for analyzing a computer infrastructure including a plurality of components that provide services.
  • the satisfaction calculation unit described in Patent Document 3 includes a service recipient that achieves 100% satisfaction and a service recipient that is not realized within the same service. Detect the person.
  • Patent Document 3 describes a method for improving service quality for service recipients with insufficient satisfaction by restricting services to service recipients with excessive satisfaction. Has been.
  • an information processing apparatus provides an acquisition unit that acquires measurement values for a monitoring target item related to an information service, and a plurality of conditions required for the monitoring target item. And a violation value calculation means for calculating a violation value indicating the degree of condition violation, and an influence calculation for calculating the degree of influence of the condition violation on the information service using the violation value.
  • a service management method acquires a measurement value for a monitoring target item related to an information service, and compares a plurality of conditions required for the monitoring target item with the measurement value. Then, a violation value indicating the degree of condition violation is calculated, and using the violation value, the degree of influence of the condition violation on the information service is calculated as an influence level.
  • a service management program provides a computer with an acquisition process for acquiring a measurement value for a monitoring target item related to an information service, and a plurality of conditions required for the monitoring target item.
  • the influence degree calculation process is executed. (The invention's effect) According to the present invention, when a problem occurs in the provided service, the degree of influence of the problem can be comprehensively evaluated.
  • IT service information service
  • IT Information Technology
  • CI Configuration Item
  • a server For example, a server, a VM (Virtual Machine), an NW (Network) device, an application, a process, and the like are included.
  • “Failure” refers to a CI failure or malfunction, a phenomenon in which an IT service is stopped based on the failure, and a monitoring index level is lowered.
  • “Service Level Agreement (SLA)” refers to a condition agreed between the IT service provider and the service recipient regarding the IT service level. SLA generally includes items related to the availability, reliability, performance, etc. of IT services. The conditions such as “TATurn Around Time) guarantees 5 seconds or less during IT service provision period” are quantified. is there. The SLA handled in the present embodiment is an item whose consent level can be expressed numerically.
  • the SLA in this (embodiment) is not limited to the case where the word SLA is clearly specified in the name of the contract (condition), but the agreement condition including the numerical contract regarding the guarantee of the quality level of the IT service is included. All shall be included. That is, in the present embodiment, the SLA refers to a condition required for the monitoring target item. Note that the SLA includes a case where the IT service level and the plurality of service recipients have different conditions with respect to the IT service level that has been separately agreed.
  • the first embodiment of the present invention relates to a technology for grasping an IT service provision state, that is, a service management technology for calculating the degree of influence on an IT service when a failure occurs.
  • the first embodiment of the present invention is particularly effective in a large-scale system including a large number of IT services, devices to be monitored items for providing IT services, and service recipients who receive IT services. is there.
  • the first embodiment of the present invention calculates the quality of the service.
  • the first embodiment of the present invention calculates evaluations for a plurality of contract information.
  • FIG. 2 is a block diagram illustrating a configuration example of the influence degree calculating device as the information processing device according to the first embodiment of the present invention.
  • the input / output unit 1 includes an input device such as a mouse and a keyboard and an output device such as a display.
  • the storage unit 2 associates (associates) the CI of the system with the IT service, associates (associates) the IT service with the SLA, and each SLA item and its numerical condition (for example, in SLA_01 which is one of the SLA, In the TAT item, information on conditions such as ensuring within 5 seconds is registered.
  • the acquisition unit 3 collects the measurement values of the monitoring indexes acquired and set in real time for the CI and IT services that constitute the system to be monitored, and outputs the information to the calculation unit 4.
  • the calculation unit 4 compares the SLA linked (associated) with the CI registered in the storage unit 2 with the measured value of the monitoring index acquired by the acquisition unit 3, and calculates a violation value indicating the degree of condition violation. calculate. In other words, the calculation unit 4 quantitatively calculates how much the SLA is violated as a violation value. And the calculation part 4 calculates the degree of the influence which SLA violation gives about each IT service as an influence degree. Specifically, the calculation unit 4 calculates the sum of violation values of a plurality of SLA linked (related) to the IT service, and sets this as the “influence”. In addition, the calculation unit 4 calculates the influence degree when the monitoring index becomes worst in the future as the most adverse effect degree although it is not violated in the measurement of the current monitoring index by SLA.
  • the SLA is linked (related) to the IT service, and the IT service is often linked (related) to the CI constituting the IT service. However, there is a case where the SLA is directly linked (related) to the CI.
  • the configuration of these data depends on information registered in the storage unit 2.
  • the generation unit 5 is an image generation unit that generates image data for visually displaying, as a graph or the like, the degree of influence and / or the most adverse effect on the CI and IT service failure calculated by the calculation unit 4. is there. If the generation unit 5 generates such image data, the presence / absence and severity of the problem as a whole system can be grasped at a glance.
  • FIG. 3 is a diagram illustrating an example of registration data 301 registered in the storage unit 2 according to the present embodiment.
  • Each SLA_ID (identifier) is associated (associated) with an IT service ID, and more specific index items and numerical conditions thereof are set.
  • SLA_001 is an SLA related to the IT service 01, and is a content that guarantees a response time within 5 seconds and an availability of 99.9% or more.
  • SLA_002 is also an SLA related to the IT service 01, and in this SLA, the response time is guaranteed within 10 seconds and the availability is guaranteed to be 99.0% or more.
  • SLA_003 is an SLA related to the IT service 02. In this SLA, the response time is guaranteed within 5 seconds and the availability is guaranteed to be 99.9% or more.
  • the calculation unit 4 can derive what conditions can be satisfied for a specific SLA. On the other hand, if a numerical value such as response time or availability is given for a specific IT service, the calculation unit 4 can also derive to what extent the problem becomes for which SLA.
  • the influence degree calculation apparatus in this Embodiment may give weight to each SLA. For example, although not shown in FIG. 3, the influence degree calculating device may set the importance degree for each SLA in the storage unit 2. For example, the degree of influence calculation device sets the importance of SLA_001 to 1, the importance of SLA_002 is 0.5, the importance of SLA_003 is 0.3, and so on. Set the degree.
  • FIG. 4 shows an example of measurement data 401 collected by the acquisition unit 3 and output to the calculation unit 4.
  • the measurement data 401 uses the response time and availability of each monitoring target CI at a certain measurement time stamp as indicators of the measurement target.
  • the availability is obtained by using the ratio between the actual operation time and the planned operation time of the IT service.
  • the acquisition unit 3 calculates the actual operation time after determining the operation status based on the measurement, and calculates the availability therefrom. Referring to FIG.
  • SLA_001 defines within 5 seconds as a condition for complying with the response time of the IT service 01.
  • the response time measurement value for the IT service 01 is 7 seconds, which violates SLA_001.
  • the calculation unit 4 can calculate the violation value related to the response time as “40”.
  • SLA_001 specifies 99.9% or more as a condition to be observed in the availability of IT service 01.
  • the measurement data 401 in FIG. 4 has 100% availability for the IT service 01 and does not violate SLA_001.
  • the calculation unit 4 can calculate the violation value related to availability as “0”. If the availability related to the IT service 01 is 90% in the measurement data, (SLA value) ⁇ (actual measurement value) does not hold. Therefore, the calculation unit 4 can calculate the violation value as “10” because the violation value is not “0” but 90% is 99.9% of 90.1 ⁇ 90% and 10% is insufficient. On the other hand, the calculation unit 4 can calculate the worst adverse effect level by predefining the worst measurement value for each index item.
  • the worst violation value of SLA_001 is “300” (20 seconds is over 300% of 5 seconds), and the worst violation value of SLA_002 Is “100”, and the worst violation value of SLA — 003 is “300”.
  • the calculation unit 4 multiplies the violation value by the importance of each SLA and calculates the sum as an influence.
  • the calculation unit 4 uses the information to trace the related IT service and SLA so that the calculation unit 4 can determine the degree of influence on the CI and the maximum information.
  • the degree of adverse effect can also be calculated.
  • the generation unit 5 displays the calculation result output from the calculation unit 4 on the screen.
  • FIG. 5 is a diagram illustrating an example of a graph image generated based on the generation unit 5. This bar graph shows the degree of influence and the worst degree of adverse effect related to each IT service. The whole shows the most adverse effect, and the hatched part shows the current influence.
  • the generation unit 5 sorts and displays IT services based on the magnitude of the most adverse effect.
  • generation part 5 may display the present influence degree or the most bad influence degree according to a use.
  • the generation unit 5 crosses the framework of the IT service, and sums the worst adverse effects when the monitored items of all IT services are the worst measured values as the total length of the bar graph, and hatches the current influence degree Is displayed. Based on such a display, the generation unit 5 can intuitively display how many problems have occurred in all the SLA to be monitored.
  • the generation unit 5 may individually display the degree of influence for each monitoring index such as response time and availability as shown in FIG. 7, or may combine the degree of influence in the plurality of monitoring indices (for example, The graph may be displayed in a unified manner (using a weighted average or the like).
  • the generation unit 5 displays item influences related to a certain IT service in time series.
  • the generation unit 5 aggregates and displays the data output from the calculation unit 4 based on the time stamp.
  • the display target may be a plurality of IT services, or may be the sum of the influence levels of all IT services.
  • the generation unit 5 displays the same information as in FIG. 5 in a pie chart.
  • the generation unit 5 indicates the ratio (occupancy) of the current degree of influence (hatching part) to the degree of the most adverse effect for each IT service, and the IT service having the current degree of influence is displayed.
  • the generation unit 5 displays the ratio of SLA with violations in a pie chart with respect to all SLAs that the IT service provider should protect.
  • FIG. 1 is a flowchart illustrating an example of an IT service influence calculation process in the calculation unit 4.
  • FIG. 10 is a table that summarizes data that is referred to and calculated in the flowchart of FIG.
  • the calculation unit 4 identifies the IT service for which the degree of influence is to be acquired, reads information on the monitoring target items necessary for calculating the degree of influence from the storage unit 2 among the CIs required for the IT service, Then, the measurement value for the monitoring target item is acquired from the acquisition unit 3 (S101).
  • the calculation unit 4 specifies the IT service 01 and the IT service 02 as the service 1001.
  • the calculation unit 4 reads the monitoring target 1002, the importance level 1003, and the worst measurement value 1004 for these services from the storage unit 2 and acquires the measurement value 1005 from the acquisition unit 3. Next, the calculation unit 4 reads out information about the SLA related to the identified IT service from the storage unit 2.
  • the SLA to be read corresponds to the SLA 1006, the condition 1007, and the importance 1008 in FIG. Then, the calculation unit 4 compares each SLA condition 1007 with the measured value 1005 to calculate a violation value 1009 for each SLA (S102).
  • the calculation unit 4 may calculate the violation value 1009 from the difference or ratio between the SLA contract value and the measurement value of each index, or may express the violation value 1009 as binary values such as violation ( ⁇ ) and compliance (O). .
  • the calculation unit 4 calculates the impact level of the IT service (S104).
  • the impact level of the IT service uses a weighted sum obtained by assigning a weight to the violation value based on the importance level of each SLA.
  • the importance 1008 is defined as “1” for SLA001 and SLA002 and “0.8” for SLA003.
  • the calculation unit 4 can first calculate the influence degree (item influence degree 1010) for each monitoring target item based on multiplying each violation value by these values and taking the sum. Then, the calculation unit 4 can calculate the IT service influence degree (service influence degree 1011) by adding the item influence degree 1010.
  • the influence is a simple sum of violation values.
  • the calculation unit 4 calculates the worst violation value 1012 of each SLA using the read worst measured value 1004, and sets the worst adverse effect level 1013 and IT for each item based on the worst violation value 1012.
  • the most adverse effect level 1014 of the entire service is calculated (S105).
  • the generation unit 5 generates an image (in the example of FIGS. 5 to 9) showing the results of the IT service influence level and the IT service most adverse effect level calculated in S104 and S105. It is displayed (S106). (Modification) Note that each configuration of the information processing apparatus (influence calculation device) according to the present embodiment may be divided into a plurality of configurations.
  • the calculation unit 4 is not limited to one configuration, and may be divided into a plurality of configurations, for example, a configuration for calculating a violation value and a configuration for calculating an influence degree.
  • each configuration is not included in one device and may be configured as a separate device.
  • the storage unit 2 may be another storage device connected via a network.
  • the generation unit 5 and the input / output unit 1 may be separate devices.
  • FIG. 18 is a diagram illustrating an example of another configuration of the information processing apparatus (influence degree calculation apparatus) according to the present embodiment. 18, the same components as those in FIG. 2 are denoted by the same reference numerals, and detailed description thereof is omitted.
  • the information processing apparatus illustrated in FIG. 18 includes an acquisition unit 3 similar to that illustrated in FIG.
  • the violation value calculation unit 42 and the influence level calculation unit 43 together operate in the same manner as the calculation unit 4 illustrated in FIG.
  • the information processing apparatus illustrated in FIG. 18 is a separate unit in which the storage unit 2, the generation unit 5, and the input / output unit 1 are connected via a network. Therefore, in FIG. 18, units connected via the network are indicated by dotted lines. Since the CI is also connected via the network, it is indicated by a dotted line.
  • the information processing apparatus (influence degree calculating apparatus) configured as described above can operate in the same manner as the influence degree calculating apparatus illustrated in FIG. 2 by exchanging information with each unit via a network.
  • the information processing apparatus shown in FIG. 18 is the minimum configuration of the present invention.
  • the information processing device (impact calculation device) described so far when an IT service provider has a problem with an IT service or CI based on a failure or a malfunction, the information service device, CI, Alternatively, a display for confirming each IT system can be provided.
  • the information processing apparatus can easily present to the service provider the possibility that the degree of influence will increase.
  • the information processing apparatus according to the present embodiment can notify an IT service provider of the influence of an IT service or CI SLA violation based on a failure or a malfunction.
  • the information processing apparatus displays the influence calculation result in a graph or the like, so that the IT service provider can easily grasp the order of the IT service and the CI to be preferentially dealt with.
  • the information processing apparatus in the present embodiment can directly reflect the influence on the IT service for each service recipient in the violation value, and calculate the degree of influence. A great effect can be expected on the accuracy of the. That is, when a problem occurs in a certain IT service, the information processing apparatus according to the present embodiment can calculate the magnitude of the influence of the problem from the viewpoint of the service recipient.
  • FIG. 11 is a block diagram illustrating a configuration of an influence degree calculating apparatus according to the second embodiment. This embodiment is different from the first embodiment shown in FIG. 2 in that the calculation unit 4 includes a warning value calculation unit 41.
  • FIG. 12 shows an example of data registered in the storage unit 2 according to this embodiment. The difference from the registration data 301 of the storage unit 2 in the first embodiment shown in FIG.
  • warning range 3 is that a warning range exists as data in addition to the violation range in each index of SLA (response time, availability).
  • This warning range is a range of values that are not violated on the SLA with the service recipient, but are likely to be violated if left untreated.
  • the example shown in FIG. 12 uses the numerical value of the previous stage in violation as the warning range. For example, the response time of SLA_001 is normal if it is less than 3 seconds, warning (danger) if it is 3 seconds or more and less than 5 seconds, and violation if it is 5 seconds or more.
  • thresholds other than SLA violations can be freely set in accordance with operational conditions, such as a threshold value representing a warning, a danger value representing a range of a danger level that is a little less urgent to deal with the warning.
  • the calculation unit 4 calculates a warning value from the warning range set in each SLA and the measured value acquired from the acquisition unit 3 in the warning value calculation unit 41.
  • the warning value calculation unit 41 may express whether or not the measured value is within the warning range by binary values within the warning range (O) and out of the warning range ( ⁇ ), and which position in the warning range is indicated. It may be expressed by a continuous value such as a 25% warning.
  • the calculation unit 4 calculates an influence value for each IT service by referring to the warning value calculated by the warning value calculation unit 41 in addition to the violation value obtained in the first embodiment. For example, the calculation unit 4 calculates a sum obtained by weighting the violation value and the warning value.
  • the calculation unit 4 calculates the IT service from the result of SLA_001 of the first embodiment.
  • FIG. 13 is a diagram displaying the result of the influence degree calculation in the second embodiment.
  • the generation unit 5 displays for each IT service so that the magnitude of the violation value and the warning value can be understood. For example, the generation unit 5 emphasizes even if the SLA that is a violation value is a little on the number, and easily reflects it in the display.
  • FIG. 14 shows an example in which the sum of the worst adverse effects when the monitored items of all IT services are the worst measured values is the total length of the bar graph, and the influence based on the violation value and the influence based on the warning value are displayed by hatching.
  • FIG. 15 is a diagram illustrating an example in which the result of the influence degree calculation in the second embodiment is displayed.
  • the generation unit 5 represents the total number of SLA in a pie chart, and displays the number of SLA having a violation value and the number of SLA having a warning value by hatching and a grid pattern, respectively.
  • FIG. 16 is a diagram showing an example in which the result of influence calculation in the second embodiment is displayed.
  • the generation unit 5 extracts an IT service in which a violation value or a warning value exists, and expresses a breakdown of the violation value and the warning value in a pie chart.
  • the operation of this embodiment is different from the operation of the first embodiment after the SLA violation value is calculated in step S102.
  • the warning value calculation unit 41 calculates the SLA warning value in step S203.
  • step S203 the warning value calculation unit 41 compares the condition of each SLA with the acquired measurement value, and calculates a warning value for each SLA (step S203).
  • the calculation unit 4 calculates the influence degree from the violation value and the warning value (step S204).
  • ⁇ Effects of Second Embodiment> By providing a warning value in addition to the violation value and reflecting it to the impact level of each IT service and CI, the information processing apparatus (impact level calculation apparatus) of the present embodiment can It can help to understand the compliance status in more detail and accurately determine the order of failure handling.
  • the medium for storing the program may be the storage unit in FIGS. 2, 11, and 18.
  • This application claims the priority on the basis of the Japanese application 2010-001968 for which it applied on January 7, 2010, and takes in those the indications of all here.
  • the present invention can be suitably applied to a purpose of accurately grasping a failure situation in the operation monitoring field and dealing with the failure.
  • the present invention is particularly useful when a plurality of failures occur simultaneously in a large-scale system environment.

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Debugging And Monitoring (AREA)

Abstract

(課題) 提供サービスに問題が発生した場合に、その問題の影響度を総合評価すること。 (解決手段) 本発明の情報処理装置は、情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、違反値を用いて、条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段とを含む。

Description

情報処理装置、サービス管理方法、並びにサービス管理プログラム
 本発明は、サービスを管理する技術に関する。
 近年、情報システムをビジネスに活用する組織や企業が、増えてきている。それらの組織や企業へ情報サービスを提供するサービス提供者は、そのサービス受容者に対するサービス品質を管理する必要がある。
 具体的には、システム運用管理者は、システムの不具合や故障、劣化に基づいて引き起こされるサービス障害(品質レベル低下)を検知し、早急に問題箇所と原因とを特定し対処する。システムが大規模になると、同時に発生するサービス障害が多くなり、そういった場合、システム運用管理者は、サービス受容者への影響が最小限に抑えられるよう、各障害に対するサービス受容者への影響度を正確に把握し、対処順序を判断する必要性が生じる。特に、システム運用管理者は、サービス受容者との同意に反することがないよう対処順序を決定し、障害に基づいて受ける金銭的ダメージを可能な限り抑えるような判断を下すことが望ましい。
 このような状況下において、特許文献1には、サービスの契約情報に対する充足度を判定する技術が、開示されている。一方、特許文献2には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。ここ(特許文献2)では、同一サービスに対してサービス受容者ごとに異なる複数のサービスレベル目標が設定され、特許文献2に記載のSLO(service level objectives)アナライザが、修正が必要なサービス構成要素を特定する。
 また、特許文献3には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。特に複数のサービス受容者へサービスを提供する場合において、特許文献3に記載の満足度算出部は、同一サービス内で、満足度が100%実現されているサービス受容者と実現されていないサービス受容者とを検出する。そして、特許文献3には、過剰な満足度を実現しているサービス受容者へのサービスを制限することで、満足度が不足しているサービス受容者へのサービス品質を向上させる方式が、記載されている。
特開2001−320370号公報 特開2008−108262号公報 特開平09−244973号公報
 しかし、上記の関連する技術では、提供サービスに問題が発生した場合、異なるサービス受容者に対する影響を総合したサービス全体の状態を示す指標がなかったため、その問題の影響度を総合評価することができない問題点があった。
 本発明の目的は、上述の課題を解決する情報処理装置を提供することにある。
(課題を解決するための手段)
 上記目的を達成するため、本発明に係る情報処理装置は、情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段とを含む。
 上記目的を達成するため、本発明に係るサービス管理方法は、情報サービスに関連する監視対象項目について、測定値を取得し、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出し、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する。
 上記目的を達成するため、本発明に係るサービス管理プログラムは、コンピュータに、情報サービスに関連する監視対象項目について、測定値を取得する取得処理と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出処理と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出処理とを実行させる。
(発明の効果)
 本発明によれば、提供サービスに問題が発生した場合に、その問題の影響度を総合評価できる。
本発明における第1実施形態に係る影響度算出装置において影響度を算出する処理を示すフローチャートである。 本発明の第1実施形態に係る影響度算出装置の構成例を示すブロック図である。 本発明の第1実施形態に係る影響度算出装置の記憶部に登録されているデータの一例を示す図である。 本発明の第1実施形態に係る影響度算出装置の取得部が出力するデータの一例を示す図である。 本発明の第1実施形態に係る影響度算出装置の生成部が生成する画像例を示す図である。 本発明の第1実施形態に係る生成部が生成する画像例を示す図である。 本発明の第1実施形態に係る生成部が生成する画像例を示す図である。 本発明の第1実施形態に係る生成部が生成する画像例を示す図である。 本発明の第1実施形態に係る生成部が生成する画像例を示す図である。 本発明の第1実施形態に係る影響度算出装置で取得又は算出されるデータを示す図である。 本発明の第2実施形態に係る影響度算出装置の構成例を示す図である。 本発明の第2実施形態に係る影響度算出装置の記憶部に登録されているデータの一例を示す図である。 本発明の第2実施形態に係る生成部が生成する画像例を示す図である。 本発明の第2実施形態に係る生成部が生成する画像例を示す図である。 本発明の第2実施形態に係る生成部が生成する画像例を示す図である。 本発明の第2実施形態に係る生成部が生成する画像例を示す図である。 本発明の第2実施形態に係る影響度算出装置において影響度を算出する処理を示すフローチャートである。 本発明の第1実施形態の係る情報処理装置の構成例を示すブロック図である。
 以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらに限定する趣旨のものではない。
 (用語の定義)
 まず、本発明の実施形態について説明する前に、必要な用語を定義する。
 「ITサービス(情報サービス)」は、IT(Information Technology)を利用するサービス受容者を支援するIT機能の集合体で、監視指標に基づき品質についての評価が可能である。例えば、ITサービスは、メールシステムの導入管理サービスや業務システムの導入管理サービスを含む。
 「CI(Configuration Item)」は、ITサービスに含まれるIT機能を実現するための構成要素である。例えば、サーバ、VM(Virtual Machine、仮想機械)、NW(Network)機器、アプリケーション、プロセスなどを含む。
 「障害」とは、CIの故障、不具合、及びそれに基づくITサービスの停止、監視指標レベル低下の現象とする。
 「SLA(Service Level Agreement)」とは、ITサービスレベルに関して、ITサービス提供者とサービス受容者との間で同意のある条件を指す。SLAは、ITサービスの可用性や信頼性、性能等に関する項目が一般的で、「ITサービス提供期間中、TAT(Turn Around Time)は5秒以下を保証する」といった条件が数値化されたものである。本実施形態で扱うSLAは、同意レベルが数値表現可能な項目とする。項目の例は、TAT、冗長HW(Hardware)数などである。また、ここ(実施形態)でのSLAは、規約(条件)名にSLAという言葉が明示されている場合に限るものではなく、ITサービスの品質レベルの保証に関する数値規約が含まれた同意条件をすべて含むものとする。つまり、本実施形態では、SLAは、監視対象項目に関して要求される条件をいう。
 なお、SLAは、ITサービス提供者と複数のサービス受容者との間で、別々に同意があったITサービスレベルについて、異なる条件である場合も含む。
 (第1実施形態)
 本発明の第1実施形態は、ITサービスの提供状態を把握するための技術、すなわち障害発生時のITサービスへの影響度を算出するサービス管理技術に関する。本発明の第1実施形態は、特に、ITサービスや、ITサービス提供のための監視対象項目となる機器や、ITサービスの提供を受けるサービス受容者を大量に備える大規模システムで有効な技術である。複数のサービス契約情報に対する閾値違反を一つの指標に集約することで、本発明の第1実施形態は、当該サービスの品質を算定する。本発明の第1実施形態は、複数の契約情報に対する評価を算出する。
 <構成>
 図2は、本発明の第1実施形態に係る情報処理装置としての影響度算出装置の構成例を表すブロック図である。図2に示す影響度算出装置は、入出力部1と、取得部3と、算出部4と、生成部5と、記憶部2とを含む。
 まず、入出力部1は、マウスやキーボードなどの入力デバイスと、ディスプレイなどの出力デバイスとを含む。
 記憶部2は、システムのCIとITサービスとの紐(関連)付け、ITサービスとSLAとの紐(関連)付け、各SLAの項目とその数値条件(例えば、SLAのひとつであるSLA_01では、TAT項目は5秒以内を保障する、といった条件)の情報を登録している。
 取得部3は、監視対象であるシステムを構成するCI及びITサービスに関して、取得設定された監視指標の測定値をリアルタイムで収集し、その情報を算出部4へ出力する。
 算出部4は、記憶部2へ登録されているCIに紐(関連)付けられたSLAについて、取得部3で取得した監視指標の測定値と比較して、条件違反の度合いを示す違反値を算出する。言い換えれば、算出部4は、どのSLAに対してどの程度違反しているかを、定量的に違反値として算出する。そして、算出部4は、各ITサービスについて、SLA違反が与える影響の度合いを影響度として算出する。具体的には、算出部4は、ITサービスに紐(関連)付けられた複数のSLAの違反値の総和を算出し、これを「影響度」とする。また、算出部4は、SLAで、現状の監視指標の測定では違反となっていないが、将来的に監視指標が最悪になった場合の影響度についても最悪影響度として算出する。
 SLAはITサービスに紐(関連)付けられており、ITサービスがそれ(ITサービス)を構成するCIへ紐(関連)付けられていることが多い。しかし、CIに直接SLAが紐(関連)付けられている場合もある。それらデータの構成は、記憶部2への登録情報に依存する。
 生成部5は、算出部4において算出されたCI及びITサービス障害についての影響度あるいは最悪影響度、又はその両方を、グラフ等で視覚的に表示するための画像データを生成する画像生成手段である。生成部5がこのような画像データを生成すれば、システム全体としての問題有無や深刻度といったものが、一見して把握できるようになる。
 図3は、本実施の形態における記憶部2に登録された登録データ301の一例を示す図である。各々のSLA_ID(識別子)は、ITサービスIDと紐(関連)付けられており、さらに具体的な指標の項目とその数値条件が設定されている。例えば、SLA_001は、ITサービス01に関するSLAであり、応答時間は5秒以内を、可用性は99.9%以上を保証する内容である。一方、SLA_002も、やはりITサービス01に関するSLAであるが、このSLAでは、応答時間は10秒以内を、可用性は99.0%以上を保証する内容である。さらに、SLA_003は、ITサービス02に関するSLAであり、このSLAでは、応答時間は5秒以内を、可用性は99.9%以上を保証する内容である。このように、記憶部2を参照すれば、算出部4は、特定のSLAについて、どのような条件を満足できるかを導き出せる。一方、算出部4は、特定のITサービスについて、応答時間や可用性などの数値が与えられれば、どのSLAに対してどの程度問題となるのかも、導き出せる。
 なお、本実施の形態のおける影響度算出装置は、それぞれのSLAに対して重みを付けても良い。例えば、影響度算出装置は、図3には示していないが、記憶部2内に、SLAごとの重要度を設定してもよい。例えば、影響度算出装置は、SLA_001の重要度を1として、SLA_002の重要度が0.5、SLA_003の重要度が0.3など、サービス受容者の規模などに応じてSLAに相対的な重要度を設定すればよい。そのようにしておけば、影響度算出装置は、ITサービスの不具合に対する重要性を総合的に正確に導ける。さらには、SLAは、それぞれの指標の項目に重み付けされていても良い。
 図4は、取得部3が収集し算出部4へ出力する測定データ401の一例を示す。測定データ401は、一例として、ある測定タイムスタンプにおける各監視対象CIについての応答時間、可用性を測定対象の指標としている。なお、可用性は、ITサービスの実稼動時間と計画稼働時間との比率を用いて求めることが一般的である。例では各ITサービスにおける計画稼働時間が予め設定されているものとして、取得部3は、測定に基づく稼働状況判定後、実稼働時間を算出し、そこから可用性を算出している。
 図3を参照するとSLA_001は、ITサービス01の応答時間が遵守する条件として、5秒以内を規定している。これに対し、図4の測定データ401は、ITサービス01に関する応答時間の測定値が、7秒となっており、SLA_001に違反している。この場合、7秒が5秒の140%であることから40%超過であるため、算出部4は、応答時間に関する違反値を「40」と算出できる。
 図3を参照すると、SLA_001は、ITサービス01の可用性で遵守する条件として99.9%以上を規定している。これに対し、図4の測定データ401は、ITサービス01に関する可用性が100%となっており、SLA_001に違反していない。すなわち、(SLA値)≦(実測値)となっているため、算出部4は、可用性に関する違反値を「0」と算出できる。仮に、測定データにおいてITサービス01に関する可用性が90%であった場合、(SLA値)≦(実測値)が成り立たない。そのため、算出部4は、違反値を「0」ではなく、90%が99.9%の90.1≒90%であり10%不足であるため、違反値を「10」と算出できる。
 一方、算出部4は、各指標項目について最悪の測定値を予め規定しておくことで、最悪影響度を算出できる。例えば、ITサービス01、ITサービス02、ITサービス03の最悪応答時間がそれぞれ20秒だとすると、SLA_001の最悪違反値は「300」(20秒は、5秒の300%超過)、SLA_002の最悪違反値は「100」、SLA_003の最悪違反値は「300」となる。そして、算出部4は、各SLAの重要度を違反値に乗算してその総和を影響度として算出する。図3に示したITサービス01の影響度は、そこ(ITサービス01)に紐(関連)付けられているSLAの影響度の総和とすると、40+0=40となる。また、最悪影響度は、最悪影響度の総和として、300+100=400となる。
 また、記憶部2に、ITサービスとCIとの関連情報が登録されている場合は、それら情報を用いて関連するITサービス、SLAをたどることで、算出部4は、CIに対する影響度及び最悪影響度を算出することもできる。生成部5は、算出部4から出力された算出結果を画面へ表示する。
 図5は、生成部5に基づいて生成されたグラフ画像の一例を示す図である。この棒グラフは、各ITサービスに関する影響度及び最悪影響度を示している。全体が最悪影響度、ハッチング部分が現状の影響度を示す。図5では、生成部5は、最悪影響度の大きさに基づいてITサービスをソートして表示している。なお、生成部5は、用途に応じて、現状の影響度又は最悪影響度を表示してもよい。図6では、生成部5は、ITサービスの枠組みを超えて、すべてのITサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、現状の影響度をハッチングで表示している。このような表示に基づき、生成部5は、監視対象のすべてのSLAにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
 グラフ表示の場合、生成部5は、応答時間、可用性といった監視指標ごとの影響度を図7のように個別にグラフ表示してもよいし、これら複数の監視指標における影響度を組み合わせて(例えば重み付け平均などを用いて)統一的にグラフ表示してもよい。図7では、生成部5は、あるITサービスに関する項目影響度を時系列に表示している。生成部5は、算出部4から出力されたデータをタイムスタンプに基づき集計し表示する。表示対象は、複数のITサービスであってもよいし、すべてのITサービスにおける影響度の総和であっても良い。
 図8では、生成部5は、図5と同様の情報を円グラフ表示している。図5と同様、生成部5は、最悪影響度に対する現状の影響度(ハッチング部)の割合(占有率)を、ITサービスごとに示しており、現状影響度のあるITサービスを表示対象としている。また、図9では、生成部5は、そのITサービス提供者が守るべき全SLAに対し、違反のあるSLAの割合を円グラフ表示している。
 <処理>
 次に、図1及び図10を用いて、本実施形態の処理について説明する。図1は、算出部4におけるITサービスの影響度算出処理の一例を表すフローチャートである。図10は、図1のフローチャートで参照及び算出されるデータをまとめた表である。まず、算出部4は、影響度を取得したいITサービスを特定し、そのITサービスに必要とするCIの中で、影響度の算出に必要な監視対象項目について情報を記憶部2から読み出し、さらに、その監視対象項目についての測定値を取得部3から取得する(S101)。図10では、算出部4は、サービス1001として、ITサービス01、ITサービス02を特定している。算出部4は、これらサービスに対する、監視対象1002、重要度1003、最悪測定値1004を記憶部2から読み出し、測定値1005を取得部3から取得する。
 次に、算出部4は、特定したITサービスに関連するSLAについての情報を記憶部2から読み出す。読み出すSLAは、図10における、SLA1006、条件1007、重要度1008に相当する。そして、算出部4は、各SLAの条件1007と測定値1005とを照らし合わせて、各SLAの違反値1009を算出する(S102)。算出部4は、違反値1009を、各指標のSLA契約値と測定値との差分や割合から算出しても良いし、違反(×)、遵守(○)といった二値で表現しても良い。
 次に、ITサービスのすべてのSLAの違反値に基づいて、算出部4は、ITサービスの影響度を算出する(S104)。ITサービスの影響度は、各SLAの重要度に基づいて違反値に重みを付与した重み付け総和を用いる。図10では、例として、SLA001及びSLA002は「1」、SLA003は「0.8」という重要度1008が定義されている。算出部4は、各違反値をこれらの値に乗算して総和を取ることに基づき、まず、監視対象項目ごとの影響度(項目影響度1010)を算出できる。そして、算出部4は、項目影響度1010を合算することでITサービスの影響度(サービス影響度1011)を算出できる。重要度が全SLAについて「1」であれば、影響度は、違反値の単純な総和となる。
 サービス影響度1011を算出後、算出部4は、読み出した最悪測定値1004を用いて、各SLAの最悪違反値1012を算出し、最悪違反値1012を基に項目ごとの最悪影響度1013及びITサービス全体の最悪影響度1014を算出する(S105)。最後に、生成部5が、S104及びS105で算出したITサービス影響度及びITサービス最悪影響度の結果を示す画像(図5~図9を例とした形式)を生成し、入出力部1に表示する(S106)。
 (変形例)
 なお、本実施の形態に係る情報処理装置(影響度算出装置)の各構成は、複数の構成に分かれても良い。例えば、算出部4は、1つの構成に限られず、複数の構成、例えば、違反値を算出する構成と、影響度を算出する構成に分かれても良い。また、各構成は、1つの装置に含まれず、別装置として構成してもよい。例えば、記憶部2は、ネットワークを介して接続した別の記憶装置としてもよい。また、生成部5及び入出力部1を別装置としてもよい。
 図18は、本実施に形態に係る情報処理装置(影響度算出装置)の別の構成の一例を示す図である。図18において図2と同じ構成には同じ番号を付し、詳細な説明は省略する。
 図18に示す情報処理装置は、図2と同様の取得部3と、違反値を算出する違反値算出部42と、影響度を算出する影響度算出部43とを含んでいる。なお、違反値算出部42と影響度算出部43とは、合わせて、図2に示す算出部4と同様に動作する。
 また、図18に示す情報処理装置は、記憶部2と、生成部5と、入出力部1とを、ネットワークを介して接続した別ユニットとしている。そのため、図18では、ネットワークを介して接続されたユニットを点線で示している。CIも、ネットワーク介して接続しているため、点線で示した。
 このように構成した情報処理装置(影響度算出装置)も、ネットワークを介して各ユニットと情報をやり取りし、図2に示す影響度算出装置と同様に動作できる。
 なお、図18に示す情報処理装置は、本発明の最小構成である。
 <第1実施形態の効果>
 これまで説明した情報処理装置(影響度算出装置)は、ITサービス提供者に、障害若しくは不具合等に基づいたITサービス及びCIに問題が発生した場合、SLA違反への影響をITサービス、CI、若しくは、ITシステムごとに確認するための表示を提供できる。また、情報処理装置は、このままITサービス及びCIの問題が放置されると、それぞれに対して影響度がどのくらい拡大するかの可能性をサービス提供者へ分かりやすく提示できる。
 以上のように、本実施形態の情報処理装置は、障害及び不具合等に基づくITサービス又はCIのSLA違反に関する影響を、ITサービス提供者に、知らせることができる。また、情報処理装置は、影響度算出結果をグラフ等で表示することで、ITサービス提供者に、優先的に対処するITサービス及びCIの順序を、容易に把握させることができる。特に、ITサービスにおける監視指標に関する閾値をSLAから決定する場合、本実施形態における情報処理装置は、サービス受容者ごとのITサービスに対する影響を違反値に直接的に反映することができ、影響度算出の正確さについて大きな効果が期待できる。
 つまり、あるITサービスに問題が発生した場合、本実施形態の情報処理装置は、その問題が及ぼすサービス受容者の観点での影響の大きさを算出できる。
 また、複数のITサービスに問題が発生し対処が必要となった場合に、本実施形態の情報処理装置は、ITサービスごとのSLAへの影響の大きさを算出できるため、ITサービス提供者が対処の優先順位付けをする際の参考を提供できる。
 (第2実施形態)
 図11は、第2実施形態としての影響度算出装置の構成を示すブロック図である。本実施形態は、図2に示す第1実施形態と比べて、算出部4が警告値算出部41を含む点で異なる。
 図12に本実施形態に係る記憶部2に登録されたデータの一例を示す。図3に示す第1実施形態における記憶部2の登録データ301との違いは、SLAの各指標(応答時間、可用性)において違反範囲に加えて警告範囲がデータとして存在することである。この警告範囲とは、サービス受容者とのSLA上は違反とはならないが、このまま対処なく放置しておけば違反となる可能性が高い値の範囲である。指標の性質に基づき異なるが、図12に示す例は、違反になる一つ前の段階の数値を警告範囲としている。例えば、SLA_001の応答時間は、3秒未満であれば正常、3秒以上5秒未満であれば警告(危険)、5秒以上であれば違反である。なお、SLAの違反以外の閾値は、警告を表す閾値以外に、警告に対しもう少し対処緊急度の低い危険レベルの範囲を表す危険値など、運用の状況に応じて自由に設定できる。
 算出部4は、警告値算出部41において、各SLAで設定されている警告範囲と取得部3から取得した測定値とから警告値を算出する。警告値算出部41は、測定値が警告範囲に入っているか否かを警告範囲内(○)、警告範囲外(×)の2値で表現しても良いし、警告範囲のどの位置かを25%警告等の連続値で表現しても良い。例えば、ITサービス01の応答時間が7秒であるという測定値が取得された場合、SLA_002について、警告範囲が5秒以上、10秒未満なので、警告値は、警告範囲内(○)、若しくは、(7−5)÷(10−5)×100=2/5×100=40%となる。
 各々のSLAについて、第1実施形態で求めた違反値に加えて、警告値算出部41で算出した警告値も参照することで、算出部4は、ITサービスごとに影響値を算出する。例えば、算出部4は、違反値と警告値とを重み付けをした総和を算出する。重みを、違反値は「10」、警告値は「2」、として、SLA_001及びSLA_002の違反値及び警告値を用いると、算出部4は、第1の実施形態のSLA_001の結果から、ITサービス01の影響度を、40×10+40×2=480と算出できる。
 図13は、第2実施形態での影響度算出の結果を表示した図である。生成部5は、各ITサービスに対して、違反値と警告値の大きさが分かるように表示する。例えば、生成部5は、違反値であるSLAが数の上では少しであっても強調し、表示に反映されやすくする。
 図14は、すべてのITサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、違反値に基づく影響度及び警告値に基づく影響度をハッチングで表示した例を示す図である。生成部5は、このような表示に基づき、全サービスにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
 図15は、第2実施形態での影響度算出の結果を表示した例を示す図である。生成部5は、全体のSLA数を円グラフで表現し、違反値を持つSLAの数、警告値を持つSLAの数をそれぞれ斜線、格子模様で表示する。この表示に基づき、影響度算出装置は、全SLAのうち対処の必要なSLAがどの程度存在するかを、ITサービス提供者に把握させることができる。
 図16は、第2実施形態での影響度算出の結果を表示した例を示す図である。生成部5は、違反値又は警告値が存在するITサービスを抽出し、それら違反値及び警告値の内訳を円グラフで表現している。
 図17を参照すると、本実施形態の動作は、第1の実施形態の動作と、ステップS102でSLA違反値を算出した後の動作が異なる。第2実施形態では、ステップS102でSLA違反値を算出した後、ステップS203で警告値算出部41においてSLA警告値を算出する。
 <処理>
 本実施形態における処理の流れについて、図17を用いて説明する。第1実施形態で示した図1との違いは、ステップS203及びステップS204であり、その他の処理は第1実施形態と同様であるので、ここでは説明を省略する。ステップS203では、警告値算出部41が、各SLAの条件と取得した測定値とを照らし合わせ、各SLAの警告値を算出する(ステップS203)。算出部4は、違反値、警告値から影響度を算出する(ステップS204)。
 <第2実施形態の効果>
 違反値に加えて警告値を設けてITサービス及びCIごとの影響度に反映させてサービス提供者へ提示することで、本実施形態の情報処理装置(影響度算出装置)は、現状のSLAの遵守状態のさらなる詳細な理解と、障害対処の順序を正確に判断することを支援できる。
 (他の実施形態)
 以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴をどのように組み合わせたシステム又は装置も、本発明の範囲に含まれる。
 また、本発明の実施の形態は、複数の機器から構成されるシステムに適用しても良いし、単体の装置に適用しても良い。さらに、本発明は、実施形態の機能を実現するサービス管理プログラムが、システム又は装置に、直接又は遠隔から供給されて実行される場合にも適用可能である。したがって、前述した本発明の実施の形態の各ユニットにおける機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、そのプログラムを格納した媒体、又は、そのプログラムをダウンロードさせるWWWサーバも、本発明の範囲に含まれる。また、プログラムを格納する媒体は、図2、図11、図18における記憶部であってもよい。
 この出願は、2010年1月7日に出願された日本出願2010−001968を基礎とする優先権を主張し、その開示をすべてここに取り込む。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 本発明は、運用監視分野における障害状況を正確に把握し、障害対処する用途に、好適に適用可能である。本発明は、特に、大規模システム環境下で複数の障害が同時に発生する場合に有用となる。
 1 入出力部
 2 記憶部
 3 取得部
 4 算出部
 5 生成部
 41 警告値算出部

Claims (9)

  1.  情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、
     前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、
     前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段と
     を含む情報処理装置。
  2.  前記影響度算出手段は、前記複数の条件の各々に設定された重要度を参照して、前記違反値から前記影響度を算出することを特徴とする請求項1に記載の情報処理装置。
  3.  前記複数の条件は、前記情報サービスの提供者と複数の受容者との間で、別々に同意があったサービスレベルについての異なる条件であることを特徴とする請求項1又は2に記載の情報処理装置。
  4.  前記監視対象項目に関して警告の対象となる複数の条件を前記測定値と比較して、条件違反になる可能性の高さを示す警告値を算出する警告値算出手段を更に備え、
     前記影響度算出手段は、前記違反値及び前記警告値を用いて、前記影響度を算出することを特徴とする請求項1乃至3のいずれかに記載の情報処理装置。
  5.  前記影響度算出手段で出力された前記影響度を表すグラフ画像を生成する画像生成手段を更に備えることを特徴とする請求項1乃至4のいずれかに記載の情報処理装置。
  6.  前記影響度算出手段は、
     前記測定値として考えられる最悪の値を最悪測定値とした場合に、前記複数の条件と前記最悪測定値とを比較して算出した最悪違反値を用いて、前記情報サービスが取り得る最悪の影響の度合いを最悪影響度として算出することを特徴とする請求項1乃至5のいずれかに記載の情報処理装置。
  7.  前記影響度算出手段で出力された前記影響度と前記最悪影響度とを比較したグラフ画像を生成する画像生成手段を更に備えることを特徴とする請求項6に記載の情報処理装置。
  8.  情報サービスに関連する監視対象項目について、測定値を取得し、
     前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出し、
     前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する
     サービス管理方法。
  9.  情報サービスに関連する監視対象項目について、測定値を取得する取得処理と、
     前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出処理と、
     前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出処理と
     をコンピュータに実行させるサービス管理プログラムを含む記憶媒体。
PCT/JP2010/073874 2010-01-07 2010-12-24 情報処理装置、サービス管理方法、並びにサービス管理プログラム WO2011083750A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011548980A JPWO2011083750A1 (ja) 2010-01-07 2010-12-24 情報処理装置、サービス管理方法、並びにサービス管理プログラム
US13/520,835 US20130073912A1 (en) 2010-01-07 2010-12-24 Information processing device, service management method, and service management program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010001968 2010-01-07
JP2010-001968 2010-01-07

Publications (1)

Publication Number Publication Date
WO2011083750A1 true WO2011083750A1 (ja) 2011-07-14

Family

ID=44305486

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/073874 WO2011083750A1 (ja) 2010-01-07 2010-12-24 情報処理装置、サービス管理方法、並びにサービス管理プログラム

Country Status (3)

Country Link
US (1) US20130073912A1 (ja)
JP (1) JPWO2011083750A1 (ja)
WO (1) WO2011083750A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013015292A1 (ja) * 2011-07-25 2013-01-31 日本電気株式会社 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体
JP2013200864A (ja) * 2012-02-22 2013-10-03 Ricoh Co Ltd 機器管理装置、機器管理システム及びプログラム
JP2018190205A (ja) * 2017-05-08 2018-11-29 日本電信電話株式会社 事業者間一括サービス管理装置および事業者間一括サービス管理方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170124470A1 (en) * 2014-06-03 2017-05-04 Nec Corporation Sequence of causes estimation device, sequence of causes estimation method, and recording medium in which sequence of causes estimation program is stored
JP7436146B2 (ja) * 2019-02-07 2024-02-21 日本電信電話株式会社 障害情報周知装置及び障害情報周知方法
JP7411512B2 (ja) * 2020-06-25 2024-01-11 株式会社日立製作所 生産計画システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120462A (ja) * 1997-10-14 1999-04-30 Fujitsu Ltd アラーム管理装置
JP2003242228A (ja) * 2002-01-31 2003-08-29 Currie & Brown Japan Ltd 施設運営管理システム
JP2005092886A (ja) * 2003-09-18 2005-04-07 Internatl Business Mach Corp <Ibm> ユーティリティ・コンピューティング環境の、自動アラートおよび率先リベートを伴うリアルタイム・サービス・レベル・パフォーマンス、違反、および保証された均一性を表示する方法。
JP2007529048A (ja) * 2003-07-11 2007-10-18 インターナショナル・ビジネス・マシーンズ・コーポレーション ビジネス・レベル・サービス・レベル・アグリーメントを監視し、制御するシステムおよび方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1213895B1 (en) * 2000-12-08 2007-09-05 Sony Deutschland GmbH High-level interface for QoS-based mobile multimedia applications
US7313568B2 (en) * 2004-03-31 2007-12-25 International Business Machines Corporation Generating and analyzing business process-aware modules
US7673040B2 (en) * 2005-10-06 2010-03-02 Microsoft Corporation Monitoring of service provider performance
US20070180061A1 (en) * 2006-02-02 2007-08-02 International Business Machines Corporation Methods and apparatus for interactive specification of context-sensitive sevice level agreements; for provisioning of resources required during service delivery events regulated by service level agreements; and for monitoring compliance with service level agreements during service delivery events
US7885842B1 (en) * 2006-04-28 2011-02-08 Hewlett-Packard Development Company, L.P. Prioritizing service degradation incidents based on business objectives
US8108250B1 (en) * 2007-01-05 2012-01-31 Intelligent Business Tools Method and apparatus for providing a business tool
US8423955B2 (en) * 2007-08-31 2013-04-16 Red Hat, Inc. Method and apparatus for supporting multiple business process languages in BPM
US8103535B2 (en) * 2008-01-29 2012-01-24 International Business Machines Corporation Evaluation of fitness for a contractual agreement related to provisioning information technology services

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11120462A (ja) * 1997-10-14 1999-04-30 Fujitsu Ltd アラーム管理装置
JP2003242228A (ja) * 2002-01-31 2003-08-29 Currie & Brown Japan Ltd 施設運営管理システム
JP2007529048A (ja) * 2003-07-11 2007-10-18 インターナショナル・ビジネス・マシーンズ・コーポレーション ビジネス・レベル・サービス・レベル・アグリーメントを監視し、制御するシステムおよび方法
JP2005092886A (ja) * 2003-09-18 2005-04-07 Internatl Business Mach Corp <Ibm> ユーティリティ・コンピューティング環境の、自動アラートおよび率先リベートを伴うリアルタイム・サービス・レベル・パフォーマンス、違反、および保証された均一性を表示する方法。

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013015292A1 (ja) * 2011-07-25 2013-01-31 日本電気株式会社 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体
JP2013200864A (ja) * 2012-02-22 2013-10-03 Ricoh Co Ltd 機器管理装置、機器管理システム及びプログラム
JP2018190205A (ja) * 2017-05-08 2018-11-29 日本電信電話株式会社 事業者間一括サービス管理装置および事業者間一括サービス管理方法

Also Published As

Publication number Publication date
US20130073912A1 (en) 2013-03-21
JPWO2011083750A1 (ja) 2013-05-13

Similar Documents

Publication Publication Date Title
CN112162878B (zh) 数据库故障发现方法、装置、电子设备及存储介质
WO2011083750A1 (ja) 情報処理装置、サービス管理方法、並びにサービス管理プログラム
US9471462B2 (en) Proactive risk analysis and governance of upgrade process
US9331897B2 (en) Recovery from multiple faults in a communications network
US8892960B2 (en) System and method for determining causes of performance problems within middleware systems
US8781865B2 (en) Handling consolidated tickets
Tjoa et al. A formal approach enabling risk-aware business process modeling and simulation
JP2017126363A (ja) 運用管理装置、運用管理方法、及びプログラム
WO2011099341A1 (ja) 障害原因抽出装置、障害原因抽出方法およびプログラム記憶媒体
JP2010526352A (ja) 統計的な分析を利用した性能障害管理システム及びその方法
US11610136B2 (en) Predicting the disaster recovery invocation response time
JP5768983B2 (ja) 契約違反予測システム、契約違反予測方法および契約違反予測プログラム
JP6109662B2 (ja) 運用管理装置、運用管理方法およびプログラム
CN109240863A (zh) 一种cpu故障定位方法、装置、设备及存储介质
CN115640998A (zh) 一种风险评估方法、装置、设备及存储介质
CN114338372A (zh) 网络信息安全监控方法及系统
WO2012070475A1 (ja) 情報処理装置、情報処理方法、並びに情報処理プログラム
EP2634746A1 (en) Maintenance management system, and maintenance management method
CN109766243B (zh) 一种基于幂函数的多核主机性能监控方法
Hanemann et al. A framework for service quality assurance using event correlation techniques
JP2013164668A (ja) 障害監視システム、インシデント集計方法、およびプログラム
JP5068351B2 (ja) ネットワーク評価システム、ネットワーク評価方法、及びプログラム
US20220076181A1 (en) Estimation method, estimation device, and estimation program
Hofmann et al. Vulnerability indicators for electric power grids
Gheorghe et al. Dynamic capability model

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10842261

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011548980

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 13520835

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10842261

Country of ref document: EP

Kind code of ref document: A1