JP2003263342A - Monitoring device and monitoring method and program for information processor - Google Patents

Monitoring device and monitoring method and program for information processor

Info

Publication number
JP2003263342A
JP2003263342A JP2002062138A JP2002062138A JP2003263342A JP 2003263342 A JP2003263342 A JP 2003263342A JP 2002062138 A JP2002062138 A JP 2002062138A JP 2002062138 A JP2002062138 A JP 2002062138A JP 2003263342 A JP2003263342 A JP 2003263342A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
monitoring
item
items
information processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002062138A
Other languages
Japanese (ja)
Inventor
Hiroyoshi Ueno
広義 植野
Original Assignee
Ntt Data Corp
Telecommunication Advancement Organization Of Japan
株式会社エヌ・ティ・ティ・データ
通信・放送機構
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PROBLEM TO BE SOLVED: To provide a monitoring device and a monitoring method and program for an information processor that can set a monitored item and an upper limit and lower limit of a threshold thereof even in the absence of knowledge of system management, and select a monitored item and decide a threshold in conformance to specific conditions of each information processor such as the configuration and available service use status of the information processor, and can detect a conventionally undetected abnormal state under a situation with a low load on and no failure in the information processor.
SOLUTION: The monitoring device 1 statistically selects a monitored item from among resource items in an information processor 2, and statistically decides an upper limit and lower limit of a threshold allowable for the monitored item. Whether the state of the information processor 2 is normal or abnormal is determined according to whether the value of the monitored item during normal operation of the information processor 2 is in the range of the threshold.
COPYRIGHT: (C)2003,JPO

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】この発明は、情報処理装置に係り、特に、情報処理装置の監視装置および監視方法並びにそのプログラムに関するものである。 BACKGROUND OF THE INVENTION [0001] [Technical Field of the Invention The present invention relates to an information processing apparatus, and particularly relates to monitoring apparatus and a monitoring method and program of an information processing apparatus. 【0002】 【従来の技術】従来、例えばWebサイトを開設する情報処理装置における異常状態の検知方法では、システム管理者が経験に基づいて監視対象となる情報処理装置の監視項目を選択し、監視項目から得られる値に一つの閾値を設け、その値が閾値を超えた場合にシステムが異常であると判断する方法を用いていた。 [0002] Conventionally, for example, in the method of detecting an abnormal state in the information processing apparatus to open a Web site, selects the monitoring items of the information processing apparatus by the system administrator to be monitored on the basis of experience, monitoring one threshold value is a value obtained from the item, the system if the value exceeds the threshold value has been used a method of determining as abnormal. 【0003】 【発明が解決しようとする課題】しかしながら、上述の情報処理装置の異常状態の検知方法では、監視項目の選定や閾値の決定に、システム管理者の豊富な経験や知識が必要となり、また、情報処理装置の構成や稼動しているサービスの利用状況といった情報処理装置毎に固有の条件に適合した監視項目の選定や、各監視項目における値の閾値を決定することが難しかった。 [0003] The present invention is, however, the method of detecting abnormal condition of the above-mentioned information processing apparatus, the determination of the selection and the threshold value of the monitored item, requires extensive experience and knowledge of the system administrator, Further, selection and monitoring items adapted to specific conditions for each information processing apparatus such as a usage configuration and operation to that service of the information processing apparatus, it is difficult to determine a threshold value for each monitoring item. さらに、そこで設けた閾値は情報処理装置における能力の限界を示すものであり、ハードウェア障害等の故障や高負荷状態の検知しかできなかった。 Further, where provided threshold value is indicative of the limit of the capability of the information processing apparatus, it could only detect a failure and a high load state such as a hardware failure. そこでこの発明は、システム管理者の豊富な経験や知識が必要なく、また、情報処理装置の構成や稼動しているサービスの利用状況といった情報処理装置毎に固有の条件に適合した監視項目選定や、その監視項目で得られる値に基づいた閾値の決定が可能となる機能を備え、さらに、従来では異常が検知出来なかった、情報処理装置にかかる負荷が低く故障も起きていないような状況下での異常状態を検知することが可能となる機能を備えた、情報処理装置の監視装置および監視方法並びにそのプログラムを提供することを目的としている。 Accordingly the present invention, experience and knowledge without the need for the system administrator, also monitoring items selected Ya adapted to specific conditions for each information processing apparatus such as a usage of services that constitute and operation of the information processing apparatus , a function of determining the threshold value based on the value obtained in the monitoring item is possible, furthermore, in the conventional abnormality could not be detected, a situation such as load on the information processing apparatus does not also occur malfunction low with an abnormal state becomes possible to detect a feature in, and its object is to provide a monitoring device and a monitoring method and program of an information processing apparatus. 【0004】 【課題を解決するための手段】上記目的を達成するために、本発明は、監視対象の情報処理装置とネットワークを介して接続された監視装置であって、前記情報処理装置に段階的な負荷をかける実際の利用状況を想定したワークロードでの負荷試験時に前記情報処理装置内における複数のリソース項目及びシステム性能を表す項目の実測データを収集する実測データ収集手段と、前記負荷試験における前記システム性能を表す項目と前記各リソース項目との相関係数を前記実測データ収集手段で収集した実測データに基づいて算出し、前記システム性能を表す項目との関連の強い複数のリソース項目を選出する相関係数算出手段と、前記相関係数算出手段で選出した複数のリソース項目に対して、異なる複数の分析条件毎にクラ [0004] To achieve SUMMARY OF THE INVENTION The above object, the present invention provides a connected monitor to an information processing apparatus via a network to be monitored, step to the information processing apparatus a measured data collection means for collecting measured data items representing a plurality of resource items and system performance within the information processing apparatus when the load test in actual workloads that assumes usage applying specific load, the load test the calculated based the the item representing the system performance correlation coefficient between each resource item measured data collected by the measurement data collecting means in the associated strong multiple resource items and items representing the system performance a correlation coefficient calculation means for selecting, for a plurality of resource items selected at the correlation coefficient calculating means, class for each different analysis conditions スター分析を行って複数のグループにグループ化し、さらに各グループ内のリソース項目から、異なる指標毎にグループを代表するリソース項目を選出し監視項目候補とする監視項目候補選出手段と、前記システム性能を表す項目を目的変数、前記監視項目候補選出手段において選出された前記監視項目候補を説明変数として重回帰分析を行い、結果として得られた複数の重回帰分析結果のうち最も妥当な重回帰分析結果の重回帰分析で用いられた監視項目候補を監視項目として選出する監視項目選出手段と、前記監視項目選出手段において選出した監視項目の前記実測データ収集手段で収集した実測データに基づいて前記負荷試験における負荷度合いに応じた前記監視項目の最大許容値及び最小許容値を閾値として決定する閾値決定手段と Performing star analysis grouped into a plurality of groups, further from the resource items in each group, and the monitoring item candidate selection means for monitoring field candidate elected resource items representing the group for different indicators, the system performance objective variable items representing the monitored item performs multiple regression analysis as explanatory variables elected the monitored item candidate in the candidate selection section, a plurality of the most reasonable multiple regression analysis of the multiple regression analysis result obtained as a result of and monitoring items selection means for selecting a monitoring item candidates used in multiple regression analysis as a monitoring item, on the basis of the measured data collected in the measured data collection unit of the monitoring items were selected in the monitored item selecting means tolerance tests a threshold value determining means for determining a maximum allowable value and the minimum permissible value of the monitored item in accordance with the load degree as the threshold value in 備えることを特徴とする監視装置である。 A monitoring device, characterized in that it comprises. 【0005】また、請求項2に記載の発明は、請求項1 [0005] The invention of claim 2, claim 1
に記載の監視装置において、前記情報処理装置の通常稼動時に前記監視項目毎のデータ値を収集する第1の手段と、前記第1の手段において収集した前記監視項目毎のデータ値と前記負荷数の度合いに応じた前記閾値とを比較し、前記データ値が前記閾値の範囲に収まった場合に、その閾値に対応する前記負荷数の度合いを記憶する第2の手段と、前記監視項目毎に前記第2の手段で記憶した前記負荷数の度合いを比較して、前記監視項目全てに渡って同じ前記負荷数の度合いを記憶していない場合、前記情報処理装置は異常であると判断する第3の手段とを備えることを特徴とする。 Usually the first means for collecting data value for each monitored item, the number of loads and data values ​​for each of the said monitoring items collected in the first means during operation of the monitoring device, the information processing apparatus according to comparing the threshold value corresponding to the degree of, if the data value is within the range of the threshold value, a second means for storing the degree of the number of loads corresponding to the threshold value, for each of the monitored item If the second by comparing the degree of load number stored in section, does not store the degree of the same the number of loads over all the monitored item, first determines that the information processing apparatus is abnormal characterized in that it comprises third and means. 【0006】また、請求項3に記載の発明は、監視対象の情報処理装置とネットワークを介して接続された監視装置における前記情報処理装置の監視方法において、前記情報処理装置に段階的な負荷をかける実際の利用状況を想定したワークロードでの負荷試験時に前記情報処理装置内における複数のリソース項目及びシステム性能を表す項目の実測データを収集する実測データ収集過程と、前記負荷試験における前記システム性能を表す項目と前記各リソース項目との相関係数を前記実測データ収集過程で収集した実測データに基づいて算出し、前記システム性能を表す項目との関連の強い複数のリソース項目を選出する相関係数算出過程と、前記相関係数算出過程で選出した複数のリソース項目に対して、異なる複数の分析条件毎にクラ Further, the invention according to claim 3, in the monitoring method of the information processing apparatus in connected to an information processing apparatus via a network of the monitoring object monitoring device, a stepwise load to the information processing apparatus the system performance and the measured data collection process for collecting measured data items representing a plurality of resource items and system performance in actual in the information processing apparatus when the load test of usage in the assumed workload, in the load test applying calculated on the basis of the measured data the an item correlation coefficient between each resource item collected by the actual data collection process representing the relevant strong multiple selects a resource item correlation between items representing the system performance the number calculation process, to a plurality of resource items selected at the correlation coefficient calculation process, class for each different analysis conditions ター分析を行って複数のグループにグループ化し、さらに各グループ内のリソース項目から、異なる指標毎にグループを代表するリソース項目を選出し監視項目候補とする監視項目候補選出過程と、前記システム性能を表す項目を目的変数、前記監視項目候補選出過程において選出された前記監視項目候補を説明変数として重回帰分析を行い、結果として得られた複数の重回帰分析結果のうち最も妥当な重回帰分析結果の重回帰分析で用いられた監視項目候補を監視項目として選出する監視項目選出過程と、前記監視項目選出過程において選出した監視項目の前記実測データ収集過程で収集した実測データに基づいて前記負荷試験における負荷度合いに応じた前記監視項目の最大許容値及び最小許容値を閾値として決定する閾値決定過程と Performing ter analysis grouped into a plurality of groups, from the more resources items within each group, a monitored item candidate selection process of the selected monitoring item candidate resources item representing the group for different indicators, the system performance objective variable items representing the monitored item performs multiple regression analysis the elected the monitored item candidate as explanatory variables in the candidate selection process, a plurality of the most reasonable multiple regression analysis of the multiple regression analysis result obtained as a result of and monitoring items selected process to elect as the monitoring items monitored item candidates used in multiple regression analysis, on the basis of the measured data collected by the actual data collection process of the monitoring items were selected in the monitored item selected process tolerance tests a threshold determination step of determining a maximum allowable value and the minimum permissible value of the monitored item in accordance with the load degree as the threshold value in 備えることを特徴とする監視方法である。 A monitoring method, characterized in that it comprises. 【0007】また、請求項4に記載の発明は、請求項3 [0007] The invention of claim 4, claim 3
に記載の監視方法において、前記情報処理装置の通常稼動時に前記監視項目毎のデータ値を収集する第1の過程と、前記第1の過程において収集した前記監視項目毎のデータ値と前記負荷数の度合いに応じた前記閾値とを比較し、前記データ値が前記閾値の範囲に収まった場合に、その閾値に対応する前記負荷数の度合いを記憶する第2の過程と、前記監視項目毎に前記第2の過程で記憶した前記負荷数の度合いを比較して、前記監視項目全てに渡って同じ前記負荷数の度合いを記憶していない場合、前記情報処理装置は異常であると判断する第3の過程とを備えることを特徴とする。 Usually the a first step of collecting data value for each monitored item, the number of loads and data values ​​of said each monitoring item collected in the first step during operation of the monitoring method, the information processing apparatus according to comparing the threshold value corresponding to the degree of, if the data value is within the range of the threshold value, a second step of storing the degree of the number of loads corresponding to the threshold value, for each of the monitored item If the second by comparing the degree of the load number stored in the process does not store the degree of the same the number of loads over all the monitored item, first determines that the information processing apparatus is abnormal characterized in that it comprises a third process. 【0008】また、請求項5に記載の発明は、監視対象の情報処理装置とネットワークを介して接続された監視装置において実行されるプログラムであって、前記監視装置に、前記情報処理装置に段階的な負荷をかける実際の利用状況を想定したワークロードでの負荷試験時に前記情報処理装置内における複数のリソース項目及びシステム性能を表す項目の実測データを収集する実測データ収集処理と、前記負荷試験における前記システム性能を表す項目と前記各リソース項目との相関係数を前記実測データ収集処理で収集した実測データに基づいて算出し、前記システム性能を表す項目との関連の強い複数のリソース項目を選出する相関係数算出処理と、前記相関係数算出処理で選出した複数のリソース項目に対して、 [0008] Further, an invention according to claim 5, a program executed in the connected monitor to an information processing apparatus via a network to be monitored, the monitoring device, step to the information processing apparatus a measured data collection processing for collecting the measured data items representing a plurality of resource items and system performance within the information processing apparatus when the load test in actual workloads that assumes usage applying specific load, the load test the calculated based the the item representing the system performance correlation coefficient between each resource item measured data collected by the actual data collection process in the related strong multiple resource items and items representing the system performance a correlation coefficient calculation process of selecting, for a plurality of resource items selected at the correlation coefficient calculation process,
異なる複数の分析条件毎にクラスター分析を行って複数のグループにグループ化し、さらに各グループ内のリソース項目から、異なる指標毎にグループを代表するリソース項目を選出し監視項目候補とする監視項目候補選出処理と、前記システム性能を表す項目を目的変数、前記監視項目候補選出処理において選出された前記監視項目候補を説明変数として重回帰分析を行い、結果として得られた複数の重回帰分析結果のうち最も妥当な重回帰分析結果の重回帰分析で用いられた監視項目候補を監視項目として選出する監視項目選出処理と、前記監視項目選出処理において選出した監視項目の前記実測データ収集処理で収集した実測データに基づいて前記負荷試験における負荷度合いに応じた前記監視項目の最大許容値及び最小許容値を閾値 Performing cluster analysis for each different analysis conditions were grouped into a plurality of groups, further from the resource items in each group, selected monitoring item candidate to be monitored field candidate elected resource items representing the group for different metrics and processing, the objective variable items representing the system performance, among the monitored item performs multiple regression analysis as explanatory variables elected the monitored item candidate in the candidate selection process, a plurality of resulting multiple regression analysis the most reasonable multiple regression analysis monitoring field candidate used in multiple regression analysis and monitoring items selection processing of selecting as the monitoring item, collected by the actual data collection process of the monitoring items were selected in the monitoring item selection process Found threshold the maximum allowable value and the minimum permissible value of the monitored item in accordance with the load degree of the load test based on the data して決定する閾値決定処理とを備えることを特徴とする監視プログラムである。 A monitoring program, characterized in that it comprises a threshold value determination processing for determining by. 【0009】また、請求項6に記載の発明は、請求項5 [0009] The invention of claim 6, claim 5
に記載の監視プログラムにおいて、前記情報処理装置の通常稼動時に前記監視項目毎のデータ値を収集する第1 The monitoring program according to, a collecting normally the data value for each monitored item during operation of the information processing apparatus 1
の過程と、前記第1の過程において収集した前記監視項目毎のデータ値と前記負荷数の度合いに応じた前記閾値とを比較し、前記データ値が前記閾値の範囲に収まった場合に、その閾値に対応する前記負荷数の度合いを記憶する第2の過程と、前記監視項目毎に前記第2の過程で記憶した前記負荷数の度合いを比較して、前記監視項目全てに渡って同じ前記負荷数の度合いを記憶していない場合、前記情報処理装置は異常であると判断する第3の過程とを備えることを特徴とする。 Comprising the steps of, said comparing the threshold value according to the first degree of data values ​​and the number of loads of the each monitoring item collected in the course, if the data value is within the range of the threshold, the a second step of storing the degree of the number of loads corresponding to the threshold, by comparing the degree of load number stored in each of the monitoring item in the second process, the same the over the monitored item all If you do not store the degree of load number, characterized in that it comprises a third step of determining that the information processing apparatus is abnormal. 【0010】 【発明の実施の形態】以下、本発明の一実施形態による情報処理装置の異常状態の検知方法を図面を参照して説明する。 DETAILED DESCRIPTION OF THE INVENTION The following describes the method of detecting an abnormal state of the information processing apparatus according to an embodiment of the present invention with reference to the drawings. 図1は、この発明の一実施形態による情報処理装置の異常状態検知を行う監視装置とその監視対象である情報処理装置の構成を示す図である。 Figure 1 is a diagram showing a configuration of an information processing apparatus is a monitoring device which performs an abnormal state detection of the information processing apparatus that monitored according to an embodiment of the present invention. この図において符号1は監視装置、2はWebサイトを開設する情報処理装置である。 Reference numeral 1 denotes the monitoring apparatus in this figure, 2 is an information processing apparatus to open a Web site. 【0011】次に、監視装置1の詳細な構成について説明する。 [0011] Next, the detailed configuration of the monitoring apparatus 1. 図2は監視装置1の構成を示すブロック図である。 Figure 2 is a block diagram showing the configuration of a monitoring apparatus 1. この図において11は監視対象となる情報処理装置2内のリソース項目のデータやシステム性能を表す項目のデータを受取る入出力制御手段である。 In this FIG. 11 is an input-output control means for receiving a data item representing data and system performance resource items in the information processing apparatus 2 to be monitored. ここでリソース項目とは図4で示すような内容からなる情報処理装置2内における項目であり、情報処理装置内で発生する特定の状況をデータ値で表す項目である。 Here resource items and is an item in the server 2 as the contents shown in Figure 4, is an item that represents a particular situation occurring in the information processing apparatus in the data values. 12は情報処理装置2のリソース項目の実測データを収集する実測データ収集手段である。 12 is actual measurement data collection means for collecting measured data of the resource items of the information processing apparatus 2. 13は情報処理装置2のレスポンスタイムやスループットなどのシステム性能を表す項目と各リソース項目の相関係数を算出する相関係数算出手段である。 13 is the correlation coefficient calculating means for calculating an item and the correlation coefficient for each resource item representing the system performance such as response time and throughput of the information processing apparatus 2. ここで相関係数とは対となるデータの関係性を評価する係数で、−1〜+1の間の数値となり、絶対値が0.7以上であるときに対となるデータどうしが強い相関にあるということを示している。 A factor for evaluating the relationship of the data to be paired and wherein the correlation coefficient becomes a value between -1 to +1, the paired data each other is a strong correlation when the absolute value is 0.7 or more It shows that there. 相関係数算出手段はまた、得られた相関係数の値から、システム性能を表す項目と弱い相関関係にあるリソース項目を監視対象から除くことを決定する。 Correlation coefficient calculating means also from the obtained value of the correlation coefficient, determines that with the exception of resource item in the items and a weak correlation representing the system performance from the monitor. 【0012】14は相関係数算出手段13において選定した複数のリソース項目をクラスター分析という統計的分析手法を用いて複数のグループにグループ化し、それぞれのグループを代表するリソース項目をまとめて監視項目候補として選出する監視項目候補選出手段である。 [0012] 14 is grouped into a plurality of groups using a statistical analysis method that a plurality of the resource items cluster analysis was selected in the correlation coefficient calculation unit 13, monitored item candidates together resource items representing each group a monitoring item candidate selection means for selecting as.
15は監視項目候補選出手段14において選出した複数の各監視項目候補を説明変数、システム性能を表す項目を目的変数として、統計的分析手法である重回帰分析を実施し、この分析結果に基づいて最終的な監視項目を選出する、監視項目選出手段である。 15 each of the plurality of monitored items candidate explanatory variables were selected in the monitoring field candidate selecting means 14, the objective variable items representing system performance, conduct multiple regression analysis is a statistical analysis technique, based on this analysis result elect a final monitoring items is a monitoring item selection means. 16は監視項目選出手段15によって選出した監視項目に基づいて得られる実測データの最大許容値と最小許容値を算出し、算出した最大許容値と最小許容値を監視項目の閾値と決定する閾値決定手段である。 16 calculates the maximum allowable value and the minimum allowable value of the actual measurement data obtained on the basis of the monitoring items were selected by monitoring items selecting means 15, the maximum allowable value and the minimum allowable value threshold to a threshold decision to determine the monitoring items calculated it is a means. 17は閾値決定手段16で得られた監視項目の閾値と、情報処理装置2の実稼動中の各監視項目のデータとに基づいて、情報処理装置2の正常状態もしくは異常状態を判断する異常状態検知手段(上述の第1の手段及び第2の手段及び第3の手段)である。 17 is the basis of the threshold value of the monitoring items obtained by the threshold determination unit 16, the data of each monitored item is live information processing apparatus 2, the abnormal state determining normal state or abnormal state of the information processing apparatus 2 detecting a section (first and second means and the third means described above).
18は情報処理装置2から得られるリソース項目や監視項目のデータを記憶し、監視装置1の各手段で得られるデータを記憶する情報記憶部である。 18 is a data storage unit for storing the data of the resource items and monitoring items obtained from the information processing apparatus 2, and stores the data obtained by the means of the monitoring device 1. 【0013】次に、上述した監視装置1の動作を図1〜 [0013] Next, FIG. 1 to the operation of the monitoring apparatus 1 described above
図25を参照して説明する。 Referring to FIG. 25 will be described. 図3は監視装置1における情報処理装置2の監視方法の手順を示すフローである。 Figure 3 is a flowchart showing the procedure of a monitoring method of an information processing apparatus 2 in the monitoring apparatus 1.
図4は監視装置1が情報処理装置2内における監視対象データとして取得するリソース項目の一覧を示す図である。 Figure 4 is a chart showing a list of resource items that monitoring device 1 is obtained as monitored data in the information processing apparatus 2. 【0014】まず、情報処理装置2の異常状態検知を行うためには、情報処理装置2の実際の稼動状況を想定した負荷試験を行い、異常状態の判定指標の元となる情報処理装置2内の監視項目を選出する。 [0014] First, in order to perform the abnormal state detection of the information processing apparatus 2 performs a load test assuming the actual operating conditions of the information processing apparatus 2, the original determination indicator of the abnormal state information processing apparatus 2 elect of monitoring items. 図3より、負荷試験の際に監視装置1の実測データ収集手段12が情報処理装置2内の全リソース項目の実測データを収集し、その実測データを情報記憶部18で保存する(ステップS Than 3, measured data collection unit 12 of the monitoring apparatus 1 during the load test collects measured data of all resources items in the information processing apparatus 2, and stores the measured data in the information storage unit 18 (step S
1)。 1). 情報処理装置2内のリソース項目は図4の一覧の例に示すように複数存在している。 Resource items in the information processing apparatus 2 there are a plurality as shown in the example of the list of FIG. この負荷試験においては、情報処理装置2に対して負荷数10から150まで段階的に負荷を上げて試験を行う。 In this load test, the test is conducted raised stepwise load from the load number 10 to the information processing apparatus 2 to 150. 負荷数とは、この負荷試験においては情報処理装置2にアクセスする人数を表しており、負荷試験により図4に示す各リソース項目の実測データを得ることができる。 A load number represents the number of people to access the information processing apparatus 2 in this load test, it is possible to obtain the measured data for each resource items shown in FIG. 4 by the load test. 図5は負荷試験における各リソース項目の実測データを表示する一覧である。 Figure 5 is a list that displays the measured data of each resource item in the load test. 図5の一覧で示す各リソース項目の実測データは情報記憶部18に保存される。 Measured data of each resource items shown in the list of FIG. 5 is stored in the information storage unit 18. 【0015】次に監視装置1の相関係数算出手段13は実測データ収集手段12で得た各リソース項目と、システム性能の項目となる情報処理装置2の負荷試験におけるレスポンスタイムとの相関係数を算出し、絶対値の値が低いリソース項目を、システム性能との関連が弱い項目となるため監視対象から除く(ステップS2)。 [0015] Then the correlation coefficient of the correlation coefficient calculating means 13 of the monitoring device 1 and each resource item obtained by the actual measurement data acquisition unit 12, a response time in the load test of the server 2 as the item of the system performance is calculated, excluding the absolute value of the value is low resource items, from a monitored for the associated weak items of system performance (step S2). レスポンスタイムとは、負荷試験において仮想的なユーザーの、情報処理装置2に対する処理要求に対するレスポンスタイムのことである。 The response time, the virtual user in the load test, is that the response time to the processing request to the information processing apparatus 2. 相関係数の算出は、 【数1】 The calculation of the correlation coefficient, [number 1] の式によって求める。 Determined by the formula. この式において、xはシステム性能の項目であるレスポンスタイムを表し、yはリソース項目を表しており、レスポンスタイムに対応した各リソース項目の相関係数が相関係数算出手段13によって算出される。 In this formula, x is represents a response time is an item of the system performance, y represents a resource item, the correlation coefficient of each resource item corresponding to the response time is calculated by the correlation coefficient calculating means 13. 図6はレスポンスタイムおよび各リソース項目の相関係数を算出した結果を示す表である。 6 is a table showing a result of calculating the response time and the correlation coefficient for each resource item. 図6において#DIV/0! In FIG. 6 # DIV / 0! という表記は、特定のリソース項目の実測データが、負荷数が変化しても一定だったために、相関係数算出でエラーとなった事を示している。 Notation, measured data of a particular resource items, because the number of loads was constant change, indicating that caused the error in the correlation coefficient calculation called. 【0016】相関係数算出手段13によって算出した相関係数は一般的に絶対値が0.7以下であった場合、対象となる2つの項目の関連が弱いと判断される。 The correlation coefficient calculated by the correlation coefficient calculating means 13 if generally the absolute value was 0.7 or less, related two items of interest is determined to be weak. よって、相関係数算出手段13はここで、相関係数の絶対値が0.7以下となったリソース項目を監視対象の候補から除き、残ったリソース項目を監視対象の候補として選出する。 Thus, where the correlation coefficient calculating means 13, except for the absolute value of the resource item becomes 0.7 or less of the correlation coefficient from the monitored candidates, selects the remaining resource item as a candidate to be monitored. 図7はレスポンスタイムと各リソース項目との相関係数の算出結果を示す図である。 Figure 7 is a graph showing the calculation result of the correlation coefficient between the response time and each resource item. この図において、 In this figure,
avm(アクティブな仮想ページ)は相関係数の絶対値が0.7以下であるため、監視対象の候補から除外されることとなる。 avm the absolute value of (active virtual page) correlation coefficient is 0.7 or less, and be excluded from the monitoring target candidate. 他の符号aの欄に表示するリソース項目が監視対象の候補となる。 Resource items displayed in the column of the other code a is monitored candidates. ここで図7においては、po Here in FIG. 7, po
(1秒あたりのページアウトされたページ数)とde (The number of pages that have been paged out per second) and de
(予想される短期メモリ不足)の2つのリソース項目は相関係数の算出時にエラーとなったため、除外されている。 Two resource items (short term memory shortage is expected) because of the error in calculating the correlation coefficient, are excluded. 【0017】次に、監視装置1の監視項目候補選出手段14はステップS2で選出した監視対象の候補となったリソース項目に対してクラスター分析を実施し、リソース項目の中で関連の強いリソース項目同士をグループ化し、各グループの中からグループを代表するリソース項目を監視項目候補として選出する(ステップS3)。 Next, monitored item candidate selection unit 14 of the monitoring apparatus 1 is a cluster analysis performed on the resource items were monitored candidate selected at step S2, related strong resource items in a resource item each other to group and selects the resource items representing the group as a monitoring field candidate from among each group (step S3). クラスター分析は以下の統計処理で実施される。 Cluster analysis is performed in the following statistical processing. 1:相関係数の算出に基づいた項目間距離を算出する2:階層的手法による樹形図(トリー)を作成する3:クラスター(グループ)化を行う。 1: 2 to calculate the entry distance based on the calculation of the correlation coefficient: 3 to create a hierarchical approach dendrogram by diagram (tree) performing cluster (group) of. 4:各クラスター(グループ)における代表のリソース項目を決定する。 4: to determine the representative of the resource items in each cluster (group). 【0018】上述の統計処理で実施されるクラスター分析の結果を図8及び図9に示す。 [0018] shown in FIGS. 8 and 9 the results of the cluster is carried out in the above-described statistical process analysis. 図8はウォード法を用いてクラスター数を3と設定した場合のクラスター分析結果である。 Figure 8 is a cluster analysis result of setting three the number clusters using Ward's method. 図9はウォード法を用いてクラスター数を4と設定した場合のクラスター分析結果である。 Figure 9 is a cluster analysis result of setting four the number clusters using Ward's method. 相関係数の算出に基づいた項目間距離の算出は図8の8a及び図9の9aに示している。 Calculating scores of distance based on the calculation of the correlation coefficient are shown in 9a of 8a and 9 in Figure 8. そして、この項目間距離の算出により、クラスター分析樹形図(図8の8b及び図9 Then, by the calculation of the inter-item distance, cluster analysis tree diagram (8b and Figures 8 9
の9b)を作成する。 To create a 9b). グループ間の距離計算方法はウォード法によって算出する。 Distance calculation method between groups is calculated by Ward's method. 【0019】尚、クラスター分析は分析条件として、クラスター数及びグループ間の距離計算方法の2条件を設定して実施されるが、クラスター数を3〜6までの4通りで設定し、また、グループ間の距離計算方法はウォード法、群平均法、最長距離平均法の3通りで設定してクラスター分析を実施する。 [0019] Incidentally, as a cluster analysis analysis conditions, but is implemented by setting the two conditions of a distance calculation method between the clusters and the number of groups, set the number of clusters in quadruplicate to 3-6, The group the distance calculation method is Ward method between, group average method, and set in three different maximum distance average method implementing the cluster analysis. よって、全部で12通りのクラスター分析結果が得られることとなる。 Therefore, so that the obtained cluster analysis of 12 kinds in total. 図8及び図9 Figures 8 and 9
はそのうちの2例を示すものである。 It shows a them two cases. 図8及び図9で示す各クラスター分析結果において、8c及び9cはクラスター規模表であり、クラスター分析樹形図8b及び9 8 and in each cluster analysis result shown in FIG. 9, 8c and 9c are clustered scale table, cluster analysis tree diagram 8b and 9
bより、クラスター数を3または4と設定すると、これにより、各クラスターにおける件数とリソース項目の割合を導き出すことができる。 Than b, and sets the number of clusters 3 or 4 and, thereby, it is possible to derive the ratio of the number and resource items in each cluster. また、8d及び9dはクラスター別項目名であり、各クラスターにおけるリソース項目の項目名を表示している。 In addition, 8d and 9d is a cluster by item name, it is displaying the item name of the resource items in each cluster. 【0020】次に、12通りのクラスター分析の各結果より、監視項目候補選出手段14は各クラスター中の複数のリソース項目から、クラスターを代表するリソース項目を選出し、各クラスターの代表するリソース項目を全てを監視項目候補とする。 Next, from each result of the cluster analysis of the 12 kinds, monitored item candidate selection means 14 from a plurality of resource items in each cluster, elected resource items representative of the cluster, the representative resource items in each cluster the all the monitoring item candidate. ここにおいて、各クラスターにおける監視項目候補の選出は手順の簡略化を図るために「グループ内中央値による選択方法」と「相関係数の絶対値による選択方法」の2通りの選択方法を用いる。 Here, selection of the monitoring field candidate in each cluster using two different selection methods of "selection method according to the median group", "an absolute value by the selection method of the correlation coefficient" in order to simplify the procedure. よってクラスター分析における12通りの分析結果に基づいて、監視項目候補の選出を上述の2通りの選択方法を用いて選出するので、合計で24通りの監視項目候補のグループが選出されることとなる。 Therefore, based on the analysis of 12 types of cluster analysis, since the selection of the monitoring field candidate selects using selection two ways described above, so that the group of monitored items candidates 24 kinds in total is elected . ここで、「グループ内中央値による選択方法」とは、グループ(クラスター)内で他項目との相関係数和が最も高いことから、他項目との距離が近く、グループの中央に位置する項目を選択する方法である。 Here, "selection method according to group the median", since it is the highest correlation coefficient sum of the other items in a group (cluster), the distance between the other items nearby, located in the center of the group items it is a method of selecting a. また、「相関係数の絶対値による選択方法」とは、グループ(クラスター)内でシステム性能を表す項目との関連が最も強い項目を選択する方法である。 Further, the "selection method according to the absolute value of the correlation coefficient", associated with the item representing the system performance in a group (cluster) is a method of selecting the strongest fields. 【0021】図10で示す、クラスター数3の場合の代表項目10a及びクラスター数4の場合の代表項目10 [0021] shown in Figure 10, a representative item 10 in the case of the representative items 10a and cluster number 4 in the case of a cluster number 3
bは、24通りのクラスター分析結果での代表のリソース項目選出におけるうちの2つの例であり、これは、図8及び図9で示したクラスター分析の結果から「相関係数の絶対値による選択方法」を用いて代表のリソース項目を選出した代表リソース項目を示している。 b are two examples of out in a representative selection of the resource items in the cluster analysis result of the 24 ways, this is selected by the absolute value of the "correlation coefficient from the results of the cluster analysis as shown in FIGS. 8 and 9 using the method "shows a representative resource items that elected representatives of the resource item. ウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた監視項目候補は図10の10aより、c Monitoring item candidate based on the result of the cluster analysis a cluster number 3 using Ward's method than 10a in FIG. 10, c
s及びInPackets及びBufferHitRa s and InPackets and BufferHitRa
tioの3つである。 There are three of tio. またウォード法を用いてクラスター数4でクラスター分析を実施した結果に基づいた監視項目候補は図10の10bより、cs及びInPack The monitoring field candidate based on results of performing cluster analysis on a cluster number 4 using Ward's method than 10b in FIG. 10, cs and InPack
ets及びpi及びBufferHitRatioの4 4 of ets and pi and BufferHitRatio
つである。 One is is. 【0022】次に、監視装置1の監視項目選出手段15 [0022] Next, the monitoring device 1 monitoring item selection means 15
は、監視項目候補選出手段14が選出した各グループ(クラスター)を代表するリソース項目(監視項目候補)を説明変数、システム性能を表す項目であるレスポンスタイムを目的変数として重回帰分析を実施し、この結果より最も妥当性の高い監視項目を選出する(ステップS4)。 Was performed multiple regression analysis described resource item monitoring item candidate selection means 14 is representative of each group were selected (clusters) (monitored item candidate) variable, the response time is an item representing the system performance as a dependent variable, elect a high monitoring item most relevance from this result (step S4). 重回帰分析はステップS3において得られた24通りの結果全てに基づいて実施されるので、重回帰分析の結果も24通りとなり、この24通りの結果の中から情報処理装置2の状態を監視するのに最も妥当性の高い監視項目を選出することとなる。 Since multiple regression analysis is performed based on all the results of 24 types obtained in step S3, the result of the multiple regression analysis also becomes 24 ways to monitor the state of the information processing apparatus 2 in the result of the 24 types and thus to elect a high monitoring item of most relevance to. 【0023】重回帰分析は、以下の統計処理により実施を行う。 The multiple regression analysis is performed to implement the following statistical processing. 1:基本統計量の算出2:変数相互の相関行列の算出3:重回帰式を求める4:分散分析表の作成5:理論値・予測値を算出する6:区間推定を行う7:実績値・理論値グラフを作成する上記の処理による重回帰分析結果のうちの2つを図11 1: Calculation of basic statistics 2: Calculation of variable cross-correlation matrix 3: 4 obtain a multiple regression equation: Creating ANOVA table 5: 6 calculates the theoretical value, the predicted value: 7 performs interval estimation: actual value · creating a theoretical graph of regression analysis results of the above process two 11
〜図20に示す。 Shown in to 20. 図11〜図15はウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた重回帰分析結果(1)〜(5)である。 11 to 15 are multiple regression analysis based on the result of the cluster analysis a cluster number 3 using Ward's method (1) to (5). 図16〜図20はウォード法を用いてクラスター数4でクラスター分析を実施した結果に基づいた重回帰分析結果(1)〜 16 to 20 multiple regression analysis based on the result of the cluster analysis a cluster number 4 using Ward's method (1) -
(5)である。 Is (5). 【0024】ステップS4において、重回帰分析の結果から最も妥当性の高い監視項目を選出するが、これは重回帰分析結果である重回帰式の検定結果を以下の手順のように比較することにより行う。 [0024] In step S4, by but selects the most appropriate highly monitoring item from the results of the multiple regression analysis, which is to compare the test results of the multiple regression equation is multiple regression analysis as follows do. (1)説明変数同士の関連が高いために重回帰式が正確でないことを示す多重共線性が発生しているか、していないかを確認し、多重共線性が発生している場合は、該当する説明変数のリソース項目は監視項目に適していないとみなす。 (1) or multicollinearity the multiple regression equation to relevant high explanatory variables to each other indicating that it is not correct is generated, and check it for, if multicollinearity is occurring, the appropriate resource item explanatory variables that are regarded as not suitable for monitoring items. (2)多重共線性が発生していない重回帰式で、重回帰式の分析制度を示す自由度修正済み決定係数の値が最も高い重回帰式の説明変数であるリソース項目が、最もシステムを監視するのに適しているとみなすが、ここで手順を簡略する観点から、自由度修正済み決定係数の値が0.8より小さい場合は、重回帰式の分析制度が悪いとみなし、監視項目に適していないとみなす。 (2) In multiple regression equation multicollinearity has not occurred, the resource value of the item flexibility corrected coefficient of determination indicating the analysis system of the multiple regression equation is the highest explanatory variables multiple regression equation, the most system Although considered to be suitable for monitoring, if where the procedure from the viewpoint of simplified, smaller values ​​of freedom corrected coefficient of determination is 0.8, regarded as analytical systems multiple regression equation is poor, monitored item It regarded as not suitable to. 【0025】上記の手順に従って、ステップS4において、ウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた3つの監視項目候補が、重回帰分析結果により、監視項目として適しているかどうかを判断する。 [0025] according to the procedure described above, whether in the step S4, 3 one monitoring item candidate based on the result of the cluster analysis a cluster number 3 using Ward's method is, by multiple regression analysis, are suitable as the monitoring item the judges. 上記の監視項目の選出手順(1)及び(2)を用いると、まず、図12における[重回帰式] With selection procedure (1) and (2) of the monitoring items, firstly, [regression equation] in FIG. 12
の「符号チェック」欄にチェック(×印)が付いていないため多重共線性が発生していないことが判る。 It can be seen that multicollinearity for checking the "code check" column (× mark) is not attached to does not occur. このことから、図10の10aで示す、ウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた3つの監視項目候補は、監視項目として適していると判断することができる。 Therefore, shown in 10a of FIG. 10, three monitoring items candidates based on results of performing cluster analysis on a cluster number 3 using Ward's method, it can be determined to be suitable as a monitored item. 【0026】また、ウォード法を用いてクラスター数4 [0026] In addition, cluster number 4 using the Ward's method
でクラスター分析を実施した結果に基づいた4つの監視項目候補が、重回帰分析結果により、監視項目として適しているかどうかを判断する。 Four monitoring item candidate based on the result of the cluster analysis in the, by multiple regression analysis, to determine whether suitable as monitor items. この場合、同様に、上記の監視項目の選出手順(1)及び(2)を用いると、図17における[重回帰式]の「符号チェック」欄にチェック(×印)が付いているため、多重共線性が発生していることが判るので、監視項目として適していないと判断することができる。 In this case, likewise, the use of selection procedures (1) and (2) of the monitoring items described above, since there is a check (× ​​mark) in "code check" column of the regression formula] in FIG. 17, since it can be seen that multicollinearity occurs, it can be determined that no suitable as monitor items. 【0027】上述の重回帰分析結果による監視項目の選出は、24通りのクラスター分析結果について全て行われる。 The selection of the monitoring items by multiple regression analysis described above is performed for all the cluster analysis result of the 24 ways. そして、複数の監視項目候補グループ(クラスター)が、監視項目として適していると判断された場合、 Then, when a plurality of monitored items candidate group (cluster) is determined to be suitable as a monitored item,
その監視項目候補のグループ(クラスター)における重回帰分析結果の自由度修正済み決定係数の値を比較し、 Comparing the values ​​of freedom corrected coefficient of determination of multiple regression analysis in group (cluster) of the monitoring item candidate,
値が最も高い監視項目候補のグループ(クラスター)を監視項目として決定する。 Value is determined as the monitoring item with the highest monitoring field candidate groups (clusters). 自由度修正済み決定係数は、 Degree of freedom corrected coefficient of determination,
図13及び図18の[精度]に表示している。 Are displayed in the Precision in FIGS. 13 and 18. 尚、最終的にこの自由度修正済み決定係数の値が、0.8以下であった場合には精度が低いと判断し監視項目には適さないと判断することとなる。 Note finally the value of the degrees of freedom corrected coefficient of determination, and thus to determine that the case was 0.8 or less not suitable for monitoring item is determined to be low accuracy. 図10の10aで示す、ウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた3つの監視項目候補における重回帰式分析結果は、図11の[精度]の自由度修正済み決定係数の値が0.8以上のため、この点においても監視項目として適していると判断することができる。 Indicated by 10a in FIG. 10, a multiple regression equation analysis in three monitoring items candidates based on results of performing cluster analysis on a cluster number 3 using Ward's method results, freedom corrected determination of the Accuracy of 11 since the value of the coefficient is 0.8 or more, it can be determined that are also suitable as monitor items in this respect. 【0028】ここで、情報処理装置2の異常状態検知を行うための、異常状態の判定指標の元となる情報処理装置2内の監視項目を決定することができた。 [0028] Here, to perform an abnormal state detection of the information processing apparatus 2, it was possible to determine the monitoring items in the server 2 as the original determination indicator of abnormal state. よってこの監視項目を用いて情報処理装置2の異常状態検知を行う。 Therefore an abnormality state detection of the information processing apparatus 2 by using the monitoring items. 図10の10aで示す、ウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた3 Indicated by 10a in FIG. 10, based on the result of the cluster analysis a cluster number 3 using Ward's method 3
つのリソース項目(cs、InPackets、Buf One of the resource item (cs, InPackets, Buf
ferHitRatio)を監視項目とする。 ferHitRatio) is referred to as monitoring items. 【0029】次に、監視装置1は情報処理装置2の閾値決定手段17において、ステップS4で選出した各監視項目のステップS1で得られた実測データ値から、偏差値算出の統計手法を用いて監視項目の負荷度合い毎に最大許容値と最小許容値を算出し、算出した最大許容値及び最小許容値を閾値として決定する。 Next, the threshold determination unit 17 of the monitoring apparatus 1 is an information processing apparatus 2, from the measured data obtained in step S1 each monitoring item selected at step S4, using statistical techniques deviation calculation It calculates the maximum allowable value and a minimum allowable value for each load degree of monitoring item, to determine the maximum allowable value and the minimum permissible value calculated as a threshold. またその最大許容値及び最小許容値を閾値として保持するテンプレートを作成する(ステップS5)。 Also to create a template to hold the maximum allowable value and the minimum allowable value thereof as a threshold value (step S5). 閾値となる最大許容値及び最小許容値の算出は以下の数式によって行われる。 Calculation of maximum permissible value and the minimum allowable value as a threshold value is performed by the following equation. また最大許容値及び最小許容値を算出する際の信頼度は95 Also reliability when calculating the maximum allowable value and the minimum permissible value 95
%として計算を行う。 The calculation is carried out as a percentage. 【数2】 [Number 2] 【数3】 [Number 3] 【0030】図21はステップS1で得られた実測データに基づくcs、InPackets及びBuffer FIG. 21 is based on actual measurement data obtained in step S1 cs, InPackets and Buffer
HitRatioの負荷数の度合い毎における最大許容値と最小許容値の算出結果である。 A calculation result of the maximum permissible value and the minimum limit for each degree of the number of loads HitRatio. そして、これが最大許容値及び最小許容値の閾値テンプレートとなり、このテンプレートに基づいて監視装置1は各監視項目における異常状態を検知する。 And this is a threshold template of the maximum allowable value and the minimum allowable value, the monitoring device 1 based on this template to detect an abnormal state in each monitoring item. また、この閾値テンプレートの情報が閾値決定手段17によって情報記憶部18に書き込まれ保持される。 The information of the threshold template is written in the information storing section 18 by the threshold determining means 17 is maintained. ステップS5における閾値テンプレートの作成により、異常状態検知装置1は情報処理装置2の異常状態を検知可能となる。 The creation of the threshold template in step S5, the abnormal condition detecting apparatus 1 is allowed detects an abnormal state of the information processing apparatus 2. 【0031】次に、監視装置1は情報処理装置2の通常稼動時の異常状態を検知するため、入出力制御手段11 Next, since the monitoring apparatus 1 to detect an abnormal condition during normal operation of the information processing apparatus 2, the input-output control means 11
を介して情報処理装置2を監視する。 Monitoring the information processing apparatus 2 via the. ここで監視装置1 Here monitoring apparatus 1
の異常状態検知手段18は、情報処理装置2の各監視項目の実測値と、ステップS5において記憶情報部18に保存した閾値テンプレートの情報を比較して、実測値が最大許容値と最小許容値内に収まった場合、その最大許容値と最小許容値に対応する負荷数を許容負荷数とする。 Abnormal condition detection means 18, the measured values ​​of the monitoring items of the information processing apparatus 2, by comparing the information of threshold template stored in the storage information unit 18 in step S5, the measured value is the maximum allowable value and the minimum allowable value If subsided within, the number of loads corresponding to the maximum allowable value and the minimum allowable value and the allowable number of loads. そして、閾値テンプレートにおける全ての監視項目において許容負荷数を確認し、全監視項目に渡って重複する許容負荷数が存在する場合は、情報処理装置2は正常であると判断し、全監視項目間に渡って重複許容負荷数がない場合は、情報処理装置2は異常状態であると判断する(ステップS6)。 Then, check the number of allowable load in all the monitoring items at the threshold template, if allowable load number that overlap over the entire monitoring item is present, it determines that the information processing apparatus 2 is normal, among all the monitoring items If there is no overlap permitted number of loads over, it is determined that the information processing apparatus 2 is in an abnormal state (step S6). 【0032】図22はステップS6において異常状態検知手段17が情報処理装置2の異常状態を検知する際の処理フローである。 [0032] FIG. 22 is a flowchart of processing when the abnormal state detecting means 17 in step S6 to detect an abnormal condition of the information processing apparatus 2. まず、異常状態検知手段17が情報処理装置2の監視を始め、情報処理装置2の稼動時における各監視項目の実測値を検出した後、情報記憶部18 First, start monitoring the abnormal state detection means 17 of the information processing apparatus 2, after detecting the actual value of each monitored item at the time of operation of the information processing apparatus 2, the information storage section 18
に記憶する閾値テンプレートにおいて、各監視項目の中で実測値と比較していない監視項目が残っているかどうかを確認する(ステップS7)。 In threshold template to be stored in, to see if there are any remaining monitor items that have not compared with the measured values ​​in each monitoring item (step S7). 【0033】ここで、異常状態検知手段17は、得られた実測値を閾値テンプレートと比較するのが初回なので、当然、全ての監視項目は実測値と比較されないで残っていることになる。 [0033] Here, the abnormal state detecting means 17, because a first time to compare actual measurement values ​​obtained with the threshold template, of course, all the monitoring items will be remaining without being compared with the measured values. よって、異常状態検知手段17は一つ目の監視項目のcsを閾値テンプレートから取り上げ(ステップS8)、各負荷数に対応した閾値と実測値とで比較してないものが残っているかどうかを確認する(ステップS9)。 Accordingly, the abnormal state detecting means 17 picks up cs monitoring items First from the threshold template (step S8), and check whether more those not compared with the threshold and the actual measurement values ​​corresponding to each number of loads (step S9). ステップS7において比較していない監視項目が残っていない場合は、異常様態検知手段1 If there are no more monitoring items not compared in step S7, the abnormality aspect detecting means 1
7は処理を終了する。 7, the process is terminated. また、ステップS9において一つの監視項目において実測値と比較する各負荷数に対応する閾値が残っていない場合、次の監視項目について実測値と閾値とを比較するために、ステップS7に処理が戻ることとなる。 Also, if there are no remaining threshold value corresponding to each load number to be compared with the measured values ​​in one monitored item at step S9, in order to compare the measured value with the threshold for the next monitoring item, the process returns to step S7 and thus. 【0034】ステップS9においては、当然、監視項目であるcsの実測値と各負荷数に対応する閾値とを比較するのが初回なので、全ての負荷数における閾値と実測値との比較結果が得られずに残っている。 [0034] In step S9, of course, since for comparing the threshold value corresponding to the measured values ​​and the number of loads cs is monitoring item is the first time, a result of comparison between the threshold and measured values ​​for all load number obtained It remains to be. よって異常状態検知手段17は、次に、負荷数10の場合の最大許容値と最小許容値による閾値を確認し、情報処理装置2で得られたcsの実測値がこの範囲内に含まれているかどうかを判断する(ステップS10)。 Therefore the abnormal condition detector 17, then, check the threshold by the maximum allowable value and the minimum permissible value when the load number 10, the measured value of cs obtained in the information processing apparatus 2 is included within this range whether judged there (step S10). ここで、ステップS10においてcsの実測値が負荷数10における最大許容値と最小許容値の範囲に含まれていない場合、ステップS9の処理に戻り、次の負荷数の最大許容値と最小許容値による閾値の範囲に実測値が含まれていないかどうかを判断することとなる。 Here, if the measured value of cs in step S10 is not in the range of the maximum allowable value and the minimum limit for load number 10, the process returns to step S9, the maximum allowable value and the minimum allowable value of the next number of loads and thus to determine whether they contain a measured value to the range of the threshold value by. 【0035】ステップS10においてcsの実測値が最大許容値と最小許容値による閾値の範囲に含まれていた場合、異常状態検知手段17は閾値テンプレートの該当する許容負荷欄をマーキングする(ステップS11)。 [0035] If the measured value of cs at step S10 is included in the range of the threshold value by the maximum allowable value and a minimum allowable value, the abnormal state detecting means 17 for marking the corresponding allowable load column threshold template (step S11) .
ここで、各監視項目の各負荷数に対応する閾値テンプレート上の欄を許容負荷欄と呼ぶ。 Here, it referred to the column of the threshold templates corresponding to each number of loads each monitored item and allowable load column. このマーキングは当然、情報として情報記憶部18において保存される。 The marking of course, is stored in the information storage section 18 as information. この様にステップS7からステップS11の処理を行うことにより、異常状態検知手段17は、情報記憶部18で記憶する閾値テンプレートにおいて、負荷数に対応する閾値の範囲に、実測値として得られた各監視項目の値が含まれているかどうかを一つずつ確認していく。 By performing the processing in step S11 from the step S7 in this manner, the abnormal state detecting means 17, the threshold template stored in the information storage unit 18, each in the range of the threshold value corresponding to the number of loads, was obtained as measured values whether it contains the value of the monitoring items go one by one check. 【0036】次に、ステップS6において異常状態検知手段17は情報記憶部18に記憶する閾値テンプレートの情報におけるマーキングをチェックする。 Next, the abnormal state detecting means in step S6 17 checks marking the information of threshold template to be stored in the information storage unit 18. 図23は異常状態検知手段17による閾値テンプレートのマーキングチェック処理フローを示す図である。 Figure 23 is a diagram showing a marking check processing flow threshold template by the abnormal state detection means 17. 異常状態検知手段17は、情報記憶部18に記憶する閾値テンプレートの情報から負荷数に対応した各監視項目の閾値を取り上げ、各監視項目の実測値が、その閾値の最大許容値と最小許容値内に収まったことを示すマーキングが許容負荷欄に行なわれたかどうかを判断する(ステップS1 Abnormal state detection means 17 picks up the threshold of each monitoring items corresponding to the number of loads from the information of threshold template to be stored in the information storage unit 18, the measured values ​​of the monitoring items, the maximum allowable value and the minimum allowable value of the threshold marking indicating that falls within it is determined whether or not conducted in the allowable load column (step S1
2)。 2). 最初に負荷数10の場合の全監視項目における許容負荷欄にマーキングがされているかどうかを確認する(ステップS13)。 First check whether it has been the marked allowable load column in all monitored items in the case of load number 10 (step S13). ここで負荷数10に対応する許容負荷欄にマーキングがされていないので、異常状態検知手段17は次に、実測値と比較していない負荷数に対応した各監視項目の閾値が残っているかどうかを判断する(ステップS14)。 Since we are not marking the allowable load column corresponding to the load number 10, the abnormal state detection means 17 then is whether more threshold values ​​of the respective monitoring items corresponding to the number of loads which are not compared with the measured value the judges (step S14). 【0037】ここで、ステップS14において負荷数2 [0037] Here, the load number in step S14 2
0に対応する各監視項目の閾値と、各監視項目の実測値を比較していないで残っているので、異常状態検知手段17は次に、負荷数20の場合の全監視項目における閾値を取り上げて(ステップS15)、再びステップS1 And a threshold for each monitored item corresponding to 0, since there remains without compares the measured values ​​of each monitoring item, the abnormal state detection means 17 then picks up the threshold in all monitored item if the load number 20 Te (step S15), and again step S1
3に戻って、許容負荷欄にマーキングがされているかどうかを確認する。 Returning to 3, to check whether it is marking the allowable load column. この様に負荷数に対応する閾値の範囲に、実測値として得られた各監視項目の値が含まれているかどうかを一つずつ確認していくが、ステップS13 The range of the threshold value corresponding to the number of loads in this manner, but if it contains a value for each monitoring item was obtained as measured values ​​gradually one by one check, step S13
において、ある負荷数に対応する全監視項目の閾値内に全監視項目の実測値が収まり、ある負荷数に対応する全監視項目の許容負荷欄が全てマーキングされている場合、異常状態検知手段17はシステムが正常であると判断する。 In, some measured values ​​of all monitored item fits into a load number within the threshold of all monitoring items corresponding, if allowable load column of all monitoring items corresponding to a certain number of loads are all marked, the abnormal state detecting means 17 it is determined that the system is normal. また、ステップS13において、ある負荷数に対応する全監視項目の閾値内に全監視項目の実測値が収まらず、ある負荷数に対応する全監視項目の許容負荷欄が全てマーキングされている状況がない場合、ステップS14において異常状態検知手段17はシステムが異常であると判断する。 Further, in step S13, it does not fit the measured values ​​of all the monitoring items within a threshold of the total monitored item corresponding to a number of loads, are all allowable load column of all monitoring items corresponding to a number of loads marking status If no, the abnormal state detecting means in step S14 17 determines that the system is abnormal. 【0038】図24は情報処理装置2が正常時の閾値テンプレート作成結果であるが、ここで、ステップS6において、監視装置1の異常状態検知手段17が情報処理装置2より得た3つの監視項目の実測値を、cs=63 [0038] Although FIG. 24 is a threshold templating result at the time the information processing apparatus 2 is normal, wherein, in step S6, 3 one monitoring items of abnormal state detection means 17 monitoring device 1 is obtained from the information processing apparatus 2 the measured value, cs = 63
4、InPackets=1655.9、Buffer 4, InPackets = 1655.9, Buffer
Hitratio=2.6333とすると、図24の閾値テンプレート作成結果の様に、許容負荷欄にマーキングがされることとなる。 When HitRatio = 2.6333, as the threshold templating results in Figure 24, and thus is marking the allowable load column. 負荷数70に対応した全監視項目の許容負荷欄にマーキングされていることが確認できるので、この時のシステムは正常であると判断することができる。 It therefore can be confirmed that marked the allowable load column of all monitoring items corresponding to the load number 70, it can be determined that the system at this time is normal. 【0039】また、図25は情報処理装置2が異常時の閾値テンプレート作成結果であるが、ここで、ステップS6において、監視装置1の異常状態検知手段17が情報処理装置2より得た3つの監視項目の実測値を、cs Further, although FIG. 25 is a threshold templating result at the time the information processing apparatus 2 is abnormal, wherein, in step S6, the monitoring device 1 the abnormal state detection means 17 of the three obtained from the information processing apparatus 2 the actual value of the monitoring item, cs
=634、InPackets=1178、Buffe = 634, InPackets = 1178, Buffe
rHitratio=2.6333とすると、図19の閾値テンプレート作成結果のように、許容負荷欄にマーキングがされることとなる。 When rHitratio = 2.6333, as threshold templating results in Figure 19, and thus is marking the allowable load column. 各負荷数に対応した全監視項目の許容負荷欄を確認すると、ある負荷数に対応する全監視項目で全て許容負荷欄がマーキングされている状況がないので、この時のシステムは異常であると判断することができる。 Check the allowable load column of all monitoring items corresponding to the respective number of loads, since all allowable load column in all the monitoring items corresponding to a certain number of loads there is no situation that is marked, the system at this time is abnormal it can be determined. 【0040】尚、上述の監視装置1のコンピュータにおいて実行されるプログラムは、情報処理装置によって読み取り可能な記憶媒体に記憶して、この記憶媒体に記憶されたプログラムを情報処理装置2に読み込ませ、実行することにより、上述の実施形態の処理を行っても良い。 [0040] Note that the program executed in the above-mentioned monitor apparatus 1 computer, stored in a storage medium readable by an information processing apparatus, to read a program stored in the storage medium in the information processing apparatus 2, by executing, processing may be performed in the embodiments described above. 【0041】 【発明の効果】以上説明したように、この発明によれば、情報処理装置などの異常状態監視対象におけるリソース項目の中から、統計手法を用いて監視項目の選出を行い、また、その監視項目が許容する上限(最大許容値)及び下限(最小許容値)の閾値を統計手法を用いて決定する機能を監視装置に備えたので、システム管理者の知識が無くとも監視項目とその閾値の上限及び下限を設定することが可能となる。 [0041] As has been described in the foregoing, according to the present invention, from among the resource items in the abnormal condition monitoring object, such as the information processing apparatus performs selection of the monitoring items by using a statistical method, also, since with the upper limit (maximum allowable value) the monitoring items are permitted and function monitoring apparatus determined using a statistical method lower threshold (minimum allowable value), the monitoring item without the knowledge of the system administrator that it is possible to set the upper and lower thresholds. また、統計手法による監視項目の選出や閾値の決定により、情報処理装置の構成や稼動しているサービスの利用状況といった情報処理装置毎に固有の条件に適合した監視項目の選出や閾値の決定が可能となり、さらに、従来では異常が検知出来なかった、情報処理装置にかかる負荷が低く故障も起きていないような状況下での異常状態を検知することが可能となる。 Further, by determining the selection and the threshold value of the monitored item by statistical method, the determination of the selection and the threshold value of the monitored item adapted to specific conditions for each information processing apparatus such as a usage of services that constitute and operation of the information processing apparatus possible and will, furthermore, in the conventional abnormality could not be detected, the load on the information processing apparatus it is possible to detect an abnormal condition under situations not happening even failure low.

【図面の簡単な説明】 【図1】 この発明の一実施形態による情報処理装置の異常状態検知を行う監視装置とその監視対象である情報処理装置の構成を示す図である。 BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a diagram showing a configuration of an information processing apparatus is a monitoring device which performs an abnormal state detection of the information processing apparatus that monitored according to an embodiment of the present invention. 【図2】 同実施形態による監視装置1の構成を示すブロック図である。 2 is a block diagram showing the configuration of a monitoring apparatus 1 according to the embodiment. 【図3】 同実施形態による監視装置1における情報処理装置2の監視方法の手順を示すフローである。 3 is a flowchart showing the procedure of a monitoring method of an information processing apparatus 2 in the monitoring apparatus 1 according to the embodiment. 【図4】 同実施形態による監視装置1が情報処理装置2内における監視対象データとして取得するリソース項目の一覧を示す図である。 [4] the monitoring apparatus 1 according to the embodiment is a chart showing a list of resource items to be acquired as the monitored data in the information processing apparatus 2. 【図5】 同実施形態による負荷試験における各リソース項目の実測データを表示する一覧である。 5 is a list that displays the measured data of each resource item in the load test by the same embodiment. 【図6】 同実施形態によるレスポンスタイムおよび各リソース項目の相関係数を算出した結果を示す表である。 6 is a table showing a result of calculating the correlation coefficient of the response time and each resource item according to the embodiment. 【図7】 同実施形態によるレスポンスタイムと各リソース項目との相関係数の算出結果を示す図である。 7 is a diagram showing a calculation result of the correlation coefficient between each resource item and response time according to the same embodiment. 【図8】 同実施形態によるウォード法を用いてクラスター数を3と設定した場合のクラスター分析結果である。 8 is a cluster analysis result of setting the number of clusters 3 and using Ward's method according to the embodiment. 【図9】同実施形態によるウォード法を用いてクラスター数を4と設定した場合のクラスター分析結果である。 9 is a cluster analysis result of setting the number of clusters 4 and using Ward's method according to the embodiment. 【図10】 同実施形態によるウォード法を用いたクラスター分析の結果から代表のリソース項目を選出した例である。 10 is an example in which elected representatives of the resource items from the results of cluster analysis using the Ward method according to the embodiment. 【図11】 同実施形態によるウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた重回帰分析結果(1)である。 11 is a similar embodiment multiple regression analysis based on the result of the cluster analysis a cluster number 3 using Ward's method by (1). 【図12】 同実施形態によるウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた重回帰分析結果(2)である。 Is 12] Multiple regression analysis based on the result of the cluster analysis a cluster number 3 using Ward's method according to the embodiment (2). 【図13】 同実施形態によるウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた重回帰分析結果(3)である。 13 is a multiple regression analysis based on the result of the cluster analysis a cluster number 3 using Ward's method according to the embodiment (3). 【図14】 同実施形態によるウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた重回帰分析結果(4)である。 14 is a multiple regression analysis based on the result of the cluster analysis a cluster number 3 using Ward's method according to the embodiment (4). 【図15】 同実施形態によるウォード法を用いてクラスター数3でクラスター分析を実施した結果に基づいた重回帰分析結果(5)である。 A [15] Multiple regression analysis based on the result of the cluster analysis a cluster number 3 using Ward's method according to the embodiment (5). 【図16】 同実施形態によるウォード法を用いてクラスター数4でクラスター分析を実施した結果に基づいた重回帰分析結果(1)である。 16 is a multiple regression analysis based on the result of the cluster analysis a cluster number 4 using Ward's method according to the embodiment (1). 【図17】 同実施形態によるウォード法を用いてクラスター数4でクラスター分析を実施した結果に基づいた重回帰分析結果(2)である。 A [17 multiple regression analysis based on the result of the cluster analysis a cluster number 4 using Ward's method according to the embodiment (2). 【図18】 同実施形態によるウォード法を用いてクラスター数4でクラスター分析を実施した結果に基づいた重回帰分析結果(3)である。 18 is a multiple regression analysis based on the result of the cluster analysis a cluster number 4 using Ward's method according to the embodiment (3). 【図19】 同実施形態によるウォード法を用いてクラスター数4でクラスター分析を実施した結果に基づいた重回帰分析結果(4)である。 Is a 19 multiple regression analysis based on the result of the cluster analysis a cluster number 4 using Ward's method according to the embodiment (4). 【図20】 同実施形態によるウォード法を用いてクラスター数4でクラスター分析を実施した結果に基づいた重回帰分析結果(5)である。 A [20] Multiple regression analysis based on the result of the cluster analysis a cluster number 4 using Ward's method according to the embodiment (5). 【図21】 同実施形態によるステップS1で得られた実測データに基づくcs、InPackets及びBu [21] based on measured data obtained in step S1 according to the embodiment cs, InPackets and Bu
fferHitRatioの負荷数の度合い毎における最大許容値と最小許容値の算出結果である。 A calculation result of the maximum permissible value and the minimum limit for each degree of the number of loads FferHitRatio. 【図22】 同実施形態によるステップS6において異常状態検知手段17が情報処理装置2の異常状態を検知する際の処理フローである。 [Figure 22] abnormal condition detector 17 in step S6 according to the embodiment is a process flow upon detecting an abnormal state of the information processing apparatus 2. 【図23】 同実施形態による異常状態検知手段による閾値テンプレートのマーキングチェック処理フローを示す図である。 23 is a diagram showing a marking check processing flow threshold template by the abnormal state detection means according to the same embodiment. 【図24】 同実施形態による情報処理装置2が正常時の閾値テンプレート作成結果である。 [24] the information processing apparatus 2 according to the embodiment is a threshold templating result of normal. 【図25】 同実施形態による情報処理装置2が異常時の閾値テンプレート作成結果である。 FIG. 25 is a threshold templating result at the time the information processing apparatus 2 is abnormal according to the same embodiment. 【符号の説明】 1 監視装置2 情報処理装置 [EXPLANATION OF SYMBOLS] 1 monitoring apparatus 2 information processing apparatus

フロントページの続き Fターム(参考) 5B042 GA10 GA12 GA18 JJ01 JJ29 JJ30 MA05 MA07 MA08 MA11 MA14 MC29 5B085 AC11 AC13 BA06 Front page of the continued F-term (reference) 5B042 GA10 GA12 GA18 JJ01 JJ29 JJ30 MA05 MA07 MA08 MA11 MA14 MC29 5B085 AC11 AC13 BA06

Claims (1)

  1. 【特許請求の範囲】 【請求項1】 監視対象の情報処理装置とネットワークを介して接続された監視装置であって、 前記情報処理装置に段階的な負荷をかける実際の利用状況を想定したワークロードでの負荷試験時に前記情報処理装置内における複数のリソース項目及びシステム性能を表す項目の実測データを収集する実測データ収集手段と、 前記負荷試験における前記システム性能を表す項目と前記各リソース項目との相関係数を前記実測データ収集手段で収集した実測データに基づいて算出し、前記システム性能を表す項目との関連の強い複数のリソース項目を選出する相関係数算出手段と、 前記相関係数算出手段で選出した複数のリソース項目に対して、異なる複数の分析条件毎にクラスター分析を行って複数のグループにグループ Patent Claims: 1. A surveillance device connected to an information processing apparatus via a network to be monitored, assuming the actual usage applying stepwise load on the information processing apparatus workpiece a measured data collection means for collecting measured data items representing a plurality of resource items and system performance within the information processing apparatus when the load test at the load, an item representing the system performance in the load test the each resource item the correlation coefficient was calculated based on the measured data collected by the measurement data collecting means, and the correlation coefficient calculating means for selecting the associated strong multiple resource items and items representing the system performance, the correlation coefficient group for a plurality of resource items selected at calculating means, into a plurality of groups by performing a cluster analysis for each different analysis conditions し、さらに各グループ内のリソース項目から、異なる指標毎にグループを代表するリソース項目を選出し監視項目候補とする監視項目候補選出手段と、 前記システム性能を表す項目を目的変数、前記監視項目候補選出手段において選出された前記監視項目候補を説明変数として重回帰分析を行い、結果として得られた複数の重回帰分析結果のうち最も妥当な重回帰分析結果の重回帰分析で用いられた監視項目候補を監視項目として選出する監視項目選出手段と、 前記監視項目選出手段において選出した監視項目の前記実測データ収集手段で収集した実測データに基づいて前記負荷試験における負荷度合いに応じた前記監視項目の最大許容値及び最小許容値を閾値として決定する閾値決定手段と、 を備えることを特徴とする監視装置。 And, further from the resource items in each group, and the monitoring item candidate selection means for the selection and monitoring item candidate resources item representing the group for different indicators, objective variable item representing the system performance, the monitored item candidate performing a multiple regression analysis elected the monitored item candidate in selection section as an explanatory variable, monitoring items used in multiple regression analysis of the most relevant multiple regression analysis of the plurality of the multiple regression analysis result obtained as a result of and monitoring items selection means for selecting the candidate as the monitoring items, the monitoring items corresponding to the load degree of the load test based on the measured data collected in the measured data collection unit of the monitoring items were selected in the monitoring item selection means the maximum allowable value and the monitoring apparatus characterized by comprising a threshold value determining means for determining a threshold minimum allowed value. 【請求項2】 前記情報処理装置の通常稼動時に前記監視項目毎のデータ値を収集する第1の手段と、 前記第1の手段において収集した前記監視項目毎のデータ値と前記負荷数の度合いに応じた前記閾値とを比較し、前記データ値が前記閾値の範囲に収まった場合に、 2. A normal first means for collecting the data value for each monitored item at the time of operation, the degree data values ​​and the number of loads for each of the said monitoring items collected in the first section of the information processing apparatus wherein comparing the threshold value corresponding to the case where the data value is within the range of the threshold value,
    その閾値に対応する前記負荷数の度合いを記憶する第2 Second storing the degree of the number of loads corresponding to the threshold
    の手段と、 前記監視項目毎に前記第2の手段で記憶した前記負荷数の度合いを比較して、前記監視項目全てに渡って同じ前記負荷数の度合いを記憶していない場合、前記情報処理装置は異常であると判断する第3の手段と、 を備えることを特徴とする請求項1に記載の監視装置。 Means, the by comparing the degree of the load number stored for each monitoring item with the second means, when said over all monitored item does not store the degree of the same the number of loads, the information processing monitoring device according to claim 1, characterized in that the device comprises a third means for determining as abnormal. 【請求項3】 監視対象の情報処理装置とネットワークを介して接続された監視装置における前記情報処理装置の監視方法において、 前記情報処理装置に段階的な負荷をかける実際の利用状況を想定したワークロードでの負荷試験時に前記情報処理装置内における複数のリソース項目及びシステム性能を表す項目の実測データを収集する実測データ収集過程と、 前記負荷試験における前記システム性能を表す項目と前記各リソース項目との相関係数を前記実測データ収集過程で収集した実測データに基づいて算出し、前記システム性能を表す項目との関連の強い複数のリソース項目を選出する相関係数算出過程と、 前記相関係数算出過程で選出した複数のリソース項目に対して、異なる複数の分析条件毎にクラスター分析を行って複数のグル 3. A monitoring method of the information processing apparatus in the connected monitor to an information processing apparatus via a network to be monitored, assuming the actual usage applying stepwise load on the information processing apparatus workpiece a measured data collection process for collecting measured data items representing a plurality of resource items and system performance within the information processing apparatus when the load test at the load, an item representing the system performance in the load test the each resource item the correlation coefficient is calculated based on the measured data collected by the actual data collection process and a correlation coefficient calculation step of selecting the associated strong multiple resource items and items representing the system performance, the correlation coefficient for a plurality of resource items selected at the calculation process, a plurality of guru performing cluster analysis for each different analysis conditions ープにグループ化し、さらに各グループ内のリソース項目から、異なる指標毎にグループを代表するリソース項目を選出し監視項目候補とする監視項目候補選出過程と、 前記システム性能を表す項目を目的変数、前記監視項目候補選出過程において選出された前記監視項目候補を説明変数として重回帰分析を行い、結果として得られた複数の重回帰分析結果のうち最も妥当な重回帰分析結果の重回帰分析で用いられた監視項目候補を監視項目として選出する監視項目選出過程と、 前記監視項目選出過程において選出した監視項目の前記実測データ収集過程で収集した実測データに基づいて前記負荷試験における負荷度合いに応じた前記監視項目の最大許容値及び最小許容値を閾値として決定する閾値決定過程と、 を備えることを特徴とする Grouped-loop, further from the resource items in each group, and the monitoring item candidate selection process of the selected monitoring item candidate resources item representing the group for different indicators, objective variable item representing the system performance, wherein the monitoring is performed multiple regression analysis the elected the monitored item candidate as explanatory variables in the item candidate selection process used resulting in a plurality of the most reasonable multiple regression analysis of the multiple regression analysis multiple regression analysis the monitored item candidate and the monitoring items selected process to elect as the monitoring items which are, according to the load degree of the load test based on the measured data collected by the actual data collection process of the monitoring items were selected in the monitored item selected process characterized in that it and a threshold determination step of determining a maximum allowable value and the minimum permissible value of the monitored item as a threshold 視方法。 Method seen. 【請求項4】 前記情報処理装置の通常稼動時に前記監視項目毎のデータ値を収集する第1の過程と、 前記第1の過程において収集した前記監視項目毎のデータ値と前記負荷数の度合いに応じた前記閾値とを比較し、前記データ値が前記閾値の範囲に収まった場合に、 4. Usually the first step of collecting the data value for each monitored item at the time of operation, the degree data values ​​and the number of loads for each of the monitoring items collected in the first step of the information processing apparatus wherein comparing the threshold value corresponding to the case where the data value is within the range of the threshold value,
    その閾値に対応する前記負荷数の度合いを記憶する第2 Second storing the degree of the number of loads corresponding to the threshold
    の過程と、 前記監視項目毎に前記第2の過程で記憶した前記負荷数の度合いを比較して、前記監視項目全てに渡って同じ前記負荷数の度合いを記憶していない場合、前記情報処理装置は異常であると判断する第3の過程と、 を備えることを特徴とする請求項3に記載の監視方法。 If the the process, by comparing the degree of said load number stored for each monitoring item the second process, does not store the degree of the same the number of loads over all the monitored item, the information processing monitoring method according to claim 3, characterized in that the device comprises a third process of determining as abnormal. 【請求項5】 監視対象の情報処理装置とネットワークを介して接続された監視装置において実行されるプログラムであって、 前記監視装置に、 前記情報処理装置に段階的な負荷をかける実際の利用状況を想定したワークロードでの負荷試験時に前記情報処理装置内における複数のリソース項目及びシステム性能を表す項目の実測データを収集する実測データ収集処理と、 前記負荷試験における前記システム性能を表す項目と前記各リソース項目との相関係数を前記実測データ収集処理で収集した実測データに基づいて算出し、前記システム性能を表す項目との関連の強い複数のリソース項目を選出する相関係数算出処理と、 前記相関係数算出処理で選出した複数のリソース項目に対して、異なる複数の分析条件毎にクラスター分析を行っ 5. A program executed in the connected monitor to an information processing apparatus via a network to be monitored, the monitoring device, the actual usage applying stepwise load to the information processing apparatus a measured data collection processing for collecting the measured data items representing a plurality of resource items and system performance within the information processing apparatus when the load test in the assumed workload, the the item representing the system performance in the load test the correlation coefficient between each resource item is calculated based on the measured data collected by the actual data collection process, and the correlation coefficient calculation process of selecting relevant strong multiple resource items and items representing the system performance, for a plurality of resource items selected at the correlation coefficient calculation process, performed cluster analysis for each different analysis conditions 複数のグループにグループ化し、さらに各グループ内のリソース項目から、異なる指標毎にグループを代表するリソース項目を選出し監視項目候補とする監視項目候補選出処理と、 前記システム性能を表す項目を目的変数、前記監視項目候補選出処理において選出された前記監視項目候補を説明変数として重回帰分析を行い、結果として得られた複数の重回帰分析結果のうち最も妥当な重回帰分析結果の重回帰分析で用いられた監視項目候補を監視項目として選出する監視項目選出処理と、 前記監視項目選出処理において選出した監視項目の前記実測データ収集処理で収集した実測データに基づいて前記負荷試験における負荷度合いに応じた前記監視項目の最大許容値及び最小許容値を閾値として決定する閾値決定処理と、 を備えることを Grouped into a plurality of groups, further from the resource items in each group, and the monitoring item candidate selection process of the selected monitoring item candidate resources item representing the group for different indicators, objective variable item representing the system performance the elected the monitored item candidate in the monitored item candidate selecting process performed multiple regression analysis as explanatory variables, the result as the most appropriate multiple regression analysis of the plurality of the multiple regression analysis result obtained results multiple regression analysis the monitored item candidate and the monitoring items selection processing of selecting as the monitoring items used, depending on the load degree of the load test based on the measured data collected by the actual data collection process of the monitoring items were selected in the monitoring item selection process a threshold determination process to determine the maximum allowable value and the minimum permissible value of the monitored item as a threshold was, in that it comprises 特徴とする監視プログラム。 Monitoring program which is characterized. 【請求項6】 前記情報処理装置の通常稼動時に前記監視項目毎のデータ値を収集する第1の過程と、 前記第1の過程において収集した前記監視項目毎のデータ値と前記負荷数の度合いに応じた前記閾値とを比較し、前記データ値が前記閾値の範囲に収まった場合に、 6. Usually the first step of collecting the data value for each monitored item at the time of operation, the degree data values ​​and the number of loads for each of the monitoring items collected in the first step of the information processing apparatus wherein comparing the threshold value corresponding to the case where the data value is within the range of the threshold value,
    その閾値に対応する前記負荷数の度合いを記憶する第2 Second storing the degree of the number of loads corresponding to the threshold
    の過程と、 前記監視項目毎に前記第2の過程で記憶した前記負荷数の度合いを比較して、前記監視項目全てに渡って同じ前記負荷数の度合いを記憶していない場合、前記情報処理装置は異常であると判断する第3の過程と、 を備えることを特徴とする請求項5に記載の監視プログラム。 If the the process, by comparing the degree of said load number stored for each monitoring item the second process, does not store the degree of the same the number of loads over all the monitored item, the information processing monitoring program according to claim 5, characterized in that the device comprises a third process of determining as abnormal.
JP2002062138A 2002-03-07 2002-03-07 Monitoring device and monitoring method and program for information processor Pending JP2003263342A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002062138A JP2003263342A (en) 2002-03-07 2002-03-07 Monitoring device and monitoring method and program for information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002062138A JP2003263342A (en) 2002-03-07 2002-03-07 Monitoring device and monitoring method and program for information processor

Publications (1)

Publication Number Publication Date
JP2003263342A true true JP2003263342A (en) 2003-09-19

Family

ID=29196066

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002062138A Pending JP2003263342A (en) 2002-03-07 2002-03-07 Monitoring device and monitoring method and program for information processor

Country Status (1)

Country Link
JP (1) JP2003263342A (en)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006046297A1 (en) * 2004-10-28 2006-05-04 Fujitsu Limited Analyzing method and device
JP2007241534A (en) * 2006-03-07 2007-09-20 Oki Electric Ind Co Ltd System performance information output device and computer program
JP2007265141A (en) * 2006-03-29 2007-10-11 Nec Corp Device, method and program for refining monitoring items
JP2007323193A (en) * 2006-05-30 2007-12-13 Nec Corp System, method and program for detecting abnormality of performance load
JP2007328396A (en) * 2006-06-06 2007-12-20 Hitachi Ltd Storage system, management device, and method
JP2008537610A (en) * 2004-12-24 2008-09-18 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation Method and system for monitoring the transaction-based system
JP2009205208A (en) * 2008-02-26 2009-09-10 Nec Corp Operation management device, method and program
WO2009110329A1 (en) * 2008-03-07 2009-09-11 日本電気株式会社 Failure analysis device, failure analysis method, and recording medium
WO2010133507A1 (en) * 2009-05-22 2010-11-25 International Business Machines Corporation Apparatus and method for monitoring a computer system
WO2011043447A1 (en) 2009-10-08 2011-04-14 日本電気株式会社 Operational surveillance device, operational surveillance method and program storage medium
WO2011083687A1 (en) * 2010-01-08 2011-07-14 日本電気株式会社 Operation management device, operation management method, and program storage medium
JP2011154483A (en) * 2010-01-26 2011-08-11 Fujitsu Ltd Failure detection device, program, and failure detection method
WO2012086444A1 (en) * 2010-12-24 2012-06-28 日本電気株式会社 Monitoring data analysis device, monitoring data analysis method, and monitoring data analysis program
WO2012086443A1 (en) * 2010-12-24 2012-06-28 日本電気株式会社 Monitoring data analysis device, monitoring data analysis method, and monitoring data analysis program
WO2013027562A1 (en) 2011-08-24 2013-02-28 日本電気株式会社 Operation management device, operation management method, and program
JP2013210759A (en) * 2012-03-30 2013-10-10 Mitsubishi Electric Information Systems Corp Method, program, and device for detecting specific data
JP2014238852A (en) * 2014-07-16 2014-12-18 日本電気株式会社 Operation management device, operation management system, information processing method, and operation management program
US9049079B2 (en) 2011-12-21 2015-06-02 International Business Machines Corporation Optimizing software configuration values using CMDB
WO2018135008A1 (en) * 2017-01-23 2018-07-26 株式会社日立製作所 Influence analysis system, measurement item optimization method, and measurement item optimization program

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8560667B2 (en) 2004-10-28 2013-10-15 Fujitsu Limited Analysis method and apparatus
WO2006046297A1 (en) * 2004-10-28 2006-05-04 Fujitsu Limited Analyzing method and device
JP4866861B2 (en) * 2004-12-24 2012-02-01 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation Method and system for monitoring the transaction-based system
US8856312B2 (en) 2004-12-24 2014-10-07 International Business Machines Corporation Method and system for monitoring transaction based system
JP2008537610A (en) * 2004-12-24 2008-09-18 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation Method and system for monitoring the transaction-based system
JP2007241534A (en) * 2006-03-07 2007-09-20 Oki Electric Ind Co Ltd System performance information output device and computer program
JP2007265141A (en) * 2006-03-29 2007-10-11 Nec Corp Device, method and program for refining monitoring items
JP4573179B2 (en) * 2006-05-30 2010-11-04 日本電気株式会社 Performance abnormal load detection system, the performance load abnormality detecting method, and program
JP2007323193A (en) * 2006-05-30 2007-12-13 Nec Corp System, method and program for detecting abnormality of performance load
JP2007328396A (en) * 2006-06-06 2007-12-20 Hitachi Ltd Storage system, management device, and method
JP2009205208A (en) * 2008-02-26 2009-09-10 Nec Corp Operation management device, method and program
WO2009110329A1 (en) * 2008-03-07 2009-09-11 日本電気株式会社 Failure analysis device, failure analysis method, and recording medium
US8448025B2 (en) 2008-03-07 2013-05-21 Nec Corporation Fault analysis apparatus, fault analysis method, and recording medium
US8769347B2 (en) 2009-05-22 2014-07-01 International Business Machines Corporation Apparatus and method for monitoring a computer system
WO2010133507A1 (en) * 2009-05-22 2010-11-25 International Business Machines Corporation Apparatus and method for monitoring a computer system
JP2012527674A (en) * 2009-05-22 2012-11-08 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Maschines Corporation Apparatus for monitoring a computer system, method, and computer program
JP5527324B2 (en) * 2009-10-08 2014-06-18 日本電気株式会社 Operation monitoring apparatus, the operation monitoring method, and program storage medium
CN102576326B (en) * 2009-10-08 2015-08-19 日本电气株式会社 Operation monitoring device operation monitoring method and a program storage medium
WO2011043447A1 (en) 2009-10-08 2011-04-14 日本電気株式会社 Operational surveillance device, operational surveillance method and program storage medium
CN102576326A (en) * 2009-10-08 2012-07-11 日本电气株式会社 Operational surveillance device, operational surveillance method and program storage medium
US8645769B2 (en) 2010-01-08 2014-02-04 Nec Corporation Operation management apparatus, operation management method, and program storage medium
WO2011083687A1 (en) * 2010-01-08 2011-07-14 日本電気株式会社 Operation management device, operation management method, and program storage medium
JP2011154483A (en) * 2010-01-26 2011-08-11 Fujitsu Ltd Failure detection device, program, and failure detection method
US9465713B2 (en) 2010-12-24 2016-10-11 Nec Corporation Monitoring data analyzing apparatus, monitoring data analyzing method, and monitoring data analyzing program
WO2012086444A1 (en) * 2010-12-24 2012-06-28 日本電気株式会社 Monitoring data analysis device, monitoring data analysis method, and monitoring data analysis program
JP5871192B2 (en) * 2010-12-24 2016-03-01 日本電気株式会社 Monitoring data analyzer, monitoring data analysis methods and monitoring data analysis program
US9111227B2 (en) 2010-12-24 2015-08-18 Nec Corporation Monitoring data analyzing apparatus, monitoring data analyzing method, and monitoring data analyzing program
WO2012086443A1 (en) * 2010-12-24 2012-06-28 日本電気株式会社 Monitoring data analysis device, monitoring data analysis method, and monitoring data analysis program
JP5871193B2 (en) * 2010-12-24 2016-03-01 日本電気株式会社 Monitoring data analyzer, monitoring data analysis methods and monitoring data analysis program
US9778972B2 (en) 2011-08-24 2017-10-03 Nec Corporation Operation management device, operation management method
WO2013027562A1 (en) 2011-08-24 2013-02-28 日本電気株式会社 Operation management device, operation management method, and program
US9049079B2 (en) 2011-12-21 2015-06-02 International Business Machines Corporation Optimizing software configuration values using CMDB
JP2013210759A (en) * 2012-03-30 2013-10-10 Mitsubishi Electric Information Systems Corp Method, program, and device for detecting specific data
JP2014238852A (en) * 2014-07-16 2014-12-18 日本電気株式会社 Operation management device, operation management system, information processing method, and operation management program
WO2018135008A1 (en) * 2017-01-23 2018-07-26 株式会社日立製作所 Influence analysis system, measurement item optimization method, and measurement item optimization program

Similar Documents

Publication Publication Date Title
Oliner et al. What supercomputers say: A study of five system logs
Xu et al. Networked Windows NT system field failure data analysis
Wohlin et al. Defect content estimations from review data
US6434513B1 (en) Method of load testing web applications based on performance goal
Vaidyanathan et al. A measurement-based model for estimation of resource exhaustion in operational software systems
MacCallum et al. Power analysis and determination of sample size for covariance structure modeling.
US6192317B1 (en) Statistical pattern analysis methods of partial discharge measurements in high voltage insulation
US7100084B2 (en) Method and apparatus for diagnosing difficult to diagnose faults in a complex system
US7369967B1 (en) System and method for monitoring and modeling system performance
US20070074076A1 (en) Network fault diagnostic device, network fault diagnostic method, and computer product
Metz et al. Statistical comparison of two ROC-curve estimates obtained from partially-paired datasets
Puechmaille The program structure does not reliably recover the correct population structure when sampling is uneven: subsampling and new estimators alleviate the problem
US7107187B1 (en) Method for modeling system performance
US20060293777A1 (en) Automated and adaptive threshold setting
US7546222B2 (en) System for performance and scalability analysis and methods thereof
US20060015612A1 (en) Trace processing program, method and apparatus
US20070240151A1 (en) Enhanced computer target groups
US6895534B2 (en) Systems and methods for providing automated diagnostic services for a cluster computer system
US6587960B1 (en) System model determination for failure detection and isolation, in particular in computer systems
Podgurski et al. Automated support for classifying software failure reports
US20030037288A1 (en) Method and system for reduction of service costs by discrimination between software and hardware induced outages
US20090216393A1 (en) Data-driven anomaly detection to anticipate flight deck effects
US20030014507A1 (en) Method and system for providing performance analysis for clusters
WO2010032701A1 (en) Operation management device, operation management method, and operation management program
US20060188011A1 (en) Automated diagnosis and forecasting of service level objective states

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Effective date: 20040513

Free format text: JAPANESE INTERMEDIATE CODE: A712

RD04 Notification of resignation of power of attorney

Effective date: 20040517

Free format text: JAPANESE INTERMEDIATE CODE: A7424

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041105

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20041105

A621 Written request for application examination

Effective date: 20050304

Free format text: JAPANESE INTERMEDIATE CODE: A621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050425

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050425

A521 Written amendment

Effective date: 20050811

Free format text: JAPANESE INTERMEDIATE CODE: A523

A977 Report on retrieval

Effective date: 20080117

Free format text: JAPANESE INTERMEDIATE CODE: A971007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A02 Decision of refusal

Effective date: 20080701

Free format text: JAPANESE INTERMEDIATE CODE: A02