JP6152770B2

JP6152770B2 - 管理プログラム、管理方法、および情報処理装置

Info

Publication number: JP6152770B2
Application number: JP2013209889A
Authority: JP
Inventors: 晶夫大場; 裕二和田; 邦昭嶋田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-10-07
Filing date: 2013-10-07
Publication date: 2017-06-28
Anticipated expiration: 2033-10-07
Also published as: JP2015075807A; US20150100579A1

Description

本発明は、複数の装置を有するシステムを管理する管理プログラム、管理方法、および情報処理装置に関する。

コンピュータシステムは、ネットワークを介して様々なサービスをユーザに提供することができる。このようにネットワークを介してサービスを提供する場合、そのサービスを安定して提供できることが重要である。

正常に動作していたシステムが正常に動作しなくなる要因の１つに、システム内のコンピュータに設定するパラメータなどの設定変更がある。例えばクラウドコンピューティングによりサービスを提供する場合、大規模なＩＣＴ（Information and Communication Technology）システムを運用する。大規模なシステム内の各コンピュータの設定を変更すると、その設定変更によりシステムに障害が発生する可能性がある。ところが、システム内に多数のコンピュータが含まれる場合、設定変更によりどの程度の障害発生リスクがあるのかを把握するのは、容易ではない。

そこで、多様な計算機の集合について、管理者が指定した計算機集合に属する計算機のみに対して設定パラメータを一括して変更できるようにすると共に、運用規則に現状の計算機の設定が合っているかを容易に診断できるようにする技術が考えられている。この技術では、各管理対象計算機の設定値として、上位階層の設定値が継承して使用されているかどうかの判定により、ネットワークシステムの運用規準を満たしているかどうかが判断される。

特開２００４−１１８３７１号公報

パラメータなどの情報の設定変更を行う場合、設定変更によるシステムへの影響が分かれば、設定変更の実施前に、影響に合わせた予防策をとることができる。例えば設定変更によるシステムへの影響が少なく障害発生の危険性も低いのであれば、設定変更後の動作確認を短時間で済ませることができる。他方、設定変更がシステムに大きな影響を及ぼし、障害発生の危険性が高い場合、ユーザの少ない時間帯に設定変更を行うか、あるいは設定変更後の運用監視を通常より厳密に長期間行うといった対策を採ることができる。

しかし、上位階層の設定値が継承して使用されているかどうかだけでは、その設定によるシステムへの影響がどの程度なのかを認識することはできない。そのため、システムへの影響に応じた適切な障害対策を採ることができない。

１つの側面では、本件は、設定変更によるシステムへの影響を判定できるようにすることを目的とする。

１つの案では、複数の集合に分類された複数の装置を有するシステムを管理する管理プログラムが提供される。この管理プログラムは、コンピュータに、特定の集合に属する装置のうちの第１の割合の装置の設定情報の変更予定を示す変更予定情報に基づいて、同一集合に属する装置のうちの少なくとも一部の装置の設定情報を変更したときの内容を含む履歴情報を記憶する記憶手段から、同一集合に属する装置のうちの、第１の割合と所定の類似関係を満たす第２の割合の装置の設定情報を変更したときの履歴情報を取得し、取得した履歴情報に基づいて、変更予定情報に示される設定情報の変更を行うことによるシステムへの影響を予測する、処理を実行させる。

１態様によれば、設定変更によるシステムへの影響を判定することができる。

第１の実施の形態に係る情報処理装置の機能構成例を示す図である。第２の実施の形態のシステム構成例を示す図である。管理装置のハードウェアの一構成例を示す図である。管理装置の機能を示すブロック図である。ＣＭＤＢに格納される情報の一例を示す図である。ツリー情報のデータ構造の一例を示す図である。ルール管理表のデータ構造の一例を示す図である。ルール「第１階層共通」の適用例を示す図である。ルール「第２階層共通」の適用例を示す図である。ルール「第３階層共通」の適用例を示す図である。ルール「サーバ個別」の適用例を示す図である。障害履歴管理ＤＢのデータ構造の一例を示す図である。危険度予測処理の手順の一例を示すフローチャートである。イレギュラー度の算出手順の一例を示すフローチャートである。ルール対象サーバ数・変更サーバ数に応じたイレギュラー度の違いを示す図である。ルール対象範囲内エントロピが「０」の場合のイレギュラー度算出例を示す図である。ルール対象範囲内エントロピが「０．８１」の場合のイレギュラー度算出例を示す図である。重要度予測処理の手順の一例を示すフローチャートである。関連障害履歴抽出の第１の例を示す図である。関連障害履歴抽出の第２の例を示す図である。危険度判定処理の手順の一例を示すフローチャートである。危険度の判定例を示す図である。変更予定情報の入力から危険度表示への画面遷移例を示す図である。

以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
〔第１の実施の形態〕
図１は、第１の実施の形態に係る情報処理装置の機能構成例を示す図である。情報処理装置１０は、記憶手段１１、決定手段１２、取得手段１３、および予測手段１４を有している。

記憶手段１１は、複数の履歴情報を記憶する。履歴情報は、同一集合に属する装置のうちの少なくとも一部の装置の設定情報を変更したときの内容を含む。設定情報を変更したときの内容には、設定情報を変更したことのシステムへの影響度合いを含めることができる。例えば履歴情報には、設定情報種別、変更割合、および重要度が含まれる。設定情報種別は、装置において値が変更された設定情報の種別（例えば設定項目名）である。変更割合は、値が変更された設定情報について、共通の値を設定するようにルールによって指定された集合に属する装置のうち、同時に設定変更が行われた装置が占める割合である。重要度は、設定変更がシステムに与える影響の度合いを示す数値である。

決定手段１２は、特定の集合に属する装置のうちの第１の割合の装置の設定情報の変更予定を示す変更予定情報１において、第１の割合の計算の基礎となる情報が示されているとき、その情報を用いて第１の割合を計算する。例えば変更予定情報１には、設定変更対象の少なくとも１つの装置、値を変更する設定情報の種別、および変更後の設定値が指定されている。なお第１の割合は、例えば値を変更予定の設定情報について、共通の値を設定するようにルールによって指定された集合に属する装置のうち、同時に設定変更が行われる装置が占める割合を示している。

また決定手段１２では、システム内の複数の装置が、階層構造の集合に分類して管理されている。図１の例では、４階層の集合に分類したときの階層間の関係をツリー構造で表している。ツリー構造における下位の階層の集合は、その上位階層の集合の部分集合である。第１の階層には、すべての装置を含む集合２が１つだけ設けられている。第２の階層には、第１階層の集合２の部分集合である複数の集合３ａ，３ｂ，・・・が設けられている。第３階層には、第２階層の集合３ａ，３ｂ，・・・の部分集合である複数の集合４ａ，４ｂ，・・・が設けられている。最下位の階層である第４階層には、第３階層の集合４ａ，４ｂ，・・・の部分集合として、装置ごとの集合が設けられている。

さらに決定手段１２には、設定情報の種別ごとに、設定情報の値をどの階層の集合で共通化するのかに関するルールが定義されている。例えばある種別の設定情報に関し、第１階層で共通化するというルールであれば、第１階層の集合２に属する装置の該当種別の設定情報には、共通の値を設定することになる。またある種別の設定情報に関し、第２階層で共通化するというルールであれば、第２階層の集合３ａ，３ｂ，・・・ごとに、その集合に属する装置の該当種別の設定情報には、共通の値を設定することになる。このルールは、標準設定をするためのルールであって、強制ではない。そのため、ルールを逸脱した設定も可能である。

決定手段１２は、変更予定情報１が入力されると、値を変更する設定情報の種別に適用されるルールに示される階層の集合のうち、変更予定情報１に示される、設定対象の少なくとも１つの装置が共に属する集合を特定する。そして決定手段１２は、特定した集合に属する装置に対する、設定対象の装置の割合を、第１の割合と決定する。決定手段１２は、決定した第１の割合を、取得手段１３に通知する。

なお取得手段１３は、変更予定情報１において、第１の割合が直接的に示されている場合も考えられる。この場合、情報処理装置１０に入力された変更予定情報１は、決定手段１２を介さずに取得手段１３に入力される。

取得手段１３は、変更予定情報１に基づいて、記憶手段１１から、同一集合に属する装置のうちの、第１の割合と所定の類似関係を満たす第２の割合の装置の設定情報を変更したときの履歴情報を取得する。例えば取得手段１３は、第２の割合が、第１の割合を中心とする所定の範囲内にあれば、所定の類似関係を満たすと判断する。

また取得手段１３は、第１の割合や第２の割合に所定の計算を施した上で、類似関係を判断することもできる。例えば取得手段１３は、第１の割合または第２の割合の逆数をイレギュラー度と定義する。第１の割合に関するイレギュラー度は、設定変更を実施した場合の、集合内の各装置の設定値の、ルールからの乖離度合いを示す指標である。第２の割合に関するイレギュラー度は、履歴情報が記録された原因となる設定変更が実施された後の、集合内の各装置の設定値の、ルールからの乖離度合いを示す指標である。例えば取得手段１３は、第１の割合に関するイレギュラー度と、第２の割合に関するイレギュラー度との差（または比）が、所定の範囲内であれば、所定の類似関係にあると判断する。

さらに取得手段１３は、設定変更直前における、集合に属する装置の設定情報の値の統一度合いを、イレギュラー度に反映させてもよい。例えば取得手段１３は、変更対象となる装置と同じ集合に属する装置それぞれの設定情報のうち、値を変更する設定情報と同じ種別の設定情報（ルール上共通の値を設定することになっている設定情報）の値を比較する。そして取得手段１３は、ルールからの乖離度合いを計算し、計算結果を、所定の類似関係を満たすかどうかの判定に利用する。ルールからの乖離度合いは、例えばエントロピで表される。例えば取得手段１３は、第１の割合または第２の割合の逆数を、「エントロピ＋１」で除算した値をイレギュラー度とする。

取得手段１３は、記憶手段１１から取得した履歴情報を、予測手段１４に送信する。
予測手段１４は、取得した履歴情報に基づいて、変更予定情報１に示される設定情報の変更を行うことによるシステムへの影響度合いを予測する。例えば予測手段１４は、取得した履歴情報に示されている重要度に基づいて、影響度合いを予測することができる。重要度を用いる場合、例えば予測手段１４は、取得した履歴情報に示されている重要度の平均を影響度合いとする。また予測手段１４は、第１の割合と第２の割合との類似度が高い履歴情報ほど、その履歴情報の内容を、予測に強く反映させてもよい。さらに予測手段１４は、取得した履歴情報に示される重要度の分布から、予測した重要度の偏差値を計算し、その偏差値を所定の閾値と比較することで、予定されている設定変更の危険度のランクを判定することもできる。

このような情報処理装置１０によれば、変更予定情報１が入力されると、決定手段１２により変更割合が計算される。図１の例では、変更予定情報１において、装置「machine#1」における種別「parameter#1」の設定情報の値を変更することが示されている。ここで、種別「parameter#1」には、ルール「第２階層共通」が適用されることが定義されている。また装置「machine#1」は、第２階層の集合３ａ，３ｂ，・・・のうち、集合３ａに属している。集合３ａに属する装置は、１００台あるものとする。変更予定情報１において設定変更の対象となる装置数は１台であるため、変更割合は「１／１００」となる。この変更割合が、第１の割合に決定される。

決定された第１の割合は、取得手段１３に通知される。すると取得手段１３において、第１の割合「１／１００」と所定の類似関係の変更割合を有する履歴情報が、記憶手段１１から抽出される。例えば割合を逆数にしたとき、第１の割合の逆数に対する上下１０％以下の範囲の収まるような変更割合について、所定の類似関係があると判断される。この場合、「１／９０」〜「１／１１０」の範囲の変更割合であれば、類似関係があると判断される。変更割合の類似関係が認められた履歴情報は、記憶手段１１から抽出され、予測手段１４に転送される。

そして予測手段１４によって、変更予定情報１に示される設定情報の変更を実施した場合のシステムへの影響度合いが計算される。例えば抽出された履歴情報の重要度が「９」と「７」であれば、平均値「８」を影響度合いとすることができる。

このようにして、設定変更を行おうとしているユーザは、影響の度合いを定量的に認識できる。影響の度合いが分かれば、影響の度合いに応じて、設定変更を実施する前に障害対策を施したり、設定変更後の動作確認の期間を変えたりすることができる。その結果、設定変更を行うことに伴うシステムの信頼性の低下を抑止することができる。

ところで、同じ種別の設定情報を変更したことによる障害事例があれば、その障害事例の履歴情報を参考にして影響の度合いを判断できる。しかし、同じ種別の設定情報を変更したことによる障害事例がないと、そのような、類似する障害事例の判断が困難となる。

第１の実施の形態では、集合内での設定変更の対象となる装置の割合に基づいて、履歴情報を抽出するため、例えば、値を変更する設定情報と同じ種別の設定情報の変更に関する履歴情報が存在していなくても、影響の度合いを判断できる。集合内での設定変更の対象となる装置の割合に基づいて履歴情報を抽出することで、影響の度合いの判断に有効である理由は、以下の通りである。

例えば特定の種別の設定情報に対する設定変更前に、ルールに従って、特定の集合内の装置に共通の値が設定されている場合、一部の装置における設定情報の値を変更すれば、ルールから乖離した状態となる。過去に、ルールからの同程度の乖離状態を発生させた設定変更事例があれば、その事例に関する履歴情報が、今回の設定変更についての影響度合いの参考となる。設定変更後のルールからの乖離状態は、集合内での設定変更の対象となる装置の割合により推定できる。従って、集合内での設定変更の対象となる装置の割合と所定の類似関係にある履歴情報を抽出すれば、予定している設定変更を実施した場合の影響度合いを求めるのに有用な履歴情報を抽出できる。

なお、決定手段１２、取得手段１３、および予測手段１４は、例えば情報処理装置１０が有するプロセッサにより実現することができる。また、記憶手段１１は、例えば情報処理装置１０が有するメモリにより実現することができる。

また、図１に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。
〔第２の実施の形態〕
次に第２の実施の形態について説明する。第２の実施の形態は、複数のデータセンタのサーバなどの機器に対する設定情報（例えばパラメータ）の値を変更する場合の障害発生の危険度を予測するものである。

図２は、第２の実施の形態のシステム構成例を示す図である。複数のデータセンタ３１，３２，３３，・・・が、ネットワーク３０を介して接続されている。データセンタ３１には、複数のサーバ４１，４２，４３，・・・や複数のストレージ装置５１，５２，・・・が設置されている。複数のサーバ４１，４２，４３，・・・および複数のストレージ装置５１，５２，・・・は、スイッチ２０を介して接続されている。他のデータセンタ３２，３３，・・・にも、複数のサーバや複数のストレージ装置が設けられている。

データセンタ３１には、さらに管理装置１００が設けられている。管理装置１００は、システム全体の運用を管理する。例えば管理装置１００は、スイッチ２０を介して、各データセンタ３１，３２，３３，・・・内の機器にアクセスし、各機器の環境設定を行う。管理装置１００は、環境設定において設定情報の値を変更する場合、その設定情報の値の変更による障害発生の危険度を見積もることができる。システムの管理者は、管理装置１００で見積もられた危険度に応じて、設定情報の値の設定変更の際の手順を変えることができる。例えば管理者は、危険度が高い場合、システムの運用に支障が出ないように、十分なバックアップ体制を取った上で、設定情報の値の設定変更を実行する。また管理者は、危険度が低い場合、システムの運用を継続しながら、効率的な手順で設定情報の値の設定変更を実行する。

このような危険度の予測が可能な管理装置１００は、図３に示すようなハードウェアのコンピュータで実現できる。
図３は、管理装置のハードウェアの一構成例を示す図である。管理装置１００は、プロセッサ１０１によって装置全体が制御されている。プロセッサ１０１には、バス１０９を介してメモリ１０２と複数の周辺機器が接続されている。プロセッサ１０１は、マルチプロセッサであってもよい。プロセッサ１０１は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、またはＤＳＰ（Digital Signal Processor）である。プロセッサ１０１の機能の少なくとも一部を、ＡＳＩＣ（Application Specific Integrated Circuit）、ＰＬＤ（Programmable Logic Device）などの電子回路で実現してもよい。

メモリ１０２は、管理装置１００の主記憶装置として使用される。メモリ１０２には、プロセッサ１０１に実行させるＯＳ（Operating System）のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ１０２には、プロセッサ１０１による処理に必要な各種データが格納される。メモリ１０２としては、例えばＲＡＭ（Random Access Memory）などの揮発性の半導体記憶装置が使用される。

バス１０９に接続されている周辺機器としては、ＨＤＤ（Hard Disk Drive）１０３、グラフィック処理装置１０４、入力インタフェース１０５、光学ドライブ装置１０６、機器接続インタフェース１０７およびネットワークインタフェース１０８がある。

ＨＤＤ１０３は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。ＨＤＤ１０３は、管理装置１００の補助記憶装置として使用される。ＨＤＤ１０３には、ＯＳのプログラム、アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、フラッシュメモリなどの不揮発性の半導体記憶装置を使用することもできる。

グラフィック処理装置１０４には、モニタ２１が接続されている。グラフィック処理装置１０４は、プロセッサ１０１からの命令に従って、画像をモニタ２１の画面に表示させる。モニタ２１としては、ＣＲＴ（Cathode Ray Tube）を用いた表示装置や液晶表示装置などがある。

入力インタフェース１０５には、キーボード２２とマウス２３とが接続されている。入力インタフェース１０５は、キーボード２２やマウス２３から送られてくる信号をプロセッサ１０１に送信する。なお、マウス２３は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。

光学ドライブ装置１０６は、レーザ光などを利用して、光ディスク２４に記録されたデータの読み取りを行う。光ディスク２４は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク２４には、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ−ＲＡＭ、ＣＤ−ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ−Ｒ（Recordable）／ＲＷ（ReWritable）などがある。

機器接続インタフェース１０７は、管理装置１００に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース１０７には、メモリ装置２５やメモリリーダライタ２６を接続することができる。メモリ装置２５は、機器接続インタフェース１０７との通信機能を搭載した記録媒体である。メモリリーダライタ２６は、メモリカード２７へのデータの書き込み、またはメモリカード２７からのデータの読み出しを行う装置である。メモリカード２７は、カード型の記録媒体である。

ネットワークインタフェース１０８は、スイッチ２０に接続されている。ネットワークインタフェース１０８は、スイッチ２０を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。

以上のようなハードウェア構成によって、第２の実施の形態の処理機能を実現することができる。なお、第１の実施の形態に示した情報処理装置１０も、図３に示した管理装置１００と同様のハードウェアにより実現することができる。なお図２に示した各サーバも、管理装置１００と同様のハードウェアで実現することができる。

管理装置１００は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第２の実施の形態の処理機能を実現する。管理装置１００に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、管理装置１００に実行させるプログラムをＨＤＤ１０３に格納しておくことができる。プロセッサ１０１は、ＨＤＤ１０３内のプログラムの少なくとも一部をメモリ１０２にロードし、プログラムを実行する。また管理装置１００に実行させるプログラムを、光ディスク２４、メモリ装置２５、メモリカード２７などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ１０１からの制御により、ＨＤＤ１０３にインストールされた後、実行可能となる。またプロセッサ１０１が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。

管理装置１００は、プロセッサ１０１の制御により、サーバなどの機器の設定情報などの設定変更機能や、設定変更に伴う危険度の予測機能を実現する。
図４は、管理装置の機能を示すブロック図である。管理装置１００は、情報の管理機能として、例えばＨＤＤ１０３内に、構成管理データベース（ＣＭＤＢ：Configuration Management Database）１１０と障害履歴管理データベース（ＤＢ）とが、予め構築されている。

ＣＭＤＢ１１０は、システムの構成を示す情報を管理するデータベースである。例えばＣＭＤＢ１１０には、システム内の機器の接続関係が階層化され、ツリー構造で管理されている。またＣＭＤＢ１１０には、システム内の機器に環境設定の設定情報（例えばパラメータ）に値を設定する際の、標準的な設定規則を示すルールが登録されている。このルールは、標準的な設定を行うためのルールであり、このルールから逸脱した設定も許容される。ただし、ルールから逸脱した設定を行った場合、その設定により、システムに障害が発生する危険性がある。

障害履歴管理ＤＢ１２０は、システムにおいて過去に発生した障害の履歴を管理するデータベースである。例えば障害履歴管理ＤＢ１２０には、サーバなどの機器に対する環境設定の変更が原因で発生した障害に関する履歴（障害履歴）が格納される。障害履歴には、その障害の重要度が含まれる。重要度は、例えばシステムに重大な影響を及ぼす障害であれば大きな値が設定され、システムに対する影響が軽微な障害であれば小さな値が設定される。また設定情報の値を変更したことによる障害に関する障害履歴であれば、その障害履歴には、例えば設定情報の値の変更時のイレギュラー度が含まれる。イレギュラー度は、適用されるルールからの乖離度（ルールから逸脱した設定値がどの程度あるか）を示す指標である。

管理装置１００は、情報処理機能として、ユーザインタフェース（Ｕ／Ｉ）１３０、イレギュラー度算出部１４１、重要度予測部１４２、危険度判定部１４３、危険度表示部１４４、および情報設定部１５０を有する。

Ｕ／Ｉ１３０は、ユーザとの間で情報のやりとりをするインタフェースである。Ｕ／Ｉ１３０は、例えばキーボード２２やマウス２３などの入力デバイスからの入力を受け付け、他の要素に入力内容を通知する。機器の環境設定を変更する場合、管理者であるユーザが、キーボード２２などを用いて、変更内容を示す変更予定情報を入力する。するとＵ／Ｉ１３０は、入力された変更予定情報を、イレギュラー度算出部１４１に変更予定情報を送信する。またＵ／Ｉ１３０は、適用する設定変更内容を示す変更情報が入力されると、変更情報を情報設定部１５０に送信する。さらにＵ／Ｉ１３０は、他の要素から処理結果を受け取ると、処理結果をモニタ２１に表示する。例えばＵ／Ｉ１３０は、危険度表示部１４４から設定変更に伴う危険度が通知されると、その危険度をモニタ２１に表示する。

イレギュラー度算出部１４１は、変更予定情報を受け取ると、ＣＭＤＢ１１０を参照し、イレギュラー度を算出する。イレギュラー度は、設定変更予定による変更後の設定の、標準設定ルールからの乖離度合いを示す数値である。イレギュラー度算出部１４１は、イレギュラー度算出結果を、重要度予測部１４２に送信する。

重要度予測部１４２は、障害履歴に基づいて、予定している設定変更によって障害が生じた場合の、その障害の重要度を予測する。例えば重要度予測部１４２は、入力された変更予定情報に関連する障害履歴（関連障害履歴）を、障害履歴管理ＤＢ１２０から検索する。そして重要度予測部１４２は、関連障害履歴に設定されている重要度に基づいて、変更予定情報に示される設定変更によって障害が発生した場合の重要度を予測する。関連障害履歴には、例えば設定変更情報に基づいて算出されたイレギュラー度と類似するイレギュラー度の障害履歴が含まれる。また変更予定の設定情報と同種の設定情報の値を変更したときの障害履歴を、関連障害履歴に含めてもよい。重要度予測部１４２は、例えば、障害履歴管理ＤＢ１２０から関連障害履歴を抽出し、関連障害履歴に設定されている重要度の平均を、重要度の予測値（予測重要度）とする。重要度予測部１４２は、算出した予測重要度を危険度判定部１４３に通知する。

危険度判定部１４３は、予測重要度に基づいて、変更予定情報で示される変更内容を適用することで発生する障害の危険度を判定する。例えば危険度判定部１４３は、関連障害履歴に示される障害の重要度が高いほど、危険度が高くなるような計算式で、危険度を算出する。危険度判定部１４３は、算出した危険度を、危険度表示部１４４に通知する。例えば危険度判定部１４３は、危険度を示す数値を、多段階にランク分けする。そして危険度判定部１４３は、危険度のランクを危険度表示部１４４に通知する。

危険度表示部１４４は、Ｕ／Ｉ１３０に対して、通知された危険度をモニタ２１に表示させる。例えば危険度表示部１４４は、危険度のランクを示す画面の表示要求を、Ｕ／Ｉ１３０に送信する。

情報設定部１５０は、Ｕ／Ｉ１３０を介して、サーバなどの機器への情報設定の指示を受け取ると、スイッチ２０を介して、設定対象の機器にアクセスし、パラメータなどの設定情報を設定する。

なお、図４に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。また図４に示すイレギュラー度算出部１４１は、第１の実施の形態における決定手段１２の一例である。また図４に示す重要度予測部１４２は、第１の実施の形態における取得手段１３と予測手段１４とを組み合わせた機能の一例である。また図４に示す危険度判定部１４３は、第１の実施の形態における予測手段１４の一部の機能の一例である。

次に、管理装置１００に予め格納される情報について、詳細に説明する。
図５は、ＣＭＤＢに格納される情報の一例を示す図である。ＣＭＤＢ１１０には、ツリー情報１１１とルール管理表１１２とが格納されている。ツリー情報１１１は、システム内のサーバ間の接続関係を、階層構造で示す情報である。ルール管理表１１２は、設定情報に適用される、設定共通化のルールを示す情報である。

図６は、ツリー情報のデータ構造の一例を示す図である。ツリー情報１１１は、各サーバが属するグループを、木構造（ツリー６１）で階層的に表したものである。例えば第１階層には、「全体」のグループが１つだけ属している。第２階層には、データセンタ（ＤＣ）ごとの複数のグループが属している。第３階層には、データセンタ内に設定されたサーバのラックごとの、複数のグループが属している。最下位の第４階層には、サーバが属している。なお第２の実施の形態におけるグループは、第１の実施の形態の集合の一例である。

各グループには、ツリー６１において、そのグループ以下の構造に属するサーバが属する。例えば「全体」のグループには、システム内のすべてのサーバが属する。データセンタのグループには、対応するデータセンタ内のサーバが属する。ラックのグループには、対応するラックに収納されたサーバが属する。サーバのグループは、１台のサーバ１つのグループとなる。このような、ツリーで表される階層構造が、ツリー情報１１１で定義されている。

ツリー情報１１１は、ツリー６１の構造を示す情報である。図６の例ではツリー情報１１１には、階層、グループ、下位のグループの欄が設けられている。階層の欄には、ツリー６１における階層が設定されている。グループの欄には、対応する階層に属するグループ（機器の集合）のグループ名が設定されている。下位のグループの欄には、各グループに属する下位のグループのグループ名が設定されている。例えば「全体」のグループの下位には、データセンタごとのグループが属している。データセンタのグループの下位には、ラックごとのグループが属している。ラックのグループの下位には、個々のサーバが属している。

第２の実施の形態では、システム内の全サーバ数が１０００台であるものとする。そして１０箇所のデータセンタに、サーバが１００台ずつ設置されているものとする。またデータセンタ内には、１０台のサーバが組み込まれたラックが、１０台設置されているものとする。

次に、ルール管理表１１２のデータ構造について説明する。
図７は、ルール管理表のデータ構造の一例を示す図である。ルール管理表１１２には、ＩＤ、サーバ、設定ファイル名、設定項目名、設定値、ルール、およびルール対象サーバ数の欄が設けられている。

ＩＤの欄には、ルールの識別番号が設定される。サーバの欄には、ルールを適用するサーバの名称が設定される。設定ファイル名の欄には、情報を設定するファイルの場所と名前が設定される。設定項目名の欄には、ファイル内の設定情報の名称（設定項目名）が設定される。設定値の欄には、サーバの設定情報として、現在設定されている値が設定される。

ルールの欄には、設定情報に設定する値に関する、標準設定のルールが設定される。ルールでは、例えばどのグループの範囲で共通の値を設定するのかが定義される。例えばルールが「第１階層共通」の場合、システム内のすべてのサーバにおいて、同じ値を設定するのが標準である。またルールが「第２階層共通」の場合、同じデータセンタに属するすべてのサーバにおいて、同じ値を設定するのが標準である。またルールが「サーバ個別」の場合、サーバごとに個別の値を設定するのが標準である。

ルール対象サーバ数の欄には、ルールに厳密に従った場合に同じ値が設定されるサーバの数が設定される。例えばルールが「第１階層共通」であれば、システム内の全サーバ数が、ルール対象サーバ数（１０００台）となる。ルールが「第２階層共通」であれば、サーバの欄に示されるサーバが属するデータセンタ内のサーバ数（１００台）が、ルール対象サーバ数となる。またルールが「サーバ個別」であれば、ルール対象サーバ数は「１」である。

次に、図８〜図１１を参照して、ルールの適用例について説明する。
図８は、ルール「第１階層共通」の適用例を示す図である。ルールが「第１階層共通」の場合、ルールに厳密に従うと、第１階層のグループ「全体」に属するサーバ（システムのすべてのサーバ）に共通の値が設定される。

図９は、ルール「第２階層共通」の適用例を示す図である。ルールが「第２階層共通」の場合、ルールに厳密に従うと、同じデータセンタに属するサーバには共通の値が設定される。

図１０は、ルール「第３階層共通」の適用例を示す図である。ルールが「第３階層共通」の場合、ルールに厳密に従うと、同じラックに搭載されたサーバには共通の値が設定される。

図１１は、ルール「サーバ個別」の適用例を示す図である。ルールが「サーバ個別」の場合、各サーバに任意の値が設定される。
次に、障害履歴管理ＤＢ１２０について詳細に説明する。

図１２は、障害履歴管理ＤＢのデータ構造の一例を示す図である。障害履歴管理ＤＢ１２０には、障害履歴管理表１２１が格納されている。障害履歴管理表１２１には、ＩＤ、障害発生時刻、障害復旧時刻、設定ファイル名、設定項目名、イレギュラー度、および重要度の欄が設けられている。

ＩＤの欄には、障害履歴の識別番号が設定される。障害発生時刻の欄には、障害が発生した日時が設定される。障害復旧時刻の欄には、障害が復旧した日時が設定される。設定ファイル名の欄には、障害発生後の原因となった情報設定が行われたファイルの場所とファイル名が設定される。設定項目名の欄には、障害発生の原因となった情報設定が行われた設定情報の名称が設定される。イレギュラー度の欄には、障害発生の原因となった情報設定のイレギュラー度が設定される。障害履歴のイレギュラー度の算出方法は、イレギュラー度算出部１４１によるイレギュラー度の算出方法と同じである。重要度の欄には、障害の重要度が設定される。例えば重要度の高い障害ほど、重要度として高い値が設定される。

なお図１２の例では、設定変更が障害の原因となった障害履歴を例示しているが、障害履歴管理表１２１には、他の原因による障害履歴が含まれる場合もある。設定変更以外の原因で発生した障害に関する障害履歴の場合、例えば設定ファイル名や設定項目名の欄は、空欄となる。また設定変更以外の原因で発生した障害に関する障害履歴の原因を詳細に登録するために、障害履歴管理表に、原因を登録する欄を追加してもよい。

以上のような内容のＤＢを用いて、Ｕ／Ｉ１３０、イレギュラー度算出部１４１、重要度予測部１４２、危険度判定部１４３、および危険度表示部１４４の連携動作により、設定変更を行うことによる危険度が予測される。

図１３は、危険度予測処理の手順の一例を示すフローチャートである。
［ステップＳ１０１］Ｕ／Ｉ１３０は、サーバに対する設定情報の変更内容の入力を受け付ける。例えばＵ／Ｉ１３０は、変更予定情報入力画面をモニタ２１に表示する。そしてＵ／Ｉ１３０は、変更予定情報入力画面に設けられた入力フィールドにユーザが入力した変更内容を取得する。Ｕ／Ｉ１３０は、取得した変更内容を、変更予定情報としてイレギュラー度算出部１４１に送信する。変更予定情報には、例えば変更対象のサーバ、設定ファイル名、変更項目名、および設定値が含まれる。

［ステップＳ１０２］イレギュラー度算出部１４１は、取得した変更予定情報に基づいて、その変更が適用された場合のイレギュラー度を算出する。イレギュラー度算出部１４１は、イレギュラー度算出結果を重要度予測部１４２に送信する。なおイレギュラー度算出処理の詳細は後述する（図１４〜図１７参照）。

［ステップＳ１０３］重要度予測部１４２は、イレギュラー度算出結果に基づいて障害履歴管理ＤＢ１２０から関連障害履歴を検索し、検索結果に基づいて、重要度を予測する。そして重要度予測部１４２は、得られた予測重要度を、危険度判定部１４３に送信する。なお重要度予測処理の詳細は後述する（図１８〜図２０参照）。

［ステップＳ１０４］危険度判定部１４３は、予測重要度に基づいて、情報の設定変更を行うことによる障害発生の危険度を判定する。危険度判定部１４３は、危険度の判定結果を、危険度表示部１４４に送信する。なお危険度算出処理の詳細は後述する（図２１、図２２参照）。

［ステップＳ１０５］危険度表示部１４５は、取得した危険度の判定結果をモニタ２１に表示する。その結果、管理者は、設定変更を適用することによる危険度を、定量的に認識できる。

以下、図１３のステップＳ１０２〜ステップＳ１０４の各処理を詳細に説明する。
＜イレギュラー度算出＞
第２の実施の形態で算出するイレギュラー度としては、例えば、以下のような性質を持つようにする。

以下のような場合、イレギュラー度が低くなるようにする。
・イレギュラー度「低」：例１
「サーバ個別」ルールに所属する設定情報の値の変更を、１台のサーバに対してだけ行う場合。
・イレギュラー度「低」：例２
「第１階層共通」ルールに所属する設定情報の値の、別の共通値への変更を、すべてのサーバに対して行う場合。

また以下のような場合、イレギュラー度が高くなるようにする。
・イレギュラー度「高」：例１
「第１階層共通」ルールに所属する設定情報の値の変更を、１台のサーバに対してだけ行う場合。

さらに以下のような場合、イレギュラー度が中間的な値となるようにする。
・イレギュラー度「中」：例１
「第２階層共通」、「第３階層共通」など中間的なレイヤーで共通している設定情報の値の変更を、１台のサーバに対してだけ行う場合。

イレギュラー度は、例えば、以下の計算式に求められる。
イレギュラー度＝ルール対象サーバ数／変更サーバ数／（１＋ルール対象範囲内エントロピ）・・・（１）
ルール対象サーバ数は、ルール管理表１１２から取得できる。変更サーバ数は、変更予定情報に示される、変更対象のサーバの数である。ルール対象範囲内エントロピは、同一ルールが適用されるサーバ内での設定情報のエントロピ（平均情報量）である。エントロピは、情報の出現確率の偏りの度合いを表すものである。１つの情報が出現確率「１」で出現する場合、エントロピは０となる。複数の情報が、それぞれ１未満の確率で出現する場合、エントロピは正の実数となる。また複数の情報の出現頻度の偏りが大きいほど、エントロピは小さくなる。ルール対象範囲内エントロピは、以下の式で求められる。
ルール対象範囲内エントロピ＝−ΣＰ（Ａ）logＰ（Ａ）・・・（２）
ここで、Ｐ（Ａ）は、変更対象の設定情報と同じルールが適用されるサーバにおいて、その設定情報に現在設定されている値（Ａ）の出現確率である。Σは、総和を表す記号である。対数（log）の底は、例えば「２」とする。ルールが適用されるサーバ内での、適用対象の種別の設定情報の値が完全に統一されている場合、ルール対象範囲内エントロピは「０」となる。ルールから逸脱した値が設定されたサーバが多くなるほど、ルール対象範囲内エントロピの値が大きくなる。すなわち、ルール対象範囲内エントロピは、設定変更前におけるルールからの乖離度合いを示している。

次に、イレギュラー度の算出手順について説明する。
図１４は、イレギュラー度の算出手順の一例を示すフローチャートである。
［ステップＳ１１１］イレギュラー度算出部１４１は、変更対象の設定情報に適用されるルールを取得する。例えばイレギュラー度算出部１４１は、変更予定情報に示される、変更対象のサーバ、設定ファイル名、変更項目名の組に合致するレコードを、ＣＭＤＢ１１０内のルール管理表１１２から検索する。そしてイレギュラー度算出部１４１は、検索でヒットしたレコードに設定されているルールを取得する。

［ステップＳ１１２］イレギュラー度算出部１４１は、取得したルールが適用されるサーバ数（ルール対象サーバ数）を取得する。例えばイレギュラー度算出部１４１は、ステップＳ１１１における検索でヒットしたレコードから、ルール対象サーバ数を取得する。

［ステップＳ１１３］イレギュラー度算出部１４１は、変更サーバ数を取得する。例えばイレギュラー度算出部１４１は、変更予定情報において変更対象として指定されているサーバの数を取得する。

［ステップＳ１１４］イレギュラー度算出部１４１は、ルール対象範囲内エントロピを計算する。例えば、以下の手順でルール対象範囲内エントロピを計算することができる。
イレギュラー度算出部１４１は、ステップＳ１１１で取得したルールに基づいて、共通のルールが適用されるグループの階層を判断する。例えば、ルールが「第１階層共通」であれば、第１階層のグループ内のサーバに対して共通のルールが適用される。またルールが「第２階層共通」であれば、第２階層のグループ内のサーバに対して共通のルールが適用される。

次にイレギュラー度算出部１４１は、ＣＭＤＢ１１０のツリー情報１１１を参照して、共通のルールが適用される階層のグループのうち、変更対象のサーバが属するグループを特定する。例えばイレギュラー度算出部１４１は、共通のルールが適用されるグループの階層が第２階層であれば、変更対象のサーバが属する第２階層のグループを特定する。

さらにイレギュラー度算出部１４１は、ルール管理表１１２を参照し、特定したグループに属するすべてのサーバにおける、変更予定の設定情報と同種の設定情報に現在設定されている設定値の出現率を計算する。変更予定の設定情報を同種の設定情報とは、設定ファイル名と設定項目名との組が、変更予定情報で指定された内容と一致する設定情報である。設定値の出現率は、特定したグループに属するサーバのうちの、その設定値が設定されているサーバ数を、特定したグループに属する総サーバ数で除算した値である。

そしてイレギュラー度算出部１４１は、各設定値の出現率を式（２）に代入し、ルール対象範囲内エントロピを算出する。
［ステップＳ１１５］イレギュラー度算出部１４１は、イレギュラー度を算出する。例えばイレギュラー度算出部１４１は、ステップＳ１１２〜Ｓ１１４で取得した、ルール対象サーバ数・変更サーバ数・ルール対象範囲内エントロピを式（１）に代入し、式（１）の右辺を計算する。計算結果がイレギュラー度となる。

以上のようにしてイレギュラー度を算出することができる。以下、イレギュラー度の算出例について説明する。
図１５は、ルール対象サーバ数・変更サーバ数に応じたイレギュラー度の違いを示す図である。なお図１５の例では、設定対象のサーバと同じグループに属するすべてのサーバにおいて、設定対象の項目に同じ値が設定されているものとする。すなわち、ルール対象範囲内エントロピが「０」のときに、１つまたは２つのサーバの設定変更を行う場合を想定している。

例えば、ルール「第１階層共通」が適用される設定情報の値を変更予定の場合、変更対象が１台であればイレギュラー度は「１０００」となり、変更対象が２台であれば、イレギュラー度は「５００」となる。ルール「第２階層共通」が適用される設定情報の値を変更予定の場合、変更対象が１台であればイレギュラー度は「１００」となり、変更対象が２台であれば、イレギュラー度は「５０」となる。ルール「第３階層共通」が適用される設定情報の値を変更予定の場合、変更対象が１台であればイレギュラー度は「１０」となり、変更対象が２台であれば、イレギュラー度は「５」となる。ルール「サーバ個別」が適用される設定情報の値を変更予定の場合、変更対象が１台であっても２台であってもイレギュラー度は「１」となる。

このように、イレギュラー度は、変更サーバ数が同じであれば、ルール対象サーバ数が多いほど、大きな値となる。またイレギュラー度は、ルール対象サーバ数が同じであれば、変更対象サーバ数が多いほど、小さな値となる。

次に、図１６・図１７を参照し、ルール対象範囲内エントロピに応じたイレギュラー度の違いについて説明する。
図１６は、ルール対象範囲内エントロピが「０」の場合のイレギュラー度算出例を示す図である。図１６の例では、変更予定情報７１において、ルール「第１階層共通」が適用される設定情報が、変更対象に指定されているものとする。すなわち標準的な設定を行うルールでは、変更予定情報７１において設定ファイル名と設定項目名とで特定される、すべてのサーバ内の設定情報に、共通の値を設定することが規定されている。また変更予定情報７１では、変更対象のサーバとして、１台のサーバが指定されている。

設定変更前は、すべてのサーバの設定値が共通であるものとする。すなわち、ルールの適用対象のサーバの設定値がすべて同じであり、ルール対象範囲内エントロピは「０」である。システム内のサーバ数が１０００台の場合、イレギュラー度は「１０００」となる。

算出されたイレギュラー度は、イレギュラー度算出結果７２に示される。イレギュラー度算出結果７２には、例えばサーバ、設定ファイル名、設定項目名、設定値、ルール、およびイレギュラー度が含まれる。

図１７は、ルール対象範囲内エントロピが「０．８１」の場合のイレギュラー度算出例を示す図である。図１７の例では、変更予定情報７３において、ルール「第１階層共通」が適用される設定情報が、変更対象に指定されているものとする。また変更予定情報７３では、変更対象のサーバとして、１台のサーバが指定されている。

設定変更前は、変更対象の設定情報と同種の設定情報には、２の設定値のうちのいずれかが設定されている。一方の値の出現率は７５％であり、他方の値の出現率は２５％である。この場合、ルール対象範囲内エントロピは「０．８１」となる。このルール対象範囲内エントロピを用いて、システム内のサーバ数が１０００台の場合のイレギュラー度を計算すると、イレギュラー度は「５５２」となる。

図１６と図１７とを比較すると分かるように、ルール「第１階層共通」が適用される設定情報の、１つのサーバに対する設定変更であっても、ルール対象範囲内エントロピの値に応じて、イレギュラー度が異なってくる。すなわち設定変更前の設定値の同一性が高ければルール対象範囲内エントロピが小さくなり、イレギュラー度が大きくなる。逆に設定変更前の設定値の同一性が低ければルール対象範囲内エントロピが大きくなり、イレギュラー度が小さくなる。

図１７に示すように、設定変更前の設定情報の共通値分布をルール対象範囲内エントロピで表すことで、設定変更前における設定値の共通性が低いほどイレギュラー度を低くすることができる。その結果、例えば図１６、図１７に示したように、一見すると似た変更パターン（ルール「第１階層共通」の１台のサーバの設定変更）であっても、異なるイレギュラー度となる。

このようなイレギュラー度を導入して、危険度の予測を行うことで、標準値からのはずれ度合いが同程度の過去の設定変更を参考にして、設定変更のリスクを定量的に評価可能となる。

＜重要度予測＞
イレギュラー度が算出されると、算出されたイレギュラー度を用いて重要度が予測される。

図１８は、重要度予測処理の手順の一例を示すフローチャートである。
［ステップＳ１２１］重要度予測部１４２は、障害履歴管理表１２１のレコードのうちの、未処理のレコードを１つ選択する。

［ステップＳ１２２］重要度予測部１４２は、選択したレコードに示される障害履歴の障害の原因が、設定変更か否かを判断する。例えば重要度予測部１４２は、障害履歴に設定項目名が含まれていれば、設定変更が障害の原因であると判断し、設定項目名が空欄であれば、障害の原因は設定変更以外であると判断する。障害の原因が設定変更であれば、処理がステップＳ１２３に進められる。障害の原因が設定変更以外であれば、処理がステップＳ１２７に進められる。

［ステップＳ１２３］重要度予測部１４２は、選択したレコードで示される障害履歴において、障害の原因となった設定変更の対象の設定情報の種別が、変更予定情報に示される設定情報の種別と同じか否かを判断する。例えば選択したレコードの設定ファイル名と設定項目名との組の設定値が、変更予定情報に示される設定ファイル名と設定項目名との組の設定値と同じであれば、設定情報の種別が同じであると判断される。設定情報の種別が同じであれば，処理がステップＳ１２５に進められる。設定情報の種別が同じでなければ、処理がステップＳ１２４に進められる。

［ステップＳ１２４］重要度予測部１４２は、選択したレコードのイレギュラー度が、変更予定情報に示された設定変更のイレギュラー度と類似するか否かを判断する。例えば重要度予測部１４２は、選択したレコードに示されるイレギュラー度と、ステップＳ１０２（図１３参照）で算出したイレギュラー度との差が、予め設定された範囲内であれば、それらのイレギュラー度が類似すると判断する。イレギュラー度が類似する場合、処理がステップＳ１２５に進められる。イレギュラー度が類似しない場合、処理がステップＳ１２７に進められる。

［ステップＳ１２５］重要度予測部１４２は、設定情報の種別が同じと判定（ステップＳ１２３でＹＥＳ）されるか、あるいはイレギュラー度が類似すると判定（ステップＳ１２４でＹＥＳ）された場合、選択したレコードが示す履歴情報を、関連障害履歴とする。そして重要度予測部１４２は、選択したレコードの重要度を、積算重要度に加算する。なお積算重要度は、関連障害履歴の重要度の合計を示しており、重要度予測処理の開始時に初期値「０」が設定されている。

重要度予測部１４２は、重要度を加算する際に、イレギュラー度に応じた重み付けを行ってもよい。例えば重要度予測部１４２は、関連障害履歴のイレギュラー度と、変更予定情報に基づいて算出したイレギュラー度との差が小さいほど大きくなる値を重みとする。そして重要度予測部１４２は、関連障害履歴の重要度に重みを乗算した結果を、積算重要度に加算する。

［ステップＳ１２６］重要度予測部１４２は、関連障害履歴数に１を加算する。関連障害履歴数は、関連障害履歴と判定された障害履歴の数を示しており、重要度予測処理の開始時に初期値「０」が設定されている。

［ステップＳ１２７］重要度予測部１４２は、障害履歴管理表１２１のすべてのレコードについて、関連障害履歴かどうかのチェック処理（ステップＳ１２２〜Ｓ１２５）を行ったか否かを判断する。チェックしていないレコードがあれば、処理がステップＳ１２１に進められる。すべてのレコードのチェックが完了していれば、処理がステップＳ１２８に進められる。

［ステップＳ１２８］重要度予測部１４２は、積算重要度と関連障害履歴数とを用いて、予測重要度を算出する。例えば重要度予測部１４２は、積算重要度を関連障害履歴数で除算して、重要度の平均を計算する。重要度予測部１４２は、計算された平均値を、予測重要度とする。

このように、変更予定情報のイレギュラー度に近いイレギュラー度の履歴情報を、関連障害履歴に加えることで、例えば変更予定情報に示される設定情報に対する設定変更が原因となる障害が過去に発生していなくても、適切な予測重要度を算出できる。

図１９は、関連障害履歴抽出の第１の例を示す図である。図１９の例では、変更予定情報のイレギュラー度算出結果７２には、イレギュラー度「１０００」が設定されている。このとき関連障害履歴と判定するためのイレギュラー度の類似範囲は、イレギュラー度算出結果７２に示されるイレギュラー度を中心として、上下１０％以下の範囲とする。図１９の例では、イレギュラー度「９００〜１１００」の範囲内が、イレギュラー度の類似範囲内とされる。そして障害履歴管理表１２１から、イレギュラー度算出結果７２に示される設定情報（設定ファイル名と設定項目名との組）と同じ種別の設定情報の履歴情報や、イレギュラー度が類似範囲内の履歴情報が、関連障害履歴として抽出される。

関連障害履歴が抽出されると、その関連障害履歴に基づいて、予測重要度が計算される。予測重要度Ｒの計算を式で表すと、以下の通りである。
Ｒ＝｛Ｒ（ｅ）＋Ｒ（ｎｅ）｝／関連障害履歴数・・・（３）
ここで、「Ｒ（ｅ）」は、同一設定項目の履歴情報の積算重要度である。例えば同一設定項目の履歴情報が２件であり、それぞれの重要度が「１」と「２」の場合、「Ｒ（ｅ）＝１＋２＝３」となる。

また「Ｒ（ｎｅ）」は、設定項目が同一でないが、イレギュラー度が類似している履歴情報の積算重要度である。例えばイレギュラー度が類似する履歴情報が６件あり、その履歴情報の重要度の合計が２９であれば、Ｒ（ｎｅ）＝２９となる。

同一設定項目の履歴情報が２件、イレギュラー度が類似する履歴情報が６件、Ｒ（ｅ）＝３、Ｒ（ｎｅ）＝２９の場合、予測重要度Ｒは、Ｒ＝（３＋２９）／８＝４．０となる。

このようにイレギュラー度が近い履歴情報の重要度を積算重要度に加算することで、過去に障害履歴のない設定項目に対する設定変更を行う場合でも、適切な予測重要度の算出が可能となる。

また第２の実施の形態では、ルール対象範囲内エントロピを用いてイレギュラー度が計算される。そのため、一見すると似たような変更パターンでも、変更前の設定項目の値の分布によってイレギュラー度が異なる。このようなイレギュラー度の違いにより、関連障害履歴として抽出される履歴情報も異なってくる。

図２０は、関連障害履歴抽出の第２の例を示す図である。図２０の例では、変更予定情報のイレギュラー度算出結果７４には、イレギュラー度「５５２」が設定されている。このとき関連障害履歴と判定するためのイレギュラー度の類似範囲は、イレギュラー度算出結果７４に示されるイレギュラー度を中心として、上下１０％以下の範囲とする。図２０の例では、イレギュラー度「４９７〜６０７」の範囲内が、イレギュラー度の類似範囲内とされる。そして障害履歴管理表１２１から、イレギュラー度算出結果７４に示される設定項目（設定ファイル名と設定項目名との組）と同じ設定項目の履歴情報や、イレギュラー度が類似範囲内の履歴情報が、関連障害履歴として抽出される。

これにより、より厳密に変更パターンの類型化ができる。例えばシステム移行の過渡期に設定項目の値の変更を行う場合、変更前の時点で、システム内のサーバに複数のバージョンのＯＳが混在することがある。このようなシステム移行の過渡期では、複数言語環境でテストを行うため、ＯＳだけでなく、言語設定が一時的に混在することがある。

図２０の例では、設定ファイル名「/etc/sysconfig/i18n」、設定項目名「LANG」の設定項目に、言語設定を行ったときの障害履歴が障害履歴管理表１２１に登録されている。この障害履歴は、例えばLANG=en＿JP.UTF-8（80%）、LANG=en＿DE.UTF-8（20％）の混在環境下での設定変更が原因で発生した障害を示している。

このような障害履歴は、ＯＳのバージョンの設定変更の障害の重要度の予測の参考となる。第２の実施の形態では、イレギュラー度の算出にルール対象範囲内エントロピを利用しているため、設定変更前の設定値の混在状況が似た履歴情報を関連障害履歴として抽出し、予測重要度の算出に利用できる。その結果、設定変更予定の設定項目と設定値の分布が近い環境における、設置項目の設定変更に関する障害履歴に基づいて予測重要度を算出でき、重要度の予測精度を向上させることができる。

＜危険度判定＞
算出された予測重要度に基づいて、予定されている設定変更の危険度が判定される。例えば危険度判定部１４３は、障害履歴管理表１２１の全レコードの重要度をもとに、予測重要度の偏差値を評価する。そして危険度判定部１４３は、偏差値の値に基づいて、危険度を判定する。偏差値と危険度との関係は、以下の通りとする。
・偏差値が下閾値未満：危険度低
・偏差値が下閾値以上〜上閾値未満：危険度中
・偏差値が上閾値以上：危険度高
閾値は任意の値を設定可能である。例えば下閾値＝４０、上閾値＝６０とする。以下に、危険度判定処理の手順について説明する。

図２１は、危険度判定処理の手順の一例を示すフローチャートである。
［ステップＳ１３１］危険度判定部１４３は、障害履歴管理表１２１の全レコードの重要度の平均を算出する。

［ステップＳ１３２］危険度判定部１４３は、障害履歴管理表１２１の全レコードの重要度の標準偏差を算出する。
［ステップＳ１３３］危険度判定部１４３は、予測重要度、重要度の平均、および標準偏差に基づいて、予測重要度の偏差値を算出する。なお、偏差値の計算式は以下の通りである。
偏差値＝｛１０×（予測重要度−重要度の平均）｝／標準偏差＋５０・・・（４）
［ステップＳ１３４］危険度判定部１４３は、予測重要度の偏差値と閾値とを比較し、危険度（低・中・高）を判定する。

このようにして、危険度が判定できる。例えば、予測重要度（ダウンタイム）が「４０時間」、重要度の平均（ダウンタイム実績平均）が「２０時間」、標準偏差が１０時間である場合、偏差値＝｛１０×（４０−２０）｝／１０＋５０＝７０となる。このようにして求めた標準偏差を下閾値および上閾値と比較して、危険度が判定される。

図２２は、危険度の判定例を示す図である。図２２には、障害履歴管理表１２１内の全レコードの重要度の偏差値分布を示している。横軸が偏差値、縦軸が該当する偏差値の重要度が設定されたレコードの件数である。図２２の例では、危険度判定の下閾値が「４０」、上閾値が「６０」である。この場合、予測重要度の偏差値が４０未満であれば、危険度が低いと判定される。また予測重要度の偏差値が４０以上６０未満であれば、危険度が中程度と判定される。さらに予測重要度の偏差値が６０以上であれば、危険度が高いと判定される。例えば、予測重要度の偏差値が７０の場合、危険度が高いと判定される。

危険度の判定結果は、危険度表示部１４４によりＵ／Ｉ１３０を介したモニタ２１に表示される。その結果、変更予定情報を入力した管理者は、その変更予定情報に示した設定変更を実施することによる危険度を認識することができる。

図２３は、変更予定情報の入力から危険度表示への画面遷移例を示す図である。例えば管理者が変更予定情報を入力する場合、モニタ２１には変更予定情報入力画面８１が表示される。

変更予定情報入力画面８１には、複数のテキストボックス８１ａ〜８１ｄとボタン８１ｅとが設けられている。テキストボックス８１ａは、対象ホスト名の入力領域である。テキストボックス８１ｂは、設定対象のファイルのファイルパスの入力領域である。テキストボックス８１ｃは、設定対象の設定情報の名称（設定項目名）の入力領域である。テキストボックス８１ｄは、設定予定値の入力領域である。ボタン８１ｅは、危険度の予測処理の実行を指示するボタンである。

管理者は、テキストボックス８１ａ〜８１ｄに変更内容を入力し、入力が完了したらボタン８１ｅを押下する。ボタン８１ｅが押下されると、管理装置１００において、各テキストボックスへの入力内容で指定された設定変更を行った場合の危険度が予測される。

なおホスト名、設定ファイルパス、設定項目名の入力は、テキストボックスに代えてセレクトボックスで行うこともできる。例えばセレクトボックスでは、入力候補となる情報がプルダウンメニューで表示される。管理者は、プルダウンメニューに表示された候補の中から、入力する情報を選択することができる。

危険度が判定されると、判定結果を示す危険度表示画面８２〜８４がモニタ２１に表示される。各危険度表示画面８２〜８４には、危険度を示すシグナル８２ａ，８３ａ，８４ａが設けられている。シグナル８２ａ，８３ａ，８４ａは、危険度に応じた色をしている。例えば危険度「高」を示すシグナル８２ａは、赤色の点灯もしくは点滅表示である。また危険度「中」を示すシグナル８３ａは、例えば黄色の点灯もしくは点滅表示である。さら危険度「低」を示すシグナル８４ａは、例えば緑色の点灯である。ここに例示したシグナル８２ａ，８３ａ，８４ａの色は、信号機の色と同じである。このような色で危険度を表示することで、管理者に対して、設定変更による障害の危険性を、直感的に認識させることができる。

また危険度表示画面８２〜８４には、危険度を示すメッセージ表示部８２ｂ，８３ｂ，８４ｂが表示されている。例えば危険度「高」の危険度表示画面８２のメッセージ表示部８２ｂには、「危険度：高（要再検討）」と表示される。また危険度「中」の危険度表示画面８３のメッセージ表示部８３ｂには、「危険度：中（要注意）」と表示される。さらに危険度「低」の危険度表示画面８４のメッセージ表示部８４ｂには、「危険度：低（安全）」と表示される。このようなメッセージの表示により、管理者は、危険の程度を容易に認識することができる。

このようにして、危険度の高さを分かりやすく表示することができる。その結果、管理者は、設定変更を行う前に、危険度に応じた対応策を講じることができる。しかも第２の実施の形態では、同種の設定情報の設定値を変更したことによる障害発生事例が過去になくても、適切な危険度を判定可能である。なお、同種の設定情報の設定値を変更したことによる障害発生事例がある場合、その事例に関する履歴情報も利用して予測重要度が計算される。これにより、重要度の予測精度が向上する。

なお、上記の障害履歴管理ＤＢ１２０には、障害が発生した設定変更に関する履歴情報を格納しているが、障害が発生しなかった設定変更に関する履歴情報を、障害履歴管理ＤＢ１２０に登録してもよい。その場合、例えば重要度０としたレコードが障害履歴管理表１２１に登録される。障害が発生していない場合の履歴情報を登録しておくことで、障害が発生しない設定変更の回数に応じて、予測重要度の値が変化する。例えば障害が発生していない履歴情報（重要度「０」）が関連障害履歴として多数抽出された場合、重要度の平均は低くなり、予測重要度の値が小さくなる。

また第２の実施の形態では、サーバ４１，４２，４３，・・・の設定情報を変更する場合の例を詳細に説明したが、第２の実施の形態の処理は、ストレージ装置５１，５２，・・・の設定情報を変更する場合にも同様に適用できる。さらに第２の実施の形態の処理は、スイッチなどの各種機器の設定変更にも適用可能である。

以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の２以上の構成（特徴）を組み合わせたものであってもよい。

１変更予定情報
２，３ａ，３ｂ，４ａ，４ｂ集合
１０情報処理装置
１１記憶手段
１２決定手段
１３取得手段
１４予測手段

Claims

複数の集合に分類された複数の装置を有するシステムを管理する管理プログラムであって、
コンピュータに、
特定の集合に属する装置のうちの第１の割合の装置の設定情報の変更予定を示す変更予定情報に基づいて、同一集合に属する装置のうちの少なくとも一部の装置の設定情報を変更したときの内容を含む履歴情報を記憶する記憶手段から、同一集合に属する装置のうちの、前記第１の割合と所定の類似関係を満たす第２の割合の装置の設定情報を変更したときの履歴情報を取得し、
取得した該履歴情報に基づいて、前記変更予定情報に示される設定情報の変更を行うことによる前記システムへの影響を予測する、
処理を実行させることを特徴とする管理プログラム。
前記システム内の前記複数の装置が、階層構造の集合に分類されており、設定情報の種別ごとに、設定情報の値をどの階層の集合で共通化するのかに関するルールが定義されており、
前記変更予定情報には、設定変更対象の少なくとも１つの装置、および値を変更する設定情報の種別が指定されており、
前記コンピュータに、さらに、
前記変更予定情報に基づいて、値を変更する設定情報の種別に適用されるルールに示される階層の集合のうち、該少なくとも１つの装置が共に属する集合を特定し、該集合に属する装置に対する、該少なくとも１つの装置の割合を、前記第１の割合と決定する、
処理を実行させることを特徴とする請求項１記載の管理プログラム。
履歴情報の取得では、前記記憶手段から、値を変更する設定情報と同じ種別の設定情報を変更したときの履歴情報を、さらに取得する、
ことを特徴とする請求項１または２に記載の管理プログラム。
影響の予測では、前記第１の割合と前記第２の割合との類似度が高い履歴情報ほど、該履歴情報の内容を、予測に強く反映させる、
ことを特徴とする請求項１乃至３のいずれかに記載の管理プログラム。
履歴情報の取得では、前記特定の集合に属する装置それぞれの設定情報のうち、値を変更する設定情報と同じ種別の設定情報の値を比較し、ルールからの乖離度合いを計算し、計算結果を、前記所定の類似関係を満たすかどうかの判定に利用する、
ことを特徴とする請求項１乃至４のいずれかに記載の管理プログラム。
前記記憶手段に記憶されている履歴情報には、同一集合に属する装置のうちの少なくとも一部の装置の設定情報を変更したときの前記システムへの影響度合いが示されており、
前記影響の予測では、前記システムへの影響の度合いを予測する、
ことを特徴とする請求項１乃至５のいずれかに記載の管理プログラム。
前記記憶手段に記憶されている履歴情報には、設定情報の変更により生じた障害の重要度が含まれており、
影響の予測では、取得した履歴情報に示される重要度に基づいて、予定されている設定変更を実施することによる影響度合いを予測する、
ことを特徴とする請求項６記載の管理プログラム。
影響の予測では、取得した履歴情報に示される重要度に基づいて、予定されている設定変更を実施することで発生する障害の重要度を予測し、取得した履歴情報に示される重要度の分布から、予測した重要度の偏差値を計算し、該偏差値を所定の閾値と比較することで、予定されている設定変更の危険度のランクを判定する、
ことを特徴とする請求項７記載の管理プログラム。
複数の集合に分類された複数の装置を有するシステムを管理する管理方法であって、
コンピュータが、
特定の集合に属する装置のうちの第１の割合の装置の設定情報の変更予定を示す変更予定情報に基づいて、同一集合に属する装置のうちの少なくとも一部の装置の設定情報を変更したときの内容を含む履歴情報を記憶する記憶手段から、同一集合に属する装置のうちの、前記第１の割合と所定の類似関係を満たす第２の割合の装置の設定情報を変更したときの履歴情報を取得し、
取得した該履歴情報に基づいて、前記変更予定情報に示される設定情報の変更を行うことによる前記システムへの影響を予測する、
処理を実行させることを特徴とする管理方法。
複数の集合に分類された複数の装置を有するシステムを管理する情報処理装置であって、
特定の集合に属する装置のうちの第１の割合の装置の設定情報の変更予定を示す変更予定情報に基づいて、同一集合に属する装置のうちの少なくとも一部の装置の設定情報を変更したときの内容を含む履歴情報を記憶する記憶手段から、同一集合に属する装置のうちの、前記第１の割合と所定の類似関係を満たす第２の割合の装置の設定情報を変更したときの履歴情報を取得する取得手段と、
取得した該履歴情報に基づいて、前記変更予定情報に示される設定情報の変更を行うことによる前記システムへの影響を予測する予測手段と、
を有する情報処理装置。