JP2007521579A - アクション中心のアプローチを用いてネットワークシステムの自律管理を行うシステム及び方法 - Google Patents

アクション中心のアプローチを用いてネットワークシステムの自律管理を行うシステム及び方法 Download PDF

Info

Publication number
JP2007521579A
JP2007521579A JP2006544419A JP2006544419A JP2007521579A JP 2007521579 A JP2007521579 A JP 2007521579A JP 2006544419 A JP2006544419 A JP 2006544419A JP 2006544419 A JP2006544419 A JP 2006544419A JP 2007521579 A JP2007521579 A JP 2007521579A
Authority
JP
Japan
Prior art keywords
action
management system
logic block
management
policy description
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006544419A
Other languages
English (en)
Other versions
JP4617317B2 (ja
JP2007521579A5 (ja
Inventor
ウッタムチャンダニ、サンディープ、マドハブ
ボーガンティ、カラダハール
スリニバサン、サンダーシャン
ピース、デイビッド、アラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2007521579A publication Critical patent/JP2007521579A/ja
Publication of JP2007521579A5 publication Critical patent/JP2007521579A5/ja
Application granted granted Critical
Publication of JP4617317B2 publication Critical patent/JP4617317B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/16Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS

Abstract

【課題】本発明によれば、アクション中心のアプローチを用いてストレージシステムの自律管理を行うSAN管理システムを提供する。
【解決手段】SAN管理システムは、管理システムと関連するポリシ記述を維持するポリシ記述ロジックブロックを含む。更に、SAN管理システムは、ロジックの組み合わせと、ポリシ記述から得られた情報とを用いてアクション規則を決定する推論ロジックブロックを含む。また、SAN管理システムは、ポリシ記述ロジックブロックを推論ロジックブロックと結合して管理システムの理解を改善する学習ロジックブロックを含む。この学習は継続し、ユーザからの手動入力への依存を減少させるシステムの自律進化を達成する。
【選択図】図1

Description

本発明は、ネットワークシステム管理の分野に関し、特に、ネットワークシステムの自律管理(autonomic management)を行うシステム及び方法に関する。
ストレージシステム内の実行時間挙動管理(run‐time behavior management)における当面の問題は、複雑性(complexity)及び脆弱性(brittleness)である。複雑性は、ポリシを記述するのに必要とされる詳細のレベルから生じる。これら詳細は些細なものではなく、システム内部の完全な理解及び知識を必要とする。特に、多くの考えられるオブザーバブルセットから、観測するシステムパラメータの組み合わせを選択し、多くのシステム変数セットの相互作用を考慮した後に適切なしきい値を決定し、多くの競合する選択肢セットから特定の修正アクションを選択することは管理者及びシステム構築者にとって困難である。ユーザ、ストレージ装置、ストレージ管理アクション及びサービスレベルアグリーメントの数が増大するにつれて、システム管理者及びストレージ管理ツール開発者がすべての代替手段を考慮することは計算上枯渇になる。
脆弱性に関して、製造業者が、製品内に予めパッケージされた変換コードを用意することは困難である。その理由は、このコードが、システム設定、ユーザ作業負荷及び部門/事業制約の変化に対して脆弱になるためである。従って、可能性がある使用ケースのシナリオのすべてをストレージ管理業者が前もって想像するのは困難であり、従って、現在のストレージ管理ソリューションの多くはワークフロー環境を形成し、これらワークフロー環境は、(ワークフロースクリプトを介して)高水準のサービス品質(QoS)目標値を変換する責任を機関のシステム管理者及びインフラ構造計画者に移す。
本発明の目的は、ストレージシステムで自律管理を行うことにあり、本発明では、複雑性及び脆弱性と関連して生じる問題に対処する。
本発明によれば、アクション中心(action‐centric)のアプローチを用いてネットワークシステムの自律管理を行うネットワーク管理システムを提供する。ネットワーク管理システムは、管理システムと関連するポリシ記述を維持するポリシ記述ロジックブロック(policy specification logic block)を含む。更に、ネットワーク管理システムは、ロジックの組み合わせと、ポリシ記述から得られた情報とを用いてアクション規則を決定する推論ロジックブロックを含む。また、ネットワーク管理システムは、ポリシ記述ロジックブロックを推論ロジックブロック(reasoning logic block)と結合して管理システムの理解を改善する学習ロジックブロック(learning logic block)を含む。この学習は継続し、ユーザからの手動入力への依存を減少させるシステムの自律進化(autonomic evolvement)を達成する。
主として、アクション中心のアプローチを用いてストレージシステムで自律管理を行うシステム及び方法として本発明を説明する。以下の記述では、本発明の充分な理解を得るために多数の具体的な詳細を説明のために述べる。しかし、当業者にとって、これら具体的な詳細なしで本発明を実施できること明らかである。
当業者は、本発明の実施を容易にするように、CPU、メモリ、I/O、プログラムストレージ、接続バス及びその他の適切な部品を含むデータ処理システムのような装置をプログラミングでき、あるいは別の方法で設計できることを理解するであろう。このようなシステムは、本発明の操作を実行する適切なプログラム手段を含む。
データ処理システムと用いる事前記録ディスクまたはその他の類似のコンピュータプログラム製品のような製品は、記録媒体と、本発明の方法の実行を容易にするようデータ処理システムに指示するため、記録媒体上に記憶されたプログラム手段とを含めることができる。このような装置及び製品も本発明の精神及び範囲内に含まれる。
図1には、本発明の例示的な実施形態に従ってアクション中心のアプローチを用いてストレージシステム12の自律管理を行うシステムモデル10を示す。
システムモデル10は、システムマネジャ14を含む。システムマネジャ14は、管理者により指定された目標値に従って管理システム12を調整する。
管理システム12は、アプリケーションからの要求をサービスするのに用いられる一連の資源<R>16を含む。資源16の例として、プロセッサ、ネットワーク、メモリ及びストレージが挙げられる。管理システム12は一連のオブザーバブル<O>18も含む。一連のオブザーバブル18は、アプリケーションに見える管理システム12の属性(例えば、処理能力、待ち時間、信頼性、可用性、安全性)を表す。管理システム12の目標値は、<R>16または<O>18の値に関するしきい値として表される。
管理システム12に入ってくる一連の要求を、幾つかの次元に沿って特徴付けることができる。例えば、ストレージシステムにおいて、代表的な次元は、リード/ライト比、(順次/無作為な)アクセスパターン、要求のブロックサイズなどである。例示的な実施形態では、様々な次元(例えば、要求のブロックサイズなど)に沿って情報を獲得することを用いて、入ってくるストリームの作業負荷特性(workload characteristics)<W>を決定する。
管理システム12と関連する目標値を達成するため、システムマネジャ14はサービスを呼び出すか、または、モニタ22から送信された状態情報(例えば、作業負荷特性、資源16からの資源情報、オブザーバブル18からのオブザーバブル情報など)の結果として管理システム12内の設定パラメータを調整する。サービスの呼び出しとパラメータの変更とは、管理システム12が実行できる一連の適応可能なアクション<A>20を規定する。
例示的な実施形態では、アクション<A>20は第1級の実体である。これらは、資源16及びオブザーバブル18を含む挙動次元(behavior dimensions)に対して影響を持っている。アクションの量的な影響は、管理システム12における現在の作業負荷特性、資源使用率レベル(resource utilization level)並びに観測可能な値に依存する。アクション20は、(ストレージネットワーク産業協会のストレージ管理主導規格(SMI‐S)に基づいて)充分に定義され、規格化された機能を有する。
図2は、本発明の例示的な実施形態に従ってシステムマネジャ14に含まれる論理ブロックのブロック図24である。ブロック図24は、ポリシ記述ロジック26、推論ロジック28及び学習ロジック30を含む。
ポリシ記述
ポリシ記述ロジック26は、維持される管理システム12と関連するポリシ記述を維持する。ポリシ記述を複数のポリシから構成することができる。本発明の例示的な実施形態によれば、ポリシ記述ロジック26により維持されるポリシ記述は、ソフトウェアオブジェクトとしてアクションを処理し、管理者は、(既存のアプローチの複雑な「やり方」の詳細よりはむしろ、)アクションの属性を簡単に規定する。
ポリシ記述ロジック26は、アクション20がソフトウェアオブジェクトとして表されるアクション中心の(イベント中心とは対照的な)アプローチを用いる。既存のアプローチは、ポリシがシステム挙動を異なる状態で規定する「イベント中心」である。ポリシ記述は、これらオブジェクトの属性すなわち修正アクションの特性を規定する。ポリシ記述は、目標値が満たされない場合、どのように管理システム12が反応すべきかを規定しない。アクション20の特性は規定され、推論によりシステムマネジャ14が正確な挙動をオンザフライで導き出す。これら特性は、アクションの呼び出しの費用/利益効果について簡単で且つ宣言型の、脆弱ではない詳細である。
例示的実施形態では、アクション20の属性は、メタ属性及び基本属性を含む2つのカテゴリに該当する。
メタ属性
メタ属性により、システムマネジャ14は、アクションの選択に含まれるトレードオフに関して推論し、アクション20内の幾つかの利用可能な選択肢のうちでどのアクションを呼び出すかを決定することができる。メタ属性は2つの次元に沿って情報を具える。すなわち、
・ アクションを呼び出す影響。これら影響は、一連の挙動結果として記述される。挙動結果は、アクションが管理システム12の資源<R>16またはオブザーバブル<O>18あるいはその両方にどのように影響を及ぼすかを表現する挙動影響ベクトルから成る。
・ アクションの「有効性」が依存する前提条件。作業負荷条件<W>または資源<R>16への制限という点においてこれら前提条件は述語である。
基本属性
このグループの属性は、メタ属性の利用により選択されたアクションをどのようにして正確に呼び出すかを指定する。このことは、アクションを呼び出すパラメータの値への制限に合致しながら、これら値を選択することを含む。
更に、メタ属性カテゴリ及び基本属性カテゴリに対して、ポリシ記述は、ある例外も含む。
表1 オブジェクトのポリシ記述用の定型書式
Figure 2007521579
本発明の例示的な実施形態によれば、表1は、ポリシ記述におけるオブジェクトの記述についての典型書式を規定する。
表2 ポリシ記述文法
Figure 2007521579
表3 先取りノブ定義
Figure 2007521579
本発明の例示的な実施形態によれば、表3は、表2の文法を用いる先取り知識の例示的な定義を規定する。
推論
推論ロジック28は、ロジックの組み合わせ及び基本属性を用いてアクション規則の決定を「オンザフライで」行う。システムマネジャ14を警報駆動し、1つ以上の目標値が破られていることを管理システム12が指摘する時だけ、システムマネジャ14は推論手続きを呼び出す。管理システム12は、警告を発することにより1つ以上の目標値の侵害を知らせる。システムマネジャ14は、推論のため、ポリシ記述に基づいて形成された知識基盤を用い、管理システム12を、すべての目標値が満たされる状態に戻す1つ以上のアクション20を呼び出すことを決定する。
図3は、本発明の例示的な実施形態に従ってシステムマネジャ14の推論ロジック28内で推論を実行する方法32である。ブロック34において、方法32が始まる。
ブロック36において、管理システム12と関連する挙動目標値を識別する。挙動目標値は、システムを実行する責任がある管理者により指定されている。これら目標値はサービスレベルアグリーメント(SLA)に類似し、管理システム12の観測される挙動に対する制約を規定する。挙動目標値の例として、5ミリ秒未満の待ち時間、100Mbpsを超える処理能力、1年当たり5分未満のシステムダウン時間などが挙げられる。
ブロック38において、管理システム12の作業負荷特性を決定する。
ブロック40において、管理システム12により用いられる資源を決定する。
ブロック42において、ブロック36で識別した挙動目標値が満たされているかを決定する。肯定応答であれば、方法32がブロック36に戻る。
ブロック42に戻って、否定応答であれば、ブロック44において、システムマネジャ14の推論ロジック28を開始するトリガを起動する。
ブロック46において、管理システム12と関連する基準設定を識別する。この基準設定は、識別された挙動目標値(behavior goals)(工程36参照)が満たされた管理システム12に関する前設定である。
ブロック48において、識別した基準設定を管理システム12の現在設定と比較して、識別された挙動目標値(工程36参照)をかなえさせないシステム特性(例えば、作業負荷、資源、環境、目標値など)またはシステム特性の組み合わせを識別する。この比較は、挙動レベル及び状態レベルでの(複数の)変化を理解するのに役立つ。
システム特性の例としてはこれらに限定されないが、下記の事項が挙げられる。
a.資源使用率(百分率)[c]:これは、欠陥、資源追加及びアプリケーション動作範囲を明らかにする。
b.アプリケーション要求特性[c
c.指定目標値[c
d.環境[c]:これは、システム内の他の部品との依存性を明らかにする。現在の作業がスタンドアロンシステムに焦点を合わせているので、この態様は今後の作業の一部である。
ほどんどの場合、[c]において[c]及び[c]の複合効果が反映する。
表4 システム特性ファイル‐システムパラメータ
Figure 2007521579
ブロック50において、ポリシ記述ロジック26により維持されるポリシ記述を検索して、ブロック48で識別されたシステム特性またはシステム特性の組み合わせに整合する属性を有する適応オブジェクトの位置を検出する。検索の結果、c、c及びcのパラメータに影響を及ぼすすべての適応オブジェクトの選抜候補リストが生じる。
ポリシ記述の検索は、表に基づく簡単なアプローチに基づく。すなわち、c、c及びcでのパラメータの各々に対して、適応オブジェクトは表の形態で配置され、言い換えれば、資源、アプリケーション特性及び環境の所望の集まりに影響を及ぼすオブジェクトである。結合動作を用いて、2つ以上のカテゴリ内のパラメータに影響を及ぼすオブジェクトを選択する。
ブロック52において、選抜候補リストを適応オブジェクト前提条件に基づいてフィルタリングする。前提条件は、(呼び出された場合、)アクションが有効になることを確実にするシステム状態及び作業負荷特性の要件である。例えば、先取りアクションの場合、作業負荷が連続し、メモリが利用できるということが前提条件である。
ブロック54において、満たされていない目標値に影響を部分的または全面的に及ぼす適応オブジェクトを含むリストを作成する。
アクションに関する高次演算の実行
図5には、N次元挙動空間56を示す。目標値(c)の次元は、呼び出す必要がある適応オブジェクトの組み合わせと、対応の変化度とを決定するのに用いられる。
図4に戻る。
ブロック58において、呼び出す必要がある適応オブジェクトの組み合わせと、対応の変化度に関する決定を行う。選抜候補リストの適応オブジェクトと、影響を受ける挙動次元の推定値とを目標値(c)の次元に与える(上記の図5参照)。挙動次元は、ポリシ記述内容の組み合わせ及び自己学習により導き出される。
ブロック58の動作をベクトル空間動作の点から見て説明することができる。ベクトル空間は、図5に示すようにn次元挙動空間を表す。各適応オブジェクトは、単位ベクトルとしてn次元挙動空間内で表される。ベクトルの方向は、影響を受ける挙動次元の推定値である。長さは、適応オブジェクトの基本呼び出しのための変化度を意味する。
単位ベクトル(図5参照)の組み合わせ及び関連の長さを決定する。
図6は、ブラックウェルの定理(Blackwell’s theorem)に基づくベクトル加法を示す線図59であり、ベクトルを結合するため、ブラックウェルの定理に基づく再帰アルゴリズムが用いられている。
現在状態62から始まって所望の状態64に至る目標ベクトル60を生成する。
目標ベクトル60との余弦角が最大となる単位ベクトルを選択する。ベクトルの刻み幅はkである。ここで、「k」は、システムの不安定の度合いを意味する(k<目的ベクトルの長さ)。目標ベクトル60の生成と、目標ベクトルとの余弦角が最大となる単位ベクトルの選択とを繰り返す。例示的な実施形態では、(刻み幅kを有する)単位ベクトルが目標ベクトルに等しくなるまで、目標ベクトルの生成を繰り返す工程を繰り返す。各繰り返し中、アルゴリズムは、所定の状態に対して実現可能な最善のアクション(例えば、現在状態に基づく局所的最適化)を選択する。
アクションを呼び出す方法を決定するための基本記述の利用
ブロック66において、呼び出すべき1つ以上のアクションを決定した後、各挙動次元(資源及びオブザーバブル)に沿って要求された量的変化に関しての決定を行う。どのパラメータ値をアクションに設定するかを決定するために付加的なアプローチを用いる。例えば、一方向にパラメータ値の単位変化を有するアクションを呼び出す。この工程の結果が予想通りであれば、このアクションを繰り返し呼び出し、システムが満足のいく状態に達するまで、パラメータの値を増大する。予想通りでなければ、アクションパラメータ値の変化方向を逆にし、ブロック66のアクションを繰り返す。
従って、管理システム12の1つ以上の目標値が破られているということをシステムが指摘すれば、推論モジュールを呼び出す。
ブロック68において、方法32が終了する。
学習
図2に戻る。学習ロジック30は、学習をポリシ記述(ポリシ記述ロジック26)及び推論(推論ロジック28)と結合する方法を行う。測定値及びしきい値で知識基盤を絞り込むのに学習ロジック30を用いる。機械学習用のアプローチ(例えば、ニューラルネットワーク、決定木(decision trees)、「K最近隣」(K Nearest Neighbours:K‐NN)法など)のような既存のアプローチが活用されている。既存のアプローチは分類に用いられており、本明細書では、先の決定への応答から学習するのに用いられる。
学習は、メタ記述レベル(上記のメタ属性を参照する)、基本記述レベル(上記の基本属性を参照する)、アクション間の関係を保護するレベル、並びに、管理者からの学習が達成されるレベルを含む複数のレベルで体系的に行われる。
メタ記述レベル
管理者は、アクションの結果に関する不完全または不明確な情報を与えることができる。例えば、これら情報は、アクションが上述の影響を持たない1つ以上の前提条件次元の値を特定できない場合がある。システムは、正常な動作中、これら追加の前提条件について学習し、これに応じてポリシ記述を変更する。
学習の他の例として、フレームワークにより、管理者は、システムを推論に導くヒントを指定することができる。例えば、システム状態を修正するため、2つ以上のアクションを呼び出すことができるシナリオにおいて、管理者は、特定の作業負荷条件下で呼び出すアクションを(過去の経験に基づいて)指定することができる。木の葉が、呼び出すアクションの管理者の選択肢を含む決定木を用いて作業負荷条件を特定することにより上記のことを実施できる。
基本記述レベル
システムは、付加的な呼び出しから学ぶことができる。アクションを呼び出すためのパラメータの値を決定するため、アクションエージェントは、付加的なアプローチに加えて、ニューラルネットワークに基づくアプローチを用いて、パラメータのどの近似値とすべきかを過去の呼び出しから知ることができる。次に、アクションエージェントは、この時点から付加的なアプローチに従う。
アクション間の関係、並びに、管理者からの学習
アクションの属性を学習することに加えて、アクションの呼び出し間の関係を記録し、パターンを導き出そうとすることによりパターンを導き出すこともできる(例えば、アクションA及びBは常に一緒に呼び出され、アクションC及びDは互いを無効にするなど)。
管理者を監視することによっても学習を達成できる。管理者が、満たされていない目標値に応じてアクションを呼び出す場合、システムはレコードを生成し、資源レベル、作業負荷特性、目標値及び所望のアクションのような詳細を記録する。このレコードは「事例」を生成するのに用いられ、事例ベース推論(Case‐based Reasoning:CBR)に既存のアプローチを用いる。
図7は、本発明の例示的な実施形態によるシステムマネジャ14並びに機能(例えば、モニタ、アクチュエータなど)との相互作用を示すブロック図70である。意思決定モジュール72は、幾つかの構成要素エージェント間の相互作用を介して実施される。これら構成要素エージェントを以下で簡単に説明する。
システムエージェント74はその他すべてのエージェント間の交信を調整し、システムにおいて、アクション属性に関する入力を管理者から獲得し、ポリシ記述に基づいて自律機能を行うために監視する。システムの管理者は、モニタ及びアクチュエータと同様にシステムエージェント74と直接に相互作用する。システムエージェント74は、システム状態を得るためにポールモデルを用いる。システムエージェント74はモニタを定期的にポーリングし、状態変数を更新する。次に、目標値が破られていないかどうか検査する。目標値が破られていれば、システムエージェント74は、この状況を修正する意思決定処理を呼び出す。
入力エージェント76は、ユーザにより与えられたポリシ記述を持続性ストレージの幾つかの表現に変換する責任がある。入力エージェント76は、与えられたXML(拡張可能なマーク付け言語)の記述を容易に解析し、データベーステーブルに投入する。この形態でアクション属性を記憶することにより、学習中にマネジャにより容易に更新できるのみならず、必要な時に情報を簡単に検索することもできる。
決定エージェント72は、マネジャが幾つかの実行可能なアクションの中からどれを呼び出すべきかを決定する。これを達成するため、決定エージェント72はメタ記述を用いてアクション間で推論し、システムを、すべての目標値が満たされる状態に戻すため、呼び出すべき1つ以上のアクションを選択する。このようなアクションがなければ、決定エージェント72は空の集合を戻す。
アクションエージェント78は、決定エージェントにより生成された1つ以上のアクションから成る集まりを獲得し、基本記述を用いて、アクションを呼び出すパラメータの値を決定する。
図8には、本発明の例示的な実施形態に従って、管理システム12における記述、推論及び自己学習についてアクション中心のアプローチを実行する方法86を示す。
ブロック88において、方法86が始まる。
ブロック90において、システムの管理者は、アクション属性の記述を含むXMLファイルをシステムエージェント74へ送信する。
ブロック92において、次に、システムエージェント74は要求を入力エージェント76に送り、この入力エージェント76はファイルを解析し、持続性論理構造体を生成する。このことは、管理システム12を開始する時に一度行われ、まれに起こるアクション属性の変更を必要とする時に再び呼び出されなければならない。
ブロック94において、システムエージェント74は、モニタにより集められた情報から形成されたシステム状態を検査する。例示的な実施形態では、この検査は、システムエージェント74により定期的に行われる。周期的とは、管理者またはソフトウェアあるいはその両方により設定できる時間の単位である。
ブロック96において、システムエージェント74は資源及びオブザーバブルの現在値を、目標値に指定されている所望の範囲と比較する。
ブロック98において、すべての管理システム12の目標値が満たされていないかを決定する。肯定応答であれば、ブロック110において方法86が終了する。
ブロック98に戻って、否定応答であれば、ブロック100において、適切な要求を生成する変化解析を開始する。1つまたはそれ以上の目標値が満たされなければ、システムは変化解析を実行し、変化解析は、すべての目標値が満たされる状態をシステムにもたらすため、資源またはオブザーバブルあるいはその両方の値に必要とされる最小数の変化を要約する。
ブロック102において、ブロック100の変化解析の要約を記録し、解決要求として決定エージェント72へ送信する。
ブロック104において、決定エージェント72はアクション間で推論し、呼び出すべきアクションまたはアクションセットを選択する。
ブロック106において、次に、アクションエージェント78は、このアクションセットとシステムの現在状態及び目標状態とを獲得し、基本記述に与えられた利用意味に基づいて、識別した(複数の)アクションと関連するパラメータの値を選択する。
ブロック108において、システムエージェント74は、アクションエージェント78によりブロック106で選択されたパラメータ値に基づいてアクションを呼び出す。
ブロック110において、方法86が終了する。
このようにして、アクション中心のアプローチを用いてストレージシステムにおいて自律管理を行うシステム及び方法を説明した。特定の例示的な実施形態を参照して本発明を説明したが、本発明の広範囲な精神及び範囲から逸脱することなく、これら実施形態に様々な修正及び変更を行うことができること明らかである。従って、上述の実施形態及び図面を、限定的な意味よりはむしろ例示的な意味に受け取るべきである。
本発明の例示的な実施形態に従ってアクション中心のアプローチを用いてストレージシステムの自律管理を行うシステムモデルのブロック図である。 本発明の例示的な実施形態に従ってコンピュータシステムの挙動を動的に管理するのに用いられるシステムマネジャ内に含まれる論理ブロックのブロック図である。 本発明の例示的な実施形態に従ってシステムマネジャ内で推論を実行する方法を示す流れ図である。 本発明の例示的な実施形態に従ってシステムマネジャ内で推論を実行する方法を示す流れ図である。 N次元挙動空間を示す図である。 ブラックウェルの定理に基づく再帰アルゴリズムを用いてベクトルを結合する、ブラックウェルの定理に基づくベクトル加法を示す図である。 本発明の例示的な実施形態によるシステムマネジャ及び機能との相互作用を示すブロック図である。 本発明の例示的な実施形態に従って管理システムにおける記述、推論及び自己学習についてアクション中心のアプローチを実行する方法を示す流れ図である。

Claims (26)

  1. ネットワークシステムの自律管理を行うシステムであって、前記システムが、前記ネットワークシステムと関連するポリシ記述を維持するポリシ記述ロジックブロックと、前記ポリシ記述ロジックブロックから得られた情報を用いてアクション規則を決定する推論ロジックブロックと、推論ロジックによる推論に従って前記ポリシ記述に自律的に調節し、これにより、前記ネットワークシステムを管理する学習ロジックブロックとを含むシステム。
  2. 前記ポリシ記述ロジックブロックにより維持されている前記ポリシ記述が、前記ネットワークシステムと関連する複数の挙動目標値を識別する、請求項1に記載のシステム。
  3. 前記推論ロジックが、前記識別した挙動目標値が満たされているかを決定する、請求項2に記載のシステム。
  4. 前記識別した挙動目標値が満たされていないことが決定されると、前記推論ロジックがアクション形式の呼び出しを選択する、請求項3に記載のシステム。
  5. アクション中心のアプローチを用いてストレージシステムの自律管理を行うシステムであって、前記システムが、管理システムと関連するポリシ記述を維持するポリシ記述ロジックブロックと、前記ポリシ記述から得られた情報、並びにロジックの組み合わせを用いてアクション規則の決定を行う推論ロジックブロックと、前記ポリシ記述ロジックブロックを前記推論ロジックブロックと結合して管理システムの理解を改善する学習ロジックブロックとを含み、前記学習が継続し、ユーザからの手動入力への依存及び保守を減少させる前記システムの自律進化を達成するシステム。
  6. 前記ポリシ記述が複数のポリシから構成されている、請求項5に記載のシステム。
  7. 前記ポリシ記述がソフトウェアオブジェクトとしてアクションを処理する、請求項5または6に記載のシステム。
  8. 前記ポリシ記述が前記ソフトウェアオブジェクトの属性を規定する、請求項7に記載のシステム。
  9. 属性がメタ属性及び基本属性を含む、請求項8に記載のシステム。
  10. メタ属性が、前記ソフトウェアオブジェクトの各々を選択する際に含まれるトレードオフに関する推論と、前記ソフトウェアオブジェクトの各々と関連する幾つかの利用可能な選択肢から呼び出すアクションの決定とを容易にする、請求項9に記載のシステム。
  11. メタ属性は、アクションを呼び出す影響と、前記アクションの有効性が依存する前提条件とに対応する情報を具える、請求項9または10に記載のシステム。
  12. 前記アクションを呼び出す前記影響が一連の挙動結果として特定され、挙動結果が、前記アクションがどのように前記管理システムの資源及びオブザーバブルに前記影響を及ぼすかを表す挙動影響ベクトルを含む、請求項11に記載のシステム。
  13. 前記アクションの前記有効性が依存する前記前提条件が、作業負荷条件、または前記管理システムの資源への制限という点において述部を含む、請求項11または12に記載のシステム。
  14. 基本属性が、選択されているアクションをどのようにして正確に呼び出すかを特定する属性を含み、前記アクションが前記管理システムのメタ属性を介して選択されている、請求項9〜13のいずれか一項に記載のシステム。
  15. アクションをどのようにして正確に呼び出すかに関する前記特定が、前記アクションと関連する選択パラメータ値を含む、請求項14に記載のシステム。
  16. 前記推論ロジックブロックが、ロジックの組み合わせ及び前記基本属性を用いることによりアクション規則の前記決定を行う、請求項1〜15のいずれか一項に記載のシステム。
  17. 前記管理システムと関連する1つまたはそれ以上の目標値が満たされていないことを前記管理システムが指摘すると、前記推論ロジックブロックが呼び出され、満たされていない前記1つまたはそれ以上の目標値に応じて、1つまたはその以上のアクションが前記推論ロジックブロックにより呼び出されて、前記目標値のすべてが満たされている状態に前記管理システムを戻すようになっている、請求項1〜16のいずれか一項に記載のシステム。
  18. 前記学習ロジックブロックが、前記ポリシ記述ロジックブロックにより維持される前記ポリシ記述と、前記推論ロジックブロックで行われる推論とを学習に結合して、前記管理システムの管理に関して絞り込まれた知識基盤を形成するようになっている、請求項1〜17のいずれか一項に記載のシステム。
  19. メタ記述レベルと、基本記述レベルと、アクション間の関係を保護するレベルと、管理者からの学習が達成されるレベルとを含む複数のレベルで学習が行われる、請求項18に記載のシステム。
  20. 不完全または不明確な情報を含む前記ポリシ記述に応じて前記ポリシ記述を修正するため、前記メタ記述レベルが、正常な動作中に学習した前記システムの使用情報を含む、請求項19に記載のシステム。
  21. 前記基本記述レベルが、前記アクションと関連してパラメータ値を近似するため、前記管理システムの過去の呼び出しと関連する前記管理システムの使用情報を含む、請求項19または20に記載のシステム。
  22. ネットワークシステムの自律ポリシ管理を行う方法であって、前記方法は、前記ネットワークシステムと関連する挙動目標値を識別する工程と、前記ネットワークシステムの作業負荷特性を識別する工程と、前記ネットワークシステムの資源利用率を決定する工程と、前記識別した挙動目標値が満たされているかを、前記識別した作業負荷特性と、決定した資源利用率とに基づいて決定する工程と、前記識別した挙動目標値が満たされていないという決定に応答して、前記識別した作業負荷特性並びに、決定した資源利用率を自律的に調節する工程とを有し、自律調節は、前記識別した作業負荷特性並びに、前記決定した資源利用率を、前記識別した挙動目標値が満たされるレベルに動的に調節する方法。
  23. アクション中心のアプローチを用いてネットワークシステムの自律管理を行うようにシステムを展開する方法であって、前記方法が、前記ネットワークシステムの前記管理でポリシを維持するのに用いられている現在の管理システムを評価し、前記ポリシが、前記ネットワークシステムの特性を考慮して取るべきシステムアクションを指定する工程と、前記ネットワークシステムを管理するために自律管理システムを用いて前記現在の管理システムを更新するし方を決定する工程と、決定した前記更新に従って前記自律管理システムを展開する工程とを有し、更新が前記現在の管理システムを前記自律管理システムと置き換えるか、あるいは、前記自律管理システムを前記現在の管理システム内で統合することを含む方法。
  24. システムアクションがメタ属性及び基本属性を含む、請求項23に記載の方法。
  25. 前記ネットワークシステムの特性がシステム作業負荷、システム資源、システム環境及びシステム目標値を含む、請求項23または24に記載の方法。
  26. 前記ネットワークシステムが、ストレージエリアネットワーク(SAN)である、請求項23または24または25に記載の方法。
JP2006544419A 2003-12-15 2004-12-08 アクション中心のアプローチを用いてネットワークシステムの自律管理を行うシステム及び方法 Expired - Fee Related JP4617317B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/737,519 US7734561B2 (en) 2003-12-15 2003-12-15 System and method for providing autonomic management of a networked system using an action-centric approach
PCT/EP2004/053352 WO2005060159A1 (en) 2003-12-15 2004-12-08 A system and method for providing autonomic management of a networked system using an action-centric approach

Publications (3)

Publication Number Publication Date
JP2007521579A true JP2007521579A (ja) 2007-08-02
JP2007521579A5 JP2007521579A5 (ja) 2010-05-20
JP4617317B2 JP4617317B2 (ja) 2011-01-26

Family

ID=34654143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006544419A Expired - Fee Related JP4617317B2 (ja) 2003-12-15 2004-12-08 アクション中心のアプローチを用いてネットワークシステムの自律管理を行うシステム及び方法

Country Status (6)

Country Link
US (2) US7734561B2 (ja)
EP (1) EP1700422B1 (ja)
JP (1) JP4617317B2 (ja)
KR (1) KR100985624B1 (ja)
CN (1) CN1894892B (ja)
WO (1) WO2005060159A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010519646A (ja) * 2007-02-22 2010-06-03 ネットアップ,インコーポレイテッド データセットを用いるデータストレージシステム内でのデータマネジメント
JP2011508340A (ja) * 2007-12-27 2011-03-10 マイクロソフト コーポレーション 層割り当ての品質の決定

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2435655A1 (en) * 2003-07-21 2005-01-21 Symbium Corporation Embedded system administration
US7370098B2 (en) * 2003-08-06 2008-05-06 International Business Machines Corporation Autonomic management of autonomic systems
US20060026054A1 (en) * 2004-07-28 2006-02-02 International Business Machines Corporation Method, apparatus, and program for implementing an automation computing evaluation scale to generate recommendations
CA2504333A1 (en) * 2005-04-15 2006-10-15 Symbium Corporation Programming and development infrastructure for an autonomic element
US7640231B2 (en) * 2005-11-16 2009-12-29 International Business Machines Corporation Approach based on self-evolving models for performance guarantees in a shared storage system
US8346735B1 (en) * 2008-09-30 2013-01-01 Emc Corporation Controlling multi-step storage management operations
US20140180738A1 (en) * 2012-12-21 2014-06-26 Cloudvu, Inc. Machine learning for systems management
US8880446B2 (en) 2012-11-15 2014-11-04 Purepredictive, Inc. Predictive analytics factory
WO2014110167A2 (en) 2013-01-08 2014-07-17 Purepredictive, Inc. Integrated machine learning for a data management product
US20140257908A1 (en) * 2013-03-07 2014-09-11 Avaya Inc. Viewer pattern analysis
US9218574B2 (en) 2013-05-29 2015-12-22 Purepredictive, Inc. User interface for machine learning
US9646262B2 (en) 2013-06-17 2017-05-09 Purepredictive, Inc. Data intelligence using machine learning
US10250451B1 (en) * 2014-01-13 2019-04-02 Cazena, Inc. Intelligent analytic cloud provisioning
GB201620199D0 (en) 2015-12-18 2017-01-11 British Telecomm Autonomic method for managing a computer system
CN111247539A (zh) 2017-10-19 2020-06-05 英国电讯有限公司 算法整合
US10867044B2 (en) 2018-05-30 2020-12-15 AppOmni, Inc. Automatic computer system change monitoring and security gap detection system
WO2021083573A1 (en) 2019-10-30 2021-05-06 British Telecommunications Public Limited Company A computer-implemented method of modifying an algorithm operating on a computing system
US11687414B2 (en) 2020-03-31 2023-06-27 International Business Machines Corporation Intelligent backup engine for data freshness
US11314783B2 (en) 2020-06-05 2022-04-26 Bank Of America Corporation System for implementing cognitive self-healing in knowledge-based deep learning models
US11429601B2 (en) 2020-11-10 2022-08-30 Bank Of America Corporation System for generating customized data input options using machine learning techniques
US11966360B2 (en) 2021-01-04 2024-04-23 Bank Of America Corporation System for optimized archival using data detection and classification model
US20220303191A1 (en) * 2021-03-18 2022-09-22 Nokia Solutions And Networks Oy Network management

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000072183A2 (en) * 1999-05-24 2000-11-30 Aprisma Management Technologies, Inc. Service level management

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2016451C (en) * 1989-06-30 2001-10-16 Rhonda L. Alexander Apparatus and method for computer-aided decision making
US6144989A (en) * 1998-06-15 2000-11-07 Dejima, Inc. Adaptive agent-oriented software architecture
US7136645B2 (en) * 1998-10-09 2006-11-14 Netmotion Wireless, Inc. Method and apparatus for providing mobile and other intermittent connectivity in a computing environment
US6473851B1 (en) * 1999-03-11 2002-10-29 Mark E Plutowski System for combining plurality of input control policies to provide a compositional output control policy
US7246370B2 (en) * 2000-01-07 2007-07-17 Security, Inc. PDstudio design system and method
US7917647B2 (en) * 2000-06-16 2011-03-29 Mcafee, Inc. Method and apparatus for rate limiting
JP4292693B2 (ja) * 2000-07-07 2009-07-08 株式会社日立製作所 計算機資源分割装置および資源分割方法
US7814194B2 (en) * 2000-12-07 2010-10-12 International Business Machines Corporation Method and system for machine-aided rule construction for event management
JP4457184B2 (ja) * 2001-02-13 2010-04-28 ネットアップ,インコーポレイテッド ストレージシステムにおけるフェイルオーバー処理
US7046650B2 (en) * 2001-03-02 2006-05-16 At&Tcorp. Interference suppression methods for 802.11
US7069337B2 (en) 2001-03-20 2006-06-27 Mci, Inc. Policy-based synchronization of per-class resources between routers in a data network
US20030105825A1 (en) 2001-05-01 2003-06-05 Profluent, Inc. Method and system for policy based management of messages for mobile data networks
US20040103315A1 (en) * 2001-06-07 2004-05-27 Geoffrey Cooper Assessment tool
US7130854B2 (en) 2001-08-14 2006-10-31 Endforce, Inc. Selection and storage of policies in network management
US20030041139A1 (en) 2001-08-14 2003-02-27 Smartpipes, Incorporated Event management for a remote network policy management system
US20030061491A1 (en) 2001-09-21 2003-03-27 Sun Microsystems, Inc. System and method for the allocation of network storage
US6854035B2 (en) 2001-10-05 2005-02-08 International Business Machines Corporation Storage area network methods and apparatus for display and management of a hierarchical file system extension policy
US20030115204A1 (en) 2001-12-14 2003-06-19 Arkivio, Inc. Structure of policy information for storage, network and data management applications
US6856942B2 (en) * 2002-03-09 2005-02-15 Katrina Garnett System, method and model for autonomic management of enterprise applications
US7269612B2 (en) * 2002-05-31 2007-09-11 International Business Machines Corporation Method, system, and program for a policy based storage manager
WO2004017201A2 (en) * 2002-08-13 2004-02-26 International Business Machines Corporation An adaptive management method and system with automatic dependency resolution
US20040059704A1 (en) * 2002-09-20 2004-03-25 International Business Machines Corporation Self-managing computing system
US7986625B2 (en) * 2002-12-10 2011-07-26 International Business Machines Corporation Resource-aware system, method and program product for managing request traffic based on a management policy
US7149738B2 (en) * 2002-12-16 2006-12-12 International Business Machines Corporation Resource and data administration technologies for IT non-experts
US7350186B2 (en) * 2003-03-10 2008-03-25 International Business Machines Corporation Methods and apparatus for managing computing deployment in presence of variable workload
US7480912B2 (en) * 2003-05-29 2009-01-20 International Business Machines Corporation Method for policy-based, autonomically allocated storage
US8386272B2 (en) * 2003-08-06 2013-02-26 International Business Machines Corporation Autonomic assistance for policy generation
US7664798B2 (en) * 2003-09-04 2010-02-16 Oracle International Corporation Database performance baselines

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000072183A2 (en) * 1999-05-24 2000-11-30 Aprisma Management Technologies, Inc. Service level management

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6010000421, Shanliang JIANG、外3名, "An Intelligent and Integrated System of Network Fault Management:Artificial Intelligence Technologie", Networks, 1995. Theme: ’Electrotechnology 2000: Communications and Networks’ in conjunction with the, 19950707, Proceedings of IEEE Singapore Internatio, p.265−268 *
JPN6010037024, Kephart, J.O.、外1名, "The vision of autonomic computing", IEEE Computer Society, 200301, p.41−50 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010519646A (ja) * 2007-02-22 2010-06-03 ネットアップ,インコーポレイテッド データセットを用いるデータストレージシステム内でのデータマネジメント
JP2011508340A (ja) * 2007-12-27 2011-03-10 マイクロソフト コーポレーション 層割り当ての品質の決定
US9177042B2 (en) 2007-12-27 2015-11-03 Microsoft Technology Licensing, Llc Determining quality of tier assignments

Also Published As

Publication number Publication date
US20050132052A1 (en) 2005-06-16
US7734561B2 (en) 2010-06-08
US8352593B2 (en) 2013-01-08
EP1700422A1 (en) 2006-09-13
CN1894892A (zh) 2007-01-10
WO2005060159A1 (en) 2005-06-30
JP4617317B2 (ja) 2011-01-26
KR100985624B1 (ko) 2010-10-05
CN1894892B (zh) 2011-05-11
KR20060126494A (ko) 2006-12-07
US20100205133A1 (en) 2010-08-12
EP1700422B1 (en) 2014-01-22

Similar Documents

Publication Publication Date Title
JP4617317B2 (ja) アクション中心のアプローチを用いてネットワークシステムの自律管理を行うシステム及び方法
US7680799B2 (en) Autonomic control of a distributed computing system in accordance with a hierarchical model
US7454427B2 (en) Autonomic control of a distributed computing system using rule-based sensor definitions
US7640231B2 (en) Approach based on self-evolving models for performance guarantees in a shared storage system
US8141130B2 (en) Automated dissemination of enterprise policy for runtime customization of resource arbitration
Palm et al. Online reinforcement learning for self-adaptive information systems
US20150213087A1 (en) Scaling framework for querying
US20090327172A1 (en) Adaptive knowledge-based reasoning in autonomic computing systems
US8478788B1 (en) Centralized information technology resources analysis system
US11394719B2 (en) Dynamic user access control management
Charalambides et al. Dynamic policy analysis and conflict resolution for diffserv quality of service management
US6553360B1 (en) Software-based problem-resolution production system with standardized information providers & solution interpreters
US7065565B2 (en) System and method for policy-enabled, contract-based management of network operational support systems
Fallon et al. Apex: An engine for dynamic adaptive policy execution
CN103414717A (zh) 一种关于c/s结构业务系统的仿真监控方法和系统
Sikora et al. Neural adaptive control in application service management environment
Shmelkin et al. Towards role-based context-aware monitoring systems
Fallon et al. Applying semantics to optimize end-user services in telecommunication networks
Uttamchandani et al. Polus: Growing storage qos management beyond a” four-year old kid”
Zhang et al. Kubedim: Self-Adaptive Service Degradation of Microservices-Based Systems
Tom-Ata Mechanisms for Monitoring Optimization in Cloud Computing Environments
CN117651052A (zh) 基于云边协同的边缘分布式存储方法及系统
ACM G. Alvarez, E. Borowsky, S. Go, T. Romer, R. Becker-Szendy, R. Golding, A. Merchant, M. Spasojevic, A. Veitch, and J. Wilkes. Minerva: An Automated Resource Provisioning Tool for Large-scale Storage Systems. ACM Trans. Comput. Syst., 19 (4): 483-518, Nov. 2001. 2 E. Anderson, M. Hobbs, K. Keeton, S. Spence, M. Uysal, and A. Veitch.
Kumar et al. Enabling policy-driven selfmanagement for enterprise-scale systems
Hudson Risk Assessment and Management for

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070921

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100310

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100310

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20100310

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20100310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100311

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100311

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100913

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100913

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20101007

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20101007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101025

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees