JP2006500654A - コンピュータ・システムにおける適応型問題判別及びリカバリー - Google Patents
コンピュータ・システムにおける適応型問題判別及びリカバリー Download PDFInfo
- Publication number
- JP2006500654A JP2006500654A JP2004537625A JP2004537625A JP2006500654A JP 2006500654 A JP2006500654 A JP 2006500654A JP 2004537625 A JP2004537625 A JP 2004537625A JP 2004537625 A JP2004537625 A JP 2004537625A JP 2006500654 A JP2006500654 A JP 2006500654A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- learning algorithm
- knowledge base
- data processing
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/079—Root cause analysis, i.e. error or fault diagnosis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0775—Content or structure details of the error report, e.g. specific table structure, specific error fields
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0781—Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2257—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/86—Event-based monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Debugging And Monitoring (AREA)
- Test And Diagnosis Of Digital Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
IF〈条件〉THEN〈動作〉
又は、
WHILE〈条件〉DO〈動作〉
の形態のものを含む規則の組を監視されたデータに適用する推論エンジン(図示せず)を含む。したがって、ロギング論理モジュール704、問題判別論理モジュール710、及びエラーリカバリー論理モジュール715の各々を、知識ベースの論理推論規則を適用する、推論エンジンを有する一種のエキスパート・システムのように考え、それぞれデータのロギング、問題の診断、及びエラーからの回復に関する決定を行うことができる。各々の知識ベースを構成する規則においては、条件節(例えば、「Xの場合には、Yである」のX)は、変数を含むことができ、「素子Xは、タイプT1である」のように簡単なものにしても、又は、統計技術、機械学習技術、又は人工知能技術を含む複雑なものにしてもよい。条件節を定めるための統計技術の例は、(これらに限られるものではないが)スチューデントT検定、相関分析、又は回帰分析の適用を含むことができる。条件節を定めるための機械学習及び人工知能技術の例は、(これらに限られるものではないが)ニューラル・ネットワーク、ベイジアン・ネットワーク、又はサポート・ベクトル・マシンのような、教師付き学習方法と、k平均法クラスタリング、階層クラスタリング、又は主成分分析のような教師なし学習方法とを含むことができる。
(i)r1:素子がタイプT1である場合、1分ごとに、システムにおけるタイプE1及びE2のイベントの新しい出現数をログに記録しなければならない、
(ii)r2:素子がタイプT2である場合、5分ごとに、CPU使用率における時間平均作業負荷と、ミリ秒での時間平均応答時間を報告しなければならない、
(iii)r3:素子がタイプT2である場合、1時間ごとに、タイプE3のイベントを報告しなければならない、
を含むことができる。
ロギング論理モジュール704は、そのデータベース705に問い合わせ、自律型素子701、702、及び703が、それぞれタイプT1、T2、及びT3の素子であることを判断する。データベース705はまた、各クラスの素子がロギングできるイベントのタイプの詳細も特定する。このように、ロギング論理モジュール704は、各自律型素子が、実際にどのようにロギング・プロセスを実施するかについての詳細を知る必要はなく、特定のタイプの素子が特定のクラスのイベントをログに記録できることを知るに過ぎない。ロギング論理モジュール704からの指示で、素子701、702、703は、それぞれのイベント・ログ706、707、708における関連するロギング論理規則によって指示されるように、イベントを記録する。これらのログは、複合ログ709内に連続的にコンパイルされ、問題判断論理モジュール710に連続的に供給される。
R1:タイプT1の素子が、1分のタイム・スパン内にタイプE2のイベントを報告できない場合、タイプT1の素子はクラスP1の問題を有する、
R2:タイプT2の素子が600ミリ秒より多い時間平均応答時間を報告する場合、タイプT2の素子はクラスP2の問題を有する、
R3:タイプT1の素子がクラスP1又はP10の問題を有する場合、及びタイプT2の素子がクラスP2の問題を有する場合、タイプT3の素子が、5分以内に80%の確率でクラスP3の問題を有することになる、
R4:クラスP3の問題が、5分以内に50%より高い確率で生じると考えられる場合、診断をエラーリカバリー論理モジュール715に伝える、
を有することができる。
R5:5分以内に60%より高い確率でタイプP3の素子においてクラスP3の問題が起こりそうな場合、タイプT2の素子の作業負荷を10%だけ減少させるように試みるという措置A1をとる、というものである。
この場合、素子703における問題発生の可能性が高いことで、問題P3がタイプT3の素子において実際に起こる可能性を減少させることを目的に、問題エラーリカバリー論理モジュール715が、タイプT2の素子において積極的な措置A1をとる。
R6:クラスP3の問題が、タイプT3の素子において、5分以内に60%より高い確率で起こりそうな場合、新しい規則r4をロギング論理モジュール704内に加える、
といったIf−then規則を含むことができ、ここで、R4は、
エラーリカバリー論理モジュール715によって更に通知されるまで、1分ごとに、タイプT2の素子はその作業負荷を報告しなければならず、タイプT3の素子はタイプE3のイベントを報告しなければならない、というものである。
この場合、自律型素子703における高い問題発生可能性が、最終的にロギング論理モジュールの変化をもたらし、素子702及び703をモニターする速度が増大する。
R7:タイプT3の素子が、先の5分以内に、措置A1がとられた後でさえもクラスP3の問題に直面した場合、措置A1を修正し、測定された作業負荷が10%より少ない場合を除いて、A1がタイプT2の素子における作業負荷をさらに10%だけ減少させるようにする、と記載することができる。
(i)基礎となる自律型素子のアトミック詳細から論理モジュール内の手続論理を分離すること。例えば、規則R7のために修正された措置A1を再考する。すなわち、
A1:測定された作業負荷が10%より少ない場合を除いて、タイプT2の素子における作業負荷をさらに10%だけ減少させようとする。この場合、更新論理モジュール719又はエラーリカバリー論理モジュール715は、タイプT2の素子が、実際に、どのように測定された作業負荷を10%だけ減少させるかについての情報を有することができない。しかしながら、データベース716に依存して、エラーリカバリー論理モジュール715は、タイプT2の素子が、測定された作業負荷を10%だけ減少させる何らかの手続き又は方法を有していることを知っている。さらに、措置A1は、タイプT2に属する自律型素子の全ての例に適用することができる。
(ii)論理モジュール内の推論及び動作エンジンに影響を及ぼすことなく、データベースにおけるプラットフォーム及び環境依存データを付加し、修正し、除去する統一フレームワークを採用すること。例として、自律型素子701を最初にシステムに付加した時に、データベース705において新しい入力を行い、該自律型素子701がタイプT1であることを示す。環境依存データは、ロギング・モジュール内の論理に影響を及ぼすことなく、あるタイプの素子、イベント、又は問題を別のタイプのものに再割り当てすることができる。例えば、タイプT3の特定の自律型素子703における特定のコンポーネントの非可用性のために、データベース705、711、及び716は、素子703がタイプT1となるように一時的に分類することができる。
(iii)推論エンジンの自動適用又は人間の介入のいずれかによる、論理モジュール内の規則の組からの規則の作成、再優先順位付け、修正、及び除去。例えば、規則R6を再考する。すなわち、
R6:クラスP3の問題が、5分以内に60%より高い確率でタイプT3の素子内で起こりそうな場合、新しい規則r4をロギング論理モジュール704内に加える、というものであり、ここで、r4は、
エラーリカバリー論理モジュール715によって更に通知されるまで、1分ごとに、タイプT2の素子はその作業負荷を報告しなければならず、タイプT3の素子はタイプE3のイベントを報告しなければならない、というものである。
この場合、新しい規則r4は、エラーリカバリー論理モジュール715によって作成され、ロギング論理モジュール704の規則の組に付加される。
(iv)論理モジュールの規則の組における規則の作成、修正、又は除去の後に矛盾が生じるたびに、多数の規則の間の矛盾を解決する。例えば、ロギング論理モジュール704内の上記の規則r4の導入を再考する。すなわち、
r4:エラーリカバリー論理モジュール715によって更に通知されるまで、1分ごとに、タイプT2の素子はその作業付加を報告しなければならず、タイプT3の素子はタイプE3のイベントを報告しなければならない、というものである。
しかしながら、この例において、ロギング論理モジュールは、すでに規則r3、すなわち、
r3:素子がタイプT2である場合、該素子は、1時間ごとに、タイプE3のイベントを報告しなければならない、を有している。
このように、タイプE3のイベントに応答して、自律型素子703(タイプT3である)によって異なる措置をとることが求められているので、規則r3及びr4は互いに矛盾した状態にある。
1)特定の詳細レベルを用いて、特定の条件下で、特定のタイプのイベントのログを記録させるようにシステム・コンポーネントに命令する推論及び動作エンジンを用いる、
2)ヘルプ学習/データ・マイニング・アルゴリズムを用いて、イベント・ログを問題のシグニチャと相関させることによって、問題(又は問題の恐れ)の診断に推論及び動作エンジンを用いる、
3)問題の診断に基づいた一連の措置と、該問題を解決する際のそれらの措置の成否を判断する推論及び動作エンジンを用いる、
4)(a)異なる推論及び動作エンジンの手続的論理をシステム・コンポーネントの詳細から分離し、(b)該推論及び動作エンジンに影響を及ぼすことなく、プラットフォーム及び環境依存データを付加し、修正し、除去するためのフレームワークを採用し、(c)規則を作成し、修正し、優先順位を付け、又は除去し、(d)多数の規則の間の矛盾を解決するといった4つの特徴を組み入れることによって、異なる推論及び動作エンジンが適用型となることを可能にする方法を用いる、
ことを実行するために、単一の問題検出及び修正論理が用いられることを理解するであろう。当業者であれば、別個の自律型素子又は他のコンポーネントが、これらのタスクを個別に実行できることも理解するであろう。例えば、第1の自律型素子は、ロギング・ポリシーを設定することができ、別の自律型素子は、学習アルゴリズムを用いて、問題及びそれらの解決法に関する新しい知識を導き出す。次に、自律型コンピューティング・システムは、これらの個別の問題検出/修正素子を「ミックス・アンド・マッチ」方法で組み合わせ、現在の要件を満たすことができる。
Claims (63)
- 問題判別及びエラーリカバリー機能をコンピューティング環境に提供するコンピュータ・ベースの方法であって、前記方法が、
前記コンピューティング環境の状態に関する情報を受信し、
知識ベースの規則から、前記コンピューティング環境の状態に適用可能な少なくとも1つの適用可能な規則を特定し、
前記少なくとも1つの適用可能な規則を適用して結果を得る、
段階を含み、
前記知識ベースの規則が、特定の状況下でシステム・コンポーネントによって特定のイベントをログに記録すべきであることを指定するロギング論理規則、イベント・ログ内に含まれる特定の情報の存在が特定の問題を示すことを指定する問題判別論理規則、及び特定の問題が従うべき前記特定の問題に対する特定の解決法を含むことを指定するエラーリカバリー論理規則のうちの1つを含む方法。 - 知識ベースの規則が少なくとも1つのロギング論理規則を含み、結果として、システム・コンポーネントによって特定のイベントのログをどのように記録すべきかを指定するロギング・ポリシーがもたらされる、請求項1に記載の方法。
- 前記ロギング・ポリシーが、前記特定のイベントのロギングを実行するための前記システム・コンポーネントの特定を含む、請求項2に記載の方法。
- 前記ロギング・ポリシーが、前記特定のイベントのログを記録すべき特定の条件を含む、請求項2に記載の方法。
- 前記ロギング・ポリシーが、前記特定のイベントのログを記録すべき特定の詳細レベルを含む、請求項2に記載の方法。
- 前記知識ベースの規則が少なくとも1つの問題判別論理規則を含み、結果として、問題診断がもたらされる、請求項1に記載の方法。
- 統計試験を用いて、前記少なくとも1つの問題判別論理規則が、イベント・ログ内に含まれる特定の情報を問題と関連付ける、請求項6に記載の方法。
- 機械学習アルゴリズムを用いて、前記少なくとも1つの問題判別論理規則が、イベント・ログ内に含まれる特定の情報を問題と関連付ける、請求項6に記載の方法。
- 前記知識ベースの規則が少なくとも1つのエラーリカバリー論理規則を含み、結果として、問題を解決する際に従う一連の措置がもたらされる、請求項1に記載の方法。
- 前記問題を解決するために前記一連の措置に従い、
前記一連の措置に従うことに応答して、該一連の措置の成功度を判断する、
段階をさらに含む、請求項9に記載の方法。 - 前記一連の措置の前記成功度に応答して、前記知識ベースの規則に優先順位を付ける段階をさらに含む、請求項10に記載の方法。
- 機械学習アルゴリズムを適用して、前記知識ベースに付加的な規則を加える段階をさらに含む、請求項1に記載の方法。
- 前記機械学習アルゴリズムが帰納的論理プログラミング・アルゴリズムである、請求項12に記載の方法。
- 前記知識ベースの規則の関連度を判断し、
前記規則が低い関連度を有するという判断に応答して、該規則を除去する段階をさらに含む、請求項1に記載の方法。 - 前記知識ベースの規則の関連度を判断し、
前記規則が低い関連度を有するという判断に応答して、該規則に前記知識ベースにおける低い優先順位を割り当てる段階をさらに含む、請求項1に記載の方法。 - 機械学習アルゴリズムを適用して、前記知識ベース内の規則を修正する段階をさらに含む、請求項1に記載の方法。
- 前記機械学習アルゴリズムが教師付き学習アルゴリズムである、請求項16に記載の方法。
- 前記教師付き学習アルゴリズムが、ニュートラル・ネットワーク、ベイジアン・ネットワーク、又はサポート・ベクトル・マシンのうちの1つである、請求項17に記載の方法。
- 前記機械学習アルゴリズムが教師なし学習アルゴリズムである、請求項16に記載の方法。
- 前記教師なし学習アルゴリズムが、k平均法クラスタリング、階層クラスタリング、又は主成分分析のうちの1つである、請求項19に記載の方法。
- 前記コンピューティング環境の状態に関する前記情報の受信、前記少なくとも1つの適用可能な規則の特定、及び該少なくとも1つの適用可能な規則の適用が、クライアントからの要求に応答して実行される、請求項1に記載の方法。
- 問題判別及びエラーリカバリー機能をコンピュータに実現させるプログラムであって、前記プログラムがコンピュータに、
コンピューティング環境の状態に関する情報を受信する機能と、
知識ベースの規則から、前記コンピューティング環境の状態に適用可能な少なくとも1つの適用可能な規則を特定する機能であって、
前記知識ベースの規則が、特定の状況下でシステム・コンポーネントによって特定のイベントをログに記録すべきであることを指定するロギング論理規則、イベント・ログ内に含まれる特定の情報の存在が特定の問題を示すことを指定する問題判別論理規則、特定の問題が従うべき該特定の問題に対する特定の解決法を含むことを指定するエラーリカバリー論理規則のうちの1つを含む機能と、
前記少なくとも1つの適用可能な規則を適用して結果を得る機能と、
をコンピュータに実行させる、プログラム。 - 知識ベースの規則が少なくとも1つのロギング論理規則を含み、結果として、システム・コンポーネントによって特定のイベントをどのようにログに記録すべきかを指定するロギング・ポリシーがもたらされる、請求項22に記載のプログラム。
- 前記ロギング・ポリシーが、前記特定のイベントのロギングを実行するための前記システム・コンポーネントの特定を含む、請求項23に記載のプログラム。
- 前記ロギング・ポリシーが、前記特定のイベントのログを記録すべき特定の条件を含む、請求項23に記載のプログラム。
- 前記ロギング・ポリシーが、前記特定のイベントのログを記録すべき特定の詳細レベルを含む、請求項23に記載のプログラム。
- 前記知識ベースの規則が少なくとも1つの問題判別論理規則を含み、結果として、問題診断がもたらされる、請求項22に記載のプログラム。
- 統計試験を用いて、前記少なくとも1つの問題判別論理規則が、イベント・ログ内に含まれる特定の情報を問題と関連付ける、請求項27に記載のプログラム。
- 機械学習アルゴリズムを用いて、前記少なくとも1つの問題判別論理規則が、イベント・ログ内に含まれる特定の情報を問題と関連付ける、請求項27に記載のプログラム。
- 前記知識ベースの規則が少なくとも1つのエラーリカバリー論理規則を含み、結果として、問題を解決する際に従う一連の措置がもたらされる、請求項22に記載のプログラム。
- 前記問題を解決するための前記一連の措置に従い、
前記一連の措置に従うことに応答して、該一連の措置の成功度を判断する機能を含む、請求項30に記載のプログラム。 - 前記一連の措置の前記成功度に応答して、前記知識ベースの規則に優先順位を付ける機能を含む、請求項31に記載のプログラム。
- 機械学習アルゴリズムを適用して、前記知識ベースに付加的な規則を加える機能を含む、請求項22に記載のプログラム。
- 前記機械学習アルゴリズムが帰納的論理プログラミング・アルゴリズムである、請求項33に記載のプログラム。
- 前記知識ベースの規則の関連度を判断する機能と、
前記規則が低い関連度を有するという判断に応答して、前記規則を除去する機能を含む、請求項22に記載のプログラム。 - 前記知識ベースの規則の関連度を判断する機能と、
前記規則が低い関連度を有するという判断に応答して、該規則に前記知識ベースにおける低い優先順位を割り当てる機能を含む、請求項22に記載のプログラム。 - 機械学習アルゴリズムを適用して、前記知識ベース内の規則を修正する機能を含む、請求項33に記載のプログラム。
- 前記機械学習アルゴリズムが教師付き学習アルゴリズムである、請求項37に記載のプログラム。
- 前記教師付き学習アルゴリズムが、ニュートラル・ネットワーク、ベイジアン・ネットワーク、又はサポート・ベクトル・マシンのうちの1つである、請求項38に記載のプログラム。
- 前記機械学習アルゴリズムが教師なし学習アルゴリズムである、請求項37に記載のプログラム。
- 前記教師なし学習アルゴリズムが、k平均法クラスタリング、階層クラスタリング、又は主成分分析のうちの1つである、請求項40に記載のプログラム。
- 前記コンピューティング環境の状態に関する前記情報の受信、前記少なくとも1つの適用可能な規則の特定、及び該少なくとも1つの適用可能な規則の適用が、クライアントからの要求に応答して実行される、請求項22に記載のプログラム。
- データ処理システムであって、
コンピューティング環境の状態に関する情報を受信するための手段と、
知識ベースの規則から、前記コンピューティング環境の状態に適用可能な少なくとも1つの適用可能な規則を特定するための手段と、
前記少なくとも1つの適用可能な規則を適用して結果を得るための手段と、
を備え、
前記知識ベースの規則が、特定の状況下でシステム・コンポーネントによって特定のイベントをログに記録すべきであることを指定するロギング論理規則、イベント・ログ内に含まれる特定の情報の存在が特定の問題を示すことを指定する問題判別論理規則、特定の問題が従うべき該特定の問題に対する特定の解決法を含むことを指定するエラーリカバリー論理規則のうちの1つを含む、データ処理システム。 - 知識ベースの規則が少なくとも1つのロギング論理規則を含み、結果として、システム・コンポーネントによって特定のイベントのログをどのように記録すべきかを指定するロギング・ポリシーがもたらされる、請求項43に記載のデータ処理システム。
- 前記ロギング・ポリシーが、前記特定のイベントのロギングを実行するための前記システム・コンポーネントの特定を含む、請求項44に記載のデータ処理システム。
- 前記ロギング・ポリシーが、前記特定のイベントのログを記録すべき特定の条件を含む、請求項44に記載のデータ処理システム。
- 前記ロギング・ポリシーが、前記特定のイベントのログを記録すべき特定の詳細レベルを含む、請求項44に記載のデータ処理システム。
- 前記知識ベースの規則が少なくとも1つの問題判別論理規則を含み、結果として、問題診断がもたらされる、請求項43に記載のデータ処理システム。
- 統計試験を用いて、前記少なくとも1つの問題判別論理規則が、イベント・ログ内に含まれる特定の情報を問題と関連付ける、請求項48に記載のデータ処理システム。
- 機械学習アルゴリズムを用いて、前記少なくとも1つの問題判別論理規則が、イベント・ログ内に含まれる特定の情報を問題と関連付ける、請求項48に記載のデータ処理システム。
- 前記知識ベースの規則が少なくとも1つのエラーリカバリー論理規則を含み、結果として、問題を解決する際に従う一連の措置がもたらされる、請求項43に記載のデータ処理システム。
- 前記問題を解決するための前記一連の措置に従うための手段と、
前記一連の措置に従うことに応答して、該一連の措置の成功度を判断するための手段と、
をさらに含む、請求項51に記載のデータ処理システム。 - 前記一連の措置の前記成功度に応答して、前記知識ベースの規則に優先順位を付けるための手段をさらに含む、請求項52に記載のデータ処理システム。
- 機械学習アルゴリズムを適用して、前記知識ベースに付加的な規則を加えるための手段をさらに含む、請求項43に記載のデータ処理システム。
- 前記機械学習アルゴリズムが帰納的論理プログラミング・アルゴリズムである、請求項54に記載のデータ処理システム。
- 前記知識ベースの規則の関連度を判断するための手段と、
前記規則が低い関連度を有するという判断に応答して、前記規則を除去するための手段と、
をさらに含む、請求項43に記載のデータ処理システム。 - 前記知識ベースの規則の関連度を判断するための手段と、
前記規則が低い関連度を有するという判断に応答して、前記規則に前記知識ベースにおける低い優先順位を割り当てるための手段と、
をさらに含む、請求項43に記載のデータ処理システム。 - 機械学習アルゴリズムを適用して、前記知識ベース内の規則を修正するための手段をさらに含む、請求項43に記載のデータ処理システム。
- 前記機械学習アルゴリズムが教師付き学習アルゴリズムである、請求項58に記載のデータ処理システム。
- 前記教師付き学習アルゴリズムが、ニュートラル・ネットワーク、ベイジアン・ネットワーク、又はサポート・ベクトル・マシンのうちの1つである、請求項59に記載のデータ処理システム。
- 前記機械学習アルゴリズムが教師なし学習アルゴリズムである、請求項58に記載のデータ処理システム。
- 前記教師なし学習アルゴリズムが、k平均法クラスタリング、階層クラスタリング、又は主成分分析のうちの1つである、請求項61に記載のデータ処理システム。
- 前記コンピューティング環境の状態に関する前記情報の受信、前記少なくとも1つの適用可能な規則の特定、及び該少なくとも1つの適用可能な規則の適用が、クライアントからの要求に応答して実行される、請求項43に記載のデータ処理システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/252,979 US7194445B2 (en) | 2002-09-20 | 2002-09-20 | Adaptive problem determination and recovery in a computer system |
PCT/US2003/022678 WO2004027705A1 (en) | 2002-09-20 | 2003-07-21 | Adaptive problem determination and recovery in a computer system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006500654A true JP2006500654A (ja) | 2006-01-05 |
Family
ID=31993063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004537625A Pending JP2006500654A (ja) | 2002-09-20 | 2003-07-21 | コンピュータ・システムにおける適応型問題判別及びリカバリー |
Country Status (7)
Country | Link |
---|---|
US (1) | US7194445B2 (ja) |
JP (1) | JP2006500654A (ja) |
KR (1) | KR100714157B1 (ja) |
CN (1) | CN1317678C (ja) |
AU (1) | AU2003252077A1 (ja) |
TW (1) | TWI243314B (ja) |
WO (1) | WO2004027705A1 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007133870A (ja) * | 2005-11-07 | 2007-05-31 | Internatl Business Mach Corp <Ibm> | コンピューティング・システムのオートノミック能力を測定するための方法、システム及びコンピュータ・プログラム |
JP2008176703A (ja) * | 2007-01-22 | 2008-07-31 | Fuji Xerox Co Ltd | 故障診断システム及び故障診断プログラム |
JP2009076103A (ja) * | 2008-12-22 | 2009-04-09 | Nec Corp | 障害復旧装置および障害復旧方法ならびにプログラム |
JP2009169610A (ja) * | 2008-01-15 | 2009-07-30 | Fujitsu Ltd | 障害対処支援プログラム、障害対処支援装置および障害対処支援方法 |
US7620849B2 (en) | 2003-07-16 | 2009-11-17 | Nec Corporation | Fault recovery system and method for adaptively updating order of command executions according to past results |
JP2009301298A (ja) * | 2008-06-12 | 2009-12-24 | Yahoo Japan Corp | アプリケーションの応答不能時を推定するシステム、方法、およびプログラム |
JP2011517807A (ja) * | 2008-03-08 | 2011-06-16 | 東京エレクトロン株式会社 | 生物学に基づく自律学習ツール |
US8725667B2 (en) | 2008-03-08 | 2014-05-13 | Tokyo Electron Limited | Method and system for detection of tool performance degradation and mismatch |
US8744607B2 (en) | 2008-03-08 | 2014-06-03 | Tokyo Electron Limited | Method and apparatus for self-learning and self-improving a semiconductor manufacturing tool |
Families Citing this family (127)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6856942B2 (en) * | 2002-03-09 | 2005-02-15 | Katrina Garnett | System, method and model for autonomic management of enterprise applications |
EP1349071A1 (en) * | 2002-03-29 | 2003-10-01 | STMicroelectronics N.V. | Integrated circuit with direct debugging architecture |
AU2003228512A1 (en) * | 2002-04-10 | 2003-10-27 | Instasolv, Inc. | Method and system for managing computer systems |
US7840856B2 (en) * | 2002-11-07 | 2010-11-23 | International Business Machines Corporation | Object introspection for first failure data capture |
US7263632B2 (en) * | 2003-05-07 | 2007-08-28 | Microsoft Corporation | Programmatic computer problem diagnosis and resolution and automated reporting and updating of the same |
US7426736B2 (en) * | 2003-05-22 | 2008-09-16 | International Business Machines Corporation | Business systems management solution for end-to-end event management using business system operational constraints |
US7509651B2 (en) * | 2003-05-23 | 2009-03-24 | Hewlett-Packard Development Company, L.P. | System and method for providing event notifications to information technology resource managers |
US20040250261A1 (en) * | 2003-06-05 | 2004-12-09 | Huibregtse Thomas P. | Method and system for displaying event information correlated with a performance parameter of a managed system |
CA2435655A1 (en) * | 2003-07-21 | 2005-01-21 | Symbium Corporation | Embedded system administration |
US7328376B2 (en) * | 2003-10-31 | 2008-02-05 | Sun Microsystems, Inc. | Error reporting to diagnostic engines based on their diagnostic capabilities |
US7529979B2 (en) * | 2003-12-12 | 2009-05-05 | International Business Machines Corporation | Hardware/software based indirect time stamping methodology for proactive hardware/software event detection and control |
US7260743B2 (en) * | 2004-01-13 | 2007-08-21 | International Business Machines Corporation | System and method for achieving autonomic computing self-healing, utilizing meta level reflection and reasoning |
US7346813B1 (en) * | 2004-04-05 | 2008-03-18 | Sun Microsystems, Inc. | Distributed event reporting hierarchy |
JP4514501B2 (ja) * | 2004-04-21 | 2010-07-28 | 株式会社日立製作所 | ストレージシステム及びストレージシステムの障害解消方法 |
US9357031B2 (en) | 2004-06-03 | 2016-05-31 | Microsoft Technology Licensing, Llc | Applications as a service |
US7908339B2 (en) * | 2004-06-03 | 2011-03-15 | Maxsp Corporation | Transaction based virtual file system optimized for high-latency network connections |
US8812613B2 (en) | 2004-06-03 | 2014-08-19 | Maxsp Corporation | Virtual application manager |
US7844969B2 (en) | 2004-06-17 | 2010-11-30 | Platform Computing Corporation | Goal-oriented predictive scheduling in a grid environment |
US7861246B2 (en) * | 2004-06-17 | 2010-12-28 | Platform Computing Corporation | Job-centric scheduling in a grid environment |
US7340654B2 (en) | 2004-06-17 | 2008-03-04 | Platform Computing Corporation | Autonomic monitoring in a grid environment |
US8032620B2 (en) * | 2004-06-24 | 2011-10-04 | Marlin Scott | Method and system for improved in-line management of an information technology network |
US7664834B2 (en) | 2004-07-09 | 2010-02-16 | Maxsp Corporation | Distributed operating system management |
US20060026054A1 (en) * | 2004-07-28 | 2006-02-02 | International Business Machines Corporation | Method, apparatus, and program for implementing an automation computing evaluation scale to generate recommendations |
US7373552B2 (en) * | 2004-09-30 | 2008-05-13 | Siemens Aktiengesellschaft | Model based diagnosis and repair for event logs |
US7624305B2 (en) * | 2004-11-18 | 2009-11-24 | International Business Machines Corporation | Failure isolation in a communication system |
US7490073B1 (en) | 2004-12-21 | 2009-02-10 | Zenprise, Inc. | Systems and methods for encoding knowledge for automated management of software application deployments |
US7409595B2 (en) * | 2005-01-18 | 2008-08-05 | International Business Machines Corporation | History-based prioritizing of suspected components |
US8589323B2 (en) * | 2005-03-04 | 2013-11-19 | Maxsp Corporation | Computer hardware and software diagnostic and report system incorporating an expert system and agents |
US8234238B2 (en) | 2005-03-04 | 2012-07-31 | Maxsp Corporation | Computer hardware and software diagnostic and report system |
US20060230133A1 (en) * | 2005-03-24 | 2006-10-12 | International Business Machines Corporation | On demand problem determination based on remote autonomic modification of web application server operating characteristics |
CA2504333A1 (en) * | 2005-04-15 | 2006-10-15 | Symbium Corporation | Programming and development infrastructure for an autonomic element |
US7606801B2 (en) * | 2005-06-07 | 2009-10-20 | Varonis Inc. | Automatic management of storage access control |
US20060282525A1 (en) * | 2005-06-10 | 2006-12-14 | Giles James R | Method and apparatus for delegating responses to conditions in computing systems |
US20070028149A1 (en) * | 2005-08-01 | 2007-02-01 | Dell Products L.P. | System, method, and computer program product for reducing error causing conditions in an information handling system |
US9129253B2 (en) * | 2005-09-29 | 2015-09-08 | Rpx Clearinghouse Llc | Workflow locked loops to enable adaptive networks to change a policy statement responsive to mission level exceptions and reconfigure the software-controllable network responsive to network level exceptions |
CN100514285C (zh) * | 2005-10-14 | 2009-07-15 | 中国科学院研究生院 | 能够容忍运行代码错误的计算机系统及其实现方法 |
DE102005061386A1 (de) * | 2005-12-22 | 2007-06-28 | Robert Bosch Gmbh | Verfahren zur Fehlerdiagnose |
US20070288925A1 (en) * | 2006-04-04 | 2007-12-13 | Computer Associates Think, Inc. | Arrangements, Methods, and Software for Managing Objects and Resolving Different Types of Events Associated with Such Objects |
US7490095B2 (en) | 2006-05-19 | 2009-02-10 | International Business Machines Corporation | Scope and distribution of knowledge in an autonomic computing system |
US8898319B2 (en) | 2006-05-24 | 2014-11-25 | Maxsp Corporation | Applications and services as a bundle |
US8811396B2 (en) | 2006-05-24 | 2014-08-19 | Maxsp Corporation | System for and method of securing a network utilizing credentials |
US20070282778A1 (en) * | 2006-06-05 | 2007-12-06 | International Business Machines Corporation | Policy-based management system with automatic policy selection and creation capabilities by using singular value decomposition technique |
US7542956B2 (en) * | 2006-06-07 | 2009-06-02 | Motorola, Inc. | Autonomic computing method and apparatus |
US9317506B2 (en) | 2006-09-22 | 2016-04-19 | Microsoft Technology Licensing, Llc | Accelerated data transfer using common prior data segments |
US7840514B2 (en) | 2006-09-22 | 2010-11-23 | Maxsp Corporation | Secure virtual private network utilizing a diagnostics policy and diagnostics engine to establish a secure network connection |
US8423821B1 (en) | 2006-12-21 | 2013-04-16 | Maxsp Corporation | Virtual recovery server |
US7844686B1 (en) | 2006-12-21 | 2010-11-30 | Maxsp Corporation | Warm standby appliance |
US7752287B2 (en) * | 2007-03-29 | 2010-07-06 | International Business Machines Corporation | Methods, systems, and computer program products for automatically generating best practices for configuring a networked system |
US20080256312A1 (en) * | 2007-04-12 | 2008-10-16 | International Business Machines Corporation | Apparatus and method to detect and repair a broken dataset |
US20080255910A1 (en) * | 2007-04-16 | 2008-10-16 | Sugato Bagchi | Method and System for Adaptive Project Risk Management |
US7895470B2 (en) * | 2007-07-09 | 2011-02-22 | International Business Machines Corporation | Collecting and representing knowledge |
US7792780B2 (en) * | 2007-08-28 | 2010-09-07 | Microsoft Corporation | Updating an engine using a description language |
US8942764B2 (en) * | 2007-10-01 | 2015-01-27 | Apple Inc. | Personal media device controlled via user initiated movements utilizing movement based interfaces |
US8645515B2 (en) | 2007-10-26 | 2014-02-04 | Maxsp Corporation | Environment manager |
US8175418B1 (en) | 2007-10-26 | 2012-05-08 | Maxsp Corporation | Method of and system for enhanced data storage |
US8307239B1 (en) | 2007-10-26 | 2012-11-06 | Maxsp Corporation | Disaster recovery appliance |
US9021074B2 (en) * | 2007-11-08 | 2015-04-28 | International Business Machines Corporation | System and method for providing server status awareness |
US8086897B2 (en) * | 2007-11-15 | 2011-12-27 | Infosys Limited | Model driven diagnostics system and methods thereof |
US7788534B2 (en) * | 2007-12-11 | 2010-08-31 | International Business Machines Corporation | Method for monitoring and managing a client device in a distributed autonomic computing environment |
US8055607B2 (en) * | 2008-03-03 | 2011-11-08 | International Business Machines Corporation | Adaptive multi-levels dictionaries and singular value decomposition techniques for autonomic problem determination |
JP2009258791A (ja) * | 2008-04-11 | 2009-11-05 | Pfu Ltd | セルフサービス端末装置およびガイダンス画面制御方法 |
US20090300430A1 (en) * | 2008-06-02 | 2009-12-03 | Orit Nissan-Messing | History-based prioritizing of suspected components |
US7904753B2 (en) * | 2009-01-06 | 2011-03-08 | International Business Machines Corporation | Method and system to eliminate disruptions in enterprises |
WO2010122604A1 (ja) * | 2009-04-23 | 2010-10-28 | 株式会社日立製作所 | 複数のノード装置を含んだ計算機システムでのイベントの発生原因を特定する計算機 |
US8365019B2 (en) * | 2009-06-16 | 2013-01-29 | International Business Machines Corporation | System and method for incident management enhanced with problem classification for technical support services |
EP2455863A4 (en) * | 2009-07-16 | 2013-03-27 | Hitachi Ltd | MANAGEMENT SYSTEM FOR PROVIDING INFORMATION DESCRIBING A RECOVERY METHOD CORRESPONDING TO A FUNDAMENTAL CAUSE OF FAILURE |
US9154362B1 (en) * | 2009-08-14 | 2015-10-06 | International Business Machines Corporation | Macro grid governance and communication |
US8407163B2 (en) * | 2009-08-27 | 2013-03-26 | Xerox Corporation | Monitoring a device, network, or system with adaptive dynamic classification employing a hidden Markov model operating on a time sequence of information |
CN102081518A (zh) * | 2009-11-30 | 2011-06-01 | 国际商业机器公司 | 提供动态帮助信息的装置和方法 |
US8230259B2 (en) * | 2009-12-02 | 2012-07-24 | International Business Machines Corporation | Automatic analysis of log entries through use of clustering |
US20110137898A1 (en) * | 2009-12-07 | 2011-06-09 | Xerox Corporation | Unstructured document classification |
KR101331935B1 (ko) * | 2009-12-09 | 2013-11-21 | 한국전자통신연구원 | 추적점 기반의 고장 진단/복구 시스템 및 그 방법 |
US8719400B2 (en) * | 2010-03-02 | 2014-05-06 | International Business Machines Corporation | Flexible delegation of management function for self-managing resources |
US9018797B2 (en) * | 2010-05-28 | 2015-04-28 | Hewlett-Packard Development Company, L.P. | Power distribution management |
US8468391B2 (en) * | 2010-08-04 | 2013-06-18 | International Business Machines Corporation | Utilizing log event ontology to deliver user role specific solutions for problem determination |
US8533022B2 (en) * | 2011-09-13 | 2013-09-10 | Nandakumar Krishnan Nair | Enterprise wide value chain management system (EVCM) for tracking, analyzing and improving organizational value chain performance and disruptions utilizing corrective actions |
US9014023B2 (en) | 2011-09-15 | 2015-04-21 | International Business Machines Corporation | Mobile network services in a mobile data network |
WO2013055311A1 (en) * | 2011-10-10 | 2013-04-18 | Hewlett-Packard Development Company, L.P. | Methods and systems for identifying action for responding to anomaly in cloud computing system |
KR101347748B1 (ko) * | 2011-10-10 | 2014-01-06 | 성균관대학교산학협력단 | 씨피에스에서의 자율 컴퓨팅 방법 및 장치 |
US8717872B2 (en) | 2011-11-16 | 2014-05-06 | International Business Machines Corporation | Fail to wire removable module for network communication link |
US8611208B2 (en) | 2011-12-19 | 2013-12-17 | International Business Machines Corporation | Autonomic error recovery for a data breakout appliance at the edge of a mobile data network |
US8724455B2 (en) * | 2012-01-20 | 2014-05-13 | International Business Machines Corporation | Distributed control of a fail-to-wire switch for a network communication link |
US8839048B2 (en) * | 2012-03-07 | 2014-09-16 | International Business Machines Corporation | Method for ranking analysis tools |
US9665576B2 (en) * | 2012-05-14 | 2017-05-30 | International Business Machines Corporation | Controlling enterprise data on mobile device via the use of a tag index |
CN102821007B (zh) * | 2012-08-06 | 2016-12-21 | 河南科技大学 | 一种基于自律计算的网络安全态势感知系统及其处理方法 |
US8949669B1 (en) * | 2012-09-14 | 2015-02-03 | Emc Corporation | Error detection, correction and triage of a storage array errors |
US20140180738A1 (en) * | 2012-12-21 | 2014-06-26 | Cloudvu, Inc. | Machine learning for systems management |
US8880446B2 (en) | 2012-11-15 | 2014-11-04 | Purepredictive, Inc. | Predictive analytics factory |
GB2508841A (en) * | 2012-12-12 | 2014-06-18 | Ibm | Computing prioritised general arbitration rules for conflicting rules |
US9466026B2 (en) * | 2012-12-21 | 2016-10-11 | Model N, Inc. | Rule assignments and templating |
WO2014110167A2 (en) | 2013-01-08 | 2014-07-17 | Purepredictive, Inc. | Integrated machine learning for a data management product |
US9465684B1 (en) * | 2013-03-15 | 2016-10-11 | Emc Corporation | Managing logs of storage systems |
KR20140122966A (ko) * | 2013-04-11 | 2014-10-21 | 한국전자통신연구원 | 자율 컴퓨팅 장치들간의 토픽을 공유하는 장치 및 그 방법 |
US9218574B2 (en) | 2013-05-29 | 2015-12-22 | Purepredictive, Inc. | User interface for machine learning |
US9646262B2 (en) | 2013-06-17 | 2017-05-09 | Purepredictive, Inc. | Data intelligence using machine learning |
WO2015045262A1 (ja) * | 2013-09-24 | 2015-04-02 | 日本電気株式会社 | ログ分析システム、障害原因分析システム、ログ分析方法、および、プログラムを記憶する記録媒体 |
US9336119B2 (en) * | 2013-11-25 | 2016-05-10 | Globalfoundries Inc. | Management of performance levels of information technology systems |
US10540606B2 (en) | 2014-06-30 | 2020-01-21 | Amazon Technologies, Inc. | Consistent filtering of machine learning data |
US10169715B2 (en) | 2014-06-30 | 2019-01-01 | Amazon Technologies, Inc. | Feature processing tradeoff management |
US10102480B2 (en) * | 2014-06-30 | 2018-10-16 | Amazon Technologies, Inc. | Machine learning service |
US10592328B1 (en) * | 2015-03-26 | 2020-03-17 | Amazon Technologies, Inc. | Using cluster processing to identify sets of similarly failing hosts |
EP3360082B1 (en) | 2015-11-12 | 2021-06-02 | Deepmind Technologies Limited | Neural programming |
US10078571B2 (en) * | 2015-12-09 | 2018-09-18 | International Business Machines Corporation | Rule-based adaptive monitoring of application performance |
GB201620199D0 (en) | 2015-12-18 | 2017-01-11 | British Telecomm | Autonomic method for managing a computer system |
US10180869B2 (en) | 2016-02-16 | 2019-01-15 | Microsoft Technology Licensing, Llc | Automated ordering of computer system repair |
US10339032B2 (en) | 2016-03-29 | 2019-07-02 | Microsoft Technology Licensing, LLD | System for monitoring and reporting performance and correctness issues across design, compile and runtime |
US10026249B2 (en) * | 2016-04-14 | 2018-07-17 | Schlage Lock Company Llc | Bi-directional access control system |
US10719856B2 (en) * | 2016-10-13 | 2020-07-21 | Rovi Guides, Inc. | Systems and methods for resolving advertisement placement conflicts |
US20180260268A1 (en) * | 2017-03-09 | 2018-09-13 | Seagate Technology Llc | Self-learning event response engine of systems |
US10409667B2 (en) * | 2017-06-15 | 2019-09-10 | Salesforce.Com, Inc. | Error assignment for computer programs |
CN111247539A (zh) | 2017-10-19 | 2020-06-05 | 英国电讯有限公司 | 算法整合 |
US10419274B2 (en) * | 2017-12-08 | 2019-09-17 | At&T Intellectual Property I, L.P. | System facilitating prediction, detection and mitigation of network or device issues in communication systems |
GB201800473D0 (en) * | 2018-01-11 | 2018-02-28 | Microsoft Technology Licensing Llc | Knowledge base construction |
US11636363B2 (en) | 2018-02-20 | 2023-04-25 | International Business Machines Corporation | Cognitive computer diagnostics and problem resolution |
US11023442B2 (en) | 2018-02-23 | 2021-06-01 | Accenture Global Solutions Limited | Automated structuring of unstructured data |
TWI691852B (zh) | 2018-07-09 | 2020-04-21 | 國立中央大學 | 用於偵測階層式系統故障之偵錯裝置及偵錯方法、電腦可讀取之記錄媒體及電腦程式產品 |
CN109697158B (zh) * | 2019-01-16 | 2022-02-22 | 郑州云海信息技术有限公司 | 一种基于故障的日志分析方法与装置 |
US10884888B2 (en) | 2019-01-22 | 2021-01-05 | International Business Machines Corporation | Facilitating communication among storage controllers |
US11042459B2 (en) * | 2019-05-10 | 2021-06-22 | Silicon Motion Technology (Hong Kong) Limited | Method and computer storage node of shared storage system for abnormal behavior detection/analysis |
US11182269B2 (en) | 2019-10-01 | 2021-11-23 | International Business Machines Corporation | Proactive change verification |
EP4052191A1 (en) | 2019-10-30 | 2022-09-07 | British Telecommunications public limited company | A computer-implemented method of modifying an algorithm operating on a computing system |
US11314783B2 (en) | 2020-06-05 | 2022-04-26 | Bank Of America Corporation | System for implementing cognitive self-healing in knowledge-based deep learning models |
CN113986643A (zh) * | 2020-07-27 | 2022-01-28 | 伊姆西Ip控股有限责任公司 | 分析日志文件的方法、电子设备和计算机程序产品 |
US11429601B2 (en) | 2020-11-10 | 2022-08-30 | Bank Of America Corporation | System for generating customized data input options using machine learning techniques |
US11366466B1 (en) * | 2020-12-24 | 2022-06-21 | Microsoft Technology Licensing, Llc | Predictive maintenance techniques and analytics in hybrid cloud systems |
US11868207B2 (en) * | 2022-03-07 | 2024-01-09 | Amdocs Development Limited | System, method, and computer program for intelligent self-healing optimization for fallout reduction |
CN116661300B (zh) * | 2023-04-07 | 2024-03-29 | 南京航空航天大学 | 一种通用非线性多智能体分层自适应容错协同控制方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5955564A (ja) * | 1982-09-25 | 1984-03-30 | Matsushita Electric Ind Co Ltd | マルチプロセツサ−装置 |
JPH04293099A (ja) * | 1991-03-22 | 1992-10-16 | Sharp Corp | 音声認識装置 |
JPH05324328A (ja) * | 1992-05-22 | 1993-12-07 | Toshiba Corp | 推論装置 |
JPH09265460A (ja) * | 1996-03-28 | 1997-10-07 | Mitsubishi Electric Corp | 分散処理システム及び分散処理方法 |
JPH09305406A (ja) * | 1996-05-16 | 1997-11-28 | Toshiba Corp | 情報処理システム及び情報処理方法 |
JPH1011292A (ja) * | 1996-06-25 | 1998-01-16 | Fuji Xerox Co Ltd | 知識発見システム |
JPH11120180A (ja) * | 1997-10-17 | 1999-04-30 | Sharp Corp | データ検索装置及びデータ検索プログラムを記録した記録媒体 |
JPH11122114A (ja) * | 1997-10-16 | 1999-04-30 | Sony Corp | コードブック作成装置およびコードブック作成方法、並びにベクトル量子化装置およびベクトル量子化方法 |
JP2000250833A (ja) * | 1999-02-26 | 2000-09-14 | Hitachi Information Systems Ltd | 複数サーバ運用管理における稼働情報取得方法およびそのプログラムを記録した記録媒体 |
JP2001075970A (ja) * | 1999-08-31 | 2001-03-23 | Toshiba Corp | 遠方監視制御装置の診断装置及び記録媒体 |
JP2002222083A (ja) * | 2001-01-29 | 2002-08-09 | Fujitsu Ltd | 事例蓄積装置および方法 |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4305522C2 (de) | 1993-02-17 | 1996-03-28 | Daimler Benz Ag | Einrichtung zur rechnergestützten Diagnose eines aus Modulen bestehenden technischen Systems |
CA2119085C (en) | 1994-03-15 | 2002-01-15 | Deborah L. Pinard | Adaptive communication system |
US5701400A (en) * | 1995-03-08 | 1997-12-23 | Amado; Carlos Armando | Method and apparatus for applying if-then-else rules to data sets in a relational data base and generating from the results of application of said rules a database of diagnostics linked to said data sets to aid executive analysis of financial data |
US5909544A (en) | 1995-08-23 | 1999-06-01 | Novell Inc. | Automated test harness |
GB9519678D0 (en) * | 1995-09-27 | 1995-11-29 | Philips Electronics Nv | Behaviour prediction |
CN1074148C (zh) * | 1996-03-18 | 2001-10-31 | 宏碁电脑股份有限公司 | 具有检错处理功能的数据处理系统 |
US6026374A (en) | 1996-05-30 | 2000-02-15 | International Business Machines Corporation | System and method for generating trusted descriptions of information products |
US5790789A (en) | 1996-08-02 | 1998-08-04 | Suarez; Larry | Method and architecture for the creation, control and deployment of services within a distributed computer environment |
US6031990A (en) | 1997-04-15 | 2000-02-29 | Compuware Corporation | Computer software testing management |
US6055562A (en) | 1997-05-01 | 2000-04-25 | International Business Machines Corporation | Dynamic mobile agents |
US5935264A (en) | 1997-06-10 | 1999-08-10 | Micron Technology, Inc. | Method and apparatus for determining a set of tests for integrated circuit testing |
GB2329266A (en) | 1997-09-10 | 1999-03-17 | Ibm | Automatic error recovery in data processing systems |
US6125359A (en) | 1997-09-23 | 2000-09-26 | Unisys Corporation | Method and apparatus for identifying the coverage of a test sequence in a rules-based expert system |
US6256771B1 (en) | 1997-10-16 | 2001-07-03 | At&T Corp. | Method and apparatus for providing a dynamic service composition software architecture |
US6286131B1 (en) | 1997-12-03 | 2001-09-04 | Microsoft Corporation | Debugging tool for linguistic applications |
GB2333864B (en) | 1998-01-28 | 2003-05-07 | Ibm | Distribution of software updates via a computer network |
US6023586A (en) | 1998-02-10 | 2000-02-08 | Novell, Inc. | Integrity verifying and correcting software |
DE19810814B4 (de) | 1998-03-12 | 2004-10-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Rechnersystem und Zustandskopierverfahren zur skalierbaren Software-Aktualisierung |
US6360331B2 (en) | 1998-04-17 | 2002-03-19 | Microsoft Corporation | Method and system for transparently failing over application configuration information in a server cluster |
US6330561B1 (en) | 1998-06-26 | 2001-12-11 | At&T Corp. | Method and apparatus for improving end to end performance of a data network |
US6182245B1 (en) | 1998-08-31 | 2001-01-30 | Lsi Logic Corporation | Software test case client/server system and method |
US6622157B1 (en) | 1998-09-28 | 2003-09-16 | Certeon, Inc. | Extending network services using mobile agents |
WO2000019343A2 (en) | 1998-09-30 | 2000-04-06 | Cadence Design Systems, Inc. | Block based design methodology |
US6145000A (en) | 1998-10-06 | 2000-11-07 | Ameritech Corporation | System and method for creating and navigating a linear hypermedia resource program |
US6851115B1 (en) | 1999-01-05 | 2005-02-01 | Sri International | Software-based architecture for communication and cooperation among distributed electronic agents |
US6353897B1 (en) | 1999-01-06 | 2002-03-05 | International Business Machines Corporation | Object oriented apparatus and method for testing object oriented software |
US6947797B2 (en) * | 1999-04-02 | 2005-09-20 | General Electric Company | Method and system for diagnosing machine malfunctions |
US6473794B1 (en) | 1999-05-27 | 2002-10-29 | Accenture Llp | System for establishing plan to test components of web based framework by displaying pictorial representation and conveying indicia coded components of existing network framework |
US7472349B1 (en) | 1999-06-01 | 2008-12-30 | Oracle International Corporation | Dynamic services infrastructure for allowing programmatic access to internet and other resources |
US6529950B1 (en) | 1999-06-17 | 2003-03-04 | International Business Machines Corporation | Policy-based multivariate application-level QoS negotiation for multimedia services |
US6467088B1 (en) | 1999-06-30 | 2002-10-15 | Koninklijke Philips Electronics N.V. | Reconfiguration manager for controlling upgrades of electronic devices |
US6587957B1 (en) * | 1999-07-30 | 2003-07-01 | Emc Corporation | Disk drive controller for controlling data flow therethrough by switching to secondary bus to receive clock pulses when a failure on master bus is detected |
US6779016B1 (en) | 1999-08-23 | 2004-08-17 | Terraspring, Inc. | Extensible computing system |
US7103647B2 (en) | 1999-08-23 | 2006-09-05 | Terraspring, Inc. | Symbolic definition of a computer system |
US6553548B1 (en) | 1999-12-14 | 2003-04-22 | International Business Machines Corporation | System and method for recovering from design errors in integrated circuits |
US6834341B1 (en) | 2000-02-22 | 2004-12-21 | Microsoft Corporation | Authentication methods and systems for accessing networks, authentication methods and systems for accessing the internet |
US6970869B1 (en) | 2000-05-09 | 2005-11-29 | Sun Microsystems, Inc. | Method and apparatus to discover services and negotiate capabilities |
US7496637B2 (en) | 2000-05-31 | 2009-02-24 | Oracle International Corp. | Web service syndication system |
US6990660B2 (en) | 2000-09-22 | 2006-01-24 | Patchlink Corporation | Non-invasive automatic offsite patch fingerprinting and updating system and method |
US20040236843A1 (en) * | 2001-11-15 | 2004-11-25 | Robert Wing | Online diagnosing of computer hardware and software |
US6804709B2 (en) | 2001-02-20 | 2004-10-12 | Microsoft Corporation | System uses test controller to match different combination configuration capabilities of servers and clients and assign test cases for implementing distributed testing |
US6982960B2 (en) | 2001-03-09 | 2006-01-03 | Motorola, Inc. | Protocol for self-organizing network using a logical spanning tree backbone |
US7249100B2 (en) | 2001-05-15 | 2007-07-24 | Nokia Corporation | Service discovery access to user location |
JP3828379B2 (ja) | 2001-05-17 | 2006-10-04 | 富士通株式会社 | テスト仕様生成支援装置、方法、プログラム及び記録媒体 |
US7412502B2 (en) * | 2002-04-18 | 2008-08-12 | International Business Machines Corporation | Graphics for end to end component mapping and problem-solving in a network environment |
US7165074B2 (en) | 2002-05-08 | 2007-01-16 | Sun Microsystems, Inc. | Software development test case analyzer and optimizer |
-
2002
- 2002-09-20 US US10/252,979 patent/US7194445B2/en not_active Expired - Fee Related
-
2003
- 2003-07-21 AU AU2003252077A patent/AU2003252077A1/en not_active Abandoned
- 2003-07-21 CN CNB038214482A patent/CN1317678C/zh not_active Expired - Fee Related
- 2003-07-21 JP JP2004537625A patent/JP2006500654A/ja active Pending
- 2003-07-21 WO PCT/US2003/022678 patent/WO2004027705A1/en active Application Filing
- 2003-07-21 KR KR1020057004736A patent/KR100714157B1/ko active IP Right Grant
- 2003-07-30 TW TW092120784A patent/TWI243314B/zh not_active IP Right Cessation
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5955564A (ja) * | 1982-09-25 | 1984-03-30 | Matsushita Electric Ind Co Ltd | マルチプロセツサ−装置 |
JPH04293099A (ja) * | 1991-03-22 | 1992-10-16 | Sharp Corp | 音声認識装置 |
JPH05324328A (ja) * | 1992-05-22 | 1993-12-07 | Toshiba Corp | 推論装置 |
JPH09265460A (ja) * | 1996-03-28 | 1997-10-07 | Mitsubishi Electric Corp | 分散処理システム及び分散処理方法 |
JPH09305406A (ja) * | 1996-05-16 | 1997-11-28 | Toshiba Corp | 情報処理システム及び情報処理方法 |
JPH1011292A (ja) * | 1996-06-25 | 1998-01-16 | Fuji Xerox Co Ltd | 知識発見システム |
JPH11122114A (ja) * | 1997-10-16 | 1999-04-30 | Sony Corp | コードブック作成装置およびコードブック作成方法、並びにベクトル量子化装置およびベクトル量子化方法 |
JPH11120180A (ja) * | 1997-10-17 | 1999-04-30 | Sharp Corp | データ検索装置及びデータ検索プログラムを記録した記録媒体 |
JP2000250833A (ja) * | 1999-02-26 | 2000-09-14 | Hitachi Information Systems Ltd | 複数サーバ運用管理における稼働情報取得方法およびそのプログラムを記録した記録媒体 |
JP2001075970A (ja) * | 1999-08-31 | 2001-03-23 | Toshiba Corp | 遠方監視制御装置の診断装置及び記録媒体 |
JP2002222083A (ja) * | 2001-01-29 | 2002-08-09 | Fujitsu Ltd | 事例蓄積装置および方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7620849B2 (en) | 2003-07-16 | 2009-11-17 | Nec Corporation | Fault recovery system and method for adaptively updating order of command executions according to past results |
JP2007133870A (ja) * | 2005-11-07 | 2007-05-31 | Internatl Business Mach Corp <Ibm> | コンピューティング・システムのオートノミック能力を測定するための方法、システム及びコンピュータ・プログラム |
JP2008176703A (ja) * | 2007-01-22 | 2008-07-31 | Fuji Xerox Co Ltd | 故障診断システム及び故障診断プログラム |
JP2009169610A (ja) * | 2008-01-15 | 2009-07-30 | Fujitsu Ltd | 障害対処支援プログラム、障害対処支援装置および障害対処支援方法 |
US8438422B2 (en) | 2008-01-15 | 2013-05-07 | Fujitsu Limited | Failure response support apparatus and failure response support method |
JP2011517807A (ja) * | 2008-03-08 | 2011-06-16 | 東京エレクトロン株式会社 | 生物学に基づく自律学習ツール |
US8725667B2 (en) | 2008-03-08 | 2014-05-13 | Tokyo Electron Limited | Method and system for detection of tool performance degradation and mismatch |
US8744607B2 (en) | 2008-03-08 | 2014-06-03 | Tokyo Electron Limited | Method and apparatus for self-learning and self-improving a semiconductor manufacturing tool |
US9275335B2 (en) | 2008-03-08 | 2016-03-01 | Tokyo Electron Limited | Autonomous biologically based learning tool |
US9424528B2 (en) | 2008-03-08 | 2016-08-23 | Tokyo Electron Limited | Method and apparatus for self-learning and self-improving a semiconductor manufacturing tool |
JP2009301298A (ja) * | 2008-06-12 | 2009-12-24 | Yahoo Japan Corp | アプリケーションの応答不能時を推定するシステム、方法、およびプログラム |
JP2009076103A (ja) * | 2008-12-22 | 2009-04-09 | Nec Corp | 障害復旧装置および障害復旧方法ならびにプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20050037606A (ko) | 2005-04-22 |
TW200405175A (en) | 2004-04-01 |
CN1317678C (zh) | 2007-05-23 |
AU2003252077A1 (en) | 2004-04-08 |
WO2004027705A1 (en) | 2004-04-01 |
CN1682243A (zh) | 2005-10-12 |
US20040059966A1 (en) | 2004-03-25 |
US7194445B2 (en) | 2007-03-20 |
KR100714157B1 (ko) | 2007-05-07 |
TWI243314B (en) | 2005-11-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006500654A (ja) | コンピュータ・システムにおける適応型問題判別及びリカバリー | |
US6792456B1 (en) | Systems and methods for authoring and executing operational policies that use event rates | |
US6697791B2 (en) | System and method for systematic construction of correlation rules for event management | |
US8170975B1 (en) | Encoded software management rules having free logical variables for input pattern matching and output binding substitutions to supply information to remedies for problems detected using the rules | |
EP1062583B1 (en) | System and method for model mining complex information technology systems | |
US7506336B1 (en) | System and methods for version compatibility checking | |
US7802144B2 (en) | Model-based system monitoring | |
US7552447B2 (en) | System and method for using root cause analysis to generate a representation of resource dependencies | |
US7814194B2 (en) | Method and system for machine-aided rule construction for event management | |
CN112988398B (zh) | 一种微服务动态伸缩及迁移方法和装置 | |
JP2006202304A (ja) | 計算資源自動起動システム | |
EP3338191B1 (en) | Diagnostic framework in computing systems | |
US20060232927A1 (en) | Model-based system monitoring | |
JP2009048611A (ja) | アソシエーションルールマイニングを使用してコンピュータ環境内の計算エンティティ向けコンフィギュレーションルールを生成するための方法及び装置 | |
CN115836305A (zh) | 用于分布式事件分类和路由的系统和方法 | |
US11593562B2 (en) | Advanced machine learning interfaces | |
US20230016199A1 (en) | Root cause detection of anomalous behavior using network relationships and event correlation | |
US11556871B2 (en) | Systems and methods for escalation policy activation | |
EP3956771A1 (en) | Timeout mode for storage devices | |
WO2023197453A1 (zh) | 一种故障诊断方法、装置、设备及存储介质 | |
WO2022012305A1 (zh) | 推理应用中模型文件的管理方法及装置 | |
JP5240709B2 (ja) | シンプトンを評価するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム | |
Chorey et al. | Failure recovery model in big data using the checkpoint approach | |
US20200134528A1 (en) | Systems and methods for coordinating escalation policy activation | |
US20230342622A1 (en) | Methods and Systems for Detecting Causes of Observed Outlier Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20051129 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051129 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20051129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20051129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080226 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080827 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081216 |