JP7369219B2 - 運用管理装置及び方法 - Google Patents
運用管理装置及び方法 Download PDFInfo
- Publication number
- JP7369219B2 JP7369219B2 JP2022016028A JP2022016028A JP7369219B2 JP 7369219 B2 JP7369219 B2 JP 7369219B2 JP 2022016028 A JP2022016028 A JP 2022016028A JP 2022016028 A JP2022016028 A JP 2022016028A JP 7369219 B2 JP7369219 B2 JP 7369219B2
- Authority
- JP
- Japan
- Prior art keywords
- abnormality
- countermeasure
- managed
- configuration
- management device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0721—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0775—Content or structure details of the error report, e.g. specific table structure, specific error fields
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Debugging And Monitoring (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
図1において、1は全体として本実施の形態による計算機システムを示す。この計算機システム1は、複数の組織2と、これらの組織2とネットワーク3を介してそれぞれ接続された運用管理装置4とを備えて構成される。
次に、本実施の形態の運用管理装置4に搭載された異常時対処案提示及び実行機能について説明する。この異常時対処案提示及び実行機能は、管理対象装置5の異常を検出してからその異常を解消するまでの間にその管理対象装置5に対して行われた対処(一連の構成変更)の内容を構成変更履歴として記録し、記録した構成変更履歴に基づいてそのとき実行された対処(一連の構成変更)の内容を一般化した異常対処ルールを生成し、その後に新たな異常が発生した場合に、適用可能な異常対処ルールを利用して1又は複数の対処案の候補(以下、これを対処案候補と呼ぶ)を生成してユーザに提示し、提示した対処案候補の中からユーザが選択した対処案候補を実行する機能である。
次に、かかる異常時対処機能に関連して運用管理装置4において実行される一連の処理(以下、これを異常対処及び異常対処ルール生成処理と呼ぶ)の内容について説明する。なお、以下においては、各種処理の処理主体を「プログラム」として説明するが、実際上は、そのプログラムに基づいて運用管理装置4のCPU10(図2)がその処理を実行することは言うまでもない。
図14は、かかる異常対処及び異常対処ルール生成処理の流れを示す。この異常対処及び異常対処ルール生成処理は、運用管理装置4の電源が投入されると開始され、まず、装置情報収集プログラム31(図2)が、計算機システム1内に存在するすべての管理対象装置5の構成情報及び稼動情報を直接的又は間接的にそれぞれ収集し、収集した構成情報及び稼動情報を装置構成管理表22(図5)や稼動情報管理表23(図6)に記録する装置情報収集処理を実行する(S1)。
図15は、図14について上述した異常対処及び異常対処ルール生成処理のステップS1において装置情報収集プログラム31により実行される装置情報収集処理の具体的な処理内容を示す。この装置情報収集処理は、異常対処及び異常対処ルール生成処理のステップS2に処理が進むと開始され、まず、装置情報収集プログラム31(図2)が、管理対象管理表20(図3)から管理対象装置5の一覧を取得する(S10)。
図16は、上述の装置情報収集処理のステップS13で装置情報収集プログラム31により呼び出された異常検知プログラム32により異常対処及び異常対処ルール生成処理のステップS2において実行される異常検知処理の具体的な処理内容を示す。
図17は、図14について上述した異常対処及び異常対処ルール生成処理のステップS4で実行される異常対処ルール生成処理の具体的な処理内容を示す。
図18は、図14について上述した異常対処及び異常対処ルール生成処理のステップS6において実行される異常対処処理の具体的な処理内容を示す。この異常対処処理は、異常対処及び異常対処ルール生成処理のステップS6に処理が進むと開始され、まず、異常検知プログラム32が、異常対処及び異常対処ルール生成処理のステップS2の異常検知処理で検知したすべての異常を対処案提示プログラム33(図2)に通知する(S40)。
以上のように本実施の形態の計算機システム1では、管理対象装置5の異常を検知してから当該異常が解消するまでの間に当該管理対象装置5に対して行われた一連の構成変更のログをログ管理表24から抽出して構成変更履歴として構成変更履歴管理表26に記録し、記録した構成変更履歴の内容を一般化した異常対処ルールを生成し、新たな異常を検知した場合に、適用可能な異常対処ルールを利用して1又は複数の対処案候補を生成し、生成した対処案候補をユーザに提示する。
なお上述の実施の形態においては、本実施の形態による異常時対処案提示及び実行機能を1つのコンピュータ装置(運用管理装置4)に搭載するようにした場合について述べたが、本発明はこれに限らず、異常時対処案提示及び実行機能の一部又は全部を分散コンピューティングシステムを構成する複数のコンピュータ装置に分散して搭載するようにしてもよい。
Claims (12)
- 1又は複数の管理対象装置を含むシステム全体の運用を管理する運用管理装置において、
前記管理対象装置の異常を検知する異常検知部と、
前記異常検知部が前記管理対象装置の前記異常を検知してから当該異常が解消するまでの間に当該管理対象装置に対して行われた一連の構成変更の内容をログから抽出して構成変更履歴として記録する構成変更抽出部と、
前記構成変更抽出部により記録された前記構成変更履歴の内容を一般化した異常対処ルールを生成する異常対処ルール生成部と、
前記異常検知部が新たな異常を検知した場合に、適用可能な前記異常対処ルールを利用して1又は複数の対処案を生成し、生成した前記対処案をユーザに提示する対処案提示部と
を備えることを特徴とする運用管理装置。 - 一部の前記管理対象装置を管理する管理装置から当該管理対象装置に対して行われた構成変更のログを収集するログ収集部をさらに備え、
前記構成変更抽出部は、
前記管理装置が管理する前記管理対象装置の異常を検知してから当該異常が解消するまでの間に当該異常を解消するために当該管理対象装置に対して行われた一連の構成変更の内容を、前記ログ収集部により収集された前記ログを含むすべての前記ログから抽出して前記構成変更履歴として記録する
ことを特徴とする請求項1に記載の運用管理装置。 - 前記構成変更抽出部は、
前記異常検知部が前記管理対象装置の前記異常を検知してから当該異常が解消するまでの間に当該管理対象装置に対して行われた一連の構成変更の内容のログとして、前記異常が検知された時刻から当該異常が解消された時刻までのすべてのログを抽出する
ことを特徴とする請求項1に記載の運用管理装置。 - 前記異常検知部は、
前記管理対象装置が異常であるか否かを判定するための予め定められた複数の異常判定ルールと、各前記管理対象装置の稼働状態とをそれぞれ比較するようにして前記管理対象装置に発生した異常を検出し、
前記構成変更抽出部は、
各前記異常判定ルールに対して、当該異常判定ルールにより検出される各前記異常に対してそれぞれ通常実行される対処を管理し、
前記異常が発生した日時に基づいて前記異常の発生日時で検索範囲を決定し、決定した検索範囲内の前記ログとして記録された前記構成変更であって、当該異常を検出する際に利用した前記異常判定ルールに対応付けられた対処と合致するすべての前記構成変更を抽出するようにして、前記一連の構成変更の内容を抽出する
ことを特徴とする請求項1に記載の運用管理装置。 - 前記異常検知部は、
前記管理対象装置が異常であるか否かを判定するための予め定められた複数の異常判定ルールと、各前記管理対象装置の稼働状態とをそれぞれ比較するようにして前記管理対象装置に発生した異常を検出し、
前記異常対処ルール生成部は、
前記異常が発生した異常箇所と、当該異常に対して行われた前記構成変更における変更元及び変更先との間の関連性を抽出し、抽出した前記関連性と、当該異常箇所と、当該異常が発生した前記管理対象装置の装置モデルと、当該異常を検出する際に利用した前記異常判定ルールとに基づいて前記異常対処ルールを生成する
ことを特徴とする請求項1に記載の運用管理装置。 - 対処案提示部は、
生成した各前記対処案の対処を実行したときの異常改善率、所要時間及び変更コストのうちの少なくとも1つを算出し、算出した前記異常改善率、前記所要時間及び又は前記変更コストに基づいて各前記対処案を順位付けして前記ユーザに提示する
ことを特徴とする請求項1に記載の運用管理装置。 - 1又は複数の管理対象装置を含むシステム全体の運用を管理する運用管理装置により実行される運用管理方法であって、
前記管理対象装置の異常を検知してから当該異常が解消するまでの間に当該管理対象装置に対して行われた一連の構成変更の内容をログから抽出して構成変更履歴として記録する第1のステップと、
記録した前記構成変更履歴の内容を一般化した異常対処ルールを生成する第2のステップと、
異常を検知した場合に、適用可能な前記異常対処ルールを利用して1又は複数の対処案を生成し、生成した前記対処案をユーザに提示する第3のステップと
を備えることを特徴とする運用管理方法。 - 前記運用管理装置は、
一部の前記管理対象装置を管理する管理装置から当該管理対象装置に対して行われた構成変更のログを収集し、
前記第1のステップでは、
前記管理装置が管理する前記管理対象装置の異常を検知してから当該異常が解消するまでの間に当該異常を解消するために当該管理対象装置に対して行われた一連の構成変更の内容を、収集した前記ログを含むすべての前記ログから抽出して前記構成変更履歴として記録する
ことを特徴とする請求項7に記載の運用管理方法。 - 前記第1のステップにおいて、前記運用管理装置は、
前記管理対象装置の前記異常を検知してから当該異常が解消するまでの間に当該管理対象装置に対して行われた一連の構成変更の内容のログとして、前記異常が検知された時刻から当該異常が解消された時刻までのすべてのログを抽出する
ことを特徴とする請求項7に記載の運用管理方法。 - 前記運用管理装置は、
前記管理対象装置が異常であるか否かを判定するための予め定められた複数の異常判定ルールと、各前記管理対象装置の稼働状態とをそれぞれ比較するようにして前記管理対象装置に発生した異常を検出し、
前記第1のステップにおいて、前記運用管理装置は、
各前記異常判定ルールに対して、当該異常判定ルールにより検出される各前記異常に対してそれぞれ通常実行される対処を管理し、
前記異常が発生した日時に基づいて前記異常の発生日時で検索範囲を決定し、決定した検索範囲内の前記ログとして記録された前記構成変更であって、当該異常を検出する際に利用した前記異常判定ルールに対応付けられた対処と合致するすべての前記構成変更を抽出するようにして、前記一連の構成変更の内容を抽出する
ことを特徴とする請求項7に記載の運用管理方法。 - 前記運用管理装置は、
前記管理対象装置が異常であるか否かを判定するための予め定められた複数の異常判定ルールと、各前記管理対象装置の稼働状態とをそれぞれ比較するようにして前記管理対象装置に発生した異常を検出し、
前記第2のステップにおいて、前記運用管理装置は、
前記異常が発生した異常箇所と、当該異常に対して行われた前記構成変更における変更元及び変更先との間の関連性を抽出し、抽出した前記関連性と、当該異常箇所と、当該異常が発生した前記管理対象装置の装置モデルと、当該異常を検出する際に利用した前記異常判定ルールとに基づいて前記異常対処ルールを生成する
ことを特徴とする請求項7に記載の運用管理方法。 - 前記第3のステップにおいて、前記運用管理装置は、
生成した各前記対処案の対処を実行したときの異常改善率、所要時間及び変更コストのうちの少なくとも1つを算出し、算出した前記異常改善率、前記所要時間及び又は前記変更コストに基づいて各前記対処案を順位付けして前記ユーザに提示する
ことを特徴とする請求項7に記載の運用管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022016028A JP7369219B2 (ja) | 2022-02-04 | 2022-02-04 | 運用管理装置及び方法 |
US17/903,483 US20230305917A1 (en) | 2022-02-04 | 2022-09-06 | Operation management apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022016028A JP7369219B2 (ja) | 2022-02-04 | 2022-02-04 | 運用管理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023114001A JP2023114001A (ja) | 2023-08-17 |
JP7369219B2 true JP7369219B2 (ja) | 2023-10-25 |
Family
ID=87569023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022016028A Active JP7369219B2 (ja) | 2022-02-04 | 2022-02-04 | 運用管理装置及び方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230305917A1 (ja) |
JP (1) | JP7369219B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11907053B2 (en) * | 2020-02-28 | 2024-02-20 | Nec Corporation | Failure handling apparatus and system, rule list generation method, and non-transitory computer-readable medium |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012003406A (ja) | 2010-06-15 | 2012-01-05 | Hitachi Solutions Ltd | 障害原因判定ルール検証装置及びプログラム |
JP2016012193A (ja) | 2014-06-27 | 2016-01-21 | 富士通株式会社 | 抽出方法、装置、及びプログラム |
WO2021172435A1 (ja) | 2020-02-28 | 2021-09-02 | 日本電気株式会社 | 障害対処装置及びシステム、ルールリスト生成方法並びに非一時的なコンピュータ可読媒体 |
-
2022
- 2022-02-04 JP JP2022016028A patent/JP7369219B2/ja active Active
- 2022-09-06 US US17/903,483 patent/US20230305917A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012003406A (ja) | 2010-06-15 | 2012-01-05 | Hitachi Solutions Ltd | 障害原因判定ルール検証装置及びプログラム |
JP2016012193A (ja) | 2014-06-27 | 2016-01-21 | 富士通株式会社 | 抽出方法、装置、及びプログラム |
WO2021172435A1 (ja) | 2020-02-28 | 2021-09-02 | 日本電気株式会社 | 障害対処装置及びシステム、ルールリスト生成方法並びに非一時的なコンピュータ可読媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2023114001A (ja) | 2023-08-17 |
US20230305917A1 (en) | 2023-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9208053B2 (en) | Method and system for predicting performance of software applications on prospective hardware architecture | |
JP5719974B2 (ja) | 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム | |
US8359440B2 (en) | Management server device for managing virtual storage device, and method for managing virtual storage device | |
US20140215471A1 (en) | Creating a model relating to execution of a job on platforms | |
US10949765B2 (en) | Automated inference of evidence from log information | |
WO2018066040A1 (ja) | 管理計算機及びテスト環境決定方法 | |
JP6449804B2 (ja) | メモリー被疑部検出のための方法およびシステム | |
WO2014188502A1 (ja) | 管理システム、管理プログラム及び管理方法 | |
JP6009089B2 (ja) | 計算機システムを管理する管理システム及びその管理方法 | |
WO2018116460A1 (ja) | 継続的インテグレーションシステム及びリソース制御方法 | |
JP7369219B2 (ja) | 運用管理装置及び方法 | |
US20070233532A1 (en) | Business process analysis apparatus | |
JP5439775B2 (ja) | 障害対応プログラム、障害対応装置、及び障害対応システム | |
JP2020042651A (ja) | リソース割当ての最適化を支援するシステム及び方法 | |
JP7415714B2 (ja) | 障害原因特定システム、障害原因特定方法および障害原因特定プログラム | |
EP3798931A1 (en) | Machine learning training resource management | |
JP6642024B2 (ja) | 管理装置,管理方法および管理プログラム | |
JPWO2017026017A1 (ja) | 管理計算機および計算機システムの管理方法 | |
US20200394091A1 (en) | Failure analysis support system, failure analysis support method, and computer readable recording medium | |
JP2023042138A (ja) | 因果探索装置 | |
CN114281260A (zh) | 应用于分布式存储系统的存储方法、装置、设备及介质 | |
US20160232187A1 (en) | Dump analysis method, apparatus and non-transitory computer readable storage medium | |
JP2016184213A (ja) | 数値データを匿名化する方法及び数値データ匿名化サーバ | |
US11762729B2 (en) | Apparatus and method for anomaly countermeasure decision, execution and evaluation | |
JP2019091130A (ja) | 質問提示制御プログラム、検索方法、および検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230926 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231013 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7369219 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |