JP2011103030A - インシデント管理方法および運用管理サーバ - Google Patents
インシデント管理方法および運用管理サーバ Download PDFInfo
- Publication number
- JP2011103030A JP2011103030A JP2009257131A JP2009257131A JP2011103030A JP 2011103030 A JP2011103030 A JP 2011103030A JP 2009257131 A JP2009257131 A JP 2009257131A JP 2009257131 A JP2009257131 A JP 2009257131A JP 2011103030 A JP2011103030 A JP 2011103030A
- Authority
- JP
- Japan
- Prior art keywords
- job
- incident
- execution
- group
- management server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/485—Task life-cycle, e.g. stopping, restarting, resuming execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/14—Error detection or correction of the data by redundancy in operation
- G06F11/1402—Saving, restoring, recovering or retrying
- G06F11/1415—Saving, restoring, recovering or retrying at system level
- G06F11/1438—Restarting or rejuvenating
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Abstract
【解決手段】運用管理サーバが、ホストにより構成される業務システムとホストによるジョブの実行を管理するジョブ管理サーバとに接続し、業務システムに発生したインシデントの発生に応答して、インシデントとホストとを対応付けたインシデントテーブル、並びに、ホストにより実行されるジョブ及びブを含むジョブグループとホストとを対応付けた、ジョブ管理サーバからのジョブグループ定義テーブルを参照して、インシデントが発生したホストにより実行されるジョブ及びジョブグループを特定するインシデント−ジョブ関連特定部、ジョブ管理サーバからのジョブ実行スケジュールテーブルに示されるジョブの実行状況を参照して、ジョブグループ内の、インシデントの発生により再実行すべき及び未実行のジョブを特定するジョブ実行予測部、及び、特定したジョブに関連させて、インシデントが業務システムに与える影響度である迷惑度を求める迷惑度算出部を有する。
【選択図】図1
Description
Claims (10)
- ホストと呼ぶ業務実行サーバにより構成される業務システムおよび前記業務実行サーバによるジョブの実行を管理するジョブ管理サーバと接続し、前記業務システムを運用管理する運用管理サーバにおける、前記業務システムに発生するインシデントを管理する方法であって、前記運用管理サーバは、
前記業務システムに発生した前記インシデントの発生に応答して、前記インシデントと前記インシデントが発生した前記ホストとを対応付けたインシデントテーブル、並びに、前記ホストにより実行される前記ジョブ及び前記ジョブを含むジョブグループと前記ホストとを対応付けた、前記ジョブ管理サーバからのジョブグループ定義テーブルを参照して、前記インシデントが発生した前記ホストにより実行される前記ジョブ及び前記ジョブグループを特定し、
前記ジョブ管理サーバからのジョブ実行スケジュールテーブルに示される前記ジョブの実行状況を参照して、前記ジョブグループ内の、前記インシデントの発生により再実行すべき及び未実行のジョブを特定し、
特定した前記ジョブに関連させて、前記インシデントが前記業務システムに与える影響度である迷惑度を求めることを特徴とするインシデント管理方法。 - 前記迷惑度は、(1)前記ジョブ実行スケジュールテーブルに示される、特定した前記ジョブの数、(2)前記ジョブ実行スケジュールテーブルに示される、特定した前記ジョブの実行時間、(3)前記ジョブグループ定義テーブルに示される、特定した前記ジョブを実行する前記ホストの数、(4)前記ジョブグループ定義テーブルに示される、特定した前記ジョブを実行する前記ホストの冗長度、および(5)前記インシデントと対処所要時間とを対応付けた対処時間履歴テーブルを参照した前記インシデントへの対処完了予定日時までの、前記ジョブ実行スケジュールテーブルに示される、前記ジョブグループの実行予定回数の少なくとも1つとして求められることを特徴とする請求項1記載のインシデント管理方法。
- 前記再実行すべきジョブの中で再実行を開始するジョブは、前記ジョブの実行状況が「失敗」を示すジョブの中で、前記ジョブグループ定義テーブルの前記ジョブグループの中の最先の実行順序を有するジョブであることを特徴とする請求項2記載のインシデント管理方法。
- 前記再実行すべきジョブの中で再実行を開始するジョブは、前記ジョブの実行状況が「失敗」を示すジョブに対応して、再実行を開始するジョブとしてジョブ再実行定義テーブルに予め定義されたジョブであることを特徴とする請求項3記載のインシデント管理方法。
- 前記未実行のジョブの中で実行を開始するジョブは、前記ジョブグループ定義テーブルの前記ジョブグループの中の前記ジョブの実行状況が「失敗」を示すジョブがなく、前記ジョブの実行状況が「未実行」を示すジョブの中で、ジョブ前記ジョブグループ定義テーブルの前記ジョブグループの中の最先の実行順序を有するジョブであることを特徴とする請求項2記載のインシデント管理方法。
- ホストと呼ぶ業務実行サーバにより構成される業務システムと前記業務実行サーバによるジョブの実行を管理するジョブ管理サーバとに接続し、
前記業務システムに発生した前記インシデントの発生に応答して、前記インシデントと前記インシデントが発生した前記ホストとを対応付けたインシデントテーブル、並びに、前記ホストにより実行される前記ジョブ及び前記ジョブを含むジョブグループと前記ホストとを対応付けた、前記ジョブ管理サーバからのジョブグループ定義テーブルを参照して、前記インシデントが発生した前記ホストにより実行される前記ジョブ及び前記ジョブグループを特定するインシデント−ジョブ関連特定部、
前記ジョブ管理サーバからのジョブ実行スケジュールテーブルに示される前記ジョブの実行状況を参照して、前記ジョブグループ内の、前記インシデントの発生により再実行すべき及び未実行のジョブを特定するジョブ実行予測部、及び、
特定した前記ジョブに関連させて、前記インシデントが前記業務システムに与える影響度である迷惑度を求める迷惑度算出部を有することを特徴とする運用管理サーバ。 - 前記迷惑度算出部は、(1)前記ジョブ実行スケジュールテーブルに示される、特定した前記ジョブの数、(2)前記ジョブ実行スケジュールテーブルに示される、特定した前記ジョブの実行時間、(3)前記ジョブグループ定義テーブルに示される、特定した前記ジョブを実行する前記ホストの数、(4)前記ジョブグループ定義テーブルに示される、特定した前記ジョブを実行する前記ホストの冗長度、および(5)前記インシデントと対処所要時間とを対応付けた対処時間履歴テーブルを参照した前記インシデントへの対処完了予定日時までの、前記ジョブ実行スケジュールテーブルに示される、前記ジョブグループの実行予定回数の少なくとも1つとして前記迷惑度を求めることを特徴とする請求項6記載の運用管理サーバ。
- 前記ジョブ実行予測部は、前記再実行すべきジョブの中で再実行を開始するジョブとして、前記ジョブの実行状況が「失敗」を示すジョブの中で、前記ジョブグループ定義テーブルの前記ジョブグループの中の最先の実行順序を有するジョブを特定することを特徴とする請求項7記載の運用管理サーバ。
- 前記ジョブ実行予測部は、前記再実行すべきジョブの中で再実行を開始するジョブとして、前記ジョブの実行状況が「失敗」を示すジョブに対応して、再実行を開始するジョブとしてジョブ再実行定義テーブルに予め定義されたジョブを特定することを特徴とする請求項8記載の運用管理サーバ。
- 前記ジョブ実行予測部は、前記未実行のジョブの中で実行を開始するジョブとして、前記ジョブグループ定義テーブルの前記ジョブグループの中の前記ジョブの実行状況が「失敗」を示すジョブがなく、前記ジョブの実行状況が「未実行」を示すジョブの中で、ジョブ前記ジョブグループ定義テーブルの前記ジョブグループの中の最先の実行順序を有するジョブを特定することを特徴とする請求項7記載の運用管理サーバ。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009257131A JP5422342B2 (ja) | 2009-11-10 | 2009-11-10 | インシデント管理方法および運用管理サーバ |
US12/703,013 US20110113429A1 (en) | 2009-11-10 | 2010-02-09 | Incident management method and operation management server |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009257131A JP5422342B2 (ja) | 2009-11-10 | 2009-11-10 | インシデント管理方法および運用管理サーバ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011103030A true JP2011103030A (ja) | 2011-05-26 |
JP5422342B2 JP5422342B2 (ja) | 2014-02-19 |
Family
ID=43975129
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009257131A Active JP5422342B2 (ja) | 2009-11-10 | 2009-11-10 | インシデント管理方法および運用管理サーバ |
Country Status (2)
Country | Link |
---|---|
US (1) | US20110113429A1 (ja) |
JP (1) | JP5422342B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012169020A1 (ja) * | 2011-06-08 | 2012-12-13 | 株式会社日立製作所 | インパクト分析方法、インパクト分析装置及び記憶媒体 |
JP2015060306A (ja) * | 2013-09-17 | 2015-03-30 | 株式会社リコー | データ処理装置、データ処理方法、及びデータ処理プログラム |
JP2015204036A (ja) * | 2014-04-15 | 2015-11-16 | 日本電信電話株式会社 | ジョブ実行管理システム、ジョブ再実行方法およびジョブ再実行プログラム |
JP2016200981A (ja) * | 2015-04-10 | 2016-12-01 | 富士通株式会社 | 運用管理プログラム、運用管理方法、および運用管理装置 |
JP2019159870A (ja) * | 2018-03-14 | 2019-09-19 | みずほ情報総研株式会社 | 影響調査システム、影響調査方法及び影響調査プログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8892539B2 (en) | 2012-11-28 | 2014-11-18 | International Business Machines Corporation | Building, reusing and managing authored content for incident management |
US20170235608A1 (en) * | 2016-02-16 | 2017-08-17 | Linkedin Corporation | Automatic response to inefficient jobs in data processing clusters |
US11012883B2 (en) * | 2017-01-06 | 2021-05-18 | Apple Inc. | Measurement job suspension and resumption in network function virtualization |
US11138168B2 (en) | 2017-03-31 | 2021-10-05 | Bank Of America Corporation | Data analysis and support engine |
US10642801B2 (en) | 2017-08-29 | 2020-05-05 | Bank Of America Corporation | System for determining the impact to databases, tables and views by batch processing |
CN111857984A (zh) * | 2020-06-01 | 2020-10-30 | 北京文思海辉金信软件有限公司 | 银行系统中的作业调用处理方法、装置和计算机设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09282192A (ja) * | 1996-04-15 | 1997-10-31 | Nec Corp | ジョブ再実行方式 |
JPH117431A (ja) * | 1997-06-16 | 1999-01-12 | Hitachi Ltd | 複数コンピュータで実行する業務の障害回復システム |
JP2004295469A (ja) * | 2003-03-27 | 2004-10-21 | Hitachi Ltd | ポリシールールの生成方法およびそれを用いたジョブ運用管理方法 |
JP2008217367A (ja) * | 2007-03-02 | 2008-09-18 | Hitachi Information Systems Ltd | バッチ処理の障害復旧方法及び障害復旧システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1078894A (ja) * | 1996-09-03 | 1998-03-24 | Hitachi Ltd | 計算機システムの障害回復支援方法 |
US7386586B1 (en) * | 1998-12-22 | 2008-06-10 | Computer Associates Think, Inc. | System for scheduling and monitoring computer processes |
US7364922B2 (en) * | 2005-01-24 | 2008-04-29 | Tokyo Electron Limited | Automated semiconductor wafer salvage during processing |
JP4669487B2 (ja) * | 2007-03-02 | 2011-04-13 | 株式会社日立製作所 | 情報処理システムの運用管理装置および運用管理方法 |
-
2009
- 2009-11-10 JP JP2009257131A patent/JP5422342B2/ja active Active
-
2010
- 2010-02-09 US US12/703,013 patent/US20110113429A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09282192A (ja) * | 1996-04-15 | 1997-10-31 | Nec Corp | ジョブ再実行方式 |
JPH117431A (ja) * | 1997-06-16 | 1999-01-12 | Hitachi Ltd | 複数コンピュータで実行する業務の障害回復システム |
JP2004295469A (ja) * | 2003-03-27 | 2004-10-21 | Hitachi Ltd | ポリシールールの生成方法およびそれを用いたジョブ運用管理方法 |
JP2008217367A (ja) * | 2007-03-02 | 2008-09-18 | Hitachi Information Systems Ltd | バッチ処理の障害復旧方法及び障害復旧システム |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012169020A1 (ja) * | 2011-06-08 | 2012-12-13 | 株式会社日立製作所 | インパクト分析方法、インパクト分析装置及び記憶媒体 |
JP5615431B2 (ja) * | 2011-06-08 | 2014-10-29 | 株式会社日立製作所 | インパクト分析方法、インパクト分析装置及び記憶媒体 |
JP2015060306A (ja) * | 2013-09-17 | 2015-03-30 | 株式会社リコー | データ処理装置、データ処理方法、及びデータ処理プログラム |
JP2015204036A (ja) * | 2014-04-15 | 2015-11-16 | 日本電信電話株式会社 | ジョブ実行管理システム、ジョブ再実行方法およびジョブ再実行プログラム |
JP2016200981A (ja) * | 2015-04-10 | 2016-12-01 | 富士通株式会社 | 運用管理プログラム、運用管理方法、および運用管理装置 |
JP2019159870A (ja) * | 2018-03-14 | 2019-09-19 | みずほ情報総研株式会社 | 影響調査システム、影響調査方法及び影響調査プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5422342B2 (ja) | 2014-02-19 |
US20110113429A1 (en) | 2011-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5422342B2 (ja) | インシデント管理方法および運用管理サーバ | |
US7840517B2 (en) | Performance evaluating apparatus, method, and computer-readable medium | |
JP5075736B2 (ja) | 仮想サーバのシステム障害回復方法及びそのシステム | |
CN105357038B (zh) | 监控虚拟机集群的方法和系统 | |
EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
JP4983795B2 (ja) | システム管理プログラム、システム管理装置およびシステム管理方法 | |
WO2012066691A1 (ja) | クラスタシステム | |
JP5942509B2 (ja) | バッチ処理システム | |
US9021078B2 (en) | Management method and management system | |
JP6530337B2 (ja) | トランザクション制御システムおよびトランザクション制御方法 | |
JPWO2007108062A1 (ja) | サーバ管理方法、プログラム及び装置 | |
JP5466740B2 (ja) | 仮想サーバのシステム障害回復方法及びそのシステム | |
JP5325827B2 (ja) | ジョブスケジュールシステム、ジョブスケジュール管理方法及びプログラム。 | |
JP5737789B2 (ja) | 仮想マシン運用監視システム | |
JP6477311B2 (ja) | ジョブ実行カレンダ管理プログラム、ジョブ実行カレンダ管理装置、及びジョブ実行カレンダ管理方法 | |
US11960928B2 (en) | Event monitoring system and event monitoring method | |
JP5384566B2 (ja) | フロントエンドサーバ、インタプリタ型プログラム及び方法 | |
JP2009289069A (ja) | 障害対応支援システム、障害対応支援方法、および障害対応支援プログラム | |
JP3995023B2 (ja) | オブジェクト管理方法 | |
JP6835763B2 (ja) | メッセージ監視サーバ、方法、プログラム | |
JP2017076299A (ja) | 事象発生通知プログラム、事象発生通知方法、及び、事象発生通知装置 | |
JP2015106329A (ja) | 運用作業の履歴を検索する情報処理装置、情報処理システム、運用作業履歴検索方法及びそのためのプログラム | |
JP5847497B2 (ja) | システム管理支援装置およびシステム管理支援方法 | |
JP2012053755A (ja) | 作業管理システム | |
JP2013191070A (ja) | 監視装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130430 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130514 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131105 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5422342 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |