WO2014171047A1 - 障害復旧手順生成装置、障害復旧手順生成方法および障害復旧手順生成プログラム - Google Patents
障害復旧手順生成装置、障害復旧手順生成方法および障害復旧手順生成プログラム Download PDFInfo
- Publication number
- WO2014171047A1 WO2014171047A1 PCT/JP2014/000331 JP2014000331W WO2014171047A1 WO 2014171047 A1 WO2014171047 A1 WO 2014171047A1 JP 2014000331 W JP2014000331 W JP 2014000331W WO 2014171047 A1 WO2014171047 A1 WO 2014171047A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- procedure
- sub
- failure recovery
- unit
- recovery procedure
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2033—Failover techniques switching over of hardware resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/805—Real-time
Definitions
- a fault recovery procedure generation device includes a sub procedure storage unit that stores a sub procedure that is a procedure for recovering a component in which a fault has occurred, and a precondition that indicates a condition required when the sub procedure is executed.
- the fault combination reception unit that receives a combination of faults that have occurred in the components of the information system, and the combination of faults that have occurred in the prerequisites and the component
- a sub-procedure identifying unit that identifies a sub-procedure necessary for the information processing, and a failure recovery procedure that is a procedure for recovering the information system by acquiring and connecting the identified sub-procedure from the sub-procedure storage unit.
- the fault recovery procedure generation method stores a sub procedure which is a procedure for recovering a component, stores a precondition indicating a condition necessary for executing the sub procedure, and stores the precondition in the information system component. Accepts a combination of faults that occurred, identifies a sub-procedure necessary to recover the component based on the prerequisites and a combination of faults that occurred in the component, and stores the identified sub-procedure
- a sub procedure which is a procedure for recovering a component
- stores a precondition indicating a condition necessary for executing the sub procedure and stores the precondition in the information system component.
- Accepts a combination of faults that occurred identifies a sub-procedure necessary to recover the component based on the prerequisites and a combination of faults that occurred in the component, and stores the identified sub-procedure
- the fault recovery procedure generation program has a sub procedure storing process for storing a sub procedure which is a procedure for restoring a component in a computer, and a precondition indicating conditions necessary for executing the sub procedure.
- the fault combination receiving process for receiving a combination of faults occurring in the components of the information system, and the combination of faults occurring in the components, in order to recover the component
- a failure which is a procedure for recovering the information system by acquiring a sub-procedure specifying process for specifying a necessary sub-procedure and acquiring and connecting the specified sub-procedure from the stored sub-procedures
- Failure recovery procedure generation processing for generating a recovery procedure candidate and the failure recovery time of the failure recovery procedure candidate A failure recovery time estimation process to be estimated, and a failure recovery procedure output process for outputting the failure recovery procedure candidate whose failure recovery time is equal to or less than a predetermined time as a failure recovery procedure.
- the sub-procedure specifying unit 102 specifies all necessary sub-procedures necessary for recovery from the acquired combination of failures.
- the failure recovery procedure generation apparatus includes, as main components, a sub procedure storage unit 108 that stores a sub procedure that is a procedure for recovering a component in which a failure has occurred, and a sub procedure.
- a precondition storage unit 107 for storing a precondition indicating a condition necessary for performing the operation, a failure combination receiving unit 101 for receiving a combination of faults occurring in the information system component, and a fault occurring in the precondition and the component
- the sub-procedure specifying unit 102 for specifying the sub-procedure necessary for restoring the component based on the combination of the information and the sub-procedure storage unit 108 for acquiring the specified sub-procedure and connecting the information to the information system.
Abstract
Description
図1は、第1の実施形態(実施形態1)の障害復旧手順生成装置1の構成を示すブロック図である。図2は、サブ手順特定部102の構成を示すブロック図である。本実施形態の障害復旧手順生成装置1は、一般的な情報処理装置(コンピュータ)により実現される。障害復旧手順生成装置1は、例えば、サーバ装置、またはパーソナルコンピュータ等である。
次に、本発明による第2の実施形態(実施形態2)に係る障害復旧手順生成装置について説明する。災害発生時、情報システムのどのリソース(物理サーバ、仮想サーバの台数など)が実際に利用可能な状態であるかは、ユーザが事前に予測することはできない。よって、利用可能なリソースの変化に合せた障害復旧手順の生成が課題となる。利用可能なリソースが少ない場合は、障害が発生した全てのコンポーネントの復旧は不可能となり、優先度の高いコンポーネント群のみ復旧することが必要となる。
次に、本発明による障害復旧手順生成装置の第3の実施形態(実施形態3)について説明する。ユーザは、災害発生時、実際に何人のオペレータが情報システムを設置している場所に投入可能であるかは、事前にはわからない。オペレータ自身の被災や、交通網の寸断などにより他地域からの支援が不可能となり、ユーザは、限られた人的リソースで情報システムの復旧を行わなければならない可能性がある。
101 障害組合せ受付部
102 サブ手順特定部
103 復旧サブ手順特定部
104 前提サブ手順特定部
105 状態特定部
106 状態実現サブ手順特定部
107 前提条件格納部
108 サブ手順格納部
109 障害復旧手順生成部
110 障害復旧時間推定部
111 障害復旧手順出力部
112 リソース受付部
113 復旧対象特定部
114 オペレータ数受付部
Claims (8)
- 障害が発生したコンポーネントを復旧するための手順であるサブ手順を格納するサブ手順格納部と、
前記サブ手順を実施する際に必要となる条件を示す前提条件を格納する前提条件格納部と、
情報システムのコンポーネントに発生した障害の組合せを受け付ける障害組合せ受付部と、
前記前提条件と前記コンポーネントに発生した障害の組合せとに基づいて、当該コンポーネントを復旧するために必要なサブ手順を特定するサブ手順特定部と、
特定された前記サブ手順を前記サブ手順格納部から取得して接続することにより、前記情報システムを復旧するための手順である障害復旧手順の候補を生成する障害復旧手順生成部と、
前記障害復旧手順の候補の障害復旧時間を推定する障害復旧時間推定部と、
前記障害復旧時間が予め定められた所定時間以下である前記障害復旧手順の候補を、障害復旧手順として出力する障害復旧手順出力部とを備えた
ことを特徴とする障害復旧手順生成装置。 - 前提条件は、
サブ手順を実施する前に実施する必要があるサブ手順である前提サブ手順を含み、
サブ手順特定部は、
障害が発生したコンポーネントを復旧するためのサブ手順を特定する復旧サブ手順特定部と、
前記前提サブ手順を用いて、特定された前記サブ手順を実施する前に実施する必要があるサブ手順を特定する前提サブ手順特定部とを含む
請求項1記載の障害復旧手順生成装置。 - 前提条件は、
サブ手順を実施するために必要なコンポーネントの状態である前提状態を含み、
サブ手順特定部は、
前記前提状態を用いて、特定されたサブ手順を実施するために必要なコンポーネントの状態を特定する状態特定部を含む
請求項2記載の障害復旧手順生成装置。 - 前提条件は、
サブ手順を実施した際に実現されるコンポーネントの状態である実現状態を含み、
サブ手順特定部は、
前記実現状態を用いて、特定されたコンポーネントの状態を実現するために必要なサブ手順を特定する状態実現サブ手順特定部を含む
請求項3記載の障害復旧手順生成装置。 - 情報システムに含まれるリソースのうち利用可能なリソースを受け付けるリソース受付部と、
コンポーネントに発生した障害の組合せの中から、前記利用可能なリソースおよび予め定められた優先度に基づいて、復旧対象となるコンポーネントを特定する復旧対象特定部とを備えた
請求項1から請求項4のうちのいずれか1項に記載の障害復旧手順生成装置。 - 作業可能なオペレータ数を受け付けるオペレータ数受付部を備え、
障害復旧手順生成部は、並列に実施されるサブ手順の数を、前記オペレータの数以下とした障害復旧手順の候補を生成する
請求項1から請求項5のうちのいずれか1項に記載の障害復旧手順生成装置。 - コンポーネントを復旧するための手順であるサブ手順を格納し、
前記サブ手順を実施する際に必要となる条件を示す前提条件を格納し、
情報システムのコンポーネントに発生した障害の組合せを受け付け、
前記前提条件と前記コンポーネントに発生した障害の組合せとに基づいて、当該コンポーネントを復旧するために必要なサブ手順を特定し、
特定された前記サブ手順を、格納された前記サブ手順の中から取得して接続することにより、前記情報システムを復旧するための手順である障害復旧手順の候補を生成し、
前記障害復旧手順の候補の障害復旧時間を推定し、
前記障害復旧時間が予め定められた所定時間以下である前記障害復旧手順の候補を、障害復旧手順として出力する
ことを特徴とする障害復旧手順生成方法。 - コンピュータに、
コンポーネントを復旧するための手順であるサブ手順を格納するサブ手順格納処理と、
前記サブ手順を実施する際に必要となる条件を示す前提条件を格納する前提条件格納処理と、
情報システムのコンポーネントに発生した障害の組合せを受け付ける障害組合せ受付処理と、
前記前提条件と前記コンポーネントに発生した障害の組合せとに基づいて、当該コンポーネントを復旧するために必要なサブ手順を特定するサブ手順特定処理と、
特定された前記サブ手順を、格納された前記サブ手順の中から取得して接続することにより、前記情報システムを復旧するための手順である障害復旧手順の候補を生成する障害復旧手順生成処理と、
前記障害復旧手順の候補の障害復旧時間を推定する障害復旧時間推定処理と、
前記障害復旧時間が予め定められた所定時間以下である前記障害復旧手順の候補を、障害復旧手順として出力する障害復旧手順出力処理とを
実行させるための障害復旧手順生成プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015512284A JP6249016B2 (ja) | 2013-04-17 | 2014-01-23 | 障害復旧手順生成装置、障害復旧手順生成方法および障害復旧手順生成プログラム |
US14/779,389 US20160062857A1 (en) | 2013-04-17 | 2014-01-23 | Fault recovery routine generating device, fault recovery routine generating method, and recording medium |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013-086208 | 2013-04-17 | ||
JP2013086208 | 2013-04-17 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2014171047A1 true WO2014171047A1 (ja) | 2014-10-23 |
Family
ID=51731014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2014/000331 WO2014171047A1 (ja) | 2013-04-17 | 2014-01-23 | 障害復旧手順生成装置、障害復旧手順生成方法および障害復旧手順生成プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20160062857A1 (ja) |
JP (1) | JP6249016B2 (ja) |
WO (1) | WO2014171047A1 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016142806A (ja) * | 2015-01-30 | 2016-08-08 | 京セラドキュメントソリューションズ株式会社 | メンテナンス管理装置及びメンテナンス管理方法 |
JP2016140991A (ja) * | 2015-01-30 | 2016-08-08 | 京セラドキュメントソリューションズ株式会社 | メンテナンス管理装置及びメンテナンス管理方法 |
JP2020109636A (ja) * | 2018-12-28 | 2020-07-16 | エーオー カスペルスキー ラボAO Kaspersky Lab | 互換性のあるモジュールを特定するシステムおよび方法 |
JP2021026394A (ja) * | 2019-08-01 | 2021-02-22 | 日本電信電話株式会社 | 復旧計画策定装置、復旧計画策定方法および復旧計画策定プログラム |
WO2022168269A1 (ja) * | 2021-02-05 | 2022-08-11 | 日本電信電話株式会社 | 情報処理装置、情報処理方法、及び、情報処理プログラム |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6622808B2 (ja) * | 2015-08-07 | 2019-12-18 | 株式会社日立製作所 | 管理計算機および計算機システムの管理方法 |
JP2018170618A (ja) * | 2017-03-29 | 2018-11-01 | Kddi株式会社 | 障害自動復旧システム、制御装置、手順作成装置およびプログラム |
JP2022116776A (ja) * | 2021-01-29 | 2022-08-10 | 株式会社日立製作所 | 保守支援装置、保守支援方法、及び保守支援プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244404A (ja) * | 2005-03-07 | 2006-09-14 | Nec Corp | 障害復旧システム、障害復旧装置、ルール作成方法、および障害復旧プログラム |
JP2009211611A (ja) * | 2008-03-06 | 2009-09-17 | Nec Corp | 運用管理システム及び方法、並びに、プログラム |
WO2009144825A1 (ja) * | 2008-05-30 | 2009-12-03 | 富士通株式会社 | 復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7065673B2 (en) * | 2002-10-29 | 2006-06-20 | Brocade Communication Systems, Inc. | Staged startup after failover or reboot |
US7818621B2 (en) * | 2007-01-11 | 2010-10-19 | International Business Machines Corporation | Data center boot order control |
US7774589B2 (en) * | 2007-03-30 | 2010-08-10 | International Business Machines Corporation | System, method and program for selectivity rebooting computers and other components of a distributed computer system |
US7757116B2 (en) * | 2007-04-04 | 2010-07-13 | Vision Solutions, Inc. | Method and system for coordinated multiple cluster failover |
US7904756B2 (en) * | 2007-10-19 | 2011-03-08 | Oracle International Corporation | Repair planning engine for data corruptions |
US8862927B2 (en) * | 2011-08-09 | 2014-10-14 | Symantec Corporation | Systems and methods for fault recovery in multi-tier applications |
US20130173329A1 (en) * | 2012-01-04 | 2013-07-04 | Honeywell International Inc. | Systems and methods for the solution to the joint problem of parts order scheduling and maintenance plan generation for field maintenance |
US8782467B2 (en) * | 2012-02-01 | 2014-07-15 | Honeywell International Inc. | Systems and methods for creating a near optimal maintenance plan |
US9063856B2 (en) * | 2012-05-09 | 2015-06-23 | Infosys Limited | Method and system for detecting symptoms and determining an optimal remedy pattern for a faulty device |
US20140089054A1 (en) * | 2012-09-24 | 2014-03-27 | General Electric Company | Method and system to forecast repair cost for assets |
-
2014
- 2014-01-23 WO PCT/JP2014/000331 patent/WO2014171047A1/ja active Application Filing
- 2014-01-23 US US14/779,389 patent/US20160062857A1/en not_active Abandoned
- 2014-01-23 JP JP2015512284A patent/JP6249016B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244404A (ja) * | 2005-03-07 | 2006-09-14 | Nec Corp | 障害復旧システム、障害復旧装置、ルール作成方法、および障害復旧プログラム |
JP2009211611A (ja) * | 2008-03-06 | 2009-09-17 | Nec Corp | 運用管理システム及び方法、並びに、プログラム |
WO2009144825A1 (ja) * | 2008-05-30 | 2009-12-03 | 富士通株式会社 | 復旧方法管理プログラム、復旧方法管理装置及び復旧方法管理方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016142806A (ja) * | 2015-01-30 | 2016-08-08 | 京セラドキュメントソリューションズ株式会社 | メンテナンス管理装置及びメンテナンス管理方法 |
JP2016140991A (ja) * | 2015-01-30 | 2016-08-08 | 京セラドキュメントソリューションズ株式会社 | メンテナンス管理装置及びメンテナンス管理方法 |
JP2020109636A (ja) * | 2018-12-28 | 2020-07-16 | エーオー カスペルスキー ラボAO Kaspersky Lab | 互換性のあるモジュールを特定するシステムおよび方法 |
JP7320443B2 (ja) | 2018-12-28 | 2023-08-03 | エーオー カスペルスキー ラボ | 互換性のあるモジュールを特定するシステムおよび方法 |
JP2021026394A (ja) * | 2019-08-01 | 2021-02-22 | 日本電信電話株式会社 | 復旧計画策定装置、復旧計画策定方法および復旧計画策定プログラム |
JP7298840B2 (ja) | 2019-08-01 | 2023-06-27 | 日本電信電話株式会社 | 復旧計画策定装置、復旧計画策定方法および復旧計画策定プログラム |
WO2022168269A1 (ja) * | 2021-02-05 | 2022-08-11 | 日本電信電話株式会社 | 情報処理装置、情報処理方法、及び、情報処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6249016B2 (ja) | 2017-12-20 |
US20160062857A1 (en) | 2016-03-03 |
JPWO2014171047A1 (ja) | 2017-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6249016B2 (ja) | 障害復旧手順生成装置、障害復旧手順生成方法および障害復旧手順生成プログラム | |
Lou et al. | Software analytics for incident management of online services: An experience report | |
US20180275986A1 (en) | Application management platform | |
JP6788178B2 (ja) | 設定支援プログラム、設定支援方法及び設定支援装置 | |
US10223248B2 (en) | Conducting automated software testing using centralized controller and distributed test host servers | |
KR102044046B1 (ko) | 텔레메트리 파일 해시 및 충돌 검출 기법 | |
WO2014031454A2 (en) | Transaction-level health monitoring of online services | |
US20180329812A1 (en) | Conducting Automated Software Testing Using Centralized Controller And Distributed Test Host Servers | |
JP6268029B2 (ja) | テストケース生成装置及びテストケース生成方法 | |
JP6693903B2 (ja) | ハードウェア試験装置及びハードウェア試験方法 | |
CN110673936A (zh) | 编排业务的断点续作方法、装置、存储介质及电子设备 | |
WO2014061199A1 (ja) | システム設計方法、システム設計装置及びシステム設計プログラム | |
US8881112B2 (en) | Quality measure tool for a composite application | |
JP6965873B2 (ja) | 変更手順生成装置、変更手順生成方法および変更手順生成プログラム | |
JP5967091B2 (ja) | システムパラメータ設定支援システム、システムパラメータ設定支援装置のデータ処理方法、およびプログラム | |
JP2013114437A (ja) | システム構築支援方法 | |
JP6818654B2 (ja) | 試験自動化装置、試験方法、及びプログラム | |
WO2015072078A1 (ja) | サービス再開手順生成装置、サービス再開手順生成方法およびサービス再開手順生成プログラム | |
JP2014106912A (ja) | 制約条件抽出プログラム、制約条件抽出装置および制約条件抽出方法 | |
US10180882B2 (en) | Information-processing device, processing method, and recording medium in which program is recorded | |
JP2016139984A (ja) | ネットワーク評価システム及びネットワーク評価方法 | |
Leong et al. | A task-based ubiquitous approach to urgent computing for disaster management | |
JP2006155047A (ja) | 検証システム及び検証方法 | |
JP7047054B2 (ja) | 試験自動化装置、試験方法、及びプログラム | |
JP5435403B2 (ja) | 画像処理装置、動作テスト実行システム、動作テスト実行方法、プログラム及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 14785521 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2015512284 Country of ref document: JP Kind code of ref document: A |
|
WWE | Wipo information: entry into national phase |
Ref document number: 14779389 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 14785521 Country of ref document: EP Kind code of ref document: A1 |