JP6607572B2 - 復旧制御システム及び方法 - Google Patents
復旧制御システム及び方法 Download PDFInfo
- Publication number
- JP6607572B2 JP6607572B2 JP2016157459A JP2016157459A JP6607572B2 JP 6607572 B2 JP6607572 B2 JP 6607572B2 JP 2016157459 A JP2016157459 A JP 2016157459A JP 2016157459 A JP2016157459 A JP 2016157459A JP 6607572 B2 JP6607572 B2 JP 6607572B2
- Authority
- JP
- Japan
- Prior art keywords
- recovery control
- recovery
- failure
- layer
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
既存手法(非特許文献3〜6)は、故障対応時に運用者が記録するトラブルチケットログが必要であり、そもそも人手作業を前提としているため完全な保守運用の自動化は出来ていない。
既存手法(非特許文献3〜6)では,故障発生した後の復旧処理をターゲットとしており、故障が発生する前に、事前に何らかの対処を行い、故障を未然に抑止する、といった事は不可能であった。
既存手法(非特許文献3〜6)では、仮想化構成(ハードウェア・ホストOS・ハイパーバイザー・ゲストOS・アプリケーションからなる構成)は固定的となっており、状況の変化に応じて自動的に切り替える事は不可能である。そのため、特定のレイヤ、例えばゲストOSにバグが発生し、動作が不安定となった場合に、システム全体の安定性が低下するといった事態に対処する事が不可能であった。
100…サーバ装置
200…ネットワーク装置
300…復旧制御装置
310…復旧制御部
320…復旧制御履歴記憶部
330…再起動制御部
340…構成変更制御部
Claims (3)
- 仮想化環境が構築され該仮想化環境上でアプリケーションが動作するサーバ装置と、専用物理装置として構成されたネットワーク装置とを備え、前記サーバ装置の前記アプリケーションがユーザ端末にサービスを提供する仮想化されたネットワークにおいて、該ネットワークで発生した障害を復旧制御装置により復旧させる障害復旧システムであって、
前記サーバ装置は、ハードウェア層・ホストOS層・仮想化環境層・ゲストOS層・アプリケーション層からなる階層構造を有し、
前記ネットワーク装置は、ハードウェア層・ファームウェア層からなら階層構造を有し、
前記復旧制御装置は、前記障害の発生原因及び発生装置を特定して前記アプリケーションによる前記ユーザ端末に対するサービス提供を継続するよう、1つ以上の層において障害発生装置と同等の機能を提供する代替構成を障害発生装置の代替として使用するよう制御することにより障害発生装置を復旧制御する復旧制御手段と、復旧制御手段による復旧制御処理のトリガ及びその復旧処理内容を関連づけて復旧制御履歴として記憶する復旧制御履歴記憶部と、前記復旧制御履歴記憶部に記憶された代替構成による復旧処理についての復旧制御履歴に基づき通常の構成におけるサーバ装置及びネットワーク装置の安定性を導出し、安定性の低いサーバ装置又はネットワーク装置の通常の構成を代替構成に変更するよう制御する構成変更手段とを備え、
前記復旧制御手段は、前記復旧制御履歴記憶部に記憶された復旧制御履歴に基づき復旧制御アルゴリズムを構成して障害発生装置の復旧制御を行う
ことを特徴とする障害復旧システム。 - 前記復旧制御装置は、更に、
前記復旧制御履歴記憶部に記憶された復旧制御履歴を解析して再起動により復旧する障害が定常的に発生しているサーバ装置又はネットワーク装置及びその障害発生周期を算出し、該サーバ装置又はネットワーク装置の次回障害発生時期を予測し、次回障害発生時期の到来前に該サーバ装置又はネットワーク装置を再起動するよう制御する再起動制御手段を備えた
ことを特徴とする請求項1記載の障害復旧システム。 - 仮想化環境が構築され該仮想化環境上でアプリケーションが動作するサーバ装置と、専用物理装置として構成されたネットワーク装置とを備え、前記サーバ装置の前記アプリケーションがユーザ端末にサービスを提供する仮想化されたネットワークにおいて、該ネットワークで発生した障害を復旧制御装置により復旧させる障害復旧方法であって、
前記サーバ装置は、ハードウェア層・ホストOS層・仮想化環境層・ゲストOS層・アプリケーション層からなる階層構造を有し、
前記ネットワーク装置は、ハードウェア層・ファームウェア層からなら階層構造を有し、
前記復旧制御装置の復旧制御手段が、前記障害の発生原因及び発生装置を特定して前記アプリケーションによる前記ユーザ端末に対するサービス提供を継続するよう、1つ以上の層において障害発生装置と同等の機能を提供する代替構成を障害発生装置の代替として使用するよう制御することにより障害発生装置を復旧制御するとともに、復旧制御処理のトリガ及びその復旧処理内容を関連づけて復旧制御履歴として復旧制御履歴記憶部に記憶し、
前記復旧制御装置の構成変更手段が、前記復旧制御履歴記憶部に記憶された代替構成による復旧処理についての復旧制御履歴に基づき通常の構成におけるサーバ装置及びネットワーク装置の安定性を導出し、安定性の低いサーバ装置又はネットワーク装置の通常の構成を代替構成に変更するよう制御し、
前記復旧制御手段は、前記復旧制御の際には、前記復旧制御履歴記憶部に記憶された復旧制御履歴に基づき復旧制御アルゴリズムを構成して障害発生装置の復旧制御を行う
ことを特徴とする障害復旧方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016157459A JP6607572B2 (ja) | 2016-08-10 | 2016-08-10 | 復旧制御システム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016157459A JP6607572B2 (ja) | 2016-08-10 | 2016-08-10 | 復旧制御システム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018025968A JP2018025968A (ja) | 2018-02-15 |
JP6607572B2 true JP6607572B2 (ja) | 2019-11-20 |
Family
ID=61193825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016157459A Active JP6607572B2 (ja) | 2016-08-10 | 2016-08-10 | 復旧制御システム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6607572B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7230332B2 (ja) * | 2018-03-19 | 2023-03-01 | 株式会社リコー | 管理サーバ、方法、プログラム及び管理システム |
CN109062082B (zh) * | 2018-07-17 | 2020-07-10 | 深圳市雅宝智能装备系统有限公司 | 一种智能故障处理方法、装置以及系统 |
CN111708705B (zh) * | 2020-06-19 | 2022-07-05 | 山东云海国创云计算装备产业创新中心有限公司 | Bios的自动修复功能测试方法、装置、设备及介质 |
CN112467686B (zh) * | 2020-11-04 | 2023-09-01 | 深圳供电局有限公司 | 配电网故障恢复方法、装置、控制设备和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5643970B2 (ja) * | 2011-07-19 | 2014-12-24 | 株式会社日立製作所 | 障害復旧装置および通信装置の復旧方法 |
US8959402B2 (en) * | 2012-10-04 | 2015-02-17 | Qualcomm Incorporated | Method for preemptively restarting software in a multi-subsystem mobile communication device to increase mean time between failures |
WO2015042937A1 (zh) * | 2013-09-30 | 2015-04-02 | 华为技术有限公司 | 故障管理的方法、实体和系统 |
-
2016
- 2016-08-10 JP JP2016157459A patent/JP6607572B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018025968A (ja) | 2018-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107179957B (zh) | 物理机故障分类处理方法、装置和虚拟机恢复方法、系统 | |
JP6607572B2 (ja) | 復旧制御システム及び方法 | |
CN107026760B (zh) | 一种故障修复方法及监控节点 | |
US8370466B2 (en) | Method and system for providing operator guidance in network and systems management | |
Kimura et al. | Spatio-temporal factorization of log data for understanding network events | |
JP5678717B2 (ja) | 監視装置、監視システムおよび監視方法 | |
CN101390336B (zh) | 灾难恢复体系结构 | |
US10684935B2 (en) | Deriving the shortest steps to reproduce a device failure condition | |
CN106775929B (zh) | 一种虚拟化平台安全监控方法及系统 | |
US11706080B2 (en) | Providing dynamic serviceability for software-defined data centers | |
US10489232B1 (en) | Data center diagnostic information | |
US20200401936A1 (en) | Self-aware service assurance in a 5g telco network | |
US10728085B1 (en) | Model-based network management | |
GB2505644A (en) | Managing network configurations | |
CN102231681A (zh) | 一种高可用集群计算机系统及其故障处理方法 | |
US8498214B2 (en) | Switching device, information processing device, and recording medium for failure notification control program | |
WO2006117833A1 (ja) | 監視シミュレーション装置,方法およびそのプログラム | |
CN113825164A (zh) | 网络故障修复方法、装置、存储介质及电子设备 | |
CN111193643A (zh) | 一种云服务器状态监控系统及方法 | |
JP6555721B2 (ja) | 障害復旧システム及び方法 | |
CN111694707A (zh) | 一种小型服务器集群管理系统及方法 | |
JP5949785B2 (ja) | 情報処理方法、装置及びプログラム | |
CN109218050B (zh) | 一种域名系统故障处理方法和系统 | |
CN111600953B (zh) | 基于蜜罐系统实现分布式部署的方法 | |
CN107888438B (zh) | 一种基于流表技术的自动感知并适应云环境变化的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190313 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190508 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191016 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191016 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6607572 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |