JP6555721B2 - 障害復旧システム及び方法 - Google Patents
障害復旧システム及び方法 Download PDFInfo
- Publication number
- JP6555721B2 JP6555721B2 JP2016157458A JP2016157458A JP6555721B2 JP 6555721 B2 JP6555721 B2 JP 6555721B2 JP 2016157458 A JP2016157458 A JP 2016157458A JP 2016157458 A JP2016157458 A JP 2016157458A JP 6555721 B2 JP6555721 B2 JP 6555721B2
- Authority
- JP
- Japan
- Prior art keywords
- failure
- layer
- recovery
- network
- traffic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Description
11…正常性試験機能部
100…サーバ装置
101…正常性試験機能部
102…トラヒック監視部
200…ネットワーク装置
201…正常性試験機能部
202…トラヒック監視部
300…復旧制御装置
310…トラヒック情報記憶部
320…正常性試験結果情報記憶部
330…障害原因特定部
340…障害箇所特定部
350…第1の復旧制御部
360…第2の復旧制御部
Claims (5)
- 仮想化環境が構築され該仮想化環境上でアプリケーションが動作するサーバ装置と、専用物理装置として構成されたネットワーク装置とを備え、前記サーバ装置の前記アプリケーションがユーザ端末にサービスを提供する仮想化されたネットワークにおいて、該ネットワークで発生した障害を復旧させる障害復旧システムであって、
前記障害の発生原因及び発生装置を特定して前記アプリケーションによる前記ユーザ端末に対するサービス提供を継続するよう障害発生装置を復旧制御する復旧制御装置を備え、
前記サーバ装置及び前記ネットワーク装置並びに前記ユーザ端末は、前記アプリケーションの正常性及び通信路の正常性を試験して正常性試験結果情報を前記復旧制御装置に送信する正常性試験手段を備え、
前記サーバ装置及び前記ネットワーク装置は、自身のトラヒックを監視してトラヒック情報を前記復旧制御装置に送信するトラヒック監視手段を備え、
前記復旧制御装置は、
前記トラヒック情報に基づき障害が前記サーバ装置又は前記ネットワーク装置の装置障害によるものか或いはトラヒック増加によるものかを判定する障害原因判定手段と、
装置障害が原因の場合には前記正常性試験結果情報に基づき障害発生装置を特定する障害装置特定手段と、
障害発生装置に対して再起動及び再起動後に正常性試験を実施するよう指示し、障害が復旧しない場合には、予め用意しておいた代替サーバ装置又は代替ネットワーク装置であって障害発生装置と同等の機能を提供するものを障害発生装置の代替として使用するよう制御する第1の復旧制御手段とを備えた
ことを特徴とする障害復旧システム。 - 前記サーバ装置は、ハードウェア層・ホストOS層・仮想化環境層・ゲストOS層・アプリケーション層からなる階層構造を有し、
前記ネットワーク装置は、ハードウェア層・ファームウェア層からなら階層構造を有し、
前記第1の復旧制御手段は、サーバ装置又はネットワーク装置に対して、障害が復旧するまで、各層ごとに再起動及び正常性試験を実施するよう指示する
ことを特徴とする請求項1記載の障害復旧システム。 - 前記代替サーバ装置は、ハードウェア層・ホストOS層・仮想化環境層・ゲストOS層・アプリケーション層からなる階層構造を有し、
前記代替ネットワーク装置は、ハードウェア層・ファームウェア層からなら階層構造を有し、
前記第1の復旧制御手段は、各層毎に、当該層においては障害発生装置と同等の機能を提供する他の構成が設定され且つ他の層においては障害発生装置と同一構成が設定された代替サーバ装置又は代替ネットワーク装置の1つを用いて正常性試験を実施するよう指示し、障害が復旧しない場合には、全ての層において障害発生装置と同等の機能を提供する他の構成が設定された代替サーバ装置又は代替ネットワーク装置を用いて正常性試験を実施し、障害が復旧した代替サーバ装置又は代替ネットワーク装置を障害発生装置の代替として使用するよう制御する
ことを特徴とする請求項2記載の障害復旧システム。 - 前記復旧制御装置は、更に、
障害発生原因がトラヒック増加の場合、トラヒックの迂回或いはサーバ装置又はネットワーク装置の物理的又は論理的な増加による処理能力の向上により障害復旧を行うよう制御する第2の復旧制御手段を備えた
ことを特徴とする請求項1乃至3何れか1項記載の障害復旧システム。 - 仮想化環境が構築され該仮想化環境上でアプリケーションが動作するサーバ装置と、専用物理装置として構成されたネットワーク装置とを備え、前記サーバ装置の前記アプリケーションがユーザ端末にサービスを提供する仮想化されたネットワークにおいて、復旧制御装置が該ネットワークで発生した障害を復旧させる障害復旧方法であって、
前記サーバ装置及び前記ネットワーク装置並びに前記ユーザ端末は、前記アプリケーションの正常性及び通信路の正常性を試験して正常性試験結果情報を前記復旧制御装置に送信する正常性試験手段を備え、
前記サーバ装置及び前記ネットワーク装置は、自身のトラヒックを監視してトラヒック情報を前記復旧制御装置に送信するトラヒック監視手段を備え、
前記復旧制御装置の障害原因判定手段が、前記トラヒック情報に基づき障害が前記サーバ装置又は前記ネットワーク装置の装置障害によるものか或いはトラヒック増加によるものかを判定し、
前記復旧制御装置の障害装置特定手段が、装置障害が原因の場合には前記正常性試験結果情報に基づき障害発生装置を特定し、
前記復旧制御装置の第1の復旧制御手段が、障害発生装置に対して再起動及び再起動後に正常性試験を実施するよう指示し、障害が復旧しない場合には、予め用意しておいた代替サーバ装置又は代替ネットワーク装置であって障害発生装置と同等の機能を提供するものを障害発生装置の代替として使用するよう制御する
ことを特徴とする障害復旧方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016157458A JP6555721B2 (ja) | 2016-08-10 | 2016-08-10 | 障害復旧システム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016157458A JP6555721B2 (ja) | 2016-08-10 | 2016-08-10 | 障害復旧システム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018026709A JP2018026709A (ja) | 2018-02-15 |
JP6555721B2 true JP6555721B2 (ja) | 2019-08-07 |
Family
ID=61194929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016157458A Active JP6555721B2 (ja) | 2016-08-10 | 2016-08-10 | 障害復旧システム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6555721B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109862331B (zh) * | 2019-03-22 | 2023-12-19 | 上海欣诺通信技术股份有限公司 | Pon网络系统及其服务器 |
US20240107340A1 (en) * | 2021-06-23 | 2024-03-28 | Rakuten Mobile, Inc. | Network management apparatus and network management method |
WO2023228233A1 (ja) * | 2022-05-23 | 2023-11-30 | 楽天モバイル株式会社 | 障害発生時における自動復旧のためのネットワーク管理 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1188471A (ja) * | 1997-09-09 | 1999-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 試験方法及び試験装置 |
EP1851934B1 (de) * | 2005-02-08 | 2016-11-30 | Nokia Solutions and Networks GmbH & Co. KG | Verfahren zur fehlererkennung eines nachrichteninterfaces in einer kommunikationseinrichtung |
JP4422176B2 (ja) * | 2007-08-09 | 2010-02-24 | 日本電信電話株式会社 | トラフィック量変化原因特定方法、システム、プログラム、及び記録媒体 |
JP2009094810A (ja) * | 2007-10-09 | 2009-04-30 | Nippon Telegr & Teleph Corp <Ntt> | ネットワーク試験装置、ネットワーク試験方法およびそのプログラム |
US9350632B2 (en) * | 2013-09-23 | 2016-05-24 | Intel Corporation | Detection and handling of virtual network appliance failures |
JP6111958B2 (ja) * | 2013-09-30 | 2017-04-12 | 富士通株式会社 | 通信システム、通信装置、プログラム、および方法 |
JP2015171052A (ja) * | 2014-03-07 | 2015-09-28 | 富士通株式会社 | 識別装置、識別プログラム、及び識別方法 |
-
2016
- 2016-08-10 JP JP2016157458A patent/JP6555721B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018026709A (ja) | 2018-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8910172B2 (en) | Application resource switchover systems and methods | |
CN111831569A (zh) | 基于故障注入的测试方法、装置、计算机设备和存储介质 | |
CN101809540B (zh) | 用于激活虚拟化的计算机应用的网络背景触发 | |
US10489232B1 (en) | Data center diagnostic information | |
US11706080B2 (en) | Providing dynamic serviceability for software-defined data centers | |
TW201738747A (zh) | 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統 | |
CN103812699A (zh) | 基于云计算的监控管理系统 | |
CN103607296B (zh) | 一种虚拟机故障处理方法和设备 | |
GB2505644A (en) | Managing network configurations | |
US10120779B1 (en) | Debugging of hosted computer programs | |
JP6555721B2 (ja) | 障害復旧システム及び方法 | |
JP6607572B2 (ja) | 復旧制御システム及び方法 | |
US11316756B2 (en) | Self-tuning networks using distributed analytics | |
CN104468283A (zh) | 多主机管理系统的监控方法、装置和系统 | |
CN118119926A (zh) | 基于候选运行手册的结果与事件的补救的相关性推荐候选运行手册 | |
CN107453888B (zh) | 高可用性的虚拟机集群的管理方法及装置 | |
EP2975524B1 (en) | Information processing device | |
CN109104333B (zh) | 基于git的分布式集群的同步方法和装置 | |
Lee et al. | A fault management system for nfv | |
CN103457771A (zh) | 一种ha的虚拟机集群的管理方法和设备 | |
JP6818654B2 (ja) | 試験自動化装置、試験方法、及びプログラム | |
CN110933066A (zh) | 网络终端非法接入局域网的监控系统及方法 | |
JP7047054B2 (ja) | 試験自動化装置、試験方法、及びプログラム | |
WO2023275983A1 (ja) | 仮想化システム障害分離装置及び仮想化システム障害分離方法 | |
CN115827500B (zh) | 一种云原生应用的调试方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180627 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190626 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190703 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190703 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6555721 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |