JP2018025968A - 復旧制御システム及び方法 - Google Patents

復旧制御システム及び方法 Download PDF

Info

Publication number
JP2018025968A
JP2018025968A JP2016157459A JP2016157459A JP2018025968A JP 2018025968 A JP2018025968 A JP 2018025968A JP 2016157459 A JP2016157459 A JP 2016157459A JP 2016157459 A JP2016157459 A JP 2016157459A JP 2018025968 A JP2018025968 A JP 2018025968A
Authority
JP
Japan
Prior art keywords
recovery control
failure
recovery
network
server device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016157459A
Other languages
English (en)
Other versions
JP6607572B2 (ja
Inventor
健太 川上
Kenta Kawakami
健太 川上
兼三 奥田
Kenzo Okuda
兼三 奥田
利幸 倉橋
Toshiyuki Kurahashi
利幸 倉橋
安川 正祥
Masanaga Yasukawa
正祥 安川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016157459A priority Critical patent/JP6607572B2/ja
Publication of JP2018025968A publication Critical patent/JP2018025968A/ja
Application granted granted Critical
Publication of JP6607572B2 publication Critical patent/JP6607572B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】自動的且つ効率的な復旧処理を行うとともに、システム全体の安定性を向上させることができる復旧制御システム及び方法を提供する。
【解決手段】復旧制御装置300は、障害の発生原因及び発生装置を特定してアプリケーションによるユーザ端末に対するサービス提供を継続するよう障害発生装置を復旧制御する復旧制御部と、復旧制御部による復旧制御処理のトリガ及びその復旧処理内容を関連づけて復旧制御履歴として記憶する復旧制御履歴記憶部とを備え、復旧制御部は、復旧制御履歴記憶部に記憶された復旧制御履歴に基づき復旧制御アルゴリズムを構成して障害発生装置の復旧制御を行う。
【選択図】図1

Description

本発明は、仮想化されたネットワークにおいて、障害が発生した際に自動的に復旧するシステムに関する。
近年、ネットワーク機能仮想化が注目されている(非特許文献1,2参照)。ネットワーク機能仮想化のメリットとしては、保守運用の自動化の一つとして、障害が発生した際に自動的に復旧できること(オートヒーリング)が期待されている。
既存のオートヒーリング(非特許文献3参照)では、主にハードウェア故障をターゲットとしており、障害が発生した場合に、他の物理サーバに同一の仮想サーバを構築する手法が一般的であった。
また、オートヒーリングにおいて、ネットワークデータ分析を行う事でネットワークの状態を可視化し、復旧手順の検討に利用する手法が提案されている(非特許文献4参照)。
また、ネットワークネットワーク内外から得られる装置ログ、トラフィック、トラブルチケットなどのデータ分析、およびネットワーク故障対応の迅速化・正確化・省力化に取り組む手法が提案されている(非特許文献5,6参照)。
下西英之, "ネットワーク機能仮想化(NFV)概要", [online], [平成28年7月14日検索], インターネット<URL:http://www.e-side.co.jp/okinawaopendays/2014/document/12_shimonishi.pdf> "Network Functions Virtualisation (NFV); Management and Orchestration", ETSI GS NFV-MAN 001 V1.1.1, 2014-12 木内道男, "NFV導入を左右する保守のしやすさ;鍵となるE2Eのオーケストレーション", [online], [平成28年7月14日検索], インターネット<URL:http://www.ric.co.jp/expo/ngns2014/extract/nec.html> T. Kimura, K. Ishibashi, T. Mori, H. Sawada, T. Toyono, K. Nishimatsu, A. Watanabe, A. Shimoda, and K. Shiomoto, "Spatio-temporal factorization of log data for understanding network events," Proc. of IEEE INFOCOM 2014, pp.610 -618, 2014 石橋圭介, "将来ネットワークの実現に向けたAnalytics−basedオペレーション", [online], [平成28年7月14日検索], インターネット<URL:http://www.ntt.co.jp/journal/1507/files/jn201507024.pdf> 石橋圭介, 林孝典, 塩本公平, "機械学習・データ分析によるネットワーク設計・運用高度化", [online], [平成28年7月14日検索], インターネット<URL:http://www.ntt.co.jp/journal/1512/files/jn201512029.pdf>
しかし従来の各手法では、障害発生時の復旧に関して下記のような課題がある。
課題1:障害復旧フローの作成には人手作業の蓄積が必要
既存手法(非特許文献3〜6)は、故障対応時に運用者が記録するトラブルチケットログが必要であり、そもそも人手作業を前提としているため完全な保守運用の自動化は出来ていない。
課題2:故障の未然抑止は不可
既存手法(非特許文献3〜6)では,故障発生した後の復旧処理をターゲットとしており、故障が発生する前に、事前に何らかの対処を行い、故障を未然に抑止する、といった事は不可能であった。
また、非特許文献6では,障害発生確率を予測する事が提唱されているが、故障発生確率に基づいて、どのような対処が必要か、といった未然抑止の概念までは未検討である。
課題3:仮想化構成は固定的であり状況の変化に応じた自動最適化は不可
既存手法(非特許文献3〜6)では、仮想化構成(ハードウェア・ホストOS・ハイパーバイザー・ゲストOS・アプリケーションからなる構成)は固定的となっており、状況の変化に応じて自動的に切り替える事は不可能である。そのため、特定のレイヤ、例えばゲストOSにバグが発生し、動作が不安定となった場合に、システム全体の安定性が低下するといった事態に対処する事が不可能であった。
上記課題を解決するために、本願発明は、仮想化環境が構築され該仮想化環境上でアプリケーションが動作するサーバ装置と、専用物理装置として構成されたネットワーク装置とを備え、前記サーバ装置の前記アプリケーションがユーザ端末にサービスを提供する仮想化されたネットワークにおいて、該ネットワークで発生した障害を復旧制御装置により復旧させる障害復旧システムであって、前記復旧制御装置は、前記障害の発生原因及び発生装置を特定して前記アプリケーションによる前記ユーザ端末に対するサービス提供を継続するよう障害発生装置を復旧制御する復旧制御手段と、復旧制御手段による復旧制御処理のトリガ及びその復旧処理内容を関連づけて復旧制御履歴として記憶する復旧制御履歴記憶部とを備え、前記復旧制御手段は、前記復旧制御履歴記憶部に記憶された復旧制御履歴に基づき復旧制御アルゴリズムを構成して障害発生装置の復旧制御を行うことを特徴とする。
また、本願発明は、前記復旧制御装置は、更に、前記復旧制御履歴記憶部に記憶された復旧制御履歴を解析して再起動により復旧する障害が定常的に発生しているサーバ装置又はネットワーク装置及びその障害発生周期を算出し、該サーバ装置又はネットワーク装置の次回障害発生時期を予測し、次回障害発生時期の到来前に該サーバ装置又はネットワーク装置を再起動するよう制御する再起動制御手段を備えたことを特徴とする。
また、本願発明は、前記代替サーバ装置は、ハードウェア層・ホストOS層・仮想化環境層・ゲストOS層・アプリケーション層からなる階層構造を有し、前記代替ネットワーク装置は、ハードウェア層・ファームウェア層からなら階層構造を有し、前記復旧制御手段は、1つ以上の層において障害発生装置と同等の機能を提供する代替構成を障害発生装置の代替として使用するよう制御し、前記復旧制御装置は、更に、前記復旧制御履歴記憶部に記憶された代替構成による復旧処理についての復旧制御履歴に基づき通常の構成におけるサーバ装置及びネットワーク装置の安定性を導出し、安定性の低いサーバ装置又はネットワーク装置の通常の構成を代替構成に変更するよう制御する構成変更手段を備えたことを特徴とする。
本発明によれば、復旧制御履歴情報に基づき自動的且つ効率的な復旧処理のパターンを得ることができるので処理効率が向上する。また、障害発生に先んじてサーバ装置やネットワーク装置の再起動が自動的に行われるので、システム全体の安定性が向上する。さらに、サーバ装置やネットワーク装置の構成が自動的により安定性の高い代替構成に変更されるので、システム全体の安定性が向上する。
本発明の概要を説明するシステム構成図 復旧制御装置の構成図 代替構成を説明する図 自動復旧のパターンを説明する図 障害復旧フローの自動最適化を説明する図 故障の未然防止を説明する図 構成の自動最適化を説明する図
本発明の一実施の形態に係る障害復旧システムについて図面を参照して説明する。図1は本発明の概要を説明するシステム構成図である。
本発明において障害復旧の対象とする仮想化されたネットワークは、NFV(Network Functions Virtualisation)技術によりネットワーク機能が仮想化されたものを想定しており、図1に示すように、サーバ装置100と、ネットワーク装置200と、ユーザ端末10とを備えている。
サーバ装置100は、汎用物理サーバ装置上に仮想化環境が構築されており、さらに当該仮想化環境上にアプリケーションが動作する。本発明では、図1に示すように、サーバ装置100は、下層から順に、ハードウェア層・ホストOS層・ハイパーバイザー層・ゲストOS層・アプリケーション層が形成されているものとして取り扱う。なお、ここでのレイヤは、OSI(Open Systems Interconnection)参照モデルの7階層とは異なるものである点に留意されたい。すなわち、本発明においてサーバ装置100で動作するアプリケーションは、OSI参照モデルのアプリケーション層だけでなくネットワーク層やトランスポート層などの階層に対応するものも含まれる点に留意されたい。例えば、サーバ装置100としては、ユーザ宅内の通信設備(CPE(Customer Premises Equipment))を仮想化してネットワーク側に配置したvCPEなどが想定され、ファイヤウォール・ルータなどの各種ネットワーク機能を提供するものが挙げられる。
ネットワーク装置200は、サーバ装置100とユーザ端末10との間の通信経路を形成する装置の1つであり、専用物理装置として実装されたものである。本発明では、ネットワーク装置200は、下層から順に、ハードウェア層・ファームウェア層が形成されているものとして取り扱う。なお、ここでのレイヤは、サーバ装置100と同様に、OSI参照モデルとは異なるものである点に留意されたい。ネットワーク装置200の具体例としては、専用物理装置としてのファイヤウォールやルータやL2スイッチなどが挙げられる。
また、本発明では、1つ以上のサーバ装置100及び1つ以上のネットワーク装置200により1つのサイトを構成し、さらに1つ以上のサイトによりプラットフォームを構成しているものとする。プラットフォームの配備位置としては、典型的には、インターネット上の所謂「クラウド」としてデータセンタ内に配備されたり、ユーザ端末がインターネットに接続するためのアクセスネットワーク(キャリアネットワーク)内のデータセンタ内に配備されたりする。プラットフォームの管理者は、プラットフォーム内において物理的な装置の増強等が可能であるものとする。
本発明では、復旧制御装置300によりネットワークで生じた障害を自動的且つ効率的に復旧させるとともに障害発生を未然に防止してシステムの安定性を維持することを目的とする。復旧制御装置300のネットワーク上での配備位置は不問である。
本発明のポイントは、(1)障害復旧フローの自動最適化、(2)故障の未然防止、(3)構成の自動最適化、という3つの要素を有する。
上記(1)障害復旧フローの自動最適化は、「自動制御のトリガ」と「自動復旧のパターン」の対応関係をDBとして保持しておき、制御アルゴリズムを自動的に再構成して、自動復旧までの間隔(「トライ&エラー」の「エラー」の頻度)を減らすものである。
上記(2)故障の未然防止は、「再起動して復旧」したパターンが定常的に発生する場合は、その事象が再発する間隔を記録しておき、事前に自動的に再起動を行う事で、故障を未然に防止するものである。
上記(3)構成の自動最適化は、代替構成の方が基本構成よりも安定性が高い場合は、代替構成を基本構成に徐々に変更する事で、システム全体の安定性を維持するものである。
図2に復旧制御装置300の構成図を示す。図2に示すように、復旧制御装置300は、ネットワークの復旧制御を行う復旧制御部310と、復旧制御部310による復旧制御処理の履歴を記憶する復旧制御履歴記憶部320と、サーバ装置100又はネットワーク装置200を再起動させることにより障害発生を未然に防止する再起動制御部330と、サーバ装置100又はネットワーク装置200の通常の構成(基本構成)を代替構成に変更するよう制御する構成変更制御部340とを備える。
復旧制御部310は、正常性試験の結果情報及びトラヒック情報に基づき障害発生原因及び障害発生箇所を特定し、復旧処理を行う。記正常性試験は、ユーザ端末10・サーバ装置100・ネットワーク装置200で定常的に実施されるものであり、復旧制御部310は、ユーザ端末10・サーバ装置100・ネットワーク装置200から正常性試験結果情報を受信・記憶する。
上記の正常性試験としては、(A)アプリケーション正常性試験、(B)通信路正常性試験、を定常的に行い、その試験結果は復旧制御装置300に通知されるものとする。前記(A)アプリケーション正常試験は、例えばDNS(Domain Name System)問合せ自動送信試験などが挙げられ、(A1)ユーザ端末10・サーバ装置100間での試験、(A2)サーバ装置100での単体試験が含まれる。また、前記(B)通信路正常性試験は、例えばPINGによる疎通確認試験などが挙げられ、(B1)ユーザ端末10・サーバ装置100間での試験、(B2)隣接する装置間での試験、(B3)ネットワーク装置200単体での試験、(B4)サーバ装置100単体での試験が含まれる。
また、上記のトラヒック情報はサーバ装置100及びネットワーク装置200から定期的に収集され、復旧制御装置300に通知されるものとする。トラヒック情報としては、(C1)ネットワーク装置200単体のトラヒック情報(例えば各インタフェースの入力パケットや出力パケットなど)、(C2)サーバ装置100単体のトラヒック情報(例えば各インタフェースの入力パケットや出力パケットなど)が含まれる。
また、上記の「代替構成」について説明する。障害の形態として、各レイヤにおけるバグが発生した場合に、単純にその装置全体の再起動等の処理を行っても障害から復旧できないパターンが想定される。その様なパターンでもサービスを継続するために、障害発生前における構成を基本構成として、各レイヤ単位で、基本構成とは異なる種別の構成を用いる。これを代替構成と呼ぶ。ここで、「異なる種別の構成」とは、障害発生前における装置の当該レイヤにおいて同等の機能を提供するものであるが、異なる実装のものであり、異なる製品だけでなく、同一製品だが異なるバージョンやリビジョンのものも含んでよい。
ただし、全てのバリエーションの構成を準備すると、構成が爆発的に増加する可能性がある。このため、図3に示すように、1レイヤのみ変更した構成((i)〜(v))と、全てを入れ替えた構成((vi))を用意する。なお、図3では、ハッチングをかけたレイヤが「異なる種別の構成」である。
本発明における障害発生の原因と障害箇所の特定並びに復旧方法の考え方について図4の表に示す。本発明では、トラヒック情報に基づき、障害発生の原因が内的要因であるか外的要因であるかを判定している。内的要因とはサーバ装置100又はネットワーク装置200或いはその通信路に原因があることを意味し、外的要因はトラヒックの急増に原因があることを意味する。内的要因の障害については、再起動により復旧するか否か、またその装置及びレイヤごとに発生箇所が分類でき、それぞれの分類に対して復旧方法が定められる。また、外的要因の障害については、急増したトラヒックの正常か異常か、またその装置毎に、さらに短期的なものか長期的なものかによって分類でき、それぞれの分類に対して、復旧方法が定められる。
内的要因についての復旧方法としては、サーバ装置100やネットワーク装置200を再起動したり、代替構成で起動したりすることが挙げられる。ここで再起動は、サーバ装置100やネットワーク装置200のレイヤ単位での再起動を行うことができる。また、代替構成についても、サーバ装置100やネットワーク装置200のレイヤ単位での代替構成を用いることができる。
外的要因についての復旧方法としては、トラヒックを所定の待避サイトに向けるようネットワーク装置200等を制御したり、プラットフォーム管理者に物理的装置増設要求を通知したり、サーバ装置100及び/又はネットワーク装置200を自動的に増加させるように制御処理したりすることが挙げられる。なお、なお、サーバ装置100の増加制御処理とは、既設の汎用物理サーバ装置上にアプリケーションが動作するようにインストール処理や設定処理を行うことによりサーバ装置100として機能させることを意味する。また、ネットワーク装置200の増加制御処理とは、既設の専用物理装置に設定処理を行うことによりネットワーク装置200として機能させることを意味する。
復旧制御処理の開始となる契機(トリガ)としては、アラーム発生、ユーザ申告、定期的な正常性試験が挙げられる。ここで、「アラーム発生」は、サーバ装置100やネットワーク装置200等の機器が備えている既存の障害検知システムによる障害発生の警告を契機とするものである。また「ユーザ申告」は、ユーザ端末10のユーザやその他の利用者等からの申告を契機とするものである。また、「定常的な正常性試験」は、ユーザ端末10・サーバ装置100・ネットワーク装置200から受信した正常性試験結果の内容(典型的には、障害が生じたとの内容)を契機とするものである。
本実施の形態に係る復旧制御部310は、図5に示すように、自動制御の契機と、これにより実施した復旧制御部310による自動復旧処理パターンとの対応関係を復旧制御履歴として復旧制御履歴記憶部320に記憶・蓄積する。そして、復旧制御部310は、該復旧制御履歴に基づき制御アルゴリズムを自動的に再構成して、自動復旧までの間隔(「トライ&エラー」の「エラー」の頻度)を減らすことを特徴とする。具体的には、復旧制御部310は、自動制御のトリガが新たに発生した場合、過去に自動復旧した実績が一定の閾値を超える復旧パターンが存在する場合は、それを優先的に実施する。
また、本実施の形態では、「再起動して復旧」した復旧パターンが定常的に発生する場合は、その事象が再発する間隔を記録しておき、再起動を自動的に行う事で故障を未然に防止する。このため復旧制御部310は、図6に示すように、事象発生の統計情報(図6の例では発生間隔の平均値・最小値・最大値及び発生回数)を復旧制御履歴記憶部320に保持しておく。そして、再起動制御部330は、最小値より少ない間隔で自動的に再起動する事で故障を未然に防止する。すなわち、再起動制御部330は、復旧制御履歴記憶部320に記憶されている復旧制御履歴を解析して、再起動により復旧する障害が定常的に発生しているサーバ装置100又はネットワーク装置200及びその障害発生周期を算出し、該サーバ装置100又はネットワーク装置200の次回障害発生時期を予測し、次回障害発生時期の到来前に該サーバ装置100又はネットワーク装置200を再起動するよう制御する。
また、本実施の形態では、サーバ装置100又はネットワーク装置200において代替構成での復旧の回数が一定の閾値を超える場合は、「基本構成」での安定性が低下したと判断し、通常の構成(基本構成)を「代替構成」に徐々に変更することにより、システム全体の安定性を向上させる。このため復旧制御部310は、図7に示すように、代替構成にて復旧したパターンの回数を復旧制御履歴記憶部320に記録しておく。そして、構成変更制御部340は、代替構成での復旧の回数が一定の閾値を超える場合は、通常の構成(基本構成)を「代替構成」に徐々に変更するよう制御する。
以上のように本実施の形態に係る障害復旧システムでは、復旧制御履歴情報に基づき自動的且つ効率的な復旧処理のパターンを得ることができるので処理効率が向上する。また、障害発生に先んじてサーバ装置100やネットワーク装置200の再起動が自動的に行われるので、システム全体の安定性が向上する。さらに、サーバ装置100やネットワーク装置200の構成が自動的により安定性の高い代替構成に変更されるので、システム全体の安定性が向上する。
より具体的には、前記ポイント(1)では、障害復旧フローの自動最適化を行っているので、すなわち、障害復旧に関して未知の状況についても自動的に対処を行い、それらのログを蓄積し自動的に最適化を行うので、人手作業を完全に不要とすることができる。これにより前述の課題1を解決することができる。
また、前記ポイント(2)では、故障の未然防止を図っているので、すなわち、故障の発生する確率が高まった場合に予め対処を行っているので、実際に故障が発生しサービス断となる事態を予め抑止し、サービス可用性を高める事ができる。これにより前述の課題2を解決することができる。
また、前記ポイント(3)では、構成の自動最適化を図っているので、すなわち、ソフトウェアバグ等で仮想化構成における特定のレイヤの安定性が低下した際に、そのレイヤについて代替構成に自動的に切り替えられるので、システム全体の安定性を維持することができる。これにより前述の課題3を解決することができる。
以上本発明の一実施の形態について詳述したが、本発明はこれに限定されるものではない。例えば、上記実施の形態では代替構成として、組み合わせ数の増大を防止するため、1つのレイヤを代替構成としたもの及び全てのレイヤの構成を代替構成としたものを用いたが、任意の組み合わせであってもよい。
10…ユーザ端末
100…サーバ装置
200…ネットワーク装置
300…復旧制御装置
310…復旧制御部
320…復旧制御履歴記憶部
330…再起動制御部
340…構成変更制御部

Claims (4)

  1. 仮想化環境が構築され該仮想化環境上でアプリケーションが動作するサーバ装置と、専用物理装置として構成されたネットワーク装置とを備え、前記サーバ装置の前記アプリケーションがユーザ端末にサービスを提供する仮想化されたネットワークにおいて、該ネットワークで発生した障害を復旧制御装置により復旧させる障害復旧システムであって、
    前記復旧制御装置は、前記障害の発生原因及び発生装置を特定して前記アプリケーションによる前記ユーザ端末に対するサービス提供を継続するよう障害発生装置を復旧制御する復旧制御手段と、復旧制御手段による復旧制御処理のトリガ及びその復旧処理内容を関連づけて復旧制御履歴として記憶する復旧制御履歴記憶部とを備え、
    前記復旧制御手段は、前記復旧制御履歴記憶部に記憶された復旧制御履歴に基づき復旧制御アルゴリズムを構成して障害発生装置の復旧制御を行う
    ことを特徴とする障害復旧システム。
  2. 前記復旧制御装置は、更に、
    前記復旧制御履歴記憶部に記憶された復旧制御履歴を解析して再起動により復旧する障害が定常的に発生しているサーバ装置又はネットワーク装置及びその障害発生周期を算出し、該サーバ装置又はネットワーク装置の次回障害発生時期を予測し、次回障害発生時期の到来前に該サーバ装置又はネットワーク装置を再起動するよう制御する再起動制御手段を備えた
    ことを特徴とする請求項1記載の障害復旧システム。
  3. 前記代替サーバ装置は、ハードウェア層・ホストOS層・仮想化環境層・ゲストOS層・アプリケーション層からなる階層構造を有し、
    前記代替ネットワーク装置は、ハードウェア層・ファームウェア層からなら階層構造を有し、
    前記復旧制御手段は、1つ以上の層において障害発生装置と同等の機能を提供する代替構成を障害発生装置の代替として使用するよう制御し、
    前記復旧制御装置は、更に、
    前記復旧制御履歴記憶部に記憶された代替構成による復旧処理についての復旧制御履歴に基づき通常の構成におけるサーバ装置及びネットワーク装置の安定性を導出し、安定性の低いサーバ装置又はネットワーク装置の通常の構成を代替構成に変更するよう制御する構成変更手段を備えた
    ことを特徴とする請求項1又は2記載の障害復旧システム。
  4. 仮想化環境が構築され該仮想化環境上でアプリケーションが動作するサーバ装置と、専用物理装置として構成されたネットワーク装置とを備え、前記サーバ装置の前記アプリケーションがユーザ端末にサービスを提供する仮想化されたネットワークにおいて、該ネットワークで発生した障害を復旧制御装置により復旧させる障害復旧方法であって、
    前記復旧制御装置の復旧制御手段が、前記障害の発生原因及び発生装置を特定して前記アプリケーションによる前記ユーザ端末に対するサービス提供を継続するよう障害発生装置を復旧制御するとともに、復旧制御処理のトリガ及びその復旧処理内容を関連づけて復旧制御履歴として復旧制御履歴記憶部に記憶し、
    前記復旧制御手段は、前記復旧制御の際には、前記復旧制御履歴記憶部に記憶された復旧制御履歴に基づき復旧制御アルゴリズムを構成して障害発生装置の復旧制御を行う
    ことを特徴とする障害復旧方法。
JP2016157459A 2016-08-10 2016-08-10 復旧制御システム及び方法 Active JP6607572B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016157459A JP6607572B2 (ja) 2016-08-10 2016-08-10 復旧制御システム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016157459A JP6607572B2 (ja) 2016-08-10 2016-08-10 復旧制御システム及び方法

Publications (2)

Publication Number Publication Date
JP2018025968A true JP2018025968A (ja) 2018-02-15
JP6607572B2 JP6607572B2 (ja) 2019-11-20

Family

ID=61193825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016157459A Active JP6607572B2 (ja) 2016-08-10 2016-08-10 復旧制御システム及び方法

Country Status (1)

Country Link
JP (1) JP6607572B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062082A (zh) * 2018-07-17 2018-12-21 深圳市万华汽车服务投资控股有限公司 一种智能故障处理方法、装置以及系统
JP2019164493A (ja) * 2018-03-19 2019-09-26 株式会社リコー 情報処理装置、方法、プログラム及び情報処理システム
CN111708705A (zh) * 2020-06-19 2020-09-25 山东云海国创云计算装备产业创新中心有限公司 Bios的自动修复功能测试方法、装置、设备及介质
CN112467686A (zh) * 2020-11-04 2021-03-09 深圳供电局有限公司 配电网故障恢复方法、装置、控制设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013025483A (ja) * 2011-07-19 2013-02-04 Hitachi Ltd 障害復旧装置および通信装置の復旧方法
WO2015042937A1 (zh) * 2013-09-30 2015-04-02 华为技术有限公司 故障管理的方法、实体和系统
JP2015534191A (ja) * 2012-10-04 2015-11-26 クアルコム,インコーポレイテッド マルチサブシステムモバイル通信デバイスにおいてソフトウェアを予防的に再起動して平均故障間隔を長くするための方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013025483A (ja) * 2011-07-19 2013-02-04 Hitachi Ltd 障害復旧装置および通信装置の復旧方法
JP2015534191A (ja) * 2012-10-04 2015-11-26 クアルコム,インコーポレイテッド マルチサブシステムモバイル通信デバイスにおいてソフトウェアを予防的に再起動して平均故障間隔を長くするための方法
WO2015042937A1 (zh) * 2013-09-30 2015-04-02 华为技术有限公司 故障管理的方法、实体和系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019164493A (ja) * 2018-03-19 2019-09-26 株式会社リコー 情報処理装置、方法、プログラム及び情報処理システム
JP7230332B2 (ja) 2018-03-19 2023-03-01 株式会社リコー 管理サーバ、方法、プログラム及び管理システム
CN109062082A (zh) * 2018-07-17 2018-12-21 深圳市万华汽车服务投资控股有限公司 一种智能故障处理方法、装置以及系统
CN109062082B (zh) * 2018-07-17 2020-07-10 深圳市雅宝智能装备系统有限公司 一种智能故障处理方法、装置以及系统
CN111708705A (zh) * 2020-06-19 2020-09-25 山东云海国创云计算装备产业创新中心有限公司 Bios的自动修复功能测试方法、装置、设备及介质
CN111708705B (zh) * 2020-06-19 2022-07-05 山东云海国创云计算装备产业创新中心有限公司 Bios的自动修复功能测试方法、装置、设备及介质
CN112467686A (zh) * 2020-11-04 2021-03-09 深圳供电局有限公司 配电网故障恢复方法、装置、控制设备和存储介质
CN112467686B (zh) * 2020-11-04 2023-09-01 深圳供电局有限公司 配电网故障恢复方法、装置、控制设备和存储介质

Also Published As

Publication number Publication date
JP6607572B2 (ja) 2019-11-20

Similar Documents

Publication Publication Date Title
CN107179957B (zh) 物理机故障分类处理方法、装置和虚拟机恢复方法、系统
US8370466B2 (en) Method and system for providing operator guidance in network and systems management
US9483343B2 (en) System and method of visualizing historical event correlations in a data center
JP6607572B2 (ja) 復旧制御システム及び方法
CN107026760B (zh) 一种故障修复方法及监控节点
US20200401936A1 (en) Self-aware service assurance in a 5g telco network
US20230318906A1 (en) Fault recovery plan determining method, apparatus, and system, and computer storage medium
US11706080B2 (en) Providing dynamic serviceability for software-defined data centers
CN103607296B (zh) 一种虚拟机故障处理方法和设备
US10684935B2 (en) Deriving the shortest steps to reproduce a device failure condition
US20130124712A1 (en) Elastic cloud networking
US20200314128A1 (en) Detecting Anomalies In Networks
GB2505644A (en) Managing network configurations
CN113328872A (zh) 故障修复方法、装置和存储介质
CN103812699A (zh) 基于云计算的监控管理系统
CN108347339B (zh) 一种业务恢复方法及装置
US8498214B2 (en) Switching device, information processing device, and recording medium for failure notification control program
WO2020121293A1 (en) Orchestration of activities of entities operating in a network cloud
CN113825164A (zh) 网络故障修复方法、装置、存储介质及电子设备
CN111193643A (zh) 一种云服务器状态监控系统及方法
JP6555721B2 (ja) 障害復旧システム及び方法
CN111694707A (zh) 一种小型服务器集群管理系统及方法
CN102143011B (zh) 一种实现网络保护的装置及方法
WO2013111317A1 (ja) 情報処理方法、装置及びプログラム
CN107888438B (zh) 一种基于流表技术的自动感知并适应云环境变化的系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180627

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191016

R150 Certificate of patent or registration of utility model

Ref document number: 6607572

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150