JP7268748B2 - 情報分析装置、方法およびプログラム - Google Patents

情報分析装置、方法およびプログラム Download PDF

Info

Publication number
JP7268748B2
JP7268748B2 JP2021546144A JP2021546144A JP7268748B2 JP 7268748 B2 JP7268748 B2 JP 7268748B2 JP 2021546144 A JP2021546144 A JP 2021546144A JP 2021546144 A JP2021546144 A JP 2021546144A JP 7268748 B2 JP7268748 B2 JP 7268748B2
Authority
JP
Japan
Prior art keywords
failure
recovery
location
handling method
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021546144A
Other languages
English (en)
Other versions
JPWO2021053801A1 (ja
Inventor
聡 鈴木
晴久 野末
俊介 金井
文香 浅井
尚美 村田
健一 田山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of JPWO2021053801A1 publication Critical patent/JPWO2021053801A1/ja
Application granted granted Critical
Publication of JP7268748B2 publication Critical patent/JP7268748B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/04Arrangements for maintaining operational condition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/008Reliability or availability analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Computer Hardware Design (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明の実施形態は、情報分析装置、方法およびプログラムに関する。
通信ネットワーク(以下、ネットワーク)(network)に障害が発生したときの、従来の復旧対処では、障害発生時のアラーム(alarm)から推定される障害原因と、ネットワークにおける障害箇所である装置の種別とから、復旧対処方法を推定し、ネットワーク管理者に提示する。
日本国特開2019-125940号公報
上記の、同じ障害箇所に起因する複数回の障害が発生したとき、この障害発生回数により、適した復旧対処方法が異なる場合がある。しかし、上記のように、障害原因と、ネットワークにおける障害箇所である装置の種別とから、復旧対処方法を推定する手法では、上記の障害発生回数に応じた、適した復旧対処方法を推定することはできない。
また、ある種別の装置に起因する障害が発生したとき、ネットワークの形態、ネットワーク上における上記装置の位置などにより、適した復旧対処方法が異なる場合がある。しかし、上記のように、障害原因と、ネットワークにおける障害箇所である装置の種別とから、復旧対処方法を推定する手法では、上記のネットワークの形態、ネットワーク上における上記装置の位置などにより、適した復旧対処方法を推定することはできない。
上記のように、障害原因と、障害箇所である装置の種別とから、復旧対処方法を推定する手法では、ネットワークに障害が発生したときの適切な復旧対処に係る情報を取得することができなかった。
この発明は、上記事情に着目してなされたもので、その目的とするところは、ネットワークに障害が発生したときの適切な復旧対処に係る情報を取得することができるようにした情報分析装置、方法およびプログラムを提供することにある。
本発明の一態様に係る情報分析装置は、通信ネットワークにおける故障発生箇所である装置、および故障の要因を示す情報を入力する入力手段と、故障発生箇所である装置、故障の要因、および前記故障に対する適切な復旧対処方法の内容、を関連付けた復旧対処方法ルールを記憶する記憶部と、前記故障発生箇所である装置について過去に発生した故障に関わる情報、または前記故障発生箇所である装置に固有の条件に基づいて、前記入力された情報で示される装置および要因に対する適切な復旧対処方法の内容を前記復旧対処方法ルールから分析する分析手段とを備え、前記記憶部に記憶される、前記故障発生箇所である装置に固有の条件は、該当の装置の種別、該当の装置のベンダ、該当の装置に係るレイヤ種別、該当の装置が設けられるネットワークの形態、該当の装置が設けられるネットワークの階層、該当の装置に係る冗長性の有無の少なくとも1つを含み、前記分析手段は、前記故障発生箇所である装置に固有の条件に基づいて、前記発生した故障に対する復旧対処方法に与える影響の大小を示し、前記復旧対処方法の実施の有無および内容に影響するスコアを計算し、前記復旧対処方法ルールは、故障発生箇所である装置、故障の要因、前記スコアの大小に係る条件、および前記故障に対する適切な復旧対処方法の実施の有無および内容、を関連付けた復旧対処方法ルールを含み、前記分析手段は、前記計算したスコアの大小に基づいて、前記適切な復旧対処方法の実施の有無および内容を前記復旧対処方法ルールから分析する
本発明の一態様に係る情報分析方法は、通信ネットワークにおける故障発生箇所である装置、故障の要因、および前記故障に対する適切な復旧対処方法の内容、を関連付けた復旧対処方法ルールを記憶する記憶部を備える情報分析装置が行なう方法であって、故障発生箇所である装置、および故障の要因を示す情報を入力することと、前記故障発生箇所である装置について過去に発生した故障に関わる情報、または前記故障発生箇所である装置に固有の条件に基づいて、前記入力された情報で示される装置および要因に対する適切な復旧対処方法の内容を前記復旧対処方法ルールから分析することと、を備え、前記記憶部に記憶される、前記故障発生箇所である装置に固有の条件は、該当の装置の種別、該当の装置のベンダ、該当の装置に係るレイヤ種別、該当の装置が設けられるネットワークの形態、該当の装置が設けられるネットワークの階層、該当の装置に係る冗長性の有無の少なくとも1つを含み、前記分析することは、前記故障発生箇所である装置に固有の条件に基づいて、前記発生した故障に対する復旧対処方法に与える影響の大小を示し、前記復旧対処方法の実施の有無および内容に影響するスコアを計算することを含み、前記復旧対処方法ルールは、故障発生箇所である装置、故障の要因、前記スコアの大小に係る条件、および前記故障に対する適切な復旧対処方法の実施の有無および内容、を関連付けた復旧対処方法ルールを含み、前記分析することは、前記計算したスコアの大小に基づいて、前記適切な復旧対処方法の実施の有無および内容を前記復旧対処方法ルールから分析することを含む
本発明によれば、ネットワークに障害が発生したときの適切な復旧対処に係る情報を取得することができる。
図1は、この発明の一実施形態に係る障害復旧対方法分析装置のハードウェア(hardware)構成の一例を示すブロック図である。 図2は、本発明の一実施形態に係る障害復旧対方法分析装置のソフトウェア(software)構成の一例を示すブロック図である。 図3は、復旧実施情報DBに格納される復旧実施情報の一例を表形式で示す図である。 図4は、過去障害履歴情報DBに格納される過去障害履歴情報の一例を表形式で示す図である。 図5は、装置属性情報DBに格納される装置属性情報の一例を表形式で示す図である。 図6は、ユーザ(user)影響度への大小への影響の一例を表形式で示す図である。 図7は、装置属性情報の重み一覧DBに格納される装置属性情報の重み一覧情報の一例を表形式で示す図である。 図8は、復旧方法ルール(rule)一覧DBに格納される復旧方法ルール一覧の一例を表形式で示す図である。 図9は、復旧方法ルール一覧DBに格納される復旧方法ルール一覧の一例を表形式で示す図である。 図10は、この発明の一実施形態に係る障害復旧対方法分析装置による処理動作の一例を示すフローチャート(flow chart)である。 図11は、この発明の一実施形態に係る障害復旧対方法分析装置による処理動作の一例を示すシーケンス(sequence)図である。 図12は、障害箇所推定結果の表示画面の一例を示す図である。 図13は、推定結果一覧の表示画面の一例を示す図である。 図14は、通知される復旧対処方法の一例を表形式で示す図である。 図15は、通知される復旧対処方法の一例を表形式で示す図である。 図16は、通知される復旧対処方法の一例を表形式で示す図である。
以下、図面を参照しながら、この発明に係わる一実施形態を説明する。
(構成)
(ハードウェア構成)
図1は、この発明の一実施形態に係る障害復旧対方法分析装置10のハードウェア構成の一例を示すブロック図である。
障害復旧対方法分析装置10は、例えばサーバコンピュータ(server computer)またはパーソナルコンピュータ(personal computer)により構成され、CPU(Central Processing Unit)等のハードウェアプロセッサ(hardware processor)111Aを有する。そして、このハードウェアプロセッサ111Aに対し、プログラムメモリ(program memory)111B、データメモリ(data memory)112、入出力インタフェース(interface)113及び通信インタフェース114を、バス(bus)120を介して接続される。
通信インタフェース114は、例えば1つ以上の無線の通信インタフェースユニットを含んでおり、通信ネットワークNWとの間で情報の送受信を可能にする。無線インタフェースとしては、例えば無線LAN(Local Area Network)などの小電力無線データ通信規格が採用されたインタフェースが使用される。
入出力インタフェース113には、障害復旧対方法分析装置10に付設される、管理者用の入力デバイス(device)20および出力デバイス30が接続される。
入出力インタフェース113は、キーボード(keyboard)、タッチパネル(touch panel)、タッチパッド(touchpad)、マウス(mouse)等の入力デバイス20を通じて管理者が入力した操作データを取り込むとともに、出力データを液晶または有機EL(Electro Luminescence)等が用いられた表示デバイスを含む出力デバイス30へ出力して表示させる処理を行なう。なお、入力デバイス20および出力デバイス30は障害復旧対方法分析装置10に内蔵されたデバイスが使用されてもよく、また、ネットワークNWを介して通信可能な他の情報端末の入力デバイスおよび出力デバイスが使用されてもよい。
プログラムメモリ111Bは、非一時的な有形の記憶媒体として、例えば、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等の随時書込みおよび読出しが可能な不揮発性メモリと、ROM(Read Only Memory)等の不揮発性メモリとが組み合わせて使用されたもので、一実施形態に係る各種制御処理を実行する為に必要なプログラムが格納されている。
データメモリ112は、有形の記憶媒体として、例えば、上記の不揮発性メモリと、RAM(Random Access Memory)等の揮発性メモリとが組み合わせて使用されたもので、情報収集処理を行なう過程で取得および作成された各種データが記憶される為に用いられる。
(ソフトウェア構成)
図2は、本発明の一実施形態に係る障害復旧対方法分析装置10のソフトウェア構成の一例を示すブロック図である。この図2では、障害復旧対方法分析装置10のソフトウェア構成が図1に示されたハードウェア構成と関連付けて示される。
図2に示されるように、本発明の一実施形態に係る障害復旧対方法分析装置10は、ソフトウェアによる処理機能部として、障害箇所・要因入力部11、分析部12、情報収集部13、復旧対処方法情報出力部14、全体制御部15、装置属性情報DB(データベース(database))41、復旧実施情報DB42、過去障害履歴情報DB43、復旧方法ルール一覧DB44、および装置属性情報の重み一覧DB45を有する情報分析装置として構成され得る。
全体制御部15は、障害箇所・要因入力部11、分析部12、情報収集部13、復旧対処方法情報出力部14、全体制御部15、装置属性情報DB41、復旧実施情報DB42、過去障害履歴情報DB43、復旧方法ルール一覧DB44、および装置属性情報の重み一覧DB45の全体の制御を司る。各部の詳細については後述する。
図2に示された障害復旧対方法分析装置10内の装置属性情報DB41、復旧実施情報DB42、過去障害履歴情報DB43、復旧方法ルール一覧DB44、装置属性情報の重み一覧DB45は、図1に示されたデータメモリ112を用いて構成され得る。ただし、これらの装置属性情報DB41、復旧実施情報DB42、過去障害履歴情報DB43、復旧方法ルール一覧DB44、装置属性情報の重み一覧DB45は障害復旧対方法分析装置10内に必須の構成ではなく、例えば、USB(Universal Serial Bus)メモリなどの外付け記憶媒体、又はクラウド(cloud)に配置されたデータベースサーバ(database server)等の記憶装置に設けられたものであってもよい。
上記の障害箇所・要因入力部11、分析部12、情報収集部13、および復旧対処方法情報出力部14、全体制御部15の各部における処理機能部は、いずれも、プログラムメモリ111Bに格納されたプログラムを上記ハードウェアプロセッサ111Aにより読み出させて実行させることにより実現される。なお、これらの処理機能部の一部または全部は、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)またはFPGA(Field-Programmable Gate Array)などの集積回路を含む、他の多様な形式によって実現されてもよい。
図3は、復旧実施情報DBに格納される復旧実施情報の一例を表形式で示す図である。
図3に示されるように、復旧実施情報DB42に格納される復旧実施情報では、(1)過去のネットワーク障害に係る故障の要因、(2)この故障要因に係る故障に対して過去に実施された復旧対処方法(復旧方法と称することがある)、および(3)この復旧対処方法が過去に実施された回数が関連付けられる。
例えば、図3に示される復旧実施情報の1列目では、故障要因Xに係る故障に対する復旧方法Lが過去に2回実施されたことが示される。
図4は、過去障害履歴情報DBに格納される過去障害履歴情報の一例を表形式で示す図である。
図4に示されるように、過去障害履歴情報DB43に格納される過去障害履歴情報では、(1)過去のネットワーク障害に係る故障の発生箇所である装置を特定する装置名、(2)この故障の発生要因、(3)この要因によるネットワーク障害の発生回数、(4)該当の要因によるネットワーク障害の自然回復(自然復旧)が考慮されるか否かを示す自然回復イベント(event)フラグ(flag)、および(5)該当の自然回復が考慮されるときの自然回復回数の基準値、が関連付けられる。上記のフラグは、故障の発生要因の種別ごとに定義される。上記自然回復は、例えば、リンクダウン(link down)後に、特に復旧対処が施されることなくリンクアップ(link up)することで、接続が自然回復することが挙げられる。
図5は、装置属性情報DBに格納される装置属性情報の一例を表形式で示す図である。図5に示されるように、装置属性情報DB41に格納される装置属性情報では、(1)ネットワークに配置される各装置の名称、(2)該当の装置の種別、(3)該当の装置のベンダ(Vendor)、(4)装置に係るネットワークのレイヤ(layer)種別、(5)該当の装置に係るネットワークの形態、(6)該当の装置に係るネットワーク上における位置(階層)、(7)該当の装置の冗長度、および(8)該当の装置が冗長性を有するときに該当する1系(予備系)または0系(通常系)を示す情報、が関連付けられる。
装置属性情報における、装置の種別の具体的な格納結果は、例えばCLI(クライアント(Client))、R(ルータ(Router))、SW(ネットワークスイッチ(network switch))、SRV(サーバ)、STR(ストレージ(storage))である。
装置属性情報における、レイヤ種別の具体的な格納結果は、例えば論理レイヤ、仮想レイヤ、物理レイヤである。
装置属性情報における、ネットワークの形態の具体的な格納結果は、例えばメッシュ(mesh)、リング(ring)、ラダー(ladder)、スター(star)である。
装置属性情報における、ネットワーク上における位置(階層)の具体的な格納結果は、例えば小ブロック(block)、中ブロック、大ブロックである。
装置属性情報における、冗長度の具体的な格納結果は、例えば冗長性あり、冗長性なしである。
装置属性情報における、1系(予備系)または0系(通常系)を示す情報の具体的な格納結果は、例えば、冗長性が無い時のブランク(blank)情報、冗長性があるときの1系(予備系)および0系(通常系)である。
この装置属性情報では、図5に示されるように、上記(2)~(8)の種類に応じた、0~1の範囲である後述するユーザ影響度の計算の元となる、パラメータ(parameter)値pが定義される。ここでは、パラメータ値pの最小値は0で最大値は1であるとする。このパラメータ値pは、予め求められて装置属性情報DB41に格納されてもよいし、装置属性の格納結果に応じて、分析部12による、復旧対処方法の分析処理時に都度計算されてもよい。
例えば、装置に係るネットワークのレイヤが論理レイヤであるときは、当該レイヤに係るパラメータ値pは比較的小さく、装置に係るネットワークのレイヤが物理レイヤであるときは、当該レイヤに係るパラメータ値pは比較的大きい。
また、装置属性情報では、各装置についての別途検出された、故障要因別の過去の故障発生回数が対応付けられる。各装置について自然回復が発生したときの故障要因別の自然回復回数についても同様である。
図6は、ユーザ影響度への大小への影響の一例を表形式で示す図である。
ユーザ影響度とは、ネットワーク管理者であるユーザによる復旧対処方法の実施の有無に影響する値である。
ユーザ影響度のスコアSは、パラメータ値pが正規化(min-max normalization)されたp´と重みwとに基づいて、下記の式(1)により求められ得る。
Figure 0007268748000001
式(1)のnは、パラメータ値および重みの種類の数に対応する変数である。各種のパラメータ値p´、および各種の重みwの最小値は0で、最大値は1であり、ユーザ影響度のスコアSの最小値は0で、最大値は1である。
このユーザ影響度の値が比較的大きいときは、ユーザによる復旧対処方法を実施する必要性が比較的大きく、ユーザ影響度の値が比較的小さいときは、ユーザによる復旧対処方法を実施する必要性が比較的小さい。
図6では、自然回復回数と、装置属性情報における上記(2)~(8)とでなる計8種類の各々について、ユーザ影響度の大小への影響の大小が示される。
また、図6では、計算されるユーザ影響度が著しく小さいときは、復旧対方法として、対処なし(様子見)が選択され、このユーザ影響度が大きくなるにしたがって、選択される復旧対方法が、コマンド実行、PKG(パッケージ(package))交換、装置交換の順で段階的に変更されることが示される。
図7は、装置属性情報の重み一覧DBに格納される装置属性情報の重み一覧情報の一例を表形式で示す図である。
図7に示されるように、装置属性情報の重み一覧DB45に格納される装置属性情報の重み一覧情報では、ユーザ影響度のスコア(score)Sを求めるための重みwの値が示される。図7に示される例では、重みの種類は8種類であり、過去の復旧対処実施回数考慮、および装置属性情報における上記(2)~(8)である。
各種類の重みの値は、各種類における重みの値の合計値が1である条件下で、入力デバイス20などを用いて動的に変更可能である。
図7に示されるように、過去の復旧対処実施回数考慮が重みの種類に含まれるときは、パラメータ値pの種類に過去の復旧対処実施回数が含まれる。過去の復旧対処実施回数が比較的少ない時は、当該実施回数に係るパラメータ値pは比較的小さく、過去の復旧対処実施回数が比較的多い時は当該実施回数に係るパラメータ値pは比較的大きい。
図8および図9は、復旧方法ルール一覧DBに格納される復旧方法ルール一覧の一例を表形式で示す図である。
図8に示された例では、自然回復回数が考慮されるときの復旧対方法ルールの一覧が示される。
具体的には、自然回復回数が考慮されないときの復旧対方法ルールの一覧では、(1)故障箇所である装置の名称、(2)該当の装置に係る故障の要因、(3)該当の故障に対して選択される復旧対処方法、および(4)自然回復回数の基準値超えのフラグ、が対応付けられる。
図8に示されるように、同一の装置名かつ同一の故障要因において、自然回復回数が基準値を超えるか否かで、選択される復旧方法が異なる。
図8に示された例では、故障箇所である装置の名称が装置Bで、この装置に係る故障の要因が要因Zで、この故障に係る過去の自然復旧回数が基準値を超えているときは、選択される復旧対処方法は復旧方法Qである。
一方で、故障箇所である装置の名称が同じく装置Bで、この装置に係る故障の要因が同じく要因Zで、この故障に係る過去の自然復旧回数が基準値を超えていないときは、選択される復旧対処方法は復旧方法Pである。
図9に示された例では、自然回復回数が考慮されないときの復旧対方法ルールの一覧が示される。
具体的には、自然回復回数が考慮されるときの復旧対方法ルールの一覧では、(1)故障箇所である装置の名称、(2)該当の装置に係る故障の要因、(3)該当の故障に対して選択され復旧対処方法、および(4)ユーザ影響度の範囲、が対応付けられる。
図9に示されるように、同一の装置名かつ同一の故障要因において、計算されるユーザ影響度のスコアSの大小により、選択される復旧方法が異なる。
図9に示された例では、故障箇所である装置の名称が装置Aで、この装置に係る故障の要因が要因Xで、装置Aについて計算されたユーザ影響度のスコアSが0.5を超え0.75以下であるときは、選択される復旧対処方法は復旧方法Mである。
一方で、故障箇所である装置の名称が同じく装置Aで、この装置に係る故障の要因が同じく要因Xで、装置Aについて計算されたユーザ影響度のスコアSが0.25を超え0.5以下であるときは、選択される復旧対処方法は復旧方法Nである。
図10は、この発明の一実施形態に係る障害復旧対方法分析装置10による処理動作の一例を示すフローチャートである。図11は、この発明の一実施形態に係る障害復旧対方法分析装置10による処理動作の一例を示すシーケンス図である。
まず、障害箇所・要因入力部11は、入力デバイス20などを介して、新たに発生したネットワーク障害に係る故障発生箇所である装置の名称、およびこの故障要因の推定結果を含む推定結果一覧を入力する(S11)。この故障発生箇所およびこの故障要因の推定結果は、ネットワーク管理者による目視などにより推定された結果であってもよいし、公知の技術により推定された結果であってもよい。
図12は、障害箇所推定結果の表示画面の一例を示す図である。
図12に示されるように、障害箇所推定結果は出力デバイス30を介して表示される。この図12では、故障箇所は図12中のaで囲まれた×印に隣接する装置である。
図13は、推定結果一覧の表示画面の一例を示す図である。
図12中のaで囲まれた×印が入力デバイス20により選択されると、図13に示されるように、障害箇所推定結果は出力デバイス30を介して表示される。図13に示されるように、S11で入力される推定結果は、故障発生箇所である装置のノード種別、故障の確信度、故障に伴うアラームの種別を含んでもよい。
この図13に示されるアイコン(icon)「対処」が入力デバイス20により選択されることで、分析部12による以降の処理が開始される。
分析部12は情報収集部13に情報収集の指示を送る。この指示にしたがって、情報収集部13は、装置属性情報DB41に格納される装置属性情報、復旧実施情報DB42に格納される復旧実施情報、および過去障害履歴情報DB43に格納される過去障害履歴情報のうち、S11で入力された故障発生箇所である装置の名称、およびこの故障要因に係る情報をそれぞれ収集し、分析部12に送る(S12)。
次に、分析部12は、復旧対処方法を分析するために、復旧方法ルール一覧DB44に格納される復旧方法ルール一覧のうち、S11で入力された故障発生箇所である装置の名称、およびこの故障要因に係るルールを収集し、装置属性情報の重み一覧DB45に格納される装置属性情報の重み一覧情報を収集する(S13)。
分析部12は、S11で入力された故障要因と、S12で収集された過去障害履歴情報とを照合することで、S11で入力された故障要因が、自然回復回数が考慮される要因であるか否かを判定する(S14)。
このS14において、S11で入力された故障要因が、自然回復回数が考慮される要因である、つまり、S11で入力された故障要因に対応する自然回復イベントフラグが「1」である場合(S14のYes)、分析部12は、S11で入力された故障要因と、S12で収集された過去障害履歴情報、装置属性情報とを照合することで、同じ故障発生箇所および故障要因による故障に対する現在の自然回復回数が過去障害履歴情報における基準値を超えているか否かを判定する(S15)。
このS15において、同じ故障発生および故障要因による故障の自然回復回数が、過去障害履歴情報における基準値を超えている、つまり、該当の自然回復回数が、S11で入力された故障要因に対応する自然回復イベントフラグ「1」に対応する基準値を超えていると判定された場合(S15のYes)、分析部12は、復旧方法ルール一覧DB45に格納される、自然回復回数が考慮されるときの復旧対方法ルールにおける、S11で入力された装置の名称、故障要因、および基準値超えフラグ「1」に対応する復旧対方法を抽出する(S16)。ここで抽出される復旧対方法は、例えば図8に示される復旧方法Qである。
一方で、S15でNoと判定された場合、分析部12は、復旧方法ルール一覧DB45に格納される、自然回復回数が考慮されるときの復旧対方法ルールにおける、S11で入力された装置の名称、故障要因、および基準値超えフラグ「0」に対応する復旧対方法を抽出する(S17)。ここで抽出される復旧対方法は、例えば図8に示される、特段の対処が不要であることを示す復旧方法P(「対処不要」と定義されてもよい)である。
また、上記のS14において、S11で入力された故障要因が、自然回復回数が考慮されない要因である、つまり、S11で入力された故障要因に対応する自然回復イベントフラグが「0」である場合(S14のNo)、分析部12は、装置属性情報DB44に格納された装置属性情報、および装置属性情報の重み一覧DB45に格納される装置属性情報の重み一覧情報に基づいて、S11で入力された装置名に係るユーザ影響度のスコアSを計算する。
そして、分析部12は、復旧方法ルール一覧DB45に格納される、自然回復回数が考慮されないときの復旧対方法ルールにおける、S11で入力された装置の名称、故障要因、および計算されたユーザ影響度のスコアSに対応する復旧対方法を抽出する(S14→S16)。ここで抽出される復旧対処方法は、例えば図9に示される復旧方法L、M、N、Оのうち、計算されたスコアSに応じた復旧方法である。
また、この処理では、S11で入力された装置の名称、故障要因、および計算されたユーザ影響度のスコアSに対応する復旧対方法のうち、計算されたスコアSに対応しない復旧対処方法が、ユーザの参考に供するためにあわせて抽出されても良い。
次に、復旧対処方法情報出力部14は、S16またはS17で抽出された復旧対処方法を、S11で入力された推定結果に対応する最適な復旧対処方法として出力デバイス30を介してユーザに視認可能な形式で出力する(S18)。
図14、図15、図16は、通知される復旧対処方法の一例を表形式で示す図である。図14に示された例は、故障箇所が装置Aで、故障要因が電源故障であるときに、復旧対処方法が1つ、ここではUnit交換のみが抽出されたときの復旧対処方法の通知結果である。
図15に示された例は、故障箇所が装置Aで、故障要因がリンク故障であり、この要因が、自然回復回数が考慮されない要因であるときに、この装置及び要因に対応する複数の復旧対処方法の通知結果である。この通知結果では、計算されたユーザ影響度のスコアSに対応する復旧対処方法が最上段に表示され、対応しない復旧対処方法が他の段に表示される。
この対応しない復旧対処方法が複数の方法であるときは、これらの方法は、図15に示されるように、復旧実施方法DB42に格納される復旧実施情報における、該当の復旧方法実施回数の降順に並べられる。
図16に示された例は、故障箇所が装置Aで、故障要因がリンク故障であり、この要因が、自然回復回数が考慮される要因であるときに、復旧対処方法が1つ、ここではUnit交換のみが抽出されたときの復旧対処方法の通知結果である。
そして、分析部12は、S18で出力された復旧実施方法が実施されたとき、この実施を入力デバイス20への操作などにより認識し、この実施された復旧実施方法に係る情報を、情報収集部13を介して復旧実施方法DB42に格納される復旧実施情報、および過去障害履歴情報DB43に格納される過去障害履歴情報へそれぞれフィードバックする(S19)。
また、入力された故障要因が自然回復回数を考慮する場合で、分析部12による処理の結果、過去の自然回復回数が基準値に満たないときは、対処不要を示すメッセージなどが出力デバイス30を介して表示される。
以上説明したように、本発明の一実施形態に係る障害復旧対方法分析装置は、通信ネットワークにおける故障発生箇所である装置、および故障の要因を示す情報を入力し、故障発生箇所である装置について過去に発生した故障に関わる情報、または故障発生箇所である装置に固有の条件に基づいて、入力された情報で示される装置および要因に対する適切な復旧対処方法を復旧対処方法ルールに基づいて分析する。
よって、障害復旧対方法分析装置は、例えば同じ装置・要因による故障が過去に発生した回数に応じて、該当の装置・要因による故障に対する適切な復旧対処方法を抽出して、ユーザに提示することができる。
また、障害復旧対方法分析装置は、例えば故障発生箇所である装置に固有の条件である、装置種別、ベンダ、レイヤ、ネットワーク形態、ネットワーク上における位置などに応じて、該当の装置・要因による故障に対する適切な復旧対処方法を抽出して、ユーザに提示することができる。
上記のように、障害復旧対方法分析装置は、復旧対処方法を抽出して、ユーザに提示することにより、適切な復旧対処方法を決定するまでの時間を短縮し、この決定までの稼働を低減することができる。
また、復旧対処方法ルールに基づいて適切な復旧対処方法が決定されるため、ネットワーク管理者による対処のばらつきが低減され得る。
また、各実施形態に記載した手法は、計算機(コンピュータ)に実行させることができるプログラム(ソフトウェア手段)として、例えば磁気ディスク(フロッピー(登録商標)ディスク(Floppy disk)、ハードディスク等)、光ディスク(CD-ROM、DVD、MO等)、半導体メモリ(ROM、RAM、フラッシュメモリ(Flash memory)等)等の記録媒体に格納し、また通信媒体により伝送して頒布することもできる。なお、媒体側に格納されるプログラムには、計算機に実行させるソフトウェア手段(実行プログラムのみならずテーブル、データ構造も含む)を計算機内に構成させる設定プログラムをも含む。本装置を実現する計算機は、記録媒体に記録されたプログラムを読み込み、また場合により設定プログラムによりソフトウェア手段を構築し、このソフトウェア手段によって動作が制御されることにより上述した処理を実行する。なお、本明細書でいう記録媒体は、頒布用に限らず、計算機内部あるいはネットワークを介して接続される機器に設けられた磁気ディスク、半導体メモリ等の記憶媒体を含むものである。
なお、本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は適宜組み合わせて実施してもよく、その場合組み合わせた効果が得られる。更に、上記実施形態には種々の発明が含まれており、開示される複数の構成要件から選択された組み合わせにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、課題が解決でき、効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
10…障害復旧対方法分析装置
11…障害箇所・要因入力部
12…分析部
13…情報収集部
14…復旧対処方法情報出力部
15…全体制御部

Claims (7)

  1. 通信ネットワークにおける故障発生箇所である装置、および故障の要因を示す情報を入力する入力手段と、
    故障発生箇所である装置、故障の要因、および前記故障に対する適切な復旧対処方法の内容、を関連付けた復旧対処方法ルールを記憶する記憶部と、
    前記故障発生箇所である装置について過去に発生した故障に関わる情報、または前記故障発生箇所である装置に固有の条件に基づいて、前記入力された情報で示される装置および要因に対する適切な復旧対処方法の内容を前記復旧対処方法ルールから分析する分析手段と、
    を備え
    前記記憶部に記憶される、前記故障発生箇所である装置に固有の条件は、該当の装置の種別、該当の装置のベンダ、該当の装置に係るレイヤ種別、該当の装置が設けられるネットワークの形態、該当の装置が設けられるネットワークの階層、該当の装置に係る冗長性の有無の少なくとも1つを含み、
    前記分析手段は、
    前記故障発生箇所である装置に固有の条件に基づいて、前記発生した故障に対する復旧対処方法に与える影響の大小を示し、前記復旧対処方法の実施の有無および内容に影響するスコアを計算し、
    前記復旧対処方法ルールは、故障発生箇所である装置、故障の要因、前記スコアの大小に係る条件、および前記故障に対する適切な復旧対処方法の実施の有無および内容、を関連付けた復旧対処方法ルールを含み
    前記分析手段は、
    前記計算したスコアの大小に基づいて、前記適切な復旧対処方法の実施の有無および内容を前記復旧対処方法ルールから分析する、
    情報分析装置。
  2. 前記過去に発生した故障に関わる情報は、該当の故障が発生したときの過去の自然回復の回数を含み、
    前記復旧対処方法ルールは、故障発生箇所である装置、故障の要因、前記自然回復の回数に係る条件、および前記故障に対する適切な復旧対処方法、を関連付けた復旧対処方法ルールを含み
    前記分析手段は、
    前記自然回復の回数の大小に基づいて、前記適切な復旧対処方法を前記復旧対処方法ルールから分析する、
    請求項1に記載の情報分析装置。
  3. 前記分析手段は、
    前記故障発生箇所である装置に固有の条件の格納結果に応じたパラメータ値に、前記条件の種類に応じた重み付けの値を掛けることで、前記スコアを計算する、
    請求項に記載の情報分析装置。
  4. 通信ネットワークにおける故障発生箇所である装置、故障の要因、および前記故障に対する適切な復旧対処方法の内容、を関連付けた復旧対処方法ルールを記憶する記憶部を備える情報分析装置が行なう方法であって、
    故障発生箇所である装置、および故障の要因を示す情報を入力することと、
    前記故障発生箇所である装置について過去に発生した故障に関わる情報、または前記故障発生箇所である装置に固有の条件に基づいて、前記入力された情報で示される装置および要因に対する適切な復旧対処方法の内容を前記復旧対処方法ルールから分析することと、
    を備え
    前記記憶部に記憶される、前記故障発生箇所である装置に固有の条件は、該当の装置の種別、該当の装置のベンダ、該当の装置に係るレイヤ種別、該当の装置が設けられるネットワークの形態、該当の装置が設けられるネットワークの階層、該当の装置に係る冗長性の有無の少なくとも1つを含み、
    前記分析することは、
    前記故障発生箇所である装置に固有の条件に基づいて、前記発生した故障に対する復旧対処方法に与える影響の大小を示し、前記復旧対処方法の実施の有無および内容に影響するスコアを計算することを含み、
    前記復旧対処方法ルールは、故障発生箇所である装置、故障の要因、前記スコアの大小に係る条件、および前記故障に対する適切な復旧対処方法の実施の有無および内容、を関連付けた復旧対処方法ルールを含み
    前記分析することは、
    前記計算したスコアの大小に基づいて、前記適切な復旧対処方法の実施の有無および内容を前記復旧対処方法ルールから分析することを含む、
    情報分析方法。
  5. 前記過去に発生した故障に関わる情報は、該当の故障が発生したときの過去の自然回復の回数を含み、
    前記復旧対処方法ルールは、故障発生箇所である装置、故障の要因、前記自然回復の回数に係る条件、および前記故障に対する適切な復旧対処方法、を関連付けた復旧対処方法ルールを含み
    前記分析することは、
    前記自然回復の回数の大小に基づいて、前記適切な復旧対処方法を前記復旧対処方法ルールから分析することを含む、
    請求項に記載の情報分析方法。
  6. 前記分析することは、
    前記故障発生箇所である装置に固有の条件の格納結果に応じたパラメータ値に、前記条件の種類に応じた重み付けの値を掛けることで、前記スコアを計算することを含む
    請求項に記載の情報分析方法。
  7. 請求項1乃至のいずれか1項に記載の情報分析装置の前記各手段としてプロセッサを機能させる情報分析処理プログラム。
JP2021546144A 2019-09-19 2019-09-19 情報分析装置、方法およびプログラム Active JP7268748B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/036839 WO2021053801A1 (ja) 2019-09-19 2019-09-19 情報分析装置、方法およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2021053801A1 JPWO2021053801A1 (ja) 2021-03-25
JP7268748B2 true JP7268748B2 (ja) 2023-05-08

Family

ID=74884464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021546144A Active JP7268748B2 (ja) 2019-09-19 2019-09-19 情報分析装置、方法およびプログラム

Country Status (3)

Country Link
US (1) US11940868B2 (ja)
JP (1) JP7268748B2 (ja)
WO (1) WO2021053801A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2023281595A1 (ja) * 2021-07-05 2023-01-12

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107151A (ja) 2004-10-06 2006-04-20 Hitachi Ltd ストレージシステム及びストレージシステムの通信パス制御方法
JP2008181302A (ja) 2007-01-24 2008-08-07 Mitsubishi Electric Corp 遠隔管理装置及び遠隔管理システム及び遠隔管理方法
JP2011066522A (ja) 2009-09-15 2011-03-31 Oki Networks Co Ltd 監視システム及びプログラム
JP2017085220A (ja) 2015-10-23 2017-05-18 日本電信電話株式会社 ネットワーク監視装置およびネットワーク監視方法
JP2019125940A (ja) 2018-01-17 2019-07-25 日本電信電話株式会社 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003114811A (ja) * 2001-10-05 2003-04-18 Nec Corp 自動障害復旧方法及びシステム並びに装置とプログラム
US7272531B2 (en) * 2005-09-20 2007-09-18 Fisher-Rosemount Systems, Inc. Aggregation of asset use indices within a process plant
US10162699B2 (en) * 2016-12-30 2018-12-25 Secure-24, Llc Artificial intelligence for resolution and notification of a fault detected by information technology fault monitoring

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006107151A (ja) 2004-10-06 2006-04-20 Hitachi Ltd ストレージシステム及びストレージシステムの通信パス制御方法
JP2008181302A (ja) 2007-01-24 2008-08-07 Mitsubishi Electric Corp 遠隔管理装置及び遠隔管理システム及び遠隔管理方法
JP2011066522A (ja) 2009-09-15 2011-03-31 Oki Networks Co Ltd 監視システム及びプログラム
JP2017085220A (ja) 2015-10-23 2017-05-18 日本電信電話株式会社 ネットワーク監視装置およびネットワーク監視方法
JP2019125940A (ja) 2018-01-17 2019-07-25 日本電信電話株式会社 作業手順提示装置及び作業手順提示方法、並びに、自動制御装置及び自動制御方法

Also Published As

Publication number Publication date
JPWO2021053801A1 (ja) 2021-03-25
WO2021053801A1 (ja) 2021-03-25
US11940868B2 (en) 2024-03-26
US20220327013A1 (en) 2022-10-13

Similar Documents

Publication Publication Date Title
CN104583968B (zh) 管理系统及管理程序
JP5223413B2 (ja) Itシステムのトラブル対処装置、トラブル対処方法およびそのためのプログラム
JP5432867B2 (ja) 計算機システムの管理方法、及び管理システム
KR102301946B1 (ko) 분산 시스템에서 결함을 분석하기 위한 비주얼 툴
KR20200057903A (ko) 인공지능 모델 플랫폼 및 인공지능 모델 플랫폼 운영 방법
JPWO2017110720A1 (ja) ログ分析システム、ログ分析方法及びプログラム
JP4383484B2 (ja) メッセージ解析装置、制御方法および制御プログラム
JP7268748B2 (ja) 情報分析装置、方法およびプログラム
JP7218797B2 (ja) 情報処理装置およびapi使用履歴表示プログラム
JP7452709B2 (ja) ネットワーク管理装置、方法およびプログラム
JP6722345B2 (ja) 予兆検知装置及び予兆検知方法
JP7369219B2 (ja) 運用管理装置及び方法
JP7440352B2 (ja) 教育コンテンツ作成システム及び方法
JP6438346B2 (ja) 操作支援装置、操作支援プログラムおよび操作支援方法
JP6636656B2 (ja) 管理システム、管理装置、および管理方法
JP7327493B2 (ja) 異常対処支援装置、方法およびプログラム
JP2004062741A (ja) 障害情報表示装置及びプログラム
JP6226895B2 (ja) ネットワーク評価システム及びネットワーク評価方法
WO2020100634A1 (ja) 復旧支援装置、復旧支援方法及びプログラム
JP6861176B2 (ja) プロジェクト見積り支援方法およびプロジェクト見積り支援装置
JP6972735B2 (ja) 表示制御プログラム、表示制御方法及び表示制御装置
JP6787873B2 (ja) 異常種別判定装置、異常種別判定方法及びプログラム
JP7334792B2 (ja) ルール生成装置、方法及びプログラム
JP2008210047A (ja) 業務イベントデータ補完装置及び業務イベントデータ補完プログラム
JP7363164B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220105

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230203

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230404

R150 Certificate of patent or registration of utility model

Ref document number: 7268748

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150