JP5439775B2 - 障害対応プログラム、障害対応装置、及び障害対応システム - Google Patents

障害対応プログラム、障害対応装置、及び障害対応システム Download PDF

Info

Publication number
JP5439775B2
JP5439775B2 JP2008238221A JP2008238221A JP5439775B2 JP 5439775 B2 JP5439775 B2 JP 5439775B2 JP 2008238221 A JP2008238221 A JP 2008238221A JP 2008238221 A JP2008238221 A JP 2008238221A JP 5439775 B2 JP5439775 B2 JP 5439775B2
Authority
JP
Japan
Prior art keywords
handling
coping
candidate
history
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008238221A
Other languages
English (en)
Other versions
JP2010072834A (ja
Inventor
裕二 和田
安英 松本
幸洋 渡辺
邦昭 嶋田
正純 松原
健司 森本
浩 大塚
昭 勝野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2008238221A priority Critical patent/JP5439775B2/ja
Priority to US12/491,998 priority patent/US8438179B2/en
Priority to GB0911136.0A priority patent/GB2463546B/en
Publication of JP2010072834A publication Critical patent/JP2010072834A/ja
Application granted granted Critical
Publication of JP5439775B2 publication Critical patent/JP5439775B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/13103Memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/13163Fault alarm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/1325Priority service
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q2213/00Indexing scheme relating to selecting arrangements in general and for multiplex systems
    • H04Q2213/13349Network management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

情報システムにおいては、様々な障害が発生する。このため、障害復旧の支援が不可欠である。一般に、情報システムの障害復旧に対する対処は、過去の障害事例を蓄積した知識ベースから障害の症状に応じた対処方法を取得し、その方法を実際に試みることにより行われている(例えば、特許文献1参照)。
図20は、従来の障害対処方法を示す模式図である。
図20に示すシステムにおいては、過去のトラブル事例1001を知識化して、それを知識ベース2000に登録しておく。知識ベース2000には、「症状」とそれに対応する「対処方法」とから成るレコードが格納されている。システム管理者などのユーザ3000が、端末3001などから「症状」3003を入力すると、その症状30003をキーとして、知識ベース2000が検索される。そして、その検索結果2003として、「原因」と「対処方法」などがユーザ3000の端末3001に返され、それが端末3001に画面表示される。
このように、従来の障害対処システムは、過去に発生したトラブルの対処事例を知識化して知識ベースなどに蓄積しておき、トラブル発生時に、症状などを基に、該知識ベースなどを検索して、対処方法などを推薦するものであった。
しかしながら、実際の現場では、「複数のトラブルに対する対処を効率的に行えるようにしてほしい」という要望があった。例えば、「同じ原因でも、複数の症状が発生する場合があり、それらの症状にまとめて対処したい」という要求があった。しかしながら、複数の症状の内、どれとどれが同じ原因に起因したものであるかは、簡単には究明できない。そうであるならば、「せめて、トラブルに効率的に対処したい」というのがユーザの願望である。
ここで、従来のトラブル対処方法を整理すると、以下のような課題が見つかる。
[同じ原因でも、複数の症状が発生する場合があり、それら症状にまとめて対処する方法]
(1)原因が自明に分かる場合
・複数の症状を一つにまとめる
しかしながら、現実には、自明に分からない場合が多い。
(2)原因が自明に分からない場合
・発生時間や過去事例などを使い、『同じ原因だろう』と推測される症状を絞込み、それらを一つの症状にまとめる
しかしながら、『同じ原因だろう』と推測することは容易ではないし、非常に手間がかかる。
特開平8−221295号公開公報
本発明の目的は、情報システムにおける複数の症状を有する障害の原因に対して効率的に対処できるようにすることである。
本発明の障害対応プログラムは、一実施の形態として、コンピュータに、受け付けた障害による症状の情報に基づき過去に発生した障害による症状の対処事例を蓄積した障害対処知識を検索して対処候補を取得し、過去に実施した、または、実施中の対処を症状に関連付けて蓄積した対処履歴情報を参照して前記対処候補の評価を行い、前記対処候補を前記評価と関連づけて出力する、処理を実行させ、前記対処候補の評価は、前記受け付けた障害に対する対処中の他の症状にも関連付けられた対処候補の評価を高くする、ことを特徴とする。
本発明の障害対応プログラムは、一実施の形態として、前記対処候補の評価は、前記対処候補に優先度を付けることにより行われる、ことを特徴とする。
本発明の障害対応プログラムは、一実施の形態として、前記対処履歴情報内に多く含まれている対処候補ほど、優先度を高くする、ことを特徴とする。
記障対応プログラムによれば、対処履歴情報を参照することにより、対処中の他の症状にも有効な対処方法を優先的に推薦できる。
本発明の障害対応プログラムは、一実施の形態として、蓄積した前記対処履歴情報のうち、共通部分が多い対処履歴情報を一つに統合する処理を実行させることを特徴とする
記障対応プログラムによれば、同一原因によって発生している症状を、一つの対処履歴情報に統合することができる。
開示のプログラム及び方法は、対処の過程で、自動的に、同じ原因に起因する症状を統合する。この結果、該統合に必要な人的手間を削減することが可能となる。また、同時進行している他の症状も考慮して、他の症状にも有効な対処方法を優先的に推薦する。この結果、複数の症状が発生するトラブルに対する総合対処時間を短縮することが可能となる。したがって、開示のプログラム及び方法によれば、情報システムにおける複数の症状が発生するトラブルに対して、効率的に対処できるようになる。
以下、図面を参照しながら、本発明の実施形態について説明する。
[原理]
まず、本発明の実施形態の原理を説明する。
(1)各症状に対してバラバラに対処を始め、行った対処方法の共通部分が多い多い症状を、一つの症状にまとめる。
この場合、後述するように、各症状の対処履歴を木構造のイメージに整理し、通ったパスの共通部分が多い症状を「同じ症状」にまとめる。こうすることで、対処の過程で、自然に、同じ原因の症状が一つにまとめられていく。これにより、「対処に必要な人手削減」、「作業の重複回避」、「症状を一つにまとめるための手間削減」などの効果が得られる。
(2)対処方法を推薦する際に、他の対処でも必要となっている作業も考慮する。
これは、同時進行している他の症状も考慮して、全体最適化を行うことである。こうすることで、本当は同じ原因に起因する症状でありながら「同じ症状」にまとめることができなかったものに対しても、互いに考慮し合いながら、対処方法が推薦される。この結果、総対処時間の短縮及び手間削減という効果が得られる。
[原理(1)、(2)の詳細]
次に、上記原理(1)、(2)について、図面を参照しながら、その具体的イメージを
説明する。
{原理1}
図1は、上記原理(1)の解決イメージを示す図である。図1(a)は症状1の対処履歴を示す木構造であり、図1(b)は症状2の対処履歴を示す木構造である。ここで、症状1は「サーバAの反応が遅い」であり、症状2は「サーバBへの通信が途切れる」である。
図1(a)、(b)において、共通の対処方法は太線の矩形枠で囲まれた部分である。すなわち、症状1の対処履歴10と症状2の対処履歴20において、対処履歴10中の対処方法11、12、13と、対処履歴20中の対処方法21、22、23が共通している。したがって、この場合には、対処方法11(21)、12(22)、13(23)を、「サーバCが原因となって発生している症状」としてまとめる。
{原理2}
図2は、上記原理(2)の解決イメージを示す図である。図2(a)は症状1の対処方法候補を示し、図2(b)は症状2の対処方法候補を示している。
図2(a)に示す対処方法候補群30内の各対処方法候補(対処方法)は図1(a)に示す対処履歴10から抽出したものであり、図2(b)に示す対処方法候補群40内の各対処方法候補(対処方法)は図1(b)に示す対処履歴20から抽出したものである。図2(a)、(b)において、対処方法候補群30と対処方法候補群40において共通な対処方法は太い矩形枠で囲まれた部分である。すなわち、両対処方法候補群30、40において、対処方法候補群30中の対処方法31、32と対処方法候補群40中の対処方法41、42が共通している。したがって、この場合は、症状1と症状2の対処において、対処方法31(41)と対処方法32(42)が有効であると判断して、これら2つの対処方法(「回線を調べる」、「サーバCを調べる」)の優先度を上げるようにする。
[実施形態]
{システム概要}
まず、本実施形態のシステムの概要を図3と図4を参照しながら説明する。
図3に示すように、ユーザ100は、サーバAの反応が遅くなった場合、自身の端末101から「サーバAの反応が遅い」という初期症状111(111−1)と、行った対処112を含む症状110(110−1を本実施形態のトラブル対処システム200に送る。この時点では、対処ID120(120−1)は“なし”(未設定)である。また、ユーザ100は症状に対する対処をまだ行なっていないので、行なった対処112−1も“なし”に設定される。
トラブル対処システム200は、該対処依頼110−1を受け取ると、優先度の高低が付与された複数の対処方法(この例では、3つの対処方法)をユーザ100の端末101に返す。この例では、対処方法310−1(「サーバAのプロセス数を調べる」)、対処方法310−2(「サーバAの回線を調べる」)及び対処方法310−3(「サーバBにpingを送ってみる」)をユーザ100の端末101に返す。ここで、優先度の順位は、対処方法310−1、310−2、310−3の順である。また、対処方法310−3で用いられる“ping”は、サーバBがTCP/IPネットワークで正常に稼動しているかを調べるためのコマンドである。
また、トラブル対処システム200は、今回、これらの対処方法301−1〜310−3に対して、識別子が“ID111”である対処ID120(120−2)を割り当て、
これをユーザ100の端末101に返す。以後、ユーザ100とトラブル対処システム200は、今回のトラブルに関するやり取りを、この識別ID120−2を用いて行う。
ユーザ100は、トラブル対処システム200から上記対処方法310−1〜310−3を受け取ると、それらを試みる。そして、図4に示すように、前記初期症状111−1に加え、今回の対処によって判明した症状111(111−2)(「サーバAのプロセス数が多い」)などと、今回行った対処112(「サーバAのプロセス数を調べる」)を含む症状110(110−2)をトラブル対処システム200に送る。これに対し、トラブル対処システム200は、対処ID120−2(“ID111”)と共に、対処方法310−4(「サーバAのI/Oを調べる」)、上記対処方法310−3及び対処方法310−5(「サーバCにpingを送ってみる」)を、ユーザ100の端末101に返す。この場合、優先度は、対処方法310−4、310−3、310−5の順である。
このようにしながら、ユーザ100は、対処ID120を識別子として使用しながら、トラブルが解決するまで、「初期症状」、「対処によって判明した症状」及び「行った対処」を含む対処依頼を、トラブル対処システム200に送り続ける。トラブル対処システム200は、ユーザ100から該対処依頼を受け取る毎に、対処ID120と共に、優先度が付けられた対処方法をユーザ100に返す。
[システム構成]
図5は、図3と図4に示すトラブル対処システム200の構成を示すブロック図である。
トラブル対処システム200は、対処依頼処理部210、対処方法更新部220、対処方法推薦部230、症状統合部240、対処履歴管理情報250、対処方法検索部260及びトラブル対処知識270を備えている。
対処依頼処理部210は、上述した図3及び図4に示す方法で、ユーザ100の端末101との間で、対処依頼と対処方法のやり取りを行う。該対処依頼は対処ID120と症状110を含み、該対処方法は対処ID120と対処方法310を含む。対処依頼処理部210は、ユーザ100の端末101から対処依頼を受信すると、対処方法検索部260に対して、受け取った症状に対応する対処方法候補の検索を依頼する。また、対処方法更新部220に対して、ユーザ100が実際に行った対処方法の更新を依頼する。また、対処方法更新部220に対して、対処方法検索部260から返された検索結果の優先度付けを依頼する。また、症状統合部240に対して、今回、ユーザ100に端末101から受け取った症状と、対処中の症状(今までに対処した症状)との統合を依頼する。そして、症状統合部240の統合結果に応じた対処IDと対処方法を、ユーザ100の端末101に返す。
対処履歴管理情報250は、各症状に関する対処履歴情報(過去に行った対処方法に関する履歴情報)を、対処IDと対応付けて管理しているテーブルである。
トラブル対処知識270は、症状に対応する対処方法を格納しているデータベースである。
対処方法検索部260は、対処依頼処理部210から検索依頼を受信すると、トラブル対処知識270を検索し、対処依頼処理部210から受け取った症状に対応する対処方法候補を取得する。そして、それを、対処依頼処理部210に返す。
対処方法更新部220は、対処依頼処理部210更新依頼を受信すると、対処履歴管理情報250中の該対処IDに対応する対処履歴情報を更新する。
対処方法推薦部230は、対処依頼処理部210から推薦依頼を受信すると、対処履歴管理情報250を参照して、対処方法検索部260が検索した対処方法候補について優先度付けを行う。そして、各対処方法候補の優先度を対処依頼処理部210に返す。
症状統合部240は、対処依頼処理部210から統合依頼を受信すると、対処履歴管理情報250を参照して、現在処理中の対処IDに関する対処履歴管理情報と対処方法に共通部分が多い対処履歴情報を有する対処履歴管理情報250内のその他の対処IDが存在するか調べ、存在する場合には、それらの対処IDの対処履歴情報を統合する。そして、その統合した対処履歴情報を対処依頼処理部210に返す。
<本実施形態が実装されるコンピュータのハードウェア構成>
図6は、図5に示す本実施形態のトラブル対処システム200をプログラムの実行により実現するコンピュータのハードウェア構成を示す図である。
図6に示すコンピュータ500は、CPU501、メモリ502、入力装置503、表示装置504、外部記憶装置505、可搬型記憶媒体駆動装置506、ネットワーク接続装置507、及び、CPU501と各構成要素502〜507を接続するバス510を備える。
CPU501は、コンピュータ500のシステム全体の動作を制御する中央演算処理装置である。メモリ502は、CPU501が実行するプログラムがロードされる領域や該プログラムが実行する際に中間データを格納する作業領域などを備える主記憶装置である。入力装置503は、キーボードやマウスなどのポインティングデバイスを備える。表示装置504は、CRTディスプレイや液晶ディスプレイなどである。外部記憶装置505は、HDD(Hard Disk Drive)やSSD(Solid State Drive)などである。可搬型記憶媒体駆動装置506は、CD(Compact Disc)やDVD(Digital Video Disc)またはUSB(Universal Serial Bus)メモリなどの可搬型記憶媒体のデータのリード/ライトを行う装置である。ネットワーク接続装置507は、データゼンターや企業内システムに構築されたLAN(Local Area Network)などに接続するためのネットワークカードなどである。上記LANは、ルータなどのネットワーク機器を介してインターネットやVPN(Virtual Private Network)などのWAN(Wide Area Network)に接続される。本実施形態においては、コンピュータ500は、ネットワーク接続装置507を介して、ユーザ100の端末101とTCP/IPなどの各種通信プロトコルにより通信を行う。
コンピュータ500を本実施形態のトラブル対処システム200として機能させるプログラム(障害対処プログラム)は、例えば、可搬型記憶媒体に格納されて、可搬型記憶媒体によって配布される。また、インターネットなどのネットワークを介して外部記憶装置505や可搬型記憶媒体駆動装置506に装着された可搬型記憶媒体にダウンロードしてインストールすることも可能である。
外部記憶装置505などにインストールされた前記障害対処プログラムは、例えば、表示装置504に表示されるユーザインターフェース画面を介して、システム管理者などによる入力装置503からの入力操作により、CPU501により実行される。このCPU501の実行により、コンピュータ500は、図5に示すトラブル対処システム200が備える対処依頼処理部210、対処方法更新部220、対処方法推薦部230、症状統合部240及び対処方法検索部260の各機能を実現する。対処履歴管理情報250とトラブル対処知識270は、例えば、外部記憶装置505内、または可搬型記憶媒体駆動装置506に装着される可搬型記憶媒体内に作成される。
[動作]
上記構成のトラブル対処システム200の処理を説明する。以下に述べる、
{全体フロー}
図7は、トラブル対処システム200の全体フローである。
トラブル対処システム200は、ユーザ100の端末101から「トラブル対処依頼」を受けると(ステップS1)、推薦するトラブル対処方法を、ユーザ100の端末101に返す(ステップS2)。
{対処依頼処理部210の処理}
図8は、図5の対処依頼処理部210の処理を示すフローチャートである。対処依頼処理部210は、図8のフローチャートに示す処理を、ユーザ100の端末101から対処依頼を受信するごとに実行する。
対処依頼処理部210は、ユーザ100の端末101から対処依頼を受け取ると、図8に示すフローチャートの処理を開始する。上記対処依頼は、パラメータiとパラメータidを含んでいる。iは「症状」を示すパラメータであり、idは「対処ID」を示すパラメータである。対処IDは、ユーザ100が現在対処中のトラブルに付与される識別子であり、システムにおいて一意的なものである。このため、ユーザ100の端末101とトラブル対処システム200は、対処IDをやり取りする事で、対処中のトラブルを識別可能となっている。症状は、「症状(初期症状及び対処によって判明した症状)」と「ユーザ100が行った対処」を含んでいる。
図8のフローチャートの説明を行う。
対処依頼処理部210は、まず、idが空であるか判断し(ステップS11)、idが空であれば(ステップS11、Yes)ステップS12に進み、idが空でなければ(ステップS11、No)ステップS113に進む。
対処IDは、トラブル対処システム200によって付与されるので、ユーザ100の端末101から最初に受け取る対処ID(=id)は“空”となっている。したがって、ステップS11の判断は、ユーザ100が最初に症状を送ってきたかを判断する処理でもある。
対処依頼処理部210は、ステップS12において、新しい対処IDを(=id´)を生成し、ステップS15に進む。一方、対処依頼処理部210は、ステップS13において、パラメータid´にidを代入する(ステップS13)。この処理は、対処ID(=id)を保存する処理である。ステップS13の処理に続いて、対処方法更新部220に、実際に行なった対処方法の更新を依頼し(ステップS14)、ステップS15に進む。ステップS14の処理の詳細は後述する。尚、ステップS14における「実際に行なった対処方法」は、ユーザ100の端末101から受け取る「症状」に含まれている情報である。
対処依頼処理部210は、ステップS15において、対処方法検索部260に、症状iに対する対処方法の検索を依頼する。対処方法検索部260は、該検索依頼を受け取ると、症状iをキーとしてトラブル対処知識270を検索し、症状iに対応する対処方法をトラブル対処知識270から取得する。そして、その取得した検索結果を対処依頼処理部210に返す。
対処依頼処理部210は、対処方法検索部260から検索結果を受け取ると、該検索結果が“空”であるか判断する(ステップS16)。そして、検索結果が空でなければ(ステップS16、No)ステップS17に進み、検索結果が空であれば(ステップS16、
Yes)ステップS23に進む。
対処依頼処理部210は、ステップS17において、対処方法推薦部230に、上記検索結果の優先度付けを依頼する。このステップS17の処理の詳細は後述する。一方、対処依頼処理部210は、ステップS23において、ユーザ100の端末101に「対処方法なし」を返す。そして、本フローチャートの処理を終了する。
対処依頼処理部210は、ステップS17に続いて、idが“空”であるか判断し(ステップS18)、idが空でなければ(ステップS18、No)ステップS19に進み、idが空であれば(ステップS118、Yes)ステップS22に進む。
このステップS18の処理は、ステップS11と同様に、現在の処理が、最初のトラブル対処処理であるかを判断する処理である。本実施形態のトラブル対処システム200は、ユーザ100の個々のトラブルに対して、そのトラブルに対する対処方法の履歴を対処履歴管理情報250に記録する。ステップS19の処理は、ユーザ100の端末101からの2回目以降の対処依頼においてのみ処理可能である。このため、対処依頼処理部210は、ステップS18の処理により、ステップS19に分岐するか否かを判断している。
対処依頼処理部210は、ステップS19において、症状統合部240に、症状iと(今までに)対処中の症状との統合を依頼する。このステップS19の処理の詳細は後述する。症状統合部240は、ステップS19の処理を終了すると、対処依頼処理部210に統合結果を返す。対処依頼処理部210は、その統合結果を基に、ステップS19において、症状iが統合されたか判断する(ステップS20)。そして、統合されていれば(ステップS20、Yes)ステップS21に進み、統合されていなければ(ステップS20、No)ステップS22に進む。
対処依頼処理部210は、ステップS21において、症状統合部240によって、症状iと統合された「対処中の症状」の対処IDと、該対処IDに対応する対処履歴情報において最後にリンクされている対処履歴の対処方法を、ユーザ100の端末101に返す。そして、本フローチャートの処理を終了する。
一方、対処依頼処理部210は、ステップS22において、id´(対処ID)と、対処方法推薦部230から取得した「優先付けされた対処方法」を、ユーザ100の端末101に返す。そして、本フローチャートの処理を終了する。
このように、対処依頼処理部210は、ユーザ100の端末101から「対処依頼」を受信すると、対処方法検索部260、対処方法更新部220、対処方法推薦部230及び症状統合部240に依頼を出しながら、ユーザ100の端末101から受け取った症状iに対処するための対処方法を、優先度を付けて、端末101に返す。また、対処履歴管理情報250に、各対処IDに対応する対処方法の履歴情報を記録していく。
{対処方法更新部220の処理}
図9は、対処方法更新部220の処理(図5のステップS14に該当)を示すフローチャートである。このフローチャートの処理は、図8のフローチャートのステップS14の処理に該当する。
対処方法更新部220は、対処依頼処理部210から引数として、前記パラメータi(症状)と前記パラメータid(対処ID)を受け取り、図8のフローチャートの処理を開始する。
対処方法更新部220は、まず、iの中に、“行なった対処”の情報eが含まれているか判断する(ステップS31)。この情報eは、上述した図4においては、症状110−2中の“サーバAのプロセス数を調べる”に該当する。
対処方法更新部220は、ステップS31において、情報eが含まれていると判断すると(ステップS31、Yes)ステップS32に進み、情報eが含まれていないと判断すると(ステップS31、No)本フローチャートの処理を終了する。
対処方法更新部220は、ステップS32において、対処履歴管理情報250に記録されている、対処IDがidである対処履歴情報について、その最後の対処履歴の「対処方法」を情報eで更新する(ステップS32)。そして、本フローチャートの処理を終了する。
このように、対処方法更新部220は、対処履歴管理情報250中の対処IDがidである対処履歴情報について、その最後の対処履歴の「対処方法」を登録する。
図10は、図9のフローチャートに示す処理の一例を示す図である。
図10において、(a)は更新前の対処履歴管理情報250、(c)は更新後の対処履歴管理情報250を示す。また、(b)は、対処方法更新部220が対処依頼処理部210から受け取る引数id(対処ID)、i(症状)を示す。
図10(a)、(c)に示すように、対処履歴管理情報250は、各エントリに、「対処ID251」とそれに対応する「対処履歴情報152」とで構成されるレコードを格納しているテーブルである。
対処履歴管理情報250は、対処依頼処理部210が生成する対処ID251とそれに対応する対処履歴情報252の組から成るレコードを、対処ID251の生成順に格納している。対処履歴情報252は、ユーザ100が実際に実施した対処方法を時系列順に記憶している。対処履歴情報252に格納されている対処履歴は、「対処方法a、[対処候補(対処方法候補)a1、対処候補a2、・・・]というデータ形式となっている。ここで、対処方法aは、ユーザ100が実際に行なった対処(前記情報eに該当)である。該対処方法aは、[ ]内の対処候補の中の一つである。また、対処履歴において、[ ]内には、対処候補が優先度順に配置されている。尚、以後の明細書においては、「対処候補」を「対処方法候補」記載することにする。
図10には、対処ID251がid3である対処履歴情報252の更新例を示している。図10(a)に示すように、対処ID251がid3である更新前の対処履歴管理情報250−1のその最後の対処履歴の対処方法は、ユーザ100の端末101から、ユーザ100が行なった対処を、まだ受け取っていないので、“なし”に設定されている。この例では、対処依頼処理部210は、推薦すべき対処方法として、「回線調査」及び「サーバC調査」をユーザ100の端末101に返す。このとき、優先度は「回線調査」の方が高くなっている。これに対し、図10(b)に示すように、対処依頼処理部210が、ユーザ100の端末101から、対処id(対処ID=id3)と共に症状iを受け取る。そして、対処方法更新部220に対し、上記のようにして対処方法の更新を依頼する。
対処方法更新部220は、対処方法更新部220から、対処id(対処ID=id3)とその症状i内に含まれる「行なった対処112」(=回線調査)を受け取ると、対処履歴管理情報250内の、対処ID251がid3であるレコードの対処履歴情報252の最後の対処履歴の対処方法を「なし」から「回線調査」に更新する(図10(c)参照)。
{対処方法推薦部230の処理}
図11は、図5の対処方法推薦部230の処理(図5のステップS17に該当)を示すフローチャートである。
この処理において、対処方法推薦部230は、対処依頼処理部210から、引数として、id´(対処ID)とC(対処方法候補群)を受け取る。そして、まず、レジスタRを“空”に設定する(ステップS41)。ここで、レジスタRは、対処履歴を格納するレジスタである。次に、引数Cが“空”であるか判断し(ステップS42)、空でなければ(ステップS42、No)ステップS43に進み、空であれば(ステップS42、Yes)ステップS52に進む。
ステップS43において、Cから一つの対処方法候補cを取り出す。取り出し順序は、例えば、優先度順である。次に、変数pを“0”に初期設定する(ステップS44)。ここで、変数pは優先度の数値を格納する変数である。続いて、対処履歴管理情報250から、対処IDがid´に等しくない対処IDに対応する対処履歴情報の全ての集合である情報Hを取出す(ステップS45)。そして、情報Hが“空”か判断し(ステップS46)、空でなければ(ステップS46、No)ステップS47に進み、空であればステップS51に進む。
ステップS47において、Hから一つの対処履歴情報h(=対処履歴情報252)を取出す。ステップS47においては、Hの先頭行から順に一つの対処履歴情報hを取出す。そして、対処履歴情報hの中に対処方法候補cに等しい対処方法候補が存在するか判断し(ステップS48)、存在しなければ(ステップS48、No)ステップS46に戻り、存在すれば(ステップS48、Yes)ステップS49に進む。
対処方法推薦部230は、2度目以降のステップS46において、Hから次の対処履歴情報hを取出す。そして、再び、ステップS47、S48の処理を行う。
このようにして、対処方法推薦部230は、現在処理中の当該対処履歴情報h中に対処方法候補cが存在するか調べ、対処方法候補cが存在すれば(ステップS48、Yes)ステップS49に進む。
対処方法推薦部230は、ステップS49において、値p´を計算する。この値p´は、優先度pの重み付け計算に使用される値であり、優先度が高い程、大きな値に設定される。値p´の計算の詳細は後述する。
次に、p+p´を計算し、その計算結果をpに代入する(ステップS50)。そして、ステップS46に戻る。
このようにして、対処方法推薦部230は、ステップS46においてHが空であると判断するまで(ステップS46、Yes)ステップS46〜S50の処理を繰り返す。これにより、対処方法候補群C中の各対処方法候補cについて、その優先度pが算出される。
対処方法推薦部230は、ステップS46において、Hが空であると判断すると(ステップS46、Yes)ステップS51に進む。
ステップS51において、対処方法候補cをRに追加する。この追加処理は、R内において、対処方法候補cが、そのpの値が大きい順から並ぶようにするソート処理である。
対処方法推薦部230は、ステップS51の処理が終了すると、ステップS42に戻り、Cが空であるか判断する。そして、Cが空でなければ(ステップS42、No)、再び、ステップS47以降の処理を行う。
このようにして、対処方法推薦部230は、ステップS42〜S51の処理を繰り返す
ことによって、対処方法候補群C中の全ての対処方法候補について、その優先度pを計算する。そして、それら各対処方法候補を、優先度pが大きい方から順に、R内に並べる。
対処方法推薦部230は、ステップS42において、Cが空である、つまり、C中から全ての対処方法候補cを取出したと判断すると(ステップS42、Yes)ステップS52に進む。
対処方法推薦部230は、ステップS52において、対処履歴管理情報250に、対処IDがid´である対処履歴情報として、Rを追加する。この追加は、例えば、上記Rを、対処履歴管理情報250中の最後尾に登録することによって行う。そして、Rを、対処依頼処理部210に返し(ステップS53)、本フローチャートの処理を終了する。
上述したように、R内には、対処方法候補が優先度順に配置されている。したがって、対処方法推薦部230から対処依頼処理部210には、優先度順に配列された対処方法候補が送られる。図11に示す処理フローにおいて、idが空の場合には、Hは空となっているので、ステップS42〜S46→S51→S42のループ処理がcの個数に等しいだけ実行される。したがって、ユーザ100の端末101から最初の対処依頼を受け取った場合、症状iの初期症状111−1に対応する全ての対処方法候補cの優先度pは“0”に設定される。したがって、初期症状111−1に対応する対処方法候補(対処依頼)の優先度pは全て等しくなるの。このため、Rには、対処方法検索部260の検索結果がそのまま設定される。
{対処方法推薦部230の処理の説明}
(1)対処全体を考慮して、優先度pを計算する方法
図12は、対処方法推薦部230の処理の一例を示す図である。図12に示す手法では、対処中の他の症状にも有効な対処方法を優先して推薦する。これは、対処履歴管理情報250の対処中の他の症状に対応する対処履歴情報252に多く含まれている対処候補(対処方法候補)ほど、その優先度pを高く設定することによって得られる。
図12(a)は、対処依頼処理部210が対処方法推薦部230を起動する前の対処履歴管理情報250(250−5)の内容を示す図である。すなわち、対処履歴管理情報250−5は、対処方法推薦部230が更新する前の対処履歴管理情報の内容を示している。対処履歴管理情報250−5には、現在、対処中の3つの対処履歴情報252(対処ID251がid1〜id3の対処履歴情報)が記録されている。
ここで、図12(b)に示すように、対処方法推薦部230は、対処依頼処理部210から、id´(対処ID=id3)、対処方法候補群C(サーバA調査、サーバB調査、サーバC調査)を引数として受け取るものとする。この場合、上述した図11のフローチャートのステップS45において対処履歴情報252−5から取出される情報Hは、対処IDが「id1」の対処履歴情報252と「id2」の対処履歴情報252の集合となる。この例では、対処方法候補群C内の各対処方法候補(この場合、サーバA調査、サーバB調査、サーバC調査)について、H内での出現頻度pを計算する。すなわち、図16のステップS49の処理は、対処方法候補cが対処履歴情報h内に含まれていた場合、p´を“1”に設定する処理となる。この結果、図12(b)に示すように、「サーバA調査」のpは“1”、「サーバB調査」のpは“0”、「サーバC調査」のpは“2”となる。したがって、サーバA調査、サーバB調査、サーバC調査を優先度pの高い順から配列すると、サーバC、サーバB、サーバAとなる。対処方法推薦部230は、この配列情報Rを、対処ID(=id3)と対応付けて、対処履歴管理情報250に追加・記録する(図11のステップS52の処理に該当)。この結果、図12(c)に示すように、対処履歴情報252内の対処ID251が「id3」である対処履歴情報252において、(なし、「サーバC調査、サーバA調査、サーバB調査」)という対処履歴が追加される。また、対処方法推薦部230は、上記Rを対処依頼処理部210に返す(図11のステップS53の処理に該当)。
(2)1つの対処を考慮して、優先度pを計算する方法
2.1)同一対処ID251の対処履歴情報252中に多く含まれる対処候補(対処方法候補)ほど、その優先度pを高くする(但し、多くの対処の対処候補に含まれている方を優先する、すなわち、上記(1)の方を優先する)手法
図13は、この方法を示す図である。
図13に示す方法では、同一の対処候補が複数の対処方法に含まれている場合には、後で実施した対処方法に含まれている対処候補のp´を“0.2”刻みで段階的に減らしていく。
ここでは、図13(a)に示す対処履歴情報252−11内の対処ID251が「id1」である対処履歴情報252を取り上げて説明する。この対処履歴情報252には、「サーバA調査」、「サーバB調査」、「サーバC調査」の順に対処したことが記録されている。
また、各対処について、サーバA調査の対処候補は、「サーバA調査」、「サーバB調査」、「サーバC調査」であることが記録されている。また、サーバB調査の対処候補は、「サーバB調査」、「サーバC調査」であることが記録されている。さらに、サーバC調査の対処候補は、「サーバC調査」であることが記録されている。また、この例では、図13(b)に示すように、対処方法候補群Cは、「サーバA調査」、「サーバB調査」、「サーバC調査」を含んでいる。
したがって、この例では、対処ID251がid1である対処履歴情報252において、サーバA調査、サーバB調査、サーバC調査の各対処方法について、優先度pを計算する。上記重み付け方法に基づき、対処ID251がid1である対処履歴情報252中の「サーバA調査」、「サーバB調査」、「サーバC調査」の各対処方法における「サーバA調査」、「サーバB調査」、「サーバC調査」のp´は、図13(a)に示す値に設定される。この結果、対処方法候補群Cの3つの対処方法候補の優先度pの値は、最終的に下記のように計算される。
サーバA調査のp=1
サーバB調査のp=1.8
サーバC調査のp=2.4
したがって、上記3つの対処方法候補の優先度は、優先度の高い順から、サーバC調査、サーバB調査、サーバA調査となる。このようにして、優先度付けされた、サーバC調査、サーバB調査、サーバB調査は図11の変数Rに格納され、その変数Rが、対処方法推薦部230から対処依頼処理部210に返される。
2.2)新しい対処候補に含まれている対処候補ほど、p´を高く設定する手法
図14は、対処履歴情報252中の新しい対処候補に含まれている対処候補ほど、p´を高く設定して、対処方法候補群C中の各対処方法候補の優先度pを計算する方法を示す図である。
図14(a)は、図14(b)に示す対処方法候補群Cの各対処方法候補の優先度pを計算するための対象となる対処履歴情報252を記録している対処履歴管理情報250(250−13)を示す図である。この例では、p´の基準値を“1”とし、最初の該当対処候補には、該基準値に“1/3”の重みを加算する。2回目の対処の該当対処候補には、上記基準値に“2/3”の重みを加算する。3回目の対処の該当対処候補には、上記基準値に“3/3”の重みを加算する。この結果、図14(a)に示すように、最初の対処の該当対処候補である「サーバA調査」のp´は“1+1/3”となる。また、2回目の対処の該当対処候補である「サーバB調査」のp´は“1+2/3”となる。また、3回目の対処の該当対処候補である該当対処候補である「サーバC調査」のp´は“1+3/3”となる。
したがって、図14(c)に示すように、対処方法候補群CのサーバA調査の優先度pは1.3、サーバB調査の優先度pは1.7、サーバC調査の優先度pは2となる。尚、この場合、優先度pの計算において、小数点2桁以下は四捨五入するようにしている。
2.3)元が高い優先度の高い対処候補ほどp´を高く設定する手法
図14は、対処履歴管理情報250内で、優先度が高い対処候補ほどp´を高く設定して、対処方法候補の優先度を計算する手法を説明する図である。
図15(a)に示すように、対処履歴管理情報250(250−15)の対処が「id1」に対応する対処履歴情報252に、(サーバA調査、[サーバA調査、サーバB調査、サーバC調査])という情報が記録されていたとする。そして、図15(b)に示すように、対処方法候補群Cが、「サーバA調査」、「サーバB調査」、「サーバC調査」を含んでいるとする。
この場合、対処履歴管理情報250の対処IDが「id1」の対処履歴情報252中の対処候補について、サーバA調査のp´を“1”に、サーバB調査のp´を“0.8(1−0.2)”に、サーバC調査のp´を“0.6(1−0.4)”に設定する(図15(a)参照)。すなわち、この場合は、優先度が1段階下がるごとに、対処方法候補のp´を“0.2”刻みで下げる。
したがって、この例においては、図15(c)に示すように、対処方法候補群Cの各対処方法候補の優先度pの計算結果は、サーバA調査=1、サーバB調査=0.8、サーバC調査=0.6となる。
2・4) まとめるほどではないが、当該対処と共通部分が多い対処に含まれている対処候補ほどp´を高くする手法
図16は、対処履歴管理情報250中の対処候補について、当該対処と共通部分が多い対処に含まれている対処候補ほどp´を高く設定する手法を説明する図である。
図16(b)に示すように、対処依頼処理部210から対処方法推薦部230
に渡される引数において、id´が「対処ID:3」、対処方法候補群Cが{サーバA調査、サーバB調査、サーバC調査}であるとする。
このとき、対処履歴管理情報250−17の記録内容が図16(a)に示すようになっていたとする。図16(a)に示すように、対処履歴管理情報250の対処ID251が「id3」の対処履歴情報252には、対処方法として、「サーバ1調査」と「サーバ2調査」が記録されている。上記2つの対処方法(「サーバ1調査」と「サーバ2調査」について、対処履歴管理情報250−17の対処ID251が「id1」と「id2」の対処履歴情報252を調べてみると、対処ID251が「id1」の対処履歴情報252には、対処方法として、「サーバ1調査」と「サーバ2調査」の両方が記録されている。また、対処ID251が「id2」の対処履歴情報252には「サーバ2調査」のみが記録されている。
したがって、この場合、p´の重み付けを、対処ID251が「id1」の対処履歴情報252中の対処候補の方が「id2」の対処履歴情報252中の対処候補よりも高くなるように設定する。図16(a)に示す例では、対処ID251が「id1」の対処候補の重み付けを“2/5”、対処ID251が「id2」の重み付けを“1/5”に設定するようにしている。具体的には、対処ID251が「id1」の「サーバA調査」と「サーバB調査」のp´は“1+2/5”、対処ID251が「id2」の「サーバA調査」と「サーバC調査」のp´は“1+1/5”に設定される。
上記設定をふまえて、対処方法候補群Cの各対処方法候補の優先度pを計算すると、その結果は、図16(c)に示すように、サーバA調査のp=2.6、サーバB調査のp=1.4、サーバC調査のp=1.2となる。
尚、上記各手法を組み合わせて、p´を設定するようにすることも可能である。
{症状統合部240の処理}
図17は、症状統合部240の処理を示すフローチャートである。この処理は、図8のステップS19の処理に該当する。
症状統合部240は、対処依頼処理部210から引数id(対処ID)を受け取り、図17のフローチャートに示す処理を開始する。
症状統合部240は、まず、idが“空”であるか判断し(ステップS61)、idが空でなければ(ステップS61、No)ステップS62に進み、idが空であれば(ステップS61、Yes)ステップS68に進む。ステップS61の判断は、上述した図8のフローチャートのステップS11と同様の処理である。
症状統合部240は、ステップS62おいて、対処履歴管理情報250から対処ID251が「id」の情報hを取り出す。この情報hは、対処ID251(=id)と、それに対応する対処履歴情報252の組から成る情報である。次に、対処履歴管理情報25から該h以外の情報Hを取得し(ステップS63)、該Hが“空”であるか判断する(ステップS64)。そして、Hが空でなければ(ステップS64、No)ステップS65に進み、Hが空であれば(ステップS64、Yes)ステップS68に進む。
症状統合部240は、ステップS65において、Hから先頭のh´を取り出す。このh´は、前記hと同様に、対処ID251と、それに対応する対処履歴情報252との組から成る情報である。続いて、hの対処履歴情報252とh´の対処履歴情報252を比較し、それらに共通部分が多いか判断する(ステップS66)。そして、該共通部分が多いと判断すれば(ステップS66、Yes)ステップS67に進み、該共通部分が少ないと判断すれば(ステップS66、No)ステップS64に戻る。ステップS66の処理の詳細は、後述する。
このようにして、症状統合部240は、ステップS64において、Hが空、すなわち、Hから取り出すh´が無いと判断するか(ステップS64、Yes)、または、ステップS66において、hの対処履歴情報252とh´の対処履歴情報252に共通部分が多いと判断するまで(ステップS66、Yes)、ステップS64〜S66の処理を繰り返す。
症状統合部240は、ステップS67において、hをh´に統合し、「統合すべき症状あり」のステイタスとh´を対処依頼処理部210に返す。そして、本フローチャートの処理を終了する。
症状統合部240は、ステップS68において、「統合すべき症状なし」のステイタス
を対処依頼処理部210に返す。そして、本フローチャートの処理を終了する。
図18は、上述した図17のフローチャートの処理の具体例を示す図である。
図18(a)は症状統合部240が統合する前の対処履歴管理情報250(250−19)を示す図、図18(b)は症状統合部240が対処依頼処理部210から受け取る引数idを示す図、図18(c)は症状統合部240が統合した後の対処履歴管理情報250(250−21)を示す図である。
この例では、図18(b)に示すように、症状統合部240は、対処依頼処理部210から、引数idとして「id3」の対処IDを受け取る。したがって、図18(a)に示す対処履歴管理情報250(250−19)の対処ID251が「id3」である情報hが統合の対象となる。この例では、対処履歴管理情報250−19において、h以外の情報Hは、対処ID251が「id1」の情報と「id2」の情報から構成される。したがって、情報Hから、「id1」の情報h´と「id2」の情報h´を順次取り出し、それぞれの対処履歴情報252の内容を情報hの対処履歴情報252の内容と比較し、情報hの対処履歴情報252と共通部分が多い対処履歴情報252を有する情報h´を見つけ出し、その情報h´が見つかったならば、情報hをその情報h´に統合させる処理を行う。
この例では、図18(a)に示すように、情報hの対処履歴情報252と共通部分が多い対処履歴情報252を有するのは、対処ID251が「id2」の情報h´の対処履歴情報252である。具体的には、それぞれの対処履歴情報252中の対処方法において、「サーバDの調査」、「サーバDのプロセス調査」、「サーバDのI/O調査」、「なし」が共通している。したがって、この例では、図18(c)に示すように、対処ID251が「id3」の情報hを、対処ID251が「id2」の情報h´に統合する。
{情報hと情報h´の対処履歴情報252の共通部分が多いと判定する方法}
図19は、図17のフローチャートのステップS66の判断方法の例を示す図である。図19おいて、「履歴1」、「履歴2」は、それぞれ、情報hの対処履歴情報252、情報h´の対処履歴情報252を示す。また、「A」、「B」、「C」、「D」、「E」は、対処履歴情報252内の対処方法を示す。また、A→B→C→D→Eは、A、B、C、D、Eの順序で対処方法が実施されたことを示している。
図19(a)は、対処履歴情報252全体に占める共通部分の割合が一定値以上である場合、共通部分が多いと判断する例を示している。この例では、一定値を50%と定めている。この例の場合、履歴1と履歴2で、対処方法C、D、Eが共通するので、共通部分の割合が60%となり、一定値(=50%)を超える。したがって、履歴1と履歴2の共通部分が多いと判断される。
図19(b)は、一方の対処履歴情報252の対処履歴(対処方法の履歴)が他方の対処履歴情報252の対処履歴に対して前方一致する場合、共通部分が多いと判断する例を示す。この例では、履歴1の対処履歴(「A→B→C→D→E」)に対し、履歴2の対処履歴(「A→B→C」)が前方一致している。したがって、この場合、前方一致率は60%となる。この例では、前方一致の基準値(一定値)を50%としているので、履歴1と履歴2の対処履歴は共通部分が多いと判断される。
図19(c)は、一方の対処履歴情報252の対処履歴(対処方法の履歴)が他方の対処履歴情報252に包含される場合、共通部分が多いと判断する例を示す。この例では、履歴1の対処履歴は「A→B→C→D→E」となっている。また、履歴2の対処履歴は「B→C→D」となっている。この場合、履歴2の対処履歴は、履歴1に包含されており、履歴1の対処履歴全体における履歴2の対処履歴の割合は60%を占めている。この例では、包含割合の基準値(一定値)を50%に設定しているので、共通部分が多いと判断される。
図19(d)は、一方の対処履歴情報252の対処履歴が他方の対処履歴情報252の対処履歴に対して後方一致する場合に、共通部分が多いと判断する例を示す。この例では、履歴1の対処履歴は「A→B→C→D→E」となっている。また、履歴2の対処履歴は「C→D→E」となっている。この場合、履歴2の対処履歴は、履歴1に後方一致しており、履歴1の対処履歴全体における履歴2の後方一致部分の割合は60%である。この例では、後方一致部分の対処履歴全体の割合の基準値(一定値)を50%に設定しているので、共通部分が多いと判断される。
尚、上述した図19(a)〜(d)の例は、いずれも、「連続する対処方法」を共通部分の対象としているが、本発明は、これに限定されるものではない。例えば、「A→E→B→C」のように、対処方法AとBの間に対処方法Eを実施するような場合でも、これを、「A→B→C」に順ずる共通部分とみなすようにしてもよい。
本発明は、上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲内で種々に変形して実施することができる。例えば、優先度pの計算方法は上述した実施形態に限定されるものではない。また、共通部分が多いと判断する方式も上述した実施形態の手法に限定されるものではない。
上述した実施形態に関し、更に、以下の付記を開示する。
(付記1)
情報システムにおいて過去に発生した障害の対処事例を知識化し、該知識化によって得られた障害対処知識と、障害発生時の障害の症状を基に、対処方法を推薦する処理を、コンピュータに実行させる障害対処プログラムであって、
前記障害対処知識を検索して、対処を依頼された障害に対する対処方法の候補を取得する検索ステップと、
各症状に対して実施した対処方法の履歴を、対処履歴情報として、記憶手段に記録する記録ステップと、
該対処履歴情報を参照して、前記検索ステップで得られた対処方法の候補(対処方法候補)を優先度付けする優先度付けステップと、
該優先度付けステップによって得られた優先度付け情報を基に、前記対処依頼された障害に対する対処方法を、優先度を付けて、対処依頼先に返すステップと、
を備える処理を、
コンピュータに実行させる障害対処プログラム。
(付記2)
前記優先度付けステップにおいて、対処中の他の症状の対処履歴情報を参照して、対処中の他の症状にも有効な対処方法候補の優先度が高くなるように設定する処理を、
前記コンピュータに実行させることを特徴とする付記1記載の障害対処プログラム。
(付記3)
前記優先度付けステップにおいて、当該対処履歴情報内に多く含まれている対処方法候補ほど、優先度が高くなるように設定する処理を、
前記コンピュータに実行させることを特徴とする付記1記載の障害対処プログラム。
(付記4)
前記優先度付けステップにおいて、当該対処履歴情報を参照し、新しく実施された対処方法候補ほど、優先度が高くなるように設定する処理を、
前記コンピュータに実行させることを特徴とする付記1記載の障害対処プログラム。
(付記5)
前記優先度付けステップにおいて、当該対処履歴情報を参照して、元の優先度が高い対処方法候補ほど、優先度が高くなるように設定する処理を、
前記コンピュータに実行させることを特徴とする付記1記載の障害対処プログラム。
(付記6)
前記優先度付けステップにおいて、前記対処履歴管理情報を参照し、前記検索ステップで得られた対処方法候補の群(対処方法候補群)に含まれる対処候補と共通する対処候補を含む対処の対処候補に含まれている対処方法候補ほど重みを大きくして、各対処方法候補の優先度を計算する処理を、
前記コンピュータに実行させることを特徴とする付記1記載の障害対処プログラム。
(付記7)
さらに、
前記対処履歴管理情報に記録されている対処履歴情報について、共通部分が多い対処履歴情報を一つに統合する統合ステップの処理を、
前記コンピュータに実行させる請求項1記載の障害対処プログラム。
(付記8)
前記統合ステップにおいて、前記対処履歴管理情報内の各対処履歴情報を参照し、対処方法の履歴(対処履歴)全体に占める共通部分の割合が一定値以上であれば、共通部分が多いと判断する処理を、
前記コンピュータに実行させることを特徴とする付記7記載の障害対処プログラム。
(付記9)
前記統合ステップにおいて、一方の対処履歴が他方の対処履歴に対して前方一致していれば、それらの対処履歴は共通部分が多いと判断する処理を、
前記コンピュータに実行させることを特徴とする付記7記載の障害対処プログラム。
(付記10)
前記統合ステップにおいて、一方の対処履歴が他方の対処履歴に包含されていれば、それらの対処履歴は共通部分が多いと判断する処理を、
前記コンピュータに実行させること特徴とする付記7記載の障害対処プログラム。
(付記11)
前記統合ステップにおいて、一方に対処履歴が他方の対処履歴に後方一致していれば、それらの対処履歴は共通部分が多いと判断する処理を、
前記コンピュータに実行させることを特徴とする付記7記載の障害対処プログラム。
(付記12)
前記共通部分は、一方が他方の対処方法を全て包含している場合も含むことを特徴とする付記8乃至付記11のいずれか1項に記載の障害対処プログラム。
(付記13)
情報システムにおいて過去に発生した障害の対処事例を知識化し、該知識化によって得られた障害対処知識と、障害発生時の障害の症状を基に、対処方法を推薦する障害対処装置であって、
前記障害対処知識を検索して、対処を依頼された障害に対する対処方法の候補を取得する検索手段と、
各症状に対して実施した対処方法の履歴を、対処履歴情報として、記憶手段に記録する記録手段と、
該記憶手段に格納されている対処履歴情報を参照して、前記検索手段により取得された対処方法の候補(対処方法候補)を優先度付けする優先度手段と、
該優先度付けステップによって得られた優先度付け情報を基に、前記対処依頼された障害に対する対処方法を、優先度を付けて、対処依頼先に返す推薦手段と、
を備える障害対処装置。
(付記14)
前記優先度手段は、対処中の他の症状の対処履歴情報を参照して、対処中の他の症状にも有効な対処方法候補の優先度が高くなるように設定することを特徴とする付記13記載
の障害対処装置。
(付記15)
前記優先度手段は、当該対処履歴情報内に多く含まれている対処方法候補ほど、優先度が高くなるように設定することを特徴とする付記13記載の障害対処装置。
(付記16)
前記優先度手段は、当該対処履歴情報を参照し、新しく実施された対処方法候補ほど、優先度が高くなるように設定することを特徴とする付記13記載の障害対処装置。
(付記17)
前記優先度手段は、当該対処履歴情報を参照して、元の優先度が高い対処方法候補ほど、優先度が高くなるように設定することを特徴とする付記13記載の障害対処装置。
(付記18)
前記優先度手段は、前記対処履歴管理情報を参照し、前記検索ステップで得られた対処方法候補の群(対処方法候補群)に含まれる対処候補と共通する対処候補を含む対処の対処候補に含まれている対処方法候補ほど重みを大きくして、各対処方法候補の優先度を計算することを特徴とする付記13記載の障害対処装置。
(付記19)
さらに、
前記対処履歴管理情報に記録されている対処履歴情報について、共通部分が多い対処履歴情報を一つに統合する統合手段を、
備える請求項13記載の障害対処装置。
(付記20)
前記統合手段は、前記対処履歴管理情報内の各対処履歴情報を参照し、対処方法の履歴(対処履歴)全体に占める共通部分の割合が一定値以上であれば、共通部分が多いと判断することを特徴とする付記19記載の障害対処装置。
(付記21)
前記統合手段は、一方の対処履歴が他方の対処履歴に対して前方一致していれば、それらの対処履歴は共通部分が多いと判断することを特徴とする付記19記載の障害対処装置。
(付記22)
前記統合手段は、一方の対処履歴が他方の対処履歴に包含されていれば、それらの対処履歴は共通部分が多いと判断すること特徴とする付記19記載の障害対処装置。
(付記23)
前記統合手段は、一方に対処履歴が他方の対処履歴に後方一致していれば、それらの対処履歴は共通部分が多いと判断することを特徴とする付記19記載の障害対処装置。
(付記24)
前記共通部分は、一方が他方の対処方法を全て包含している場合も含むことを特徴とする付記19乃至付記23のいずれか1項に記載の障害対処装置。
(付記25)
情報システムにおいて過去に発生した障害の対処事例を知識化し、該知識化によって得られた障害対処知識と、障害発生時の障害の症状を基に、対処方法を推薦する障害対処装置であって、
各対処IDと、各対処IDに対応する対処履歴情報の組を含む対処履歴管理情報を記憶する対処履歴管理情報記憶部と、
ユーザの端末から、対処IDと障害の症状を含む対処依頼を受信し、該対処依頼に対して、対処IDと対処方法を返す対処依頼処理部と、
前記障害対処知識を検索して、前記対処依頼に含まれる障害の症状に対応する対処方法の候補(対処方法候補)を取得する対処方法検索部と、
前記対処履歴管理情報記憶部に記録されている対処履歴管理情報記憶部を参照して、該対処方法検索部により取得された対処方法候補に対して優先度を付け、前記対処IDと該優先度付けされた対処方法(対処方法候補)の組を対処履歴情報として、前記対処履歴管
理情報記憶部内の対処履歴管理情報に追加すると共に、前記優先度付けされた対処方法を前記対処依頼処理部に渡す対処方法推薦部と、
前記対処履歴管理情報記憶部に記録されている対処履歴管理情報内の該対処依頼に含まれる対処IDに対応する対処履歴情報の当該対処履歴内の対処方法を、前記対処依頼処理部が受信した対処依頼に含まれるユーザが実施した対処方法に更新する対処方法更新部と、
を備える障害対処装置。
原理(1)の解決イメージを示す図である。 原理(2)の解決イメージを示す図であり、(a)は症状1の対処方法候補を、(b)は症状2の対処方法候補を示している。 本実施形態のシステムの概要を示す図(その1)である。 本実施形態のシステムに概要を示す図(その2)である。 トラブル対処システムの構成を示すブロック図である。 図5に示す本実施形態のトラブル対処システムをプログラムの実行により実現するコンピュータのハードウェア構成を示す図である。 トラブル対処システムの全体フローである。 図5の対処依頼処理部の処理を示すフローチャートである。 図5の対処方法更新部の処理を示すフローチャートである。 (a)は対処方法更新部により更新される前の対処履歴管理情報、(b)は対処依頼処理部から受け取る引数、(c)は対処方法更新部により更新された後の対処履歴管理情報を示す図である。 図5の対処方法推薦部の処理(図5のステップS17に該当)を示すフローチャートである。 対処中の他の症状にも有効な対処方法を優先して推薦する方法を説明する図である。 1つの対処を考慮して、優先度を計算する方法(その1)を説明する図である。 1つの対処を考慮して、優先度を計算する方法(その2)を説明する図である。 1つの対処を考慮して、優先度を計算する方法(その3)を説明する図である。 1つの対処を考慮して、優先度を計算する方法(その4)を説明する図である。 症状統合部の処理を示すフローチャートである。 図17のフローチャートの処理の具体例を示す図である。 図17のフローチャートのステップS66の判断方法の例を示す図である。 従来の障害対処方法を示す模式図である。
符号の説明
10 症状1の対処履歴
11、12、13 対処方法
20 症状2の対処履歴
21、22、23 対処方法
30 対処方法候補群
31、32 対処方法候補(対処方法)
40 対処方法候補群
41、42 対処方法候補(対処方法)
110(110−1、110−2) 症状
111−1 初期症状
112 対処
120(120−1、120−2) 対処ID
200 トラブル対処システム
210 対処依頼処理部
220 対処方法更新部
230 対処方法推薦部
240 症状統合部
250(250−1、250−2、250−5、250−6、250−11、250−13、250−15、250−17,250−19、250−21) 対処履歴管理情報
251 対処ID
252 対処履歴情報
260 対処方法検索部
270 トラブル対処知識
310(310−1〜310−5) 対処方法
500 コンピュータ
501 CPU
502 メモリ(主記憶装置)
503 入力装置
504 表示装置
505 外部記憶装置
506 可搬型記憶媒体駆動装置
510 バス
i 症状
id、id´ 対処ID
C 対処方法候補群
c 対処方法候補
p 優先度
p´ 優先度pの計算式で使用される変数

Claims (7)

  1. ンピュータに、
    受け付けた障害による症状の情報に基づき過去に発生した障害による症状の対処事例を蓄積した障害対処知識を検索して対処候補を取得
    過去に実施した、または、実施中の対処を症状に関連付けて蓄積した対処履歴情報を参照して前記対処候補の評価を行い
    前記対処候補を前記評価と関連づけて出力する、
    処理を実行させ、
    前記対処候補の評価は、前記受け付けた障害に対する対処中の他の症状にも関連付けられた対処候補の評価を高くする、
    ことを特徴とする障害対応プログラム。
  2. 請求項1記載の障害対応プログラムであって、前記対処候補の評価は、前記対処候補に優先度を付けることにより行われる、ことを特徴とする障害対応プログラム。
  3. 請求項2記載の障害対応プログラムであって、前記対処履歴情報内に多く含まれている対処候補ほど、優先度くすことを特徴とする障対応プログラム。
  4. 請求項1記載の障害対応プログラムであって、コンピュータに、さらに、
    蓄積した前記対処履歴情報のうち、共通部分が多い対処履歴情報を一つに統合する
    理を実行させることを特徴とする障害対応プログラム。
  5. 受け付けた障害による症状の情報に基づき過去に発生した障害による症状の対処事例を蓄積した障害対処知識を検索して対処候補を取得する検索手段と、
    過去に実施した、または、実施中の対処を症状に関連付けて蓄積した対処履歴情報を記録する記録手段と、
    前記記憶手段に格納されている対処履歴情報を参照して前記対処候補を評価する評価手段と、
    前記対処候補を前記評価と関連付けて出力する出力手段と
    を備え、
    前記評価手段は、前記受け付けた障害に対する対処中の他の症状にも関連付けられた対処候補の評価を高くする
    ことを特徴とする障害対応装置。
  6. 請求項5に記載の障害対応装置は、さらに、
    前記記憶手段に記録されている対処履歴情報のうち、共通部分が多い対処履歴情報を一つに統合する統合手段、
    備えることを特徴とする障害対応装置。
  7. ユーザの端末から、対処中のトラブルに付与される識別子である対処識別子と障害の症状を含む対処依頼を受信し、該対処依頼に対して、対処識別子と対処方法を返す依頼処理部と、
    受け付けた障害による症状の情報に基づき前記過去に発生した障害による症状の対処事例を蓄積した障害対処知識を検索して対処候補を取得する検索部と、
    過去に実施した、または、実施中の対処を症状に関連付けて蓄積した対処履歴情報を記憶する記憶部と、
    前記記憶部に記憶された前記対処履歴情報を参照して前記対処候補の評価を行い、前記対処識別子と該対処候補と該評価と関連付けて対処履歴情報として、前記記憶部に追加すると共に、前記評価された対処候補を前記依頼処理部に渡す評価部と、
    前記記憶部に記録されている対処識別子に対応する対処履歴情報における対処候補を、前記依頼処理部が受信した対処依頼に含まれるユーザが実施した対処方法に更新する更新部と、
    を備え、
    前記評価部は、前記受け付けた障害に対する対処中の他の症状にも関連付けられた対処候補の評価を高くする、
    ことを特徴とする障害対応システム
JP2008238221A 2008-09-17 2008-09-17 障害対応プログラム、障害対応装置、及び障害対応システム Expired - Fee Related JP5439775B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008238221A JP5439775B2 (ja) 2008-09-17 2008-09-17 障害対応プログラム、障害対応装置、及び障害対応システム
US12/491,998 US8438179B2 (en) 2008-09-17 2009-06-25 Storage medium storing trouble handling program, and trouble handling apparatus
GB0911136.0A GB2463546B (en) 2008-09-17 2009-06-26 Trouble handling in an information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008238221A JP5439775B2 (ja) 2008-09-17 2008-09-17 障害対応プログラム、障害対応装置、及び障害対応システム

Publications (2)

Publication Number Publication Date
JP2010072834A JP2010072834A (ja) 2010-04-02
JP5439775B2 true JP5439775B2 (ja) 2014-03-12

Family

ID=41008356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008238221A Expired - Fee Related JP5439775B2 (ja) 2008-09-17 2008-09-17 障害対応プログラム、障害対応装置、及び障害対応システム

Country Status (3)

Country Link
US (1) US8438179B2 (ja)
JP (1) JP5439775B2 (ja)
GB (1) GB2463546B (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014103071A1 (ja) 2012-12-28 2014-07-03 富士通株式会社 対処方法作成プログラム、対処方法作成方法、及び情報処理装置
US9619311B2 (en) * 2013-11-26 2017-04-11 International Business Machines Corporation Error identification and handling in storage area networks
US10263836B2 (en) * 2014-03-24 2019-04-16 Microsoft Technology Licensing, Llc Identifying troubleshooting options for resolving network failures
US10067812B2 (en) * 2015-03-30 2018-09-04 Ca, Inc. Presenting diagnostic headlines using simple linguistic terms
US9979607B2 (en) * 2015-06-22 2018-05-22 Ca, Inc. Diagnosing anomalies based on deviation analysis
JP2020181505A (ja) * 2019-04-26 2020-11-05 富士通株式会社 インシデント対応支援プログラム、インシデント対応支援装置およびインシデント対応支援方法
US11775367B2 (en) 2019-07-08 2023-10-03 Nippon Telegraph And Telephone Corporation Automatic cooperation apparatus, automatic cooperation method and automatic cooperation program

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4633467A (en) * 1984-07-26 1986-12-30 At&T Bell Laboratories Computer system fault recovery based on historical analysis
US5214653A (en) * 1990-10-22 1993-05-25 Harris Corporation Fault finder expert system
US5253184A (en) * 1991-06-19 1993-10-12 Storage Technology Corporation Failure and performance tracking system
JPH08221295A (ja) * 1995-02-13 1996-08-30 Mitsubishi Electric Corp 障害支援装置
US6446224B1 (en) * 1995-03-03 2002-09-03 Fujitsu Limited Method and apparatus for prioritizing and handling errors in a computer system
US5799317A (en) * 1995-11-08 1998-08-25 Mci Communications Corporation Data management system for a telecommunications signaling system 7(SS#7)
US6012152A (en) * 1996-11-27 2000-01-04 Telefonaktiebolaget Lm Ericsson (Publ) Software fault management system
US6343236B1 (en) * 1999-04-02 2002-01-29 General Electric Company Method and system for analyzing fault log data for diagnostics
US6415395B1 (en) * 1999-04-02 2002-07-02 General Electric Company Method and system for processing repair data and fault log data to facilitate diagnostics
US6912676B1 (en) * 1999-09-02 2005-06-28 International Business Machines Automated risk assessment tool for AIX-based computer systems
US6324659B1 (en) * 1999-10-28 2001-11-27 General Electric Company Method and system for identifying critical faults in machines
US6651034B1 (en) * 1999-10-28 2003-11-18 General Electric Company Apparatus and method for performance and fault data analysis
US7237138B2 (en) * 2000-05-05 2007-06-26 Computer Associates Think, Inc. Systems and methods for diagnosing faults in computer networks
US6631384B1 (en) * 2000-09-05 2003-10-07 Algoplus Consulting Limited Information system and method using analysis based on object-centric longitudinal data
US6895585B2 (en) * 2001-03-30 2005-05-17 Hewlett-Packard Development Company, L.P. Method of mixed workload high performance scheduling
GB2391132B (en) * 2002-07-19 2005-09-21 Hewlett Packard Co Fault diagnosis in a network
JP4237076B2 (ja) * 2004-02-17 2009-03-11 Necパーソナルプロダクツ株式会社 エラー処理システム、エラー対応情報処理装置、情報端末、エラー処理方法、プログラム
JP4445300B2 (ja) * 2004-03-18 2010-04-07 富士通株式会社 ネットワーク障害推定方法及びネットワーク障害推定装置
US7409595B2 (en) * 2005-01-18 2008-08-05 International Business Machines Corporation History-based prioritizing of suspected components
JP4239989B2 (ja) * 2005-03-07 2009-03-18 日本電気株式会社 障害復旧システム、障害復旧装置、ルール作成方法、および障害復旧プログラム
US7349826B2 (en) * 2006-05-23 2008-03-25 International Business Machines Corporation Causal ladder mechanism for proactive problem determination, avoidance and recovery
US7765040B2 (en) * 2006-06-14 2010-07-27 Spx Corporation Reverse failure analysis method and apparatus for diagnostic testing
WO2008083345A2 (en) * 2006-12-30 2008-07-10 Peak8 Partners, Llc Technical support agent and technical support service delivery platform
US8554790B2 (en) * 2007-12-18 2013-10-08 Red Hat, Inc. Content based load balancer
JP5141762B2 (ja) 2008-03-31 2013-02-13 富士通株式会社 トラブル対処システム、方法およびそのためのプログラム

Also Published As

Publication number Publication date
US8438179B2 (en) 2013-05-07
GB2463546B (en) 2012-11-28
GB0911136D0 (en) 2009-08-12
JP2010072834A (ja) 2010-04-02
GB2463546A (en) 2010-03-24
US20100070462A1 (en) 2010-03-18

Similar Documents

Publication Publication Date Title
JP5439775B2 (ja) 障害対応プログラム、障害対応装置、及び障害対応システム
US11240126B2 (en) Distributed tracing for application performance monitoring
KR101221205B1 (ko) Http 세션 작업부하를 특성화하기 위한 데이터를수집하는 방법 및 장치
US9189355B1 (en) Method and system for processing a service request
US8271417B2 (en) Health meter
US8219548B2 (en) Data processing method and data analysis apparatus
JP5223413B2 (ja) Itシステムのトラブル対処装置、トラブル対処方法およびそのためのプログラム
JP2005115514A (ja) データベース検索システム及びその検索方法並びにプログラム
JP6823265B2 (ja) 分析装置、分析システム、分析方法および分析プログラム
US20120016957A1 (en) Method of improving efficiency of replication monitoring
US11526413B2 (en) Distributed tracing of huge spans for application and dependent application performance monitoring
KR20190022434A (ko) 데이터베이스 시스템의 최적화 방법, 시스템, 전자장치 및 저장매체
JPWO2013018288A1 (ja) 計算機およびリソース検索方法
JP4383484B2 (ja) メッセージ解析装置、制御方法および制御プログラム
JP2021149849A (ja) 障害原因特定システム、障害原因特定方法および障害原因特定プログラム
JP4688478B2 (ja) ストレージ装置のソフトウェア開発支援システム及びソフトウェア開発支援方法
US8516466B2 (en) Optimization of automated system-managed storage operations
WO2023063172A1 (ja) 業務情報管理システム及びデータ検索方法
JP6336919B2 (ja) ソースコードレビュー方法及びそのシステム
JP7369219B2 (ja) 運用管理装置及び方法
JP7068210B2 (ja) データベース管理システム、端末装置及び方法
JP2019101829A (ja) ソフトウェア部品管理システム、計算機および方法
JP6007320B2 (ja) 計算機、関連性算出方法及び記憶媒体
CN112148712A (zh) 一种数据处理方法、装置、设备及介质
JP5938482B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131202

R150 Certificate of patent or registration of utility model

Ref document number: 5439775

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees