JP7425918B1 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP7425918B1
JP7425918B1 JP2023120623A JP2023120623A JP7425918B1 JP 7425918 B1 JP7425918 B1 JP 7425918B1 JP 2023120623 A JP2023120623 A JP 2023120623A JP 2023120623 A JP2023120623 A JP 2023120623A JP 7425918 B1 JP7425918 B1 JP 7425918B1
Authority
JP
Japan
Prior art keywords
data
information
learning
failure
network equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023120623A
Other languages
English (en)
Inventor
勝也 山崎
篤志 蒔田
裕美 横田(島田)
雅也 岡崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2023120623A priority Critical patent/JP7425918B1/ja
Application granted granted Critical
Publication of JP7425918B1 publication Critical patent/JP7425918B1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

Figure 0007425918000001
【課題】装置に関する情報のみでは検出できない障害の発生を予測する。
【解決手段】機器の動作状況を示す動作データを取得する動作データ取得部131と、テキストデータに含まれる所定のアプリケーションサービスの利用状況に関する情報である抽出データを抽出する抽出データ生成部132と、保守データを取得する保守データ取得部133と、動作データ取得部131が取得した動作データと、抽出データ生成部132が生成した抽出データと、保守データ取得部133が取得した保守データと、を学習済みモデルに入力することで障害の発生有無を示す情報を出力する出力部134と、を有する情報処理装置1である。
【選択図】図2

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
装置のログデータに基づいて将来発生する故障を予測する装置が知られている(例えば、特許文献1を参照)。
特開2023-20166号公報
サービスを構成する装置及びネットワークの複雑化によりアプリケーションに障害が発生した際の障害発生個所の特定が困難になっており、装置のログやアラームに基づいて検出できない障害が発生するという問題が生じていた。
そこで、本発明はこれらの点に鑑みてなされたものであり、装置に関する情報のみでは検出できない障害の発生を予測できるようにすることを目的とする。
本発明の第1の態様の情報処理装置においては、所定のアプリケーションサービスを提供するためのネットワーク設備群を構成する機器の動作状況を示す動作データを取得する動作データ取得部と、前記ネットワーク設備群の外部で生成されたテキストデータに含まれる前記所定のアプリケーションサービスの利用状況に関する情報である抽出データを抽出する抽出データ生成部と、前記ネットワーク設備群を保守するためのシステムから入力されたデータである保守データを取得する保守データ取得部と、学習用の動作データである学習用動作データ、学習用の抽出データである学習用抽出データ及び学習用の保守データである学習用保守データを入力として、前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の有無を示す障害予測情報であって、学習用の障害予測情報である学習用障害予測情報を出力するよう学習した学習済みモデルを記憶する記憶部と、前記動作データ取得部が取得した前記動作データと、前記抽出データ生成部が生成した前記抽出データと、前記保守データ取得部が取得した前記保守データと、を前記学習済みモデルに入力することで障害の発生有無を示す情報を出力する出力部と、を有する。
前記ネットワーク設備群は、前記動作データを取得可能な第1のネットワーク設備群と、前記動作データを取得することができないネットワーク設備群である第2のネットワーク設備群と、を含み、前記動作データ取得部は、前記第1のネットワーク設備群を構成する機器の動作状況を示す前記動作データを取得し、前記出力部は、前記動作データ取得部が取得した前記動作データと、前記抽出データ生成部が生成した前記抽出データと、を前記学習済みモデルに入力することで前記第2のネットワーク設備群における障害の発生有無を示す情報を出力してもよい。
前記学習用障害予測情報は、前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の内容をさらに含み、前記出力部は、前記学習済みモデルが出力した障害の内容に対応するための手順をさらに出力してもよい。
前記保守データは、前記所定のアプリケーションサービスの利用者から受付けた、前記所定のアプリケーションサービスに関する不具合に関する申告内容を示し、前記出力部は、所定の閾値以上、前記保守データを取得した場合に、障害が発生していることを出力してもよい。
前記抽出データは、前記所定のアプリケーションサービスの品質に関する語句を含むテキストから抽出されたデータであり、前記出力部は、前記抽出データに含まれる前記所定のアプリケーションサービスの品質が悪いことを示す語句に基づいて、障害が発生していることを出力してもよい。
前記所定のアプリケーションサービスの処理状況を定量的に示す処理状況情報を取得する処理状況取得部をさらに有し、前記出力部は、前記処理状況情報が示す処理状況が、過去の処理状況の統計値と比較して乖離がある場合に、障害が発生していることを出力してもよい。
前記所定のアプリケーションサービスの処理状況を定量的に示す処理状況情報を時系列に取得する処理状況取得部をさらに有し、前記記憶部は、前記処理状況情報であって、過去に取得した処理状況情報である学習用処理状況情報を教師データとして学習した学習済みモデルであって、処理状況情報を入力として、入力された学習用処理状況情報が示す過去の処理状況から予測される将来の時点における処理状況の予測値を出力するよう学習した学習済みモデルである処理状況学習モデルを記憶し、前記出力部は、前記処理状況情報が示す処理状況が、前記処理状況情報が示す過去の処理状況に基づいて前記処理状況学習モデルが出力した予測値と比較して乖離がある場合に、障害が発生していることを出力してもよい。
本発明の第2の態様の情報処理方法においては、コンピュータが実行する、所定のアプリケーションサービスを提供するためのネットワーク設備群を構成する機器の動作状況を示す動作データを取得する動作データ取得ステップと、前記ネットワーク設備群の外部で生成されたテキストデータに含まれる前記所定のアプリケーションサービスの利用状況に関する情報である抽出データを抽出する抽出ステップと、前記ネットワーク設備群を保守するためのシステムから入力されたデータである保守データを取得する保守データステップと、記憶部が記憶する、学習用の動作データである学習用動作データ、学習用の抽出データである学習用抽出データ、学習用の保守データである学習用保守データ並びに前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の有無を示す障害予測情報であって、学習用の障害予測情報である学習用障害予測情報と、を教師データとして学習した学習済みモデルに、取得された前記動作データと、生成された前記抽出データと、取得された前記保守データと、を入力することで障害の発生有無を示す情報を出力する出力ステップと、を有する。
本発明の第3の態様のプログラムにおいては、コンピュータに、所定のアプリケーションサービスを提供するためのネットワーク設備群を構成する機器の動作状況を示す動作データを取得する動作データ取得ステップと、前記ネットワーク設備群の外部で生成されたテキストデータに含まれる前記所定のアプリケーションサービスの利用状況に関する情報である抽出データを抽出する抽出ステップと、前記ネットワーク設備群を保守するためのシステムから入力されたデータである保守データを取得する保守データステップと、記憶部が記憶する、学習用の動作データである学習用動作データ、学習用の抽出データである学習用抽出データ、学習用の保守データである学習用保守データ並びに前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の有無を示す障害予測情報であって、学習用の障害予測情報である学習用障害予測情報と、を教師データとして学習した学習済みモデルに、取得された前記動作データと、生成された前記抽出データと、取得された前記保守データと、を入力することで障害の発生有無を示す情報を出力する出力ステップと、を実行させる。
本発明によれば、装置に関する情報のみでは検出できない障害の発生を予測できるという効果を奏する。
実施形態にかかる情報処理システムSの概要を説明するための図である。 情報処理装置1の構成を示すブロック図である。 動作データ取得部131が取得する動作データの一例を示す図である。 抽出データ生成部132が生成する抽出データの一例を示す図である。 保守データ取得部133が取得する保守データの一例を示す図である。 処理状況取得部135が取得する処理状況情報の一例を示す図である。 記憶部12が記憶する手順情報のデータ構造の一例を示す図である。 情報処理装置1における処理の流れを示すフローチャートである。
[情報処理装システムSの概要]
図1は、実施形態にかかる情報処理システムSの概要を説明するための図である。情報処理システムSは、設備等の保守を支援するためのシステムである。情報処理システムSは、情報処理装置1及び情報端末2を有する。
情報処理装置1は、ネットワーク設備群において発生した障害を予測するための装置である。情報処理装置1は、障害を予測するよう学習された学習済みモデルを記憶している。ネットワーク設備群は、所定のアプリケーションサービス又は所定のネットワークサービスを提供するために構成された複数の設備である。ネットワーク設備群は、例えば、サーバ、スイッチ、ルータ等を含む。所定のアプリケーションサービスは、例えば、決済サービスであるがこれに限られない。所定のネットワークサービスは、情報処理装置1は、例えばサーバである。
情報端末2は、情報処理システムSのユーザが使用する端末である。情報端末2は、パーソナルコンピュータ、タブレット又はスマートフォンである。情報処理システムSのユーザは、例えば、所定のアプリケーションサービス又は所定のネットワークサービスを提供する事業者の従業員である。
情報処理装置1の処理の概要について説明する。情報処理装置1は、動作データ及び保守データを取得する。動作データは、ネットワーク設備群を構成する機器の動作状況を示すデータである。動作データは、例えば、ネットワークにおける疎通状況、トラフィック状況、警報の発生状況等を示す。
保守データは、ネットワーク設備群を保守するためのシステムから入力されたデータである。保守データは、所定のアプリケーションサービスの利用者から受付けた、所定のアプリケーションサービスに関する不具合に関する申告内容を示す情報である。保守データは一例として、ユーザが申告した障害の申告を受付けたオペレータが不図示の外部システムに入力した申告情報を集計した情報である。
情報処理装置1は、外部装置からテキストデータを取得し、取得したテキストデータに基づいて抽出データを生成する。テキストデータは、例えばSNS(Social Networking Service)やブログ等に投稿された文章を示す。テキストデータは、また、各種データベースから得られる運用情報、管理情報、障害情報、ステータス情報等のデータも含まれ得る。抽出データは、ネットワーク設備群の外部で生成されたテキストデータに含まれる所定のアプリケーションサービスの利用状況に関する情報である。抽出データは、所定のアプリケーションサービスの品質に関する語句を含むテキストから抽出して生成されたデータである。情報処理装置1は、テキストデータを取得する。
情報処理装置1は、動作データ、保守データ及び抽出データに基づいて、障害予測情報を出力する。障害予測情報は、所定のアプリケーションサービス又はネットワーク設備群における障害の有無を予測した情報である。障害予測情報は、さらに、障害の原因となるサービス、影響が生じているサービスやネットワークを示す情報含んでいてもよい。より具体的には、情報処理装置1は、動作データ、保守データ及び抽出データを学習済みモデルに入力することにより障害予測情報を出力する。
情報処理装置1においては、装置に関する情報のみでは検出できない障害の発生を予測できるという効果を奏する。
[情報処理装置1の構成]
図2は、情報処理装置1の構成を示すブロック図である。情報処理装置1は、通信部11、記憶部12及び制御部13を有する。制御部13は、動作データ取得部131、抽出データ生成部132、保守データ取得部133、出力部134及び処理状況取得部135を有する。
通信部11は、ネットワークを介して他の装置とデータの送受信をするための通信インターフェースである。記憶部12は、ROM(Read Only Memory)、RAM(Random Access Memory)、SSD(Solid State Drive)、ハードディスクドライブ等を含む記憶媒体である。記憶部12は、制御部13が実行するプログラムを予め記憶している。
記憶部12は、障害予測情報を出力するために学習した学習済みモデルを記憶する。学習済みモデルは、学習用動作データ、学習用抽出データ、学習用保守データを教師データとして学習し、障害予測情報を出力するよう学習している。学習済みモデルは、学習用動作データ、学習用抽出データ、学習用保守データに基づいて、学習用の障害予測情報と一致する障害予測情報を出力するよう学習している。学習用動作データ、学習用抽出データ、学習用保守データはそれぞれ、学習用の動作データ、抽出データ及び保守データである。
制御部13は、例えばCPU(Central Processing Unit)等のプロセッサである。制御部13は、記憶部12に記憶されたプログラムを実行することにより、動作データ取得部131、抽出データ生成部132、保守データ取得部133、出力部134及び処理状況取得部135として機能する。
動作データ取得部131は、動作データを取得する。動作データ取得部131は、ネットワーク設備群から外部装置(不図示)から動作データを取得する。図3は、動作データ取得部131が取得する動作データの一例を示す図である。図3に示す動作データにおいては、「データ種別」及び「量」が関連付けられている。「データ種別」は、当該レコードが示す設備の動作状況の種別を示す。「データ種別」は、例えば、ping試験の結果やトラフィック量等を含む。「量」は、当該データ種別が示す動作状況についての量を示す。
抽出データ生成部132は、取得したテキストデータから抽出データを生成する。一例として、抽出データ生成部132は、取得したテキストデータに特定の文字列が含まれる文章を抽出し、抽出した文章を集計することで抽出データを生成する。例えば、抽出データ生成部132は、所定のアプリケーションサービス又はネットワークサービスの名称又はその略称(「名称等」と言う)と、「遅い」、「使えない」等のサービスの品質が悪いことを示す文字列と、を含む文章を抽出する。抽出データ生成部132は、取得したテキストデータを解析し、文章を投稿したユーザの感情が「怒り」等のネガティブな感情であり、かつ、当該文章が所定のアプリケーションサービス又はネットワークサービスの名称等を含む文章を抽出して抽出データを生成してもよい。
図4は、抽出データ生成部132が生成する抽出データの一例を示す図である。抽出データにおいては、「時刻」と「ネガティブ発言数」とが関連付けられている。「時刻」は、当該レコードが示す抽出データを生成した時刻を示す。「ネガティブ発言数」は、取得したテキストデータにおいて抽出された品質が悪いことを示す語句が含まれる文章の数を示す。抽出データにおいては、さらに「ポジティブ発言数」が関連付けられていてもよい。「ポジティブ発言数」は、取得したテキストデータにおいてサービス等に満足したことを示す語句が含まれる文章の数を示す。
抽出データ生成部132が取得するテキストデータにおいては、さらに、場所若しくは地域を示す文字列、サービスの利用状況を示す文字列又は関連するサービスの名称等を示す文字列がさらに含まれていてもよい。この場合、抽出データ生成部132は、テキストデータに含まれる場所若しくは地域を示す文字列、サービスの利用状況を示す文字列又は関連するサービスの名称等を示す文字列を関連付けた抽出データを生成する。抽出データがこのように構成されることでより詳細な障害の予測が可能になる。
保守データ取得部133は、ネットワーク設備群を保守するためのシステムから入力されたデータである保守データを取得する。保守データ取得部133は、外部装置から保守データを取得する。図5は、保守データ取得部133が取得する保守データの一例を示す図である。図5に示す保守データにおいては、「申告種別」と「申告数」とが関連付けられている。「申告種別」は、当該レコードが示す申告の種類を示す。例えば、申告種別は、例えば、サービスのユーザ側において発生している事象を示す。「申告数」は、当該「申告種別」が示す申告内容について集計された申告の件数を示す。保守データにおいては、さらに申告があった地域や申告対象のサービスがさらに関連付けられ、地域別や申告対象のサービス別に集計された申告数が含まれていてもよい。
出力部134は、動作データ取得部131が取得した動作データと、抽出データ生成部132が生成した抽出データと、保守データ取得部133が取得した保守データと、を学習済みモデルに入力することで障害予測情報を出力する。出力部134は、学習済みモデルが出力した障害予測情報に対応する画面を情報端末2に表示させてもよい。具体的には、出力部134は、障害予測情報が示す障害の有無、障害の原因となる設備及び障害の影響を受けるサービスや地域を示す情報の全部または一部を示す画面を情報端末2に表示させる。出力部134は、障害予測情報が障害が発生していることを示す場合、障害の影響範囲の大きさに応じて、画面上で強調してもよい。また、出力部134は、障害予測情報を音声等の態様で出力してもよい。特に、障害予測情報が障害が発生していることを示す場合に音声により出力することで、ユーザが障害の発生を認識しやすくなる。
情報処理装置1がこのように構成されることで、装置に関する情報のみでは検出できない障害の発生を予測できるという効果を奏する。
なお、出力部134は、障害予測情報を記憶部12に記憶させ、情報端末2から障害予測情報を表示する要求を受け付けた場合に、記憶部12に記憶された過去の障害予測情報を表示してもよい。このように出力部134が構成されることで、障害発生後に、過去の障害についての検証作業を容易にすることができる。
ネットワーク設備群においては、例えば、ネットワークの保守を行う事業者とは別の事業者が管理するシステムである場合や、監視機能が無い等の理由により装置からログを取得することができないことに起因して、情報処理装置1において動作データを取得できない設備が含まれうる。そこで、動作データを取得可能な設備の動作データに基づいて、動作データの取得対象ではない設備の障害予測情報を出力するよう情報処理装置1が構成されると、障害の予測性を高めることができる。
以下では、ネットワーク設備群のうち、情報処理装置1が動作データを取得可能な設備群を第1のネットワーク設備群と言い、動作データを取得することができないネットワーク設備群を第2のネットワーク設備群と言う。動作データ取得部131は、第1のネットワーク設備群を構成する機器の動作状況を示す動作データを取得する。この場合、学習済みモデルは、第1のネットワーク設備群の動作データと、保守データと、抽出データと、に基づいて第2のネットワーク設備群を含むネットワーク設備群の障害における障害の有無を少なくとも含む障害予測情報を出力するよう学習している。
出力部134は、動作データ取得部131が取得した動作データと、抽出データ生成部132が生成した抽出データと、を学習済みモデルに入力することで第2のネットワーク設備群における障害の発生有無を示す情報を出力する。情報処理装置1がこのように構成されることで、動作データを取得することができない設備群における、障害の予測性を高めることができる。
例えばユーザの操作ミス等に起因してサービスの品質に関してネガティブな発言がされるような場合が想定される。そこで、抽出データにおいてサービスの品質に関する所定の語句が所定の条件を満たした場合に障害の有無を出力するよう情報処理装置1が構成されてもよい。
出力部134は、抽出データに含まれる所定のアプリケーションサービスの品質が悪いことを示す語句に基づいて、障害が発生していることを出力する。一例として、出力部134は、抽出データに含まれる「ネガティブ発言数」が所定の閾値を超えた場合に、障害が発生していることを示す画面を情報端末2に表示させる。また、出力部134は、抽出データに含まれる「ネガティブ発言数」の頻度が所定の閾値を超えた場合に、障害が発生していることを示す画面を情報端末2に表示させてもよい。所定の閾値は、一例として、障害が発生していない状態において取得されるテキストデータにから抽出される「ネガティブ発言数」の統計量に基づいて定められる。
また、出力部134は、抽出データにおいてサービスの品質に関する所定の語句が所定の条件を満たした場合に、取得した動作データ、抽出データ及び保守データに基づいて、障害予測情報を出力してもよい。すなわち、出力部134は、抽出データに含まれる「ネガティブ発言数」の量又は頻度が所定の閾値を超えた場合に、動作データ、抽出データ及び保守データを学習済みモデルに入力し、障害予測情報を出力する。
抽出データに含まれる所定の語句に基づいて障害の有無を判定するよう情報処理装置1が構成されることで、障害の予測性を高めるという効果を奏する。なお、所定の閾値と比較して障害の発生を予測することを説明したが、比較する対象は閾値に限られず、例えば発言数のトレンドと比較してもよい。情報処理装置1がこのように構成されることで、ユーザ操作のミス等に基づく発言により障害の誤った予測を低減させることができ、障害の予測性を高めるという効果を奏する。
ユーザの操作ミス等に基づき誤った申告がされる場合がある。そこで、保守データに含まれる障害が発生していることを示す情報が所定の条件を満たした場合に障害の有無を出力するよう情報処理装置1が構成されてもよい。
出力部134は、所定の閾値以上、保守データを取得した場合に、障害が発生していることを出力する。一例として、出力部134は、保守データに含まれる「申告数」が所定の閾値を超えた場合に、申告数が所定の閾値を超えたエリア又はサービスにおいて障害が発生していることを示す画面を情報端末2に表示させる。所定の閾値は、一例として、障害が発生していない状態における申告の量の統計値に基づいて設定される。
また、出力部134は、保守データに含まれる「申告数」が所定の閾値を超えた場合に、取得した動作データ、抽出データ及び保守データに基づいて、障害予測情報を出力してもよい。すなわち、出力部134は、抽出データに含まれる保守データにおける「申告数」が所定の閾値を超えた場合に動作データ、抽出データ及び保守データを学習済みモデルに入力し、障害予測情報を出力する。
情報処理装置1がこのように構成されることで、ユーザ操作のミス等に基づく障害の誤った予測を低減させることができ、障害の予測性を高めるという効果を奏する。
アプリケーションサービスの処理状況が所定の条件を満たす場合に障害予測情報を出力するよう情報処理装置1が構成されてもよい。
処理状況取得部135は、所定のアプリケーションサービスの処理状況を定量的に示す処理状況情報を取得する。図6は、処理状況取得部135が取得する処理状況情報の一例を示す図である。処理状況情報においては、「データ種別」と「量」とが関連付けられている。「データ種別」は、当該レコードが示す処理状況の種類を示す。データ種別は、例えば「決済実績数」、「決済エラー数」等を含む。「処理量」は、当該データ種別が示す処理状況の量を示す。なお、処理状況情報においては、当該レコードが対象とする場所や地域又は関連するサービス、関連する他のデータ種別等の情報がさらに関連付けられていてもよい。
出力部134は、処理状況情報が示す処理状況が、過去の処理状況の統計値と比較して乖離がある場合に、障害が発生していることを出力する。統計値は例えば平均値や中央値である。乖離があるか否かは例えば、標準偏差を用いてもよいし、処理状況と統計値との差や乖離率が所定の閾値以上であるか否かに基づいて判定されてもよい。一例として、出力部134は、処理状況情報に含まれる「決済エラー数」、「チャージエラー数」等の処理量(処理頻度)と過去の処理量(処理頻度)の統計値との差が所定の閾値を超えた場合に、障害が発生していることを示す画面を情報端末2に表示させる。出力部134は、処理状況情報に含まれる「決済処実績数」、「チャージ実績額」等の処理量(処理頻度)が所定の閾値以下である場合に、障害が発生していることを示す画面を情報端末2に表示させてもよい。
なお、アプリケーションサービスの処理状況に基づく以上の有無の判定は、過去の処理状況に基づく予測値との比較に基づいて行われてもよい。この場合、処理状況取得部135は、所定のアプリケーションサービスの処理状況を定量的に示す処理状況情報を時系列に取得する。この場合の処理状況情報においては、当該レコードが対象とする時刻、当該処理状況情報が取得又は生成された日時がさらに関連付けられていてもよい。
学習部131は、過去に取得した処理状況情報である学習用処理状況情報を教師データとして、時系列に取得した処理状況情報を入力すると、将来の時点における処理状況の予測値を出力するよう学習済みモデルを学習させ、学習させた学習済みモデルである処理状況学習モデルを記憶部12に記憶させる。出力部245は、取得した処理状況情報が示す処理状況が、処理状況情報が示す過去の処理状況に基づいて処理状況学習モデルが出力した予測値と比較して乖離がある場合に、障害が発生していることを出力する。
情報処理装置1がこのように構成されることで、障害の予測性を高めるという効果を奏する。なお、出力部134は、動作データ、保守データ、抽出データ及び処理状況情報のうち少なくとも2種類以上の情報の相関関係に基づいて障害が発生していることを出力してもよい。また、出力部134は、相関関係に基づいて取得した動作データ、抽出データ、処理状況情報及び保守データに基づいて、障害予測情報を出力してもよい。
[対応手順の出力]
障害予測情報に基づいて対応手順を出力するよう情報処理装置1が構成されてもよい。学習用障害予測情報は、所定のアプリケーションサービス若しくはネットワーク設備群における障害の内容をさらに含む。すなわち、この場合の学習済みモデルは、障害の内容を含む学習用障害予測情報に基づいて、入力されたデータに基づいて障害の内容を含む障害予測情報を出力するよう学習されている。
この場合、記憶部12は、障害の内容と、障害の内容に対応するための手順とを関連付けた手順情報を記憶している。図7は、記憶部12が記憶する手順情報のデータ構造の一例を示す図である。手順情報においては、「障害内容」と「対応手順」とが関連付けられている。「障害内容」は、障害の内容を示す。「対応手順」は、当該障害の内容に対応するための手順を示す。
出力部134は、学習済みモデルが出力した障害の内容に対応するための手順をさらに出力する。出力部134は、記憶部12を参照し、学習済みモデルが出力した障害予測情報が示す障害の内容に対応する対応手順を特定する。出力部134は、特定した対応手順を表示するための画面を情報端末2に表示させる。
情報処理装置1がこのように構成されることで、ユーザは障害にどのように対応すればよいかを判断することができる。
[情報処理装置1における処理の流れ]
図8は、情報処理装置1における処理の流れを示すフローチャートである。図8に示す処理は、情報処理装置1が動作データを取得する時点から開始している。
動作データ取得部131は、外部装置から動作データを取得する(S01)。抽出データ生成部132は、外部装置からテキストデータを取得する(S02)。抽出データ生成部132は、取得したテキストデータに基づいて抽出データを生成する(S03)。
保守データ取得部133は、外部装置から保守データを取得する(S04)。出力部134は、動作データ、抽出データ及び保守データ学習済みモデルに入力することで出力された障害予測情報を表示する画面を情報端末2に表示させる(S05)。出力部134は、障害予測情報を表示する画面を情報端末2における、定常的に監視業務に用いられる各種統計情報の確認画面に合わせ、必要に応じて表示させる。そして、情報処理装置1は、処理を終了する。情報処理装置1は、周期的に上記の処理を繰り返し、運用の監視を継続してもよい。
[情報処理装置1による効果]
情報処理装置1がこのように構成されることで、装置に関する情報のみでは検出できない障害の発生を予測できるという効果を奏する。
なお、本発明により、国連が主導する持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」に貢献することが可能となる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
1 情報処理装置
2 情報端末
11 通信部
12 記憶部
13 制御部
131 動作データ取得部
132 抽出データ生成部
133 保守データ取得部
134 出力部
135 処理状況取得部

Claims (9)

  1. 所定のアプリケーションサービスを提供するためのネットワーク設備群を構成する機器の動作状況を示す動作データを取得する動作データ取得部と、
    前記ネットワーク設備群の外部で生成されたテキストデータに含まれる前記所定のアプリケーションサービスの利用状況に関する情報である抽出データを抽出する抽出データ生成部と、
    前記ネットワーク設備群を保守するためのシステムから入力されたデータである保守データを取得する保守データ取得部と、
    学習用の動作データである学習用動作データ、学習用の抽出データである学習用抽出データ及び学習用の保守データである学習用保守データを入力として、前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の有無を示す障害予測情報であって、学習用の障害予測情報である学習用障害予測情報を出力するよう学習した学習済みモデルを記憶する記憶部と、
    前記動作データ取得部が取得した前記動作データと、前記抽出データ生成部が生成した前記抽出データと、前記保守データ取得部が取得した前記保守データと、を前記学習済みモデルに入力することで障害の発生有無を示す情報を出力する出力部と、
    を有する情報処理装置。
  2. 前記ネットワーク設備群は、前記動作データを取得可能な第1のネットワーク設備群と、前記動作データを取得することができないネットワーク設備群である第2のネットワーク設備群と、を含み、
    前記動作データ取得部は、前記第1のネットワーク設備群を構成する機器の動作状況を示す前記動作データを取得し、
    前記出力部は、前記動作データ取得部が取得した前記動作データと、前記抽出データ生成部が生成した前記抽出データと、を前記学習済みモデルに入力することで前記第2のネットワーク設備群における障害の発生有無を示す情報を出力する、
    請求項1に記載の情報処理装置。
  3. 前記学習用障害予測情報は、前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の内容をさらに含み、
    前記出力部は、前記学習済みモデルが出力した障害の内容に対応するための手順をさらに出力する、
    請求項1又は2に記載の情報処理装置。
  4. 前記保守データは、前記所定のアプリケーションサービスの利用者から受付けた、前記所定のアプリケーションサービスに関する不具合に関する申告内容を示し、
    前記出力部は、所定の閾値以上、前記保守データを取得した場合に、障害が発生していることを出力する、
    請求項1又は2に記載の情報処理装置。
  5. 前記抽出データは、前記所定のアプリケーションサービスの品質に関する語句を含むテキストから抽出されたデータであり、
    前記出力部は、前記抽出データに含まれる前記所定のアプリケーションサービスの品質が悪いことを示す語句に基づいて、障害が発生していることを出力する、
    請求項1又は2に記載の情報処理装置。
  6. 前記所定のアプリケーションサービスの処理状況を定量的に示す処理状況情報を取得する処理状況取得部をさらに有し、
    前記出力部は、前記処理状況情報が示す処理状況が、過去の処理状況の統計値と比較して乖離がある場合に、障害が発生していることを出力する、
    請求項1又は2に記載の情報処理装置。
  7. 前記所定のアプリケーションサービスの処理状況を定量的に示す処理状況情報を時系列に取得する処理状況取得部をさらに有し、
    前記記憶部は、前記処理状況情報であって、過去に取得した処理状況情報である学習用処理状況情報を教師データとして学習した学習済みモデルであって、処理状況情報を入力として、入力された学習用処理状況情報が示す過去の処理状況から予測される将来の時点における処理状況の予測値を出力するよう学習した学習済みモデルである処理状況学習モデルを記憶し、
    前記出力部は、前記処理状況情報が示す処理状況が、前記処理状況情報が示す過去の処理状況に基づいて前記処理状況学習モデルが出力した予測値と比較して乖離がある場合に、障害が発生していることを出力する、
    請求項1又は2に記載の情報処理装置。
  8. コンピュータが実行する、
    所定のアプリケーションサービスを提供するためのネットワーク設備群を構成する機器の動作状況を示す動作データを取得する動作データ取得ステップと、
    前記ネットワーク設備群の外部で生成されたテキストデータに含まれる前記所定のアプリケーションサービスの利用状況に関する情報である抽出データを抽出する抽出ステップと、
    前記ネットワーク設備群を保守するためのシステムから入力されたデータである保守データを取得する保守データステップと、
    記憶部が記憶する、学習用の動作データである学習用動作データ、学習用の抽出データである学習用抽出データ、学習用の保守データである学習用保守データ並びに前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の有無を示す障害予測情報であって、学習用の障害予測情報である学習用障害予測情報と、を教師データとして学習した学習済みモデルに、取得された前記動作データと、生成された前記抽出データと、取得された前記保守データと、を入力することで障害の発生有無を示す情報を出力する出力ステップと、
    を有する情報処理方法。
  9. コンピュータに、
    所定のアプリケーションサービスを提供するためのネットワーク設備群を構成する機器の動作状況を示す動作データを取得する動作データ取得ステップと、
    前記ネットワーク設備群の外部で生成されたテキストデータに含まれる前記所定のアプリケーションサービスの利用状況に関する情報である抽出データを抽出する抽出ステップと、
    前記ネットワーク設備群を保守するためのシステムから入力されたデータである保守データを取得する保守データステップと、
    記憶部が記憶する、学習用の動作データである学習用動作データ、学習用の抽出データである学習用抽出データ、学習用の保守データである学習用保守データ並びに前記所定のアプリケーションサービス若しくは前記ネットワーク設備群における障害の有無を示す障害予測情報であって、学習用の障害予測情報である学習用障害予測情報と、を教師データとして学習した学習済みモデルに、取得された前記動作データと、生成された前記抽出データと、取得された前記保守データと、を入力することで障害の発生有無を示す情報を出力する出力ステップと、
    を実行させるプログラム。
JP2023120623A 2023-07-25 2023-07-25 情報処理装置、情報処理方法及びプログラム Active JP7425918B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023120623A JP7425918B1 (ja) 2023-07-25 2023-07-25 情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2023120623A JP7425918B1 (ja) 2023-07-25 2023-07-25 情報処理装置、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
JP7425918B1 true JP7425918B1 (ja) 2024-01-31

Family

ID=89718063

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023120623A Active JP7425918B1 (ja) 2023-07-25 2023-07-25 情報処理装置、情報処理方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7425918B1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015028700A (ja) 2013-07-30 2015-02-12 Kddi株式会社 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015028700A (ja) 2013-07-30 2015-02-12 Kddi株式会社 障害検知装置、障害検知方法、障害検知プログラム及び記録媒体

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
大木 基至 外3名,「ユーザ行動に基づくモバイルネットワーク故障検知と予測」,一般社団法人 人工知能学会 第32回全国大会論文集DVD [DVD-ROM],一般社団法人 人工知能学会,2018年06月05日,セッション番号1D1-05,pp.1-4
石橋 圭介 外2名,「機械学習・データ分析によるネットワーク設計・運用高度化」,NTT技術ジャーナル,一般社団法人電気通信協会,2015年12月01日,第27巻, 第12号,pp.29-33

Similar Documents

Publication Publication Date Title
US10387899B2 (en) Systems and methods for monitoring and analyzing computer and network activity
JP6643211B2 (ja) 異常検知システム及び異常検知方法
Chen et al. How incidental are the incidents? characterizing and prioritizing incidents for large-scale online service systems
US10067815B2 (en) Probabilistic prediction of software failure
US8314694B2 (en) System and method for suppressing redundant alarms
US20110066908A1 (en) Similarity detection for error reports
US10592328B1 (en) Using cluster processing to identify sets of similarly failing hosts
US9860109B2 (en) Automatic alert generation
CN112308126A (zh) 故障识别模型训练方法、故障识别方法、装置及电子设备
CN112152823B (zh) 网站运行错误监控方法、装置及计算机存储介质
US11640459B2 (en) Abnormality detection device
WO2022001125A1 (zh) 一种存储系统的存储故障预测方法、系统及装置
US11567824B2 (en) Restricting use of selected input in recovery from system failures
CN115039116A (zh) 用于主动客户关系分析的方法和系统
CN114169604A (zh) 性能指标的异常检测方法、异常检测装置、电子设备和存储介质
CN116755992B (zh) 一种基于OpenStack云计算的日志分析方法及系统
JP7425918B1 (ja) 情報処理装置、情報処理方法及びプログラム
CN110855489B (zh) 故障处理方法、装置和故障处理装置
JP2019049802A (ja) 障害解析支援装置、インシデント管理システム、障害解析支援方法及びプログラム
JP7082285B2 (ja) 監視システム、監視方法および監視プログラム
CN115543665A (zh) 一种内存可靠性评估方法、装置及存储介质
Huang et al. Achieving scalable automated diagnosis of distributed systems performance problems
CN111652379A (zh) 模型管理方法、装置、电子设备及存储介质
US20230370350A1 (en) System and method for outage prediction
CN117240700B (zh) 一种基于贝叶斯分类器的网络故障诊断方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231006

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20231016

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20231031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240119

R150 Certificate of patent or registration of utility model

Ref document number: 7425918

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150