JP7466878B2

JP7466878B2 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: JP7466878B2
Application number: JP2022097225A
Authority: JP
Inventors: 達明木村; 慶太郎甲斐田; 啓嗣山内
Original assignee: Osaka University NUC; SoftBank Corp
Current assignee: Osaka University NUC; SoftBank Corp
Priority date: 2022-06-16
Filing date: 2022-06-16
Publication date: 2024-04-15
Anticipated expiration: 2042-06-16
Also published as: JP2023183621A

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。

現在、高品質な動画配信サービス、及び、車両及びＩｏＴ（Internet of Things）による通信等が普及していることで、通信事業者（キャリア）が構築する通信ネットワークは大規模かつ複雑化している。特許文献１には、通信事業者が管理するＩＰ中継網で利用する通信装置及びその通信経路の監視技術が開示されている。

特開２００５－１８４６３８号公報

通信ネットワークを構成する通信装置群はマルチベンダ化されており、更に、仮想化技術の進展による通信装置のソフトウェア化や多重化が進んでいる。このように、通信ネットワークが更に大規模かつ複雑化することで、故障対応などのネットワーク監視及び管理業務が非常に困難になってきている。したがって、通信装置から出力されるコマンドログの分析を効率化することが、ネットワーク監視及び管理業務の効率化を図るために重要であると考えられる。

そこで、本発明は、通信装置から得られるコマンドログの分析を効率化することを可能とする技術を提供することを目的とする。

本発明の一態様に係る情報処理装置は、通信装置から出力される、コマンドの実行結果を示す複数のコマンドログを取得する取得部と、複数のコマンドログに基づいて共通部分及びパラメータ部分を示すテンプレートを生成する生成部であって、複数のコマンドログの各々を複数のブロックに分割し、複数のブロックをクラスタリングすることで、複数のブロッククラスタに分類し、同一のブロッククラスタに分類される複数のブロックに含まれる単語列のうち共通部分及びパラメータ部分を示すテンプレートを、ブロッククラスタごとに生成する、生成部と、を有する。

本発明の他の態様に係る情報処理装置は、複数のコマンドログの各々の特徴ベクトルと通信装置の動作状態を示す情報とを含む教師データを用いてモデルを学習させることで、特徴ベクトルを入力すると通信装置の動作状態を出力する学習モデルを生成する学習処理部、を有する。

本発明によれば、通信装置から得られるコマンドログの分析を効率化することを可能にする技術を提供することができる。

図１は、本実施形態に係る監視システムのシステム構成例を示す図である。図２は、コマンドログの一例を示す図である。図３は、監視装置がコマンドログから特徴ベクトルを生成する処理の概要を示す図である。図４は、監視装置のハードウェア構成例を示す図である。図５は、監視装置の機能ブロック構成例を示す図である。図６は、監視装置が特徴ベクトルを生成する処理の一例を示すフローチャートである。図７は、Pingのコマンドログの一例を示す図である。図８は、ブロック分割した後のPingのコマンドログの一例を示す図である。図８は、ブロッククラスタの一例を示す図である。図１０は、Pingコマンドのテンプレートを抽出する処理手順の一例を説明するための図である。図１１は、コマンドＸのテンプレートを抽出する処理手順の他の例を説明するための図である。図１２は、特徴ベクトルの構成例その１を説明するための図である。図１３は、特徴ベクトルの構成例その２を説明するための図である。図１４は、特徴ベクトルの具体例その１を示す図である。図１５は、特徴ベクトルの具体例その２を示す図である。図１６は、特徴ベクトルの具体例その３を示す図である。図１７は、通信装置の動作状態を推定する処理手順の一例を示すフローチャートである。

添付図面を参照して、本発明の実施形態について説明する。なお、各図において、同一の符号を付したものは、同一又は同様の構成を有する。

＜システム構成＞
図１は、本実施形態に係る監視システム１のシステム構成例を示す図である。監視システム１は、監視装置１０（情報処理装置）と、端末２０と、ネットワーク３０とを含む。

ネットワーク３０は、複数の通信装置４０により構成され、ユーザネットワークやインターネットなどと接続されていてもよい。通信装置４０は、例えばルータ又はスイッチ等であり、各種データのルーティング等を行う。通信装置４０は、冗長構成を有しており、片系が故障してもサービスを継続可能なように構成されていてもよい。

監視装置１０は、複数の通信装置４０の動作状態を監視する装置である。監視装置１０は、通信装置４０から、装置コマンドの実行結果であるコマンドログを取得し、取得したコマンドログを分析することで、コマンドログの特徴量を生成する。また、監視装置１０は、生成したコマンドログの特徴量に基づいて、通信装置４０の動作状態を推定する。コマンドログは、装置コマンドログと呼ばれてもよい。装置コマンドはどのようなコマンドであってもよいが、例えば、ping、traceroute、show interface、show onu uni-status、show service id、show LAG(Link Aggregation Group)などが挙げられる。装置コマンドは、コマンドと呼ばれてもよい。

端末２０は、オペレータ等が利用する端末であり、パーソナルコンピュータ（ＰＣ）、ノート型ＰＣ、スマートフォン、タブレット端末、携帯電話機など、通信機能を備えた端末であればあらゆる端末を用いることができる。端末２０は、監視装置１０と通信可能に接続され、監視装置１０が出力する各種の情報を表示する。

図２は、コマンドログの一例を示す図である。コマンドログＣ１０は、通信装置４０から出力される、pingコマンドのコマンドログの一例を示す。コマンドログＣ１１は、通信装置４０から出力される、show interfaceコマンドのコマンドログの一例を示す。コマンドログは、十数から数百行にわたる非構造なメッセージであり、メッセージの内容は装置コマンドごとに異なる。また、通信装置４０が実行可能な装置コマンドは多数存在し、更に、通信装置４０の種類及びベンダ等によっても利用可能な装置コマンドは異なる。また、同種の装置コマンドであっても、通信装置４０の種類またはベンダ、通信装置４０上で動作しているソフトウェアのバージョン、通信装置４０の設定等によって、メッセージの内容及び構造、項目等が異なる場合もある。したがって、通信装置４０の自動監視を実現するために、装置コマンドごとに分析ロジックを手作業で構築していくことは、非常に手間であり困難である。なお、以下の説明において、通信装置４０の種類、通信装置４０のベンダ、通信装置４０上で動作しているソフトウェアのバージョン、及び／又は、通信装置４０の動作設定等を、「通信装置情報」と言う。

ここで、コマンドログとして出力される文字列には規則性が存在する。つまり、コマンドログは、文字列の出力パターンが定義された１以上のテンプレートの組み合わせにより生成されたものとみなすことができる。そこで、本実施形態では、監視装置１０は、コマンドログを分析することでテンプレートを自動的に特定し、当該テンプレートを用いて、コマンドログの特徴量を示す特徴ベクトルを生成する。更に、本実施形態では、コマンドログの特徴ベクトルから通信装置４０の動作状態を推定可能な学習済モデルを予め生成しておき、監視装置１０は、監視対象の通信装置４０から得られたコマンドログから特徴ベクトルを生成して学習済モデルに入力することで、通信装置４０の動作状態を推定する。

図３は、監視装置１０がコマンドログから特徴ベクトルを生成する処理の概要を示す図である。図３は、コマンドＡを通信装置４０で実行することで得られる複数のコマンドログから、複数のコマンドログの各々について特徴ベクトルを生成する処理を示す。

まず、監視装置１０は、複数のコマンドログの各々を、所定条件に基づいて複数のブロックに分割する。続いて、監視装置１０は、複数のブロックを、似た単語が含まれるブロックにクラスタリングする。複数のブロックをクラスタリングすることで得られるブロックの集合を、「ブロッククラスタ」と呼ぶ。続いて、監視装置１０は、同一のブロッククラスタに属するブロックの間で共通に表れる単語列（以下、「共通部分」と言う。）及び共通部分以外の部分（以下、「パラメータ部分」と言う。）を特定することで、ブロッククラスタごとにテンプレートを生成する。続いて、監視装置１０は、ブロッククラスタごとのテンプレートを用いて、コマンドログからパラメータ部分に該当する単語を抽出し、抽出したパラメータ部分に該当する単語を用いて特徴ベクトルを生成する。

なお、本実施形態における「単語」は、１以上の文字又は数字から構成される文字又は文字列を意味することとしてもよい。すなわち、「5」及び「1111」といったように数字のみから構成される文字又は文字列、及び、「abc1111」といったように文字及び数字から構成される文字列も単語に含まれるものとしてもよい。

＜ハードウェア構成＞
図４は、監視装置１０のハードウェア構成例を示す図である。監視装置１０は、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphical Processing Unit）等のプロセッサ１１、メモリ、ＨＤＤ（Hard Disk Drive）及び／又はＳＳＤ（Solid State Drive）等の記憶装置１２、有線又は無線通信を行う通信ＩＦ（Interface）１３、入力操作を受け付ける入力デバイス１４、及び情報の出力を行う出力デバイス１５を有する。入力デバイス１４は、例えば、キーボード、タッチパネル、マウス及び／又はマイク等である。出力デバイス１５は、例えば、ディスプレイ、タッチパネル及び／又はスピーカ等である。

監視装置１０は、１又は複数の物理的なサーバ等から構成されていてもよいし、ハイパーバイザー（hypervisor）上で動作する仮想的なサーバを用いて構成されていてもよいし、クラウドサーバを用いて構成されていてもよい。

＜機能ブロック構成＞
図５は、監視装置１０の機能ブロック構成例を示す図である。監視装置１０は、記憶部１００と、取得部１０１と、生成部１０２と、学習処理部１０３と、推定部１０４とを含む。記憶部１００は、監視装置１０が備える記憶装置１２を用いて実現することができる。また、取得部１０１と、生成部１０２と、学習処理部１０３と、推定部１０４とは、監視装置１０のプロセッサ１１が、記憶装置１２に記憶されたプログラムを実行することにより実現することができる。また、当該プログラムは、記憶媒体に格納することができる。当該プログラムを格納した記憶媒体は、コンピュータ読み取り可能な非一時的な記憶媒体（Non-transitory computer readable medium）であってもよい。非一時的な記憶媒体は特に限定されないが、例えば、ＵＳＢメモリ又はＣＤ－ＲＯＭ等の記憶媒体であってもよい。

記憶部１００は、通信装置４０から収集したコマンドログを蓄積するコマンドログＤＢ（Data Base）１００ａと、コマンドログの特徴ベクトルを入力することで、通信装置４０の動作状態を出力するように学習された学習済モデル１００ｂと、各種の単語が格納される単語辞書ＤＢ１００ｃとを記憶する。

取得部１０１は、通信装置４０から出力される、コマンドの実行結果を示す複数のコマンドログ（第１のコマンドログ）を取得する。当該コマンドログ（第１のコマンドログ）は、テンプレート及び／又はモデルを学習させるための教師データを生成するために取得されたコマンドログであってもよい。

生成部１０２は、取得部１０１で得られた複数のコマンドログに基づいてテンプレートを生成する。より具体的には、生成部１０２は、複数のコマンドログの各々を複数のブロックに分割し、複数のブロックをクラスタリングすることで、複数のブロッククラスタに分類し、同一のブロッククラスタに分類される複数のブロックに含まれる単語列のうち共通部分及びパラメータ部分を示すテンプレートを、ブロッククラスタごとに生成する。

また、生成部１０２は、取得部１０１で得られた複数のコマンドログを分析することで、複数のコマンドログの各々の特徴ベクトルを生成する。より具体的には、生成部１０２は、複数のコマンドログの各々を複数のブロックに分割し、複数のブロックをクラスタリングすることで、複数のブロッククラスタに分類し、同一のブロッククラスタに分類される複数のブロックに含まれる単語列のうち共通部分及びパラメータ部分を示すテンプレートを、ブロッククラスタごとに生成し、複数のコマンドログの各々に対してブロッククラスタごとのテンプレートを適用することで、複数のコマンドログの各々に含まれる単語列の中から、テンプレートで示されるパラメータ部分に対応する１以上の単語を、コマンドログごとに抽出し、抽出したコマンドログごとの当該１以上の単語に基づいて、複数のコマンドログの各々の特徴ベクトルを生成する。

なお、通信装置４０は、属性の異なる複数の通信装置４０を含んでおり、生成部１０２は、属性の異なる複数の通信装置４０から出力される複数のコマンドログに基づいてテンプレートを生成する処理を、属性の異なる通信装置ごとに実行するようにしてもよい。つまり、属性Ａの複数の通信装置４０と、属性Ｂの複数の通信装置４０が存在する場合、属性Ａの複数の通信装置４０から出力される複数のコマンドログに基づいてテンプレートを生成する処理と、属性Ｂの複数の通信装置４０から出力される複数のコマンドログに基づいてテンプレートを生成する処理とを、別々に実行するようにしてもよい。同様に、生成部１０２は、属性の異なる複数の通信装置４０から出力される複数のコマンドログに基づいて特徴ベクトルを生成する処理を、属性の異なる通信装置ごとに実行するようにしてもよい。通信装置４０の属性については後述する。

また、取得部１０１は、通信装置４０から出力される、コマンドの実行結果を示す複数のコマンドログ（第２のコマンドログ）を取得する。当該コマンドログ（第２のコマンドログ）は、作成済みのテンプレート及び学習済モデルを用いて通信装置４０の動作状態を推定するために取得されたコマンドログであってもよい。

また、生成部は、取得部１０１で取得されるコマンドログ（第２のコマンドログ）の各々に対してブロッククラスタごとのテンプレートを適用することで、当該コマンドログに含まれる単語列の中から、テンプレートで示されるパラメータ部分に対応する１以上の単語（１以上の第２の単語）を抽出し、抽出した１以上の単語（第２の単語列）に基づいて、当該コマンドログ（第２のコマンドログ）の特徴ベクトルを生成するようにしてもよい。

学習処理部１０３は、複数のコマンドログ（第１のコマンドログ）の各々の特徴ベクトルと通信装置４０の動作状態とを含む教師データを用いてモデルを学習させることで、特徴ベクトルを入力すると通信装置４０の動作状態を出力する学習モデルを生成する。学習処理部１０３は、生成した学習モデルを定義するパラメータセットを、学習済モデル１００ｂに格納する。

推定部１０４は、生成部１０２で生成されたコマンドログ（第２のコマンドログ）の特徴ベクトルを、学習処理部１０３で学習された学習モデルに入力することで、通信装置４０の動作状態を推定する。

＜処理手順＞
（特徴ベクトルの生成）
図６は、監視装置１０が特徴ベクトルを生成する処理の一例を示すフローチャートである。以下で説明する処理手順は、装置コマンド毎に実行される。すなわち、pingコマンドのコマンドログと、show service idコマンドのコマンドログについて特徴ベクトルを生成する場合、監視装置１０は、pingコマンド及びshow service idコマンドについて、以下で説明する処理手順を別々に実行する。

通信装置４０は、通信装置情報に基づいて複数の属性に分けられてもよい。また、以下で説明する手順は、装置コマンド毎に加えて、通信装置４０の属性毎に実行されてよい。具体的には、例えば、ベンダＡ製の通信装置４０と、ベンダＢ製の通信装置４０のそれぞれにおいて、pingコマンドのコマンドログと、show service idコマンドのコマンドログについて特徴ベクトルを生成する場合、監視装置１０は、ベンダＡ製通信装置４０のpingコマンドと、ベンダA製通信装置４０のshow service idコマンド、ベンダＢ製通信装置４０のpingコマンドと、ベンダＢ製通信装置４０のshow service idコマンドについて、以下で説明する処理手順を別々に実行してよい。

なお、通信装置情報は、通信装置情報を記憶するデータベース（図示しない）に予め記憶されたものを参照してよい。また、通信装置情報は、SNMP（Simple Network Management Protocol）をはじめとする既知の通信プロトコルを用いて、通信装置４０から取得されてもよい。さらに、通信装置情報は、以下で説明する処理手順を用いて対応するコマンド（show version、show running-config等）のコマンドログから抽出され、取得されてもよい。上記の通信装置情報を取得する手段は一例であり、上記の例に限定されるものではない。

通信装置４０の属性は、通信装置情報を用いて定義可能であればどのように定義されてもよい。例えば、通信装置４０の属性は、通信装置４０の製造ベンダに基づいて定義されてよい。具体的には、例えば、ベンダＡの通信装置４０、ベンダＢの通信装置４０のように、製造ベンダが同一である通信装置４０は同一の属性であることとしてよい。また、例えば、通信装置４０の属性は、通信装置４０の製造ベンダ及び通信装置４０のソフトウェアバージョンに基づいて定義されてよい。具体的には例えば、ベンダＡかつソフトウェアバージョンが１．０である通信装置４０、ベンダＡかつソフトウェアバージョンが２．０である通信装置のように、製造ベンダが同一であり、かつソフトウェアバージョンも同一である通信装置４０は同一の属性であることとしてもよい。なお、上記の通信装置４０の属性を定義する通信装置情報は、一例であり、上記の例に限定されない。例えば、通信装置４０の型式または、通信装置４０の設定状況に基づいて定義されてもよい。

ステップＳ１０で、取得部１０１は、ネットワーク３０に存在する１以上の通信装置４０から、特徴ベクトルを生成する装置コマンドについての複数のコマンドログを取得する。なお、取得部１０１は、監視装置１０のコマンドログＤＢ１００ａに格納されているコマンドログのログデータの中から、特徴ベクトルを生成するために用いる複数のコマンドログを取得するようにしてもよい。例えば、pingコマンドのコマンドログについて特徴ベクトルを生成する場合、コマンドログＤＢ１００ａの中から、pingコマンドのコマンドログを複数取得するようにしてもよい。若しくは、取得部１０１は、通信装置４０にログインしてpingコマンドを投入することにより、通信装置４０から直接pingコマンドのコマンドログを取得するようにしてもよい。取得するコマンドログの数は２以上であれば特に限定されない。

ステップＳ１１で、生成部１０２は、ステップＳ１０で取得した複数のコマンドログについて、複数のコマンドログの各々を、所定条件に従って分割することで、複数のコマンドログを複数のブロックに分割する。「所定条件」は、例えば空白行であってもよい。すなわち、複数のコマンドログを所定条件に従って分割することは、複数のコマンドログを空白行で分割することであってもよい。なお、所定条件は、空白行に限られず、特定の文字列であってもよい。また、所定条件は、複数種類の条件のうち少なくとも２つ以上の組み合わせであってもよいし、複数の条件のうちいずれか１つであってもよい。具体的には、例えば、所定条件として空白行と、特定の文字列とが設定されている場合、生成部１０２は、空白行及び特定の文字列の両方でコマンドログを分割してよい。さらに、所定条件は、特定の文字列のパターンであってもよい。具体的には、例えば、所定条件として、「-」が５回以上連続する箇所などのように指定されてよい。以下、所定条件は空白行であるものとして説明する。

図７は、pingのコマンドログの一例を示す図である。図７には、コマンドログの例として、コマンドログ１（ping）、コマンドログ２（ping）、及び、コマンドログ３（ping）が図示されている。図７に示すように、pingコマンドには空白行が１つ存在しており、空白行よりも上側にはicmpパケットごとのラウンドトリップ時間が５つ記述され、空白行よりも下側には５つのicmpパケットについてラウンドトリップ時間の最小時間、平均時間、最大時間及び標準偏差（standard deviation）が記録されている。生成部１０２は、pingのコマンドログを、空白行で分割することで、コマンドログを２つのブロックに分割する。なお、空白行が２つ以上存在する装置コマンドの場合、生成部１０２は、コマンドログを３つ以上のブロックに分割することになる。

図８は、ブロック分割した後のpingのコマンドログの一例を示す図である。図７におけるコマンドログ１は、図８のブロック１－１及びブロック１－２に対応する。また、図７におけるコマンドログ２は、図８のブロック２－１及びブロック２－２に対応する。また、図７におけるコマンドログ３は、図８のブロック３－１及びブロック３－２に対応する。図６に戻り説明を続ける。

ステップＳ１２で、生成部１０２は、ステップＳ１１で複数のコマンドログを分割することで生成された複数のブロックをクラスタリングすることで、複数のブロックを、同一のテンプレートを有すると考えられるブロッククラスタごとに分類する。クラスタリング処理については後述する。

ここで、ブロッククラスタＣ_iをブロックの集合として定義する。なお、ｉは１以上の正の整数である。また、Ｃ_iに含まれるブロックに含まれる単語リストをＬ_iと定義する。なお、単語リストＬ_iは、空白（スペース）を区切り文字として抽出したブロック内の全単語を、重複を許さずに格納したリストである。また、単語リストＬ_iにおける単語数をＮ_iと定義する。同様に、ブロッククラスタＣ_jをブロックの集合として定義する。なお、ｊは１以上の正の整数である。また、Ｃ_jに含まれるブロックに含まれる単語リストをＬ_jと定義する。なお、単語リストＬ_jは、空白を区切り文字として抽出したブロック内の全単語を、重複を許さずに格納したリストである。また、単語リストＬ_jにおける単語数をＮ_jと定義する。この場合において、異なるブロッククラスタＣ_i及びＣ_jに対する類似度スコアＳ_ijを、以下の数式１の通り定義する。

ここで、len(X)は、Ｘに含まれる単語数を表す。すなわち、数式１における分子は、単語リストＬ_i及びＬ_jで共通に存在する単語の単語数を意味する。また、max(X)は、Ｘのうち値が大きい方の値を表す。すなわち、数式１における分母は、単語数Ｎ_i及びＮ_jのうち大きい方の値を意味する。

生成部１０２は、ステップＳ１１の処理手順で生成された各々のブロックを１つのブロッククラスタとみなし、数式１を用いて、複数のブロッククラスタにおける全てのペアについて、類似度スコアを算出する。例えば、４つのブロッククラスタ１～４が存在する場合、生成部１０２は、ブロッククラスタ１及びブロッククラスタ２の類似度スコア、ブロッククラスタ１及びブロッククラスタ３の類似度スコア、ブロッククラスタ１及びブロッククラスタ４の類似度スコア、ブロッククラスタ２及びブロッククラスタ３の類似度スコア、ブロッククラスタ２及びブロッククラスタ４の類似度スコア、ブロッククラスタ３及びブロッククラスタ４の類似度スコアを算出する。

続いて、生成部１０２は、ブロッククラスタの全てのペアのうち、類似度スコアが閾値Ｔを超えており、かつ、最も類似度スコアが高いブロッククラスタのペアを、以下に示す数式２、数式３及び数式４に従って併合する。なお、生成部１０２は、最も類似度スコアが高いブロッククラスタのペアが複数存在する場合、併合する１つのペアを、最も類似度スコアが高い複数のペアの中からランダムに選択する。

ここで、Ｃ_i′は、Ｃ_i及びＣ_jを併合した後のブロッククラスタを示す。

ここで、Ｌ_i′は、単語リストＬ_i及びＬ_jの両方に含まれる単語から構成される単語リストを示す。

ここで、Ｎ_i′は、単語リストＬ_iにおけるユニークな単語数Ｎ_iと単語リストＬ_iにおけるユニークな単語数Ｎ_jとの平均値を意味する。

ブロッククラスタのペアを併合した後、生成部１０２は、併合後のブロッククラスタを含む複数のブロッククラスタにおける全てのペアについて、類似度スコアを算出する。続いて、生成部１０２は、複数のブロッククラスタにおける全てのペアのうち、類似度スコアが閾値Ｔを超えており、かつ、最も類似度スコアが高いブロッククラスタのペアを併合する。もし、最も類似度スコアが高いブロッククラスタのペアが複数存在する場合、生成部１０２は、併合する１つのペアを、当該複数のペアの中からランダムに選択する。このように、生成部１０２は、ブロッククラスタにおける全てのペアの類似度スコアを算出して併合する処理を、類似度スコアが閾値Ｔを超えているペアが存在しなくなるまで繰り返す。

続いて、図８を参照しながら、クラスタリングを行う処理の具体例を説明する。まず、生成部１０２は、各ブロックをブロッククラスタとみなし、ブロッククラスタ１－１～ブロッククラスタ３－２の全てのペア（すなわち、１５個のペア）について、類似度スコアを算出する。ここで、ブロッククラスタ（１－１）及びブロッククラスタ（１－２）の間の類似度スコアＳを算出する際の例を説明する。まず、ブロッククラスタ（１－１）の単語リストＬは、「Ping」、「56」、「data」、「byte」、「64byte」、「from」、「icmp_seq=1」、「ttl=225」、「time=1.41ms」、「time=1.66ms」、「time=1.54ms」、「time=1.61ms」、「time=1.65ms」であり、ブロッククラスタ（１－１）の単語数Ｎは１３である。

また、ブロッククラスタ（１－２）における単語リストＬは、「----」、「PING」、「Statistics」、「5」、「Packets」、「transmitted」、「packets」、「received」、「0.00%」、「packet」、「loss」、「round-trip」、「min」、「=」、「1.41ms」、「avg」、「1.57ms」、「max」、「1.66ms」、「stddev」、「0.091ms」であり、ブロッククラスタ（１－２）における単語数Ｎは２１である。なお、生成部１０２は、「Ping」及び「PING」、「Packets」及び「packets」のように相違点が大文字及び小文字のみである単語を、異なる単語として認識するようにしてもよいし、同一の単語として認識するようにしてもよい。ここでは、異なる単語として認識するものとして説明する。

以上より、ブロッククラスタ（１－１）の単語リスト及びブロッククラスタ（１－２）の単語リストについて、共通に存在する単語の単語数Ｎは、ゼロである。したがって、ブロッククラスタ（１－１）及びブロッククラスタ（１－２）の類似度スコアＳはゼロになる。

同様に、生成部１０２は、ブロッククラスタ（１－１）及びブロッククラスタ（２－１）の間の類似度スコアＳを算出する際の例を説明する。ブロッククラスタ（２－１）の単語リストＬは、「Ping」、「56」、「data」、「byte」、「64byte」、「from」、「icmp_seq=1」、「ttl=225」、「time=13.3ms」、「time=13.4ms」であり、ブロッククラスタ（２－１）の単語数Ｎは１０である。

ブロッククラスタ（１－１）の単語リストＬ及びブロッククラスタ（２－１）の単語リストＬについて、共通に存在する単語の単語数Ｎは８である。また、ブロッククラスタ（１－１）の単語数及びブロッククラスタ（２－１）の単語数Ｎのうち大きい方の数は１３である。したがって、ブロッククラスタ（１－１）及びブロッククラスタ（２－１）の間の類似度スコアＳは、８／１３（約０．６２）になる。

このように、生成部１０２は、ブロッククラスタのペアごとに類似度スコアを算出す処理を繰り返すことで、ブロッククラスタ１－１～ブロッククラスタ３－２における全てのペアについて、類似度スコアを算出する。

次に、生成部１０２は、全てのペアの類似度スコアのうち、閾値Ｔを超えており、かつ、類似度スコアが最も高いブロッククラスタのペアを併合する。ここではブロッククラスタ（１－１）及びブロッククラスタ（２－１）を併合するものと仮定する。

生成部１０２は、ブロッククラスタ（１－１）及びブロッククラスタ（２－１）を併合することで新たなブロッククラスタ（１－１、２－１）を生成する。併合後のブロッククラスタ（１－１、２－１）の単語リストＬは、数式３に従い、「Ping」、「56」、「data」、「byte」、「64byte」、「from」、「icmp_seq=1」、「ttl=225」であり、併合後のブロッククラスタ（１－１、２－１）の単語数Ｎは、数式４に従って、（１３＋１０）÷２＝１１．５になる。

続いて、生成部１０２は、ブロッククラスタ（１－１、２－１）、ブロッククラスタ（１－２）、ブロッククラスタ（２－２）、ブロッククラスタ（３－１）及びブロッククラスタ（３－２）の５つのブロッククラスタにおける全てのペア（すなわち、１０個のペア）について、類似度スコアを算出し、全てのペアの類似度スコアのうち、閾値Ｔを超えており、かつ、類似度スコアが最も高いブロッククラスタのペアを併合する。

生成部１０２は、ブロッククラスタにおける全てのペアの類似度スコアを算出して併合する処理を繰り返し、ブロッククラスタ（１－１、２－１、３－１）及びブロッククラスタ（１－２、２－２、３－２）の２つのブロッククラスタが生成されたものとする。

続いて、生成部１０２は、ブロッククラスタ（１－１、２－１、３－１）及びブロッククラスタ（１－２、２－２、３－２）の間の類似度スコアＳを計算する。ここでは、当該類似度スコアＳは閾値Ｔを超えなかったものと仮定する。この状態において、更に組み合わせ可能なブロッククラスタは存在しないことから、生成部１０２は、クラスタリング処理を終了する。

これにより、生成部１０２は、図９に示すように、ブロック１－１～ブロック３－２の６つのブロックを、ブロック１－１、ブロック２－１及びブロック３－１が属するブロッククラスタ１及びブロック１－２、ブロック２－２及びブロック３－２が属するブロッククラスタ２の２つのブロッククラスタに分類することになる。図６に戻り説明を続ける。

ステップＳ１３で、生成部１０２は、ステップＳ１２の処理手順で分類された各ブロッククラスタについて、同一のブロッククラスタに属する全てのブロックに対して、シーケンスアライメントを適用することで、各ブロッククラスタに対応するテンプレートを抽出する。ここで、シーケンスアライメントとは、複数の系列間における類似した部分列を特定する手法である。シーケンスアライメントを実現するアルゴリズムとしては、例えば、Needleman-Wunschアルゴリズムが知られている。Needleman-Wunschアルゴリズムを利用することで、２つのテキストデータの各々に含まれる単語列のうち、共通部分（マッチ）及び非共通部分（ミスマッチ又はギャップのいずれか）を抽出することができる。

Needleman-Wunschアルゴリズムは、２つの異なる単語列に、ギャップと呼ばれる特殊文字を挿入しながら、単語列間の類似度を最大化することで、共通部分及び非共通部分を抽出する手法である。マッチとは、２つの単語列を先頭から数えて同一の位置に存在する単語が一致していることを意味する。ミスマッチとは、２つの単語列を先頭から数えて同一の位置に存在する単語が一致していないことを意味する。また、ギャップとは、２つの単語列を先頭から数えて同一の位置において、２つの単語例のいずれか一方に特殊文字（ギャップ）が存在することを意味する。

例えば、特殊文字（ギャップ）を挿入して類似度を最大化した後の２つの単語列が、「5 packets transmitted. 5 packets bounced. 0 packets received.」及び「5 packets transmitted. GAP GAP GAP 5 packets received.」であると仮定する。この場合、最初の３つの単語（「5」、「packets」、「transmitted」）は２つの単語列で同一であるためマッチと判定される。次の３つの単語は、一方の単語列が特殊文字（GAP）であるためギャップと判定される。次の１つの単語（一方は「0」で他方は「5」）は２つの単語列で同一ではないためミスマッチと判定される。残りの２つの単語（「packets」、「transmitted」）は、２つの単語列で同一であるためマッチと判定される。

そこで、生成部１０２は、同一のブロッククラスタに属する２つのブロックに含まれる単語列について、Needleman-Wunschアルゴリズムを利用することで共通部分と非共通部分（ミスマッチ又はギャップのいずれか）に分類する。また、生成部１０２は、非共通部分に分類された単語列を、数値のみから構成される「数値パラメータ」と、数値を含まない文字のみからなる「単語パラメータ」と、数値及び文字の両方を含む「その他パラメータ」とに分類する。更に、生成部１０２は、共通部分に該当する単語と数値パラメータを示す符号と単語パラメータを示す符号とその他パラメータを示す符号とを並べることで、２つのブロックに対応するテンプレートを生成する。

同一のブロッククラスタに３つ以上のブロックが含まれる場合、生成部１０２は、総当たりでテンプレートを生成する。また、生成部１０２は、全てのブロックの組み合わせにおいて共通部分として分類された部分のみを、ブロッククラスタに対応するテンプレートの共通部分とし、それ以外の部分については数値パラメータ、単語パラメータ又はその他パラメータのいずれかに分類する。なお、数値パラメータは、数字のみで表現されるパラメータ（例えば、50や1111など）を意味し、単語パラメータは、文字列のみで表現されるパラメータ（例えば、pingやpacketなど）を意味し、その他パラメータは、数字及び文字列の組み合わせで表現されるパラメータ（例えば、TunGrp04-0035など）を意味する。

例えば、生成部１０２は、全てのブロックの組み合わせのうち、少なくとも一部のブロックの組み合わせにおいて非共通部分に分類された部分（すなわち、全てのブロックの組み合わせにおいて非共通部分に分類された部分、若しくは、一部のブロックの組み合わせにおいて共通部分に分類され、かつ、その他のブロックの組み合わせにおいて非共通部分に分類された部分を意味しており、以下同様）が、全てのブロックの組み合わせにおいて数値のみで構成される場合、当該部分を数値パラメータに分類するようにしてもよい。

また、生成部１０２は、全てのブロックの組み合わせのうち、少なくとも一部のブロックの組み合わせにおいて非共通部分に分類された部分が、全てのブロックの組み合わせにおいて単語のみで構成される場合、当該部分を単語パラメータに分類するようにしてもよい。

また、生成部１０２は、全てのブロックの組み合わせのうち、少なくとも一部のブロックの組み合わせにおいて非共通部分に分類された部分が、一部のブロックの組み合わせにおいて単語で構成され、かつ、その他のブロックの組み合わせにおいて非共通部分に分類された部分が数字で構成される場合、当該部分を単語パラメータに分類するようにしてもよい。

また、生成部１０２は、全てのブロックの組み合わせのうち、少なくとも一部のブロックの組み合わせにおいて非共通部分に分類された部分が、一部のブロックの組み合わせにおいて単語及び数字で構成される場合、当該部分をその他パラメータに分類するようにしてもよい。

図１０は、pingコマンドのテンプレートを抽出する処理手順の一例を説明するための図である。図１０のブロッククラスタ１及びブロッククラスタ２は、それぞれ、図９に示すブロッククラスタ１及びブロッククラスタ２に対応する。なお、生成部１０２は、コマンドログにおいて、空白又はコロンで区切られた範囲の文字を１つの単語とみなすようにしてもよい。また、コロンやイコールなどの符号そのものについても、１つの単語とみなすようにしてもよい。

まず、生成部１０２は、ブロッククラスタ１のテンプレートを抽出する。生成部１０２は、ブロック１－１及びブロック２－１に対し、Needleman-Wunschアルゴリズムを利用することで、共通部分と数値パラメータと単語パラメータとその他パラメータとに分類する。例えば、「Ping」、「56」、「data」、「byte」、「64byte」、「from」、「icmp_seq」、「=」、「1」、「ttl」、「=」、「225」、「time」、「=」、「ms.」等が存在する部分が共通部分として分類され、「1.41」及び「13.3」等が存在する部分が数値パラメータとして分類される。

続いて、生成部１０２は、ブロック２－１及びブロック３－１に対し、Needleman-Wunschアルゴリズムを利用することで、共通部分と数値パラメータと単語パラメータとその他パラメータとに分類する。例えば、「Ping」、「56」、「data」、「byte」、「64byte」、「from」、「icmp_seq」、「=」、「1」、「ttl」、「=」、「225」、「time」、「=」、「ms.」等が存在する部分が共通部分として分類され、「13.3」及び「3.8」等が存在する部分が数値パラメータとして分類される。

続いて、生成部１０２は、ブロック１－１及びブロック３－１に対し、Needleman-Wunschアルゴリズムを利用することで、共通部分と数値パラメータと単語パラメータとその他パラメータとに分類する。例えば、「Ping」、「56」、「data」、「byte」、「64byte」、「from」、「icmp_seq」、「=」、「1」、「ttl」、「=」、「225」、「time」、「=」、「ms.」等が存在する部分が共通部分として分類され、「1.41」及び「3.8」等が存在する部分が数値パラメータとして分類される。

生成部１０２は、ブロック１－１及びブロック２－１の組み合わせ、ブロック２－１及びブロック３－１の組み合わせ、ブロック１－１及びブロック３－１の組み合わせの全てにおいて共通部分として分類された部分、すなわち、「Ping」、「56」、「data」、「byte」、「64byte」、「from」、「icmp_seq」、「=」、「1」、「ttl」、「=」、「225」、「time」、「=」、「ms.」等が存在する部分を、ブロッククラスタ１の共通部分として分類する。また、生成部１０２は、ブロック１－１及びブロック２－１の組み合わせ、ブロック２－１及びブロック３－１の組み合わせ、ブロック１－１及びブロック３－１の組み合わせの全てにおいて非共通部分として分類され、かつ、数字のみで構成される部分、すなわち、「1.41」、「13.3」及び「3.8」が存在する部分、並びに、「1.66」、「13.3」及び「4.1」が存在する部分については、数値パラメータとして分類する。

続いて、生成部１０２は、共通部分として分類した単語、数値パラメータとして分類した部分を並べることで、ブロッククラスタ１のテンプレートを生成する。生成されたブロッククラスタ１のテンプレートを、図１０のＴＢ１に示す。なお、図１０及び以下に示す図において、「***」は数値パラメータに該当する部分を意味し、「###」は単語パラメータに該当する部分を意味し、「@@@」はその他パラメータに該当する部分を意味する。

生成部１０２は、同様の処理手順で、ブロッククラスタ２のテンプレートを生成する。生成されたブロッククラスタ２のテンプレートを、図１０のＴＢ２に示す。

図１１は、コマンドＸのテンプレートを抽出する処理手順の他の例を説明するための図である。図１１の例では、「lag-109」が存在する部分はブロック２及びブロック３で共通であるが、ブロック１では「lag-106」である。従って、生成部１０２は、テンプレートにおいて、「lag-106」及び「lag-109」の部分をその他パラメータに分類する。また、「quiq」の部分は、ブロック１及びブロック２に存在するが、ブロック３には存在しない（すなわち、ブロック３ではギャップに相当する）。従って、生成部１０２は、テンプレートにおいて、「quiq」の部分を単語パラメータに分類する。また、「Admin State:」の後の部分は、ブロック１では「Up」であるが、ブロック２及びブロック３では「Down」である。従って、生成部１０２は、テンプレートにおいて、「Admin State:」の後の「Up」又は「Down」の部分を単語パラメータに分類する。また、「OpenState:」の後の部分は、ブロック１では「Down」であるが、ブロック２及びブロック３では「Up」である。従って、生成部１０２は、テンプレートにおいて、「OpenState:」の後の「Down」又は「Up」の部分を単語パラメータに分類する。生成されたコマンドＸのブロッククラスタのテンプレートを図１１の下段に示す。図６に戻り説明を続ける。

ステップＳ１４で、生成部１０２は、テンプレートを用いて、コマンドログの特徴ベクトルを生成する。本実施形態では、生成部１０２は、コマンドログを構成する単語列から、テンプレートにおける数値パラメータ及び単語パラメータに該当する部分の数値又は文字列を抽出し、抽出した数値又は文字列から生成される値を並べることで、コマンドログの特徴ベクトルを生成する。

ここで、特徴ベクトルを生成するコマンドログのうち、テンプレートの数値パラメータに該当する部分の数値については、コマンドログの値をそのまま特徴ベクトルの要素にしてもよい。例えば、コマンドログのうちテンプレートの数値パラメータに該当する部分に1.41の数値が存在する場合、1.41をそのまま特徴ベクトルの要素にしてもよい。

若しくは、生成部１０２は、当該コマンドログの値を、テンプレート生成に用いた複数のコマンドログにおける、テンプレートの数値パラメータに該当する部分の数値の平均値と標準偏差を用いて標準化した値を、特徴ベクトルの要素にしてもよい。例えば、特徴ベクトルを生成する対象のコマンドログのうちテンプレートの１番目の数値パラメータに該当する部分に「1.41」の数値が存在し、かつ、当該テンプレート生成に用いた３つのコマンドログにおいて当該テンプレートの１番目の数値パラメータに該当する部分の数値は、「1.41」、「13.3」及び「3.8」であったとする。「1.41」、「13.3」及び「3.8」の平均値は6.17であり、標準偏差は5.14である。また、Ｘを標準化した値は、（Ｘ－平均値）÷標準偏差で計算することができる。従って、生成部１０２は、「1.41」を標準化した値である「-0.93」を特徴ベクトルの要素にしてもよい。すなわち、生成部１０２は、特徴ベクトルを生成する対象のコマンドログにテンプレートを適用することで抽出した１以上の単語のうち、数値パラメータに対応する単語について、該単語で示される数値を標準化した後の数値に基づいて、特徴ベクトルを生成するようにしてもよい。これにより、コマンドログの値の範囲が異なる場合であっても、各値を平等に特徴量として扱うことが可能になる。

また、単語パラメータについては、テンプレート生成に用いた複数のコマンドログにおける、テンプレートの単語パラメータに該当する部分の単語のうち、予め指定された単語が出現する数を、特徴ベクトルの要素にしてもよい。予め指定された単語は、例えば、任意の単語辞書に掲載されている単語であってもよい。例えば、図１１の例において、テンプレート生成に用いた複数のコマンドログにおいてテンプレートの単語パラメータに該当する部分の単語は、「quiq」、「UP」及び「Down」である。また、これら３つのうち、任意の単語辞書に掲載されている単語は、「UP」及び「Down」の２つであるものと仮定する。また、特徴ベクトルを生成するコマンドログにおいて、テンプレートの単語パラメータに該当する部分の単語のうち「Up」が出現する数が３であり、「Down」が出現する数が１であったと仮定する。この場合、３及び１を、特徴ベクトルの要素にしてもよい。すなわち、生成部１０２は、特徴ベクトルを生成する対象のコマンドログにテンプレートを適用することで抽出した１以上の単語のうち単語パラメータに対応する単語の中に含まれる、予め指定された単語の数に基づいて、特徴ベクトルを生成するようにしてもよい。コマンドログには、装置名を含む固有名詞又は記号など、単体では意味をなさない単語が多く含まれることから、故障解析等に有効と考えられる単語に絞って特徴ベクトルを生成することが可能になる。

図１２は、特徴ベクトルの構成例その１を説明するための図である。図１２は、pingコマンドに対応する特徴ベクトルの構成例を示す。これまでに説明したように、pingコマンドのコマンドログは、ブロッククラスタ１及びブロッククラスタ２に分類され、ブロッククラスタ１及びブロッククラスタ２のそれぞれについて、テンプレートが生成される。そこで、生成部１０２は、ブロッククラスタ１のテンプレートのうち１番目～５番目の数値パラメータを、それぞれ、特徴ベクトルの１番目～５番目の要素に割り当てるとともに、ブロッククラスタ２のテンプレートのうち１番目～４番目の数値パラメータを、それぞれ、特徴ベクトルの６番目～９番目の要素に割り当てるようにしてもよい。

図１３は、特徴ベクトルの構成例その２を説明するための図である。図１３は、コマンドＸに対応する特徴ベクトルの構成例を示す。ここで、ブロッククラスタＸのテンプレートを生成する際に用いた複数のコマンドログにおいて、ブロッククラスタＸのテンプレートのうち２か所の単語パラメータ部分には、単語辞書に掲載されいる単語として「Up」及び「Down」が存在していたものとする。この場合、生成部１０２は、ブロッククラスタＸのテンプレートのうち１番目の数値パラメータを、特徴ベクトルの１番目の要素に割り当てる。また、生成部１０２は、ブロッククラスタＸのテンプレートに含まれる２つの単語パラメータに対応する特徴ベクトルの要素として、「UP」の数及び「Down」の数を、それぞれ特徴ベクトルの２番目及び３番目の要素に割り当てる。

図１４は、特徴ベクトルの具体例その１を示す図である。図１４は、pingコマンドのコマンドログＸについて、図１２に示す方法で特徴ベクトルを生成した場合の例を示している。なお、図１４の例では、コマンドログのうちテンプレートの数値パラメータに該当する部分の値をそのまま特徴ベクトルの要素にしているが、これに代えて、標準化後の値を特徴ベクトルに要素にしてもよい。

図１５は、特徴ベクトルの具体例その２を示す図である。図１５は、pingコマンドのコマンドログＹについて、図１２に示す方法で特徴ベクトルを生成した場合の例を示している。なお、図１５に示すコマンドログは、図１４と異なり、ブロッククラスタ２のテンプレートに該当する部分が存在せず、欠損している。この場合、生成部１０２は、欠損部分に対応する特徴ベクトルの要素には、ゼロを設定するようにしてもよい。

図１６は、特徴ベクトルの具体例その３を示す図である。図１６は、コマンドＸのコマンドログについて、図１３に示す方法で特徴ベクトルを生成した場合の例を示している。

なお、上述したように、監視装置１０は、特徴ベクトルを用いてモデルを学習させる処理、及び、学習済みモデルを用いて通信装置４０の動作状態を推定する処理を行う。従って、コマンドログから生成する特徴ベクトルの次元数及び各要素の意味を定めておく必要がある。そこで、生成部１０２は、これまでに説明した処理手順により生成した特徴ベクトルについて、コマンドごとに、特徴ベクトルに含まれる各要素とテンプレートとの対応関係及び各要素の生成方法を定義する情報（以下、「特徴ベクトル定義データ」と言う。）を生成して記憶部１００に格納しておくようにしてもよい。なお、各要素の生成方法には、例えば、数値パラメータを標準化した値を要素に格納することを指示する情報、及び／又は、単語パラメータのうち何の単語の数をどの位置の要素に格納するのかを指示する情報等が含まれる。

例えば、生成部１０２は、図１２に示す構成の特徴ベクトルを生成した場合、コマンドログのうち、ブロッククラスタ１のテンプレートの１番目～５番目の数値パラメータに該当する値が、それぞれ、特徴ベクトルの１番目～５番目の要素に対応することと、コマンドログのうち、ブロッククラスタ２のテンプレートの１番目～４番目の数値パラメータに該当する値が、それぞれ、特徴ベクトルの６番目～９番目の要素に対応することを示す特徴ベクトル定義データを生成する。なお、生成部１０２は、標準化した値を特徴ベクトルの要素とする場合、ブロッククラスタ１のテンプレートのうち１番目～９番目の各数値パラメータを特徴ベクトルの要素に変換する際に用いた偏差値及び平均値を、数値パラメータごとに、特徴ベクトル定義データに含めておく。

また、例えば、生成部１０２は、図１３に示す構成の特徴ベクトルを生成した場合、コマンドログのうち、テンプレートの１番目の数値パラメータに該当する値が、特徴ベクトルの１番目に対応することと、コマンドログのうち、テンプレートの単語パラメータの部分に該当する単語における「UP」の数及び「Down」の数を、それぞれ特徴ベクトルの２番目及び３番目の要素に割り当てることを示す特徴ベクトル定義データを生成する。

（モデルの学習）
学習処理部１０３は、複数のコマンドログの各々の特徴ベクトルと通信装置４０の動作状態を示す情報とを含む教師データを用いてモデルを学習させることで、特徴ベクトルを入力すると通信装置４０の動作状態を出力するモデルを生成する。学習処理部１０３は、コマンド種別ごとに、異なるモデルを生成するようにしてもよい。例えば、学習処理部１０３は、pingコマンド用のモデル、show interfaceコマンド用のモデルのように、コマンド種別ごとにモデルを生成するようにしてもよい。モデルに用いるアルゴリズムは特に限定されないが、例えば、ニューラルネットワーク、サポートベクターマシン、決定木、ランダムフォレスト、勾配ブースティング決定木などを利用することとしてもよい。

通信装置４０の動作状態を示す情報は、例えば、通信装置４０の動作状態を２種類表現可能なフラグ（例えば、正常の場合は０、異常の場合は１など）であってもよいし、通信装置４０の状態を３種類以上表現可能なフラグ（例えば、両系との正常の場合は０、片系が異常である場合は１、両系が異常の場合は２など）であってもよい。なお、教師データは、オペレータが、過去に監視業務を行った際のログデータに対して通信装置４０の動作状態を付与することで生成されたものであってもよい。

（通信装置の動作状態の推定）
図１７は、通信装置４０の動作状態を推定する処理手順の一例を示すフローチャートである。なお、以下の説明では、特徴ベクトルを入力すると通信装置４０の動作状態を出力することが可能な学習済モデルが、予め生成済みであるものとする。

ステップＳ２０で、取得部１０１は、通信装置４０から出力されるコマンドログ（第２のコマンドログ）を取得する。当該コマンドログは、例えば、通信装置４０の監視業務を行うために、オペレータ又は監視装置１０が通信装置４０に投入した装置コマンドに対する応答として出力されたものであってもよい。

ステップＳ２１で、生成部１０２は、ステップＳ２０で取得したコマンドログ（第２のコマンドログ）の各々に対してブロッククラスタごとのテンプレートを適用することで、当該コマンドログに含まれる単語列の中から、テンプレートで示されるパラメータ部分に対応する１以上の単語（１以上の第２の単語）を抽出し、抽出した当該１以上の単語に基づいて、コマンドログ（第２のコマンドログ）の特徴ベクトルを生成する。

例えば、ステップＳ２０の処理手順において、通信装置４０にpingコマンドを投入することで、図７のコマンドログ３に示すコマンドログが取得されたものとする。また、pingコマンドのテンプレートは、図１０に示すように、ブロッククラスタ１のテンプレート及びブロッククラスタ２のテンプレートの２つであるものとする。この場合、生成部１０２は、コマンドログに含まれる単語列に、ブロッククラスタ１のテンプレートを当てはめることで、ブロッククラスタ１のテンプレートにおけるパラメータ部分に該当する１以上の単語（数値）を抽出する。同様に、生成部１０２は、コマンドログに含まれる単語列に、ブロッククラスタ２のテンプレートを当てはめることで、ブロッククラスタ２のテンプレートにおけるパラメータ部分に該当する１以上の単語（数値）を抽出する。

続いて、生成部１０２は、ブロッククラスタ１のテンプレートを用いて抽出した１以上の単語（数値）と、ブロッククラスタ２のテンプレートを用いて抽出した１以上の単語（数値）とを、pingコマンドの特徴ベクトル定義データで定義された順に並べることで、特徴ベクトルを生成する。なお、pingコマンドの特徴ベクトル定義データに、数値を標準化すべきことが指定されている場合、生成部１０２は、抽出した単語（数値）の標準化を行い、標準化後の数値を並べることで特徴ベクトルを生成する。

ステップＳ２２で、推定部１０４は、ステップＳ２１の処理手順で生成された特徴ベクトルを学習済モデルに入力することで、通信装置４０の動作状態を推定する。例えば、ステップＳ２０の処理手順で取得したコマンドログがpingコマンドである場合、推定部１０４は、pingコマンドに対応する学習済モデルに、ステップＳ２１の処理手順で生成した特徴ベクトルを入力する。また、推定部１０４は、当該学習済モデルから出力される値に基づいて、通信装置４０の動作状態を推定する。推定部１０４は、推定した通信装置４０の動作状態を、端末２０の画面に出力するようにしてもよい。

＜まとめ＞
以上説明した実施形態によれば、監視装置１０は、装置コマンドのコマンドログを分析することで、コマンドログにおける共通部分及びパラメータ部分を示すテンプレートを抽出するようにした。また、監視装置１０は、更に、コマンドログのうちパラメータ部分に基づいて特徴ベクトルを生成するようにした。これにより、通信装置から得られるコマンドログの分析を効率化することが可能になる。また、監視装置１０は、生成した特徴ベクトルを教師データとして学習させた学習済モデルを用いることで、通信装置４０のコマンドログから通信装置４０の動作状態を推定するようにした。これにより、迅速かつ効率的な監視業務を実現することが可能になる。また、本実施形態に係る技術は、持続可能な開発目標（ＳＤＧｓ）の目標９「産業と技術革新の基盤をつくろう」の達成に貢献することができる。

以上説明した実施形態は、本発明の理解を容易にするためのものであり、本発明を限定して解釈するためのものではない。実施形態で説明したフローチャート、シーケンス、実施形態が備える各要素並びにその配置、材料、条件、形状及びサイズ等は、例示したものに限定されるわけではなく適宜変更することができる。また、異なる実施形態で示した構成同士を部分的に置換し又は組み合わせることが可能である。

１…監視システム、１０…監視装置、１１…プロセッサ、１２…記憶装置、１３…通信ＩＦ、１４…入力デバイス、１５…出力デバイス、２０…端末、３０…ネットワーク、４０…通信装置、１００…記憶部、１００ａ…コマンドログＤＢ、１００ｂ…学習済モデル、１００ｃ…単語辞書ＤＢ、１０１…取得部、１０２…生成部、１０３…学習処理部、１０４…推定部

Claims

通信装置から出力される、コマンドの実行結果を示す複数のコマンドログを取得する取得部と、
前記複数のコマンドログに基づいて共通部分及びパラメータ部分を示すテンプレートを生成する生成部であって、
前記複数のコマンドログの各々を複数のブロックに分割し、
前記複数のブロックをクラスタリングすることで、複数のブロッククラスタに分類し、
同一のブロッククラスタに分類される複数のブロックに含まれる単語列のうち共通部分及びパラメータ部分を示すテンプレートを、ブロッククラスタごとに生成する、
生成部と、
を有する情報処理装置。
前記生成部は、
前記複数のコマンドログの各々に対して前記ブロッククラスタごとのテンプレートを適用することで、前記複数のコマンドログの各々に含まれる単語列の中から、前記テンプレートで示されるパラメータ部分に対応する１以上の単語を、コマンドログごとにさらに抽出し、
抽出したコマンドログごとの前記１以上の単語に基づいて、前記複数のコマンドログの各々の特徴ベクトルをさらに生成する、
請求項１に記載の情報処理装置。
前記複数のコマンドログの各々の特徴ベクトルと前記通信装置の動作状態を示す情報とを含む教師データを用いてモデルを学習させることで、特徴ベクトルを入力すると前記通信装置の動作状態を出力する学習モデルを生成する学習処理部、を有する、
請求項２に記載の情報処理装置。
前記取得部は、前記通信装置から出力される、第２のコマンドログを取得し、
前記生成部は、前記第２のコマンドログの各々に対して前記ブロッククラスタごとのテンプレートを適用することで、前記第２のコマンドログに含まれる単語列の中から、前記テンプレートで示されるパラメータ部分に対応する１以上の第２の単語を抽出し、抽出した前記１以上の第２の単語に基づいて、前記第２のコマンドログの特徴ベクトルを生成し、
生成された前記第２のコマンドログの特徴ベクトルを前記学習モデルに入力することで、前記通信装置の動作状態を推定する、推定部、を有する、
請求項３に記載の情報処理装置。
前記生成部は、前記複数のコマンドログを所定条件に従って分割することで、前記複数のコマンドログを複数のブロックに分割する、
請求項１に記載の情報処理装置。
前記複数のコマンドログを前記所定条件に従って分割することは、前記複数のコマンドログを空白行で分割することである、
請求項５に記載の情報処理装置。
前記複数のコマンドログを前記所定条件に従って分割することは、前記複数のコマンドログを特定の文字列で分割することである、
請求項５に記載の情報処理装置。
前記複数のコマンドログを前記所定条件に従って分割することは、前記複数のコマンドログを空白行及び前記特定の文字列で分割することである、
請求項７に記載の情報処理装置。
前記複数のコマンドログを前記所定条件に従って分割することは、前記複数のコマンドログを特定の文字列のパターンで分割することである、
請求項５に記載の情報処理装置。
前記テンプレートで示されるパラメータ部分は、単語で表されるパラメータを示す単語パラメータを含み、
前記生成部は、抽出した前記１以上の単語のうち前記単語パラメータに対応する単語の中に含まれる、予め指定された単語の数に基づいて、前記特徴ベクトルを生成する、
請求項２に記載の情報処理装置。
前記テンプレートで示されるパラメータ部分は、数値で表される数値パラメータを含み、前記生成部は、抽出した前記１以上の単語のうち前記数値パラメータに対応する単語について、該数値で示される数値を標準化した後の数値に基づいて、前記特徴ベクトルを生成する、
請求項２に記載の情報処理装置。
前記通信装置は、属性の異なる複数の通信装置を含み、
前記生成部は、属性の異なる前記複数の通信装置から出力される前記複数のコマンドログに基づいて前記テンプレートを生成する処理を、属性の異なる通信装置ごとに実行する、
請求項１に記載の情報処理装置。
通信装置から出力される、コマンドの実行結果を示す複数のコマンドログを取得するステップと、
前記複数のコマンドログに基づいて共通部分及びパラメータ部分を示すテンプレートを生成するステップであって、
前記複数のコマンドログの各々を複数のブロックに分割し、
前記複数のブロックをクラスタリングすることで、複数のブロッククラスタに分類し、
同一のブロッククラスタに分類される複数のブロックに含まれる単語列のうち共通部分及びパラメータ部分を示すテンプレートを、ブロッククラスタごとに生成する、
ステップと、
を含む、情報処理装置が実行する情報処理方法。
通信装置から出力される、コマンドの実行結果を示す複数のコマンドログを取得するステップと、
前記複数のコマンドログに基づいて共通部分及びパラメータ部分を示すテンプレートを生成するステップであって、
前記複数のコマンドログの各々を複数のブロックに分割し、
前記複数のブロックをクラスタリングすることで、複数のブロッククラスタに分類し、
同一のブロッククラスタに分類される複数のブロックに含まれる単語列のうち共通部分及びパラメータ部分を示すテンプレートを、ブロッククラスタごとに生成する、
ステップと、
をコンピュータに実行させるためのプログラム。