JP2021196730A

JP2021196730A - 原因推論システム、原因推論装置および原因推論方法

Info

Publication number: JP2021196730A
Application number: JP2020101390A
Authority: JP
Inventors: 雅江岡田; Masae Okada; 佑樹長沼; Yuki Naganuma; 恵介畑崎; Keisuke Hatasaki
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2020-06-11
Filing date: 2020-06-11
Publication date: 2021-12-27

Abstract

【課題】コンテナアプリケーションおよびその実行基盤の構築失敗時に、アプリ実行基盤の構築先環境とエラー報告文書に記載されるエラー内容の両方を考慮して自動で高精度に原因を推論すること。【解決手段】コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、構築の成功時の実行基盤の情報を保存するデータベースと、構築の失敗時の実行基盤の情報を受け付けるとともに、失敗時のエラー内容を表すテキスト情報を受け付けるインタフェースと、失敗時および成功時の実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理部と、テキスト情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第２の推論処理部と、第１の推論処理部による推論結果と、第２の推論処理部による推論結果とを組み合わせ、実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理部と、を備える。【選択図】図１

Description

本発明は、コンテナ技術を用いたアプリケーションおよびその実行基盤の構築が失敗した原因を推定する原因推論システム、原因推論装置および原因推論方法に関する。

近年、コンテナ型の仮想化技術やその実行基盤構築および管理（オーケストレーション）ツールを利用したアプリケーション開発と提供が盛んに行われている。アプリケーションの開発者がアプリケーションおよび実行基盤構築用のコードを提供することで、アプリケーション利用者による自環境へのアプリケーション実行基盤の構築とアプリケーション本体の構築が容易に可能となる。コンテナ型の仮想環境を提供するソフトウェアの一例としてはDocker（登録商標）が、その実行基盤構築及び管理ツールの一例としてはKubernetes（登録商標）が挙げられる。

Philip J. Guo, et al. " Not my bug!" and other reasons forsoftware bug report reassignments." Proceedings of the ACM 2011 conferenceon Computer supported cooperative work. pp. 395-404, 2011.

アプリケーションの利用者は、アプリケーションの開発者が提供しているアプリケーションのパッケージを用いてアプリケーション実行基盤およびアプリケーション本体の構築を行うことによって、アプリケーションを容易に利用することが可能である。しかし、開発者が想定した環境と利用者がアプリケーション実行基盤を構築しようとする環境が異なる場合、アプリケーション実行基盤の構築に失敗する場合がある。この場合、失敗の原因を明らかにし、開発者がアプリケーションのパッケージに含まれるソースコードを修正する、または利用者が実行基盤を構築しようとする環境を修正する必要がある。

非特許文献１では、ソフトウェア開発の現場において、新規エラーを報告する文書をテキスト解析し、過去の類似したエラーの対応者の情報と照らし合わせ、新規エラーの担当者を決定する技術が開示されている。非特許文献１により、コンテナ技術を活用したアプリケーションの実行基盤および本体の構築の失敗においても、エラー報告文書に含まれるエラーログなどのテキスト解析によって原因を推論可能となると見込める。

アプリケーション実行基盤の構築の失敗原因の特定には、構築先環境の情報を考慮することが重要である。しかし、非特許文献１で用いるエラーログ等のテキスト文書には、エラーの内容は記述されているが、アプリケーション実行基盤を構築しようとする環境に関する詳細な情報が含まれない。よって、環境を考慮した切り分けができず、原因推論精度が低下してしまうという課題が存在する。
本発明はこの課題を解決するものである。

上記課題を解決するために、代表的な本発明の原因推論システムの一つは、コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、前記構築の成功時の前記実行基盤の情報を保存するデータベースと、前記構築の失敗時の実行基盤の情報を受け付けるとともに、前記失敗時のエラー内容を表すテキスト情報を受け付けるインタフェースと、前記失敗時および前記成功時の前記実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理部と、前記テキスト情報に基づいて作成した特徴量を使って、前記失敗原因の推論を行う第２の推論処理部と、前記第１の推論処理部による推論結果と、前記第２の推論処理部による推論結果とを組み合わせ、前記実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理部と、を備える。
また、代表的な本発明の原因推論装置の一つは、コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、前記構築の失敗時の実行基盤の情報を受け付けるとともに、前記失敗時のエラー内容を表すテキスト情報を受け付けるインタフェースと、前記構築の成功時の前記実行基盤の情報を保存するデータベースを参照し、前記失敗時および前記成功時の前記実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理部と、前記テキスト情報に基づいて作成した特徴量を使って、前記失敗原因の推論を行う第２の推論処理部と、前記第１の推論処理部による推論結果と、前記第２の推論処理部による推論結果とを組み合わせ、前記実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理部と、を備える。
また、代表的な本発明の原因推論方法の一つは、コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、前記構築の失敗時の実行基盤の情報を受け付けるとともに、前記失敗時のエラー内容を表すテキスト情報を受け付ける受付ステップと、前記構築の成功時の前記実行基盤の情報を参照し、前記失敗時および前記成功時の前記実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理ステップと、前記テキスト情報に基づいて作成した特徴量を使って、前記失敗原因の推論を行う第２の推論処理ステップと、前記第１の推論処理ステップによる推論結果と、前記第２の推論処理ステップによる推論結果とを組み合わせ、前記実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理ステップと、を含む。

本発明を用いることにより、コンテナ技術を用いたアプリケーションおよびその実行基盤の構築に失敗した際に、アプリ実行基盤の構築先環境とエラー報告文書に記載されるエラー内容の両方を考慮して自動で高精度に原因を推論することが可能となる。

本実施例の概要を説明する図である。本実施例におけるシステム構成の一例を示すブロック図である。原因推論システムＧＵＩの一例を示す図である。原因推論システムへの入力の一例を示す図である。各コンポーネントが動作する計算機の構成の一例を示すブロック図である。端末のメモリまたは記憶装置、原因推論システムのメモリまたは記憶装置に格納されたプログラムや処理、データの一例を示すブロック図である。原因推論システムのメモリまたは記憶装置が保持するテーブルの構成の一例を示す図である。アプリケーション実行基盤の情報とエラー内容文章を使った原因推論システムの処理の一例を示す図である。基盤特徴量作成処理部の処理の一例を示す図である。基盤特徴量グループ化処理部の処理の一例を示す図である。基盤特徴量推論処理部の処理の一例を示す図である。エラー内容特徴量作成・推論処理部の処理の一例を示す図である。基盤・エラー内容関連付処理部の処理の一例を示す図である。組み合わせ決定処理部の処理の一例を示す図である。推論結果組み合わせ処理部の処理の一例を示す図である。

以下図面を参照し、本発明の一実施の形態を詳述する。なお、以下の説明では、同種の要素を区別しないで説明する場合には、枝番を含む参照符号のうちの共通部分（枝番を除く部分）を使用し、同種の要素を区別して説明する場合は、枝番を含む参照符号を使用することがある。例えば、ユーザを特に区別しないで説明する場合には、「ユーザ２００」と記載し、個々のユーザを区別して説明する場合には、「ユーザ２００−１」、「ユーザ２００−２」のように記載することがある。

＜システムの説明＞
図１を用いて本実施例の概要を説明する。
本実施例は、エラー原因の推論を行う原因推論システム１００からなる。
原因推論システム１００は、基盤特徴量作成処理部１０２、基盤特徴量グループ化処理部１０３、基盤特徴量推論処理部１０４、エラー内容特徴量作成・推論処理部１０５、基盤・エラー内容関連付処理部１０６、組み合わせ決定処理部１０７、推論結果組み合わせ処理部１０８、正常動作データベース１２０、過去事例蓄積データベース１３０を持つ。

本実施例は、アプリケーションの利用者であるユーザ２００−２がコンテナ技術を用いたアプリケーションおよびその実行基盤の構築に失敗した際にその原因を明らかにするために入力した異常時の情報（実行基盤構築情報およびエラー内容を表すテキスト情報）に基づいた、原因推論システム１００によるコンテナ技術を用いたアプリケーションおよびの実行基盤構築の失敗原因を推論する技術に関するものである。
コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗原因を推論する技術を構成する各処理部の概要を以下に示す。

基盤特徴量作成処理部１０２では、アプリケーションの利用者であるユーザ２００−２が入力したコンテナ技術を用いたアプリケーションおよびその実行基盤の構築に失敗した際（異常時）の実行基盤構築情報と、アプリケーションの開発者であるユーザ２００−１が過去事例蓄積データベース１３０に登録し蓄積された、入力と同じアプリケーション実行基盤構築の正常終了時の実行基盤構築情報を用いて、実行基盤に関する特徴量を作成する。これによって、異常時および正常時の実行基盤の構築情報の特徴を取得することが可能となる。

基盤特徴量グループ化処理部１０３では、基盤に関する特徴量のグループ化のルールを定義する基盤グループ化テーブル１１１に基づいて、実行基盤に関する特徴量を、特徴量の作成元である実行基盤構築の定義情報の関連性が強い特徴量同士でグループ化する。

基盤特徴量推論処理部１０４では、前述の基盤特徴量グループ化処理部１０３でグループ化された特徴量それぞれを用いて実行基盤構築の失敗原因に関する推論を行う。この結果、グループごとに推論結果が得られる。基盤特徴量グループ化処理部１０３において膨大な実行基盤構築の定義情報から作成される膨大な特徴量を分割してから基盤特徴量推論処理部１０４による推論を行うことで、特徴量の次元を下げることができ、精度の高い推論を行うことが可能となる。また、基盤特徴量グループ化処理部１０３での特徴量のグループ化では、特徴量の作成元である実行基盤構築の定義情報の関連性に基づいて特徴量をグループ化することから、統計処理による数値的なグループ化に比べて各グループに対して明確に基盤の情報を反映することが可能であり、このような特徴量を用いて基盤特徴量推論処理を行うことによって、得られる推論結果と実行基盤との結びつけを保つことが可能となる。さらに、実行基盤との関連性を保持した推論結果を用いて後述する推論結果組み合わせ処理部１０８による推論結果の組み合わせを行うことで、より精度の高い組み合わせ結果を得ることが可能となる。

エラー内容特徴量作成・推論処理部１０５では、ユーザ２００が入力したコンテナ技術を用いたアプリケーションおよびその実行基盤の構築に失敗した際（異常時）のエラー内容テキスト情報に基づいてエラー内容に関する特徴量を作成し、実行基盤構築の失敗原因に関する推論を行う。

基盤・エラー内容関連付処理部１０６では、エラー内容と実行基盤との関連性を定義した基盤グループ・エラー内容対応テーブル１１２と、基盤に関する特徴量のグループ化のルールを定義する基盤グループ化テーブル１１１に基づいて、エラー内容に関する特徴量を実行基盤と関連付けた後、さらに基盤に関する特徴量のグループと関連付ける。

組み合わせ決定処理部１０７では、過去事例蓄積データベース１３０に蓄積された、過去の原因推論結果とその精度の情報から、推論したい実行環境構築の失敗状況と類似した過去の事例に基づいて、最も推論精度が高いと考えられる、基盤に関する特徴量による推論結果とエラー内容に関する特徴量による推論結果の組み合わせを決定する。換言するならば、組み合わせ決定処理部１０７では、どのグループの特徴量による推論結果と組み合わせたときに、推論精度が高くなるかを決定する。

推論結果組み合わせ処理部１０８では、組み合わせ決定処理部１０７において決定した組み合わせに基づいて、基盤に関する特徴量による推論結果とエラー内容に関する特徴量による推論結果を組み合わせ、コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗原因について最終的な推論結果を導く。基盤に関する特徴量による推論結果とエラー内容に関する特徴量による推論結果を組み合わせることによって、それぞれの推論の弱点を補い、より精度の高い推論結果を得ることが可能となる。また、基盤・エラー内容関連付処理部１０６において、実行基盤構築情報とエラー内容という異なる二つの情報を持つ基盤に関する特徴量とエラー内容に関する特徴量の関連性を取得した上で組み合わせ決定処理部１０７による組み合わせの決定を行うことで、実行基盤の構築に注目して推論結果の組み合わせを決定することが可能であり、その組み合わせ決定結果に基づいて推論結果組み合わせ処理部１０８において最終的な原因推論結果を導くことで、さらに精度の高い推論結果を得ることが可能となる。なお、失敗原因に基づいてアプリケーションの開発者がアプリケーションのパッケージに含まれるソースコードを修正する場合と、アプリケーションの利用者が実行基盤を構築しようとする環境を修正する場合が想定されるが、推論結果組み合わせ処理部１０８が導く最終的な失敗原因の推論結果は、実行基盤構築の失敗原因箇所そのものであってもよいし、失敗箇所が発生する原因となったユーザ２００（たとえばアプリケーション開発者または利用者）であってもよいし、その両方であってもよい。

推論結果は、原因推論システムＧＵＩ１４０を介してユーザ２００に提示される。ユーザ２００は実際の対応内容を過去事例蓄積データベース１３０に登録することで情報が更新され、次回以降の推論に活用されることで推論精度の向上が可能となる。
上記処理の詳細は後述する。

図２は、本実施例におけるシステム構成の一例を示すブロック図である。図２のシステムは、端末３１０と、原因推論システム１００と、ネットワークスイッチ５００と、アプリケーションの実行基盤４１０と、アプリケーション４２０から構成される。

ユーザ２００は、アプリケーション実行基盤４１０およびアプリケーション４２０の情報を取得し、端末３１０で動作するクライアントプログラム７１１により、原因推論システム１００にアクセスし、コンテナ技術を用いたアプリケーション４２０の実行基盤４１０構築の失敗時の情報の登録や、原因の推論結果の取得、実際の対応内容の登録ができる。

原因推論システム１００は、原因推論システムＧＵＩ１４０と、コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗原因推論機能、対応内容の登録機能を持つ。原因推論システムＧＵＩ１４０や機能の詳細は後述する。

なお、実行基盤４１０およびアプリケーション４２０はネットワークスイッチ５００を介して原因推論システム１００や端末３１０と通信できてもよい。その場合、実行基盤およびアプリケーションの情報はユーザ２００や端末３１０のクライアントプログラム７１１を介さずに直接原因推論システム１００に入力されてもよい。

＜画面の説明＞
図３は、原因推論システムＧＵＩ１４０の一例を示す図である。実行基盤構築失敗内容入力画面６１０をホーム画面として、ユーザ２００の画面操作により、原因推論結果表示画面６２０や対応内容フィードバック画面６３０が開く。

実行基盤構築失敗内容入力画面６１０は、コンテナ技術を用いたアプリケーションおよびその実行基盤構築失敗時（異常時）の実行基盤構築情報とエラー内容のテキスト情報を入力する画面の一例である。ユーザ２００は、前記実行基盤構築失敗内容入力画面６１０に表示されているアプリケーション名入力窓６１１に実行基盤構築に失敗したアプリケーション名を入力し、基盤構築情報入力窓６１２に実行基盤構築失敗時（異常時）の実行基盤構築情報をアップロードし、エラー内容情報入力窓６１３にエラー内容を示すテキスト情報をアップロードする。最後に推論開始ボタン６１４をクリックすると、アプリケーションおよびその実行基盤構築の失敗原因の推論が行われる。また、対応内容フィードバックボタン６１５をクリックすると、対応内容フィードバック画面６３０が表示される。

アプリケーション名入力窓６１１へのアプリケーション名の入力は、直接ユーザ２００がアプリケーション名を入力する形式や、新たなウインドウやプルダウンなどでアプリケーション名の一覧が提示され、その中からアプリケーション名を選択することで入力を補助する形式、などの形式をとる。また、原因推論システム１００が実行基盤構築失敗原因を推測する対象となるアプリケーションが１つだけであることが明らかである場合には、実行基盤構築失敗内容入力画面６１０はアプリケーション名を入力する機能を持たなくてもよい。基盤構築情報入力窓６１２への実行基盤構築失敗時（異常時）の実行基盤構築情報のアップロードおよびエラー内容情報入力窓６１３へのエラー内容を示すテキスト情報のアップロードは、当該情報を記載した単一または複数のファイルをアップロードする形式や、これらファイル（群）へのリンクを入力する形式、当該情報を入力窓に直接入力する形式、などの形式をとる。なお、実行基盤およびアプリケーションが原因推論システム１００と通信可能な場合は実行基盤構築失敗内容入力画面６１０を介さずに直接原因推論システム１００に入力されてもよい。

原因推論結果表示画面６２０は、コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗原因の推論結果を表示する画面の一例である。原因推論結果表示画面６２０は、実行基盤構築失敗内容入力画面６１０の推論開始ボタン６１４をクリックしたことを契機に表示される。ユーザ２００は、アプリケーション名６２１、リクエストの受付番号６２２、原因推論結果６２３とその確率６２４を参照可能である。

原因推論結果６２３は、実行基盤構築の失敗原因箇所そのものであってもよいし、失敗箇所が発生する原因となったユーザ２００（例えばアプリケーション開発者または利用者）であってもよいし、その両方であってもよい。

対応内容フィードバック画面６３０は、コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗に対して実際にどのような対応を行って問題を解決したかを登録する画面の一例である。対応内容フィードバック画面６３０は、実行基盤構築失敗内容入力画面６１０の対応内容フィードバックボタンをクリックしたことを契機に表示される。ユーザ２００は受付番号入力窓６３１に、原因推論時に発行された受付番号６２２を入力し、呼び出しボタン６３２をクリックすることで原因推論結果を呼び出すことができる。ユーザ２００は呼び出されたアプリケーション名６３３、受付番号６３４、原因推論結果６３５を参照し、原因推論結果６３５が本当に問題の原因であったかどうか、つまり推論結果の正誤を、実際の問題解決の対応内容に基づいて対応内容チェックボックス６３６にチェックを入れ、送信ボタン６３８をクリックすることで登録する。原因推論結果６３５に実際の問題解決の結果判明した本当の原因が含まれない場合には、対応内容入力窓６３７に入力する。

＜入力の説明＞
図４は、原因推論システム１００への入力の一例を示す図である。以降、コンテナ技術によるアプリケーションおよびその実行基盤の構築ツールとして、Kubernetesを利用したアプリケーションを構築する場合を例に示す。

図４Ａは、実行基盤構築情報の一例を示す図である。この実行基盤構築情報は、例えば、アプリケーションの開発者であるユーザ２００−１が原因推論システム１００の過去事例蓄積データベース１３０に登録する。または、アプリケーション利用者であるユーザ２００−２が失敗原因推論のための情報として原因推論システム１００に入力する。または実行基盤およびアプリケーションが原因推論システム１００と通信可能な場合は実行基盤構築失敗内容入力画面６１０を介さずに直接原因推論システム１００に入力される。

Kubernetesの利用を仮定する場合、実行基盤構築情報７１０はYAML(YAML Aren’t Markup Language)形式と呼ばれる構造化データの表現方法で記載され、項目（key）７１１とその値（Value）７１２の組み合わせで実行基盤の構築情報を表す。
実行基盤情報は、コンテナアプリケーションの実行基盤の状態を示していれば上記以外の形式で表現されていてもよい。

図４Ｂは、エラー内容を示すテキスト情報の一例を示す図である。エラー内容を示すテキスト情報は、例えば、アプリケーション利用者であるユーザ２００−２が失敗原因推論のための情報として原因推論システム１００に入力する。または実行基盤およびアプリケーションが原因推論システム１００と通信可能な場合は実行基盤構築失敗内容入力画面６１０を介さずに直接原因推論システム１００に入力される。

エラー内容テキスト情報７２０は、エラーが起きたことを知らせる文章７２１と、アプリケーション名７２２、エラー内容の概要７２３と、エラーログ７２４、などのテキスト文章から構成される。

エラーログ７２４は、アプリケーション４２０およびその実行基盤４１０およびこれら管理するシステムが出力するログデータであり、エラーのタイプ７２４１、エラーの発生個所７２４２、エラーメッセージ７２４３などから構成される。

エラー内容テキスト情報７２０は、上記のすべての情報が含まれている必要はなく、また、エラーについて説明する内容を示すテキスト文章であれば上記に含まれない情報が記載されていてもよい。エラーログ７２４は、上記のすべての情報が含まれている必要はなく、また、アプリケーションおよびその実行基盤を管理するシステムが出力するログデータであれば上記に含まれない情報が記載されていてもよい。また、エラーのタイプ７２４１、エラーの発生個所７２４２、エラーメッセージ７２４３などのログデータは、システムが出力した形式そのものであってもよいし、システムが出力したログを選択・分割してエラーについて説明するテキストの中に含む形で記載されていてもよい。

＜計算機の説明＞
図５は、図２に示す各コンポーネントが動作する計算機８００の構成の一例を示すブロック図である。
計算機８００は、プロセッサであるＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）８１０と、主記憶デバイスであるメモリ８２０と、不揮発性の二次記憶装置８３０と、入出力装置８４０と、ポート８５０を有する。これらの各構成要素は、バス８６０により相互に接続される。

ＣＰＵ８１０は、メモリ８２０に記憶されているプログラムを実行することによって、各計算機の所定の機能を実現する。メモリ８２０は、ＣＰＵ８１０よって実行されるプログラム及びプログラムの実行に必要なデータを記憶する。プログラムは、二次記憶装置８３０からメモリ８２０にロードされる。

入出力装置８４０は、ディスプレイ、ポインタ又はキーボード等のデバイスの一つ又は複数のデバイスを含む。ユーザ２００は、入出力装置８４０により、各計算機を操作することができる。

ポート８５０は、ネットワーク（例えば、図２のネットワークスイッチ５００）に接続される。各計算機は、ポート８５０を介して、他の計算機８００と通信することができる。
なお、各コンポーネントが動作する計算機８００は、仮想マシンやコンテナ等の仮想環境であっても良い。

＜メモリまたは記憶装置のデータ構成の説明＞
図６は、開発端末のメモリまたは記憶装置９１０、原因推論システムのメモリまたは記憶装置９２０に格納されたプログラムや処理、データの一例を示すブロック図である。
開発端末のメモリまたは記憶装置９１０は、前述図３に示したＧＵＩを表示するためのクライアントプログラム７１１を持つ。クライアントプログラム７１１の一例は、ウェブブラウザである。

原因推論システムのメモリまたは記憶装置９２０は、原因推論システムＧＵＩ表示処理部１０１、基盤特徴量作成処理部１０２、基盤特徴量グループ化処理部１０３、基盤特徴量推論処理部１０４、エラー内容特徴量作成・推論処理部１０５、基盤・エラー内容関連付処理部１０６、組み合わせ決定処理部１０７、推論結果組み合わせ処理部１０８、基盤グループ化テーブル１１１、基盤グループ・エラー内容対応テーブル１１２、正常動作データベース１２０、過去事例蓄積データベース１３０を持つ。

原因推論システムＧＵＩ表示処理部１０１はＪａｖａｓｃｒｉｐｔのように開発端末のメモリまたは記憶装置上のクライアントプログラム７１１で動作しても良いし、専用アプリケーションなど、端末３１０上のクライアントプログラム７１１以外のクライアントＧＵＩを用いて動作してもよい。

正常動作データベース１２０は正常時実行基盤構築情報テーブル１２１を持つ。その一例については後述する。
過去事例蓄積データベース１３０は組み合わせ相性テーブル１３１、過去事例テーブル１３２を持つ。正常動作データベース１２０および過去事例データベースは原因推論システムのメモリまたは記憶装置９２０上に存在していてもよいし、原因推論システムのメモリまたは記憶装置９２０とは別のネットワーク接続された独立の専用または共用の一つまたは複数のサーバのメモリまたは記憶装置上に存在してもよい。
上記の各プログラムおよびテーブル・リストの詳細は後述する。
上記の開発端末のメモリまたは記憶装置９１０、原因推論システムのメモリまたは記憶装置９２０はネットワーク接続されたデータベースや仮想サーバのようなものの上で動作しても良い。

＜テーブルの説明＞
図７は、原因推論システムのメモリまたは記憶装置９２０が保持するテーブルの構成の一例を示す図である。
基盤グループ化テーブル１１１は、基盤に関する特徴量のグループ化のルールを定義するテーブルである。
基盤グループ化テーブル１１１は、各グループに割り当てられた固有のグループＩＤ１１１１と、グループ名１１１２と、グループ化の条件１１１３を持つ。
グループ化の条件１１１３は、特徴量の作成元である実行基盤構築の定義情報の関連性が強い特徴量同士でグループ化するための条件である。その一例については後述する。

基盤グループ・エラー内容対応テーブル１１２は、エラー内容に関する特徴量を実行基盤に関する特徴量と関連付けるためのエラー内容と実行基盤との関連性を定義するテーブルである。
基盤グループ・エラー内容対応テーブル１１２は、各条件に割り当てられた固有の条件ＩＤ１１２１と、対応付けの条件１１２２と、対応させるグループID１１２３を持つ。
対応付けの条件１１２２は、実行基盤構築情報とエラー内容という異なる二つの情報を持つ基盤に関する特徴量とエラー内容に関する特徴量を関連付けするための条件である。その一例については後述する。

正常時実行基盤構築情報テーブル１２１は、アプリケーションおよびその実行基盤の構築が正常に行われた際の情報を管理するテーブルである。本テーブルの情報は、アプリケーションを開発したユーザ２００−１が開発時に行ったテストの情報や、アプリケーションを利用したユーザ２００−２が正常にアプリケーション実行基盤を構築できた際の情報によって蓄積・更新される。

正常時実行基盤構築情報テーブル１２１は、アプリケーション名１２１１と、各アプリケーションに割り当てられた固有のアプリケーションID１２１２と、正常時基盤構築情報１２１３を持つ。
正常時基盤構築情報１２１３は、正常動作データベース１２０が持つアプリケーションおよびその実行基盤の構築が正常に行われた際の実行基盤情報であり、実行基盤情報の記述そのものであってもよいし、当該情報を記述したファイルの格納場所を示すポインタのようなものであってもよい。

組み合わせ相性テーブル１３１は、過去に行われたアプリケーション実行基盤構築失敗原因の推論結果に基づいて作成される、過去の原因推論結果とその精度に関するテーブルである。本テーブルの情報は、アプリケーションおよびその実行基盤構築に失敗し、原因推論システム１００による失敗原因の推論結果に基づいて実行基盤構築の問題を解決したユーザ２００がフィードバックした対応内容に基づいて蓄積・更新される。

組み合わせ相性テーブル１３１は、過去の失敗原因推論時の受付番号１３１１と、その際に実行環境構築に失敗したアプリケーションのアプリケーションID１３１２と、そのエラー内容に関するテキスト情報が基盤・エラー内容関連付処理部１０６によって関連付けられた基盤に関する特徴量のグループID１３１３と、ユーザ２００による推論結果のフィードバック結果に基づいた基盤に関する特徴量の各グループとエラー内容に関する特徴量の組み合わせ相性１３１４を持つ。

組み合わせ相性１３１４には、エラー内容に関する特徴量を、基盤に関する特徴量の各グループと組み合わせた場合の相性が登録される。相性の例として、たとえば、推論結果の正誤や、推論時に計算される推論結果の精度の確率値やその両方が登録されることが考えられる。組み合わせ相性１３１４の登録は、例えば、相性の例として推論結果の正誤が登録される場合には、ユーザ２００が対応内容フィードバック画面６３０を介して推論結果の正誤を登録した結果に基づいて入力され、相性の例として推論時に計算される推論結果の精度の確率値が登録される場合には、後述する基盤特徴量推論処理部１０４おけるステップによる推論処理の結果に基づいて入力されることが考えられる。

具体的には、図７の組み合わせ相性テーブル１３１では、case-001の事例は、エラー内容のテキストを分析した結果、gr-001(Application)に関連付けられている。そして、特徴量の推論結果との組み合わせ相性は、gr-001(Application)が正(80%)となり最も高い。すなわち、case-001の事例は、エラー内容のテキストからアプリケーションに関するエラーであることが示唆され、アプリケーションの特徴量の推論結果との組み合わせることが適切であることが示される。

一方、case-002の事例は、エラー内容のテキストを分析した結果、gr-003(Storage)に関連付けられているが、特徴量の推論結果との組み合わせ相性は、gr-002(Network)が正(75%)となり最も高い。すなわち、case-002の事例は、エラー内容のテキストからストレージに関するエラーであることが示唆されるが、ネットワークの特徴量の推論結果との組み合わせること推奨されることになる。

このように、本実施例に係るシステムでは、エラー内容に基づくグループ分けと、特徴量に基づくグループ分けとを個別に行い、過去の実績を参照して組み合わせを決定する。このため、アプリ実行基盤の構築先環境とエラー報告文書に記載されるエラー内容の両方を考慮して、自動で高精度な原因推論を行うことができる。

過去事例テーブル１３２は、過去に行われたアプリケーション実行基盤構築失敗原因の推論に用いられた各種情報および推論結果を管理するテーブルである。
過去事例テーブル１３２は、過去の失敗原因推論時の受付番号１３２１と、その際に実行環境構築に失敗したアプリケーションのアプリケーションID１３２２と、異常時の基盤構築情報１３２３と、異常時のエラー内容テキスト情報１３２４と、エラー内容テキスト情報から作成されたエラー内容に関する特徴量であるエラー内容特徴量１３２５と、正常時および異常時の基盤構築情報から作製された基盤に関する特徴量である基盤特徴量１３２６と、推論結果１３２７を持つ。

異常時の基盤構築情報１３２３は、アプリケーションおよびその実行基盤の構築に失敗した際（異常時）の実行基盤情報であり、実行基盤情報の記述そのものであってもよいし、当該情報を記述したファイルの格納場所を示すポインタのようなものであってもよい。
エラー内容テキスト情報１３２４は、アプリケーションおよびその実行基盤の構築に失敗した際（異常時）のエラー内容を示したテキスト情報であり、当該情報の記述そのものであってもよいし、当該情報を記述したファイルの格納場所を示すポインタのようなものであってもよい。

エラー内容特徴量１３２５は、エラー内容特徴量作成・推論処理部１０５においてアプリケーションおよびその実行基盤の構築に失敗した際（異常時）のエラー内容を示したテキスト情報から作成された特徴量であり、当該情報の記述そのものであってもよいし、当該情報を記述したファイルの格納場所を示すポインタのようなものであってもよい。
基盤特徴量１３２６は、基盤特徴量作成処理部１０２において実行基盤構築情報から作成された実行基盤に関する特徴量または当該特徴量が基盤特徴量グループ化処理部１０３においてグループ化された後の特徴量またはその両方であり、当該情報の記述そのものであってもよいし、当該情報を記述したファイルの格納場所を示すポインタのようなものであってもよい。

推論結果１３２７は、原因推論システムによって推論された結果に関する情報であり、当該情報の記述そのものであってもよいし、当該情報を記述したファイルの格納場所を示すポインタのようなものであってもよい。

＜フローチャートの説明＞
図８に、アプリケーション実行基盤の情報とエラー内容を表すテキスト文章を用いたアプリケーション実行基盤の構築失敗原因推論処理の一例を示す。以下の処理は、ユーザ２００が端末３１０のクライアントプログラム７１１に表示された原因推論システムＧＵＩ１４０の実行基盤構築失敗内容入力画面６１０のアプリケーション名入力窓６１１、基盤構築情報入力窓６１２、エラー内容情報入力窓６１３にそれぞれアプリケーション名、基盤構築情報、エラー内容情報を入力し、推論開始ボタン６１４を押したこと、または実行基盤およびアプリケーションが原因推論システム１００と通信可能な場合は実行基盤構築失敗内容入力画面６１０を介さずに直接原因推論システム１００に入力されたこと、を契機に実行される。

まず、ステップ１０００において、ユーザ２００が入力したアプリケーション名、基盤構築情報、エラー内容情報を、原因推論システム１００が受信する。
次に、ステップ１００１において、原因推論システム１００が基盤特徴量作成処理部１０２を呼び出し、前ステップ１０００にて原因推論システム１００が受信した実行基盤構築失敗時（異常時）の基盤構築情報と、正常動作データベース１２０に蓄積されている正常時の基盤構築情報に基づいて実行基盤に関す特徴量を作成する。処理の詳細については後述する。

次に、ステップ１００２において、原因推論システム１００が基盤特徴量グループ化処理部１０３を呼び出し、基盤グループ化テーブル１１１に基づいて、前ステップ１００１で作成した実行基盤に関する特徴量をグループ化する。処理の詳細については後述する。

次に、ステップ１００３において、原因推論システム１００が基盤特徴量推論処理部１０４を呼び出し、前述の基盤特徴量グループ化処理部１０３でグループ化された特徴量それぞれを用いて実行基盤構築の失敗原因に関する推論を行う。処理の詳細については後述する。

次に、ステップ１００４において、原因推論システム１００がエラー内容特徴量作成・推論処理部１０５を呼び出し、前ステップ１０００にて原因推論システムが受信した実行基盤構築失敗時（異常時）のエラー内容テキスト情報に基づいてエラー内容に関する特徴量を作成し、実行基盤構築の失敗原因に関する推論を行う。処理の詳細については後述する。

次に、ステップ１００５において、原因推論システム１００が基盤・エラー内容関連付処理部１０６を呼び出し、基盤グループ・エラー内容対応テーブル１１２と基盤グループ化テーブル１１１に基づいて、エラー内容に関する特徴量を実行基盤と関連付けた後、さらに基盤に関する特徴量のグループと関連付ける。処理の詳細については後述する。

次に、ステップ１００６において、原因推論システム１００が組み合わせ決定処理部１０７を呼び出し、過去事例蓄積データベース１３０に蓄積された過去の原因推論結果とその精度の情報に基づいて、基盤に関する特徴量による推論結果とエラー内容に関する特徴量による推論結果の組み合わせを決定する。処理の詳細については後述する。

次に、ステップ１００７において、原因推論システム１００が推論結果組み合わせ処理部１０８を呼び出し、前ステップ１００６において決定した組み合わせに基づいて、基盤に関する特徴量による推論結果とエラー内容に関する特徴量による推論結果を組み合わせ、コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗原因について最終的な推論結果を導く。

次に、ステップ１００８において、原因推論システム１００が推論結果を端末３１０のクライアントプログラム７１１に送信し、原因推論システムＧＵＩ１４０の原因推論結果表示画面６２０に推論結果を表示する。なお、検索結果はGUIに表示せず、ユーザ２００は推論結果をデータとして受け取っても良い。

最後に、ステップ１００９において、過去事例蓄積データベース１３０の過去事例テーブル１３２に、受付番号、アプリケーションID、ユーザ２００が原因推論システムＧＵＩ１４０の実行基盤構築失敗内容入力画面６１０に入力した異常時基盤構築情報およびエラー内容テキスト情報、推論過程で作成したエラー内容特徴量および基盤特徴量、推論結果を保存する。

なお、過去事例蓄積データベース１３０の過去事例テーブル１３２への各種データの保存は、保存すべきデータが作成されたタイミング、例えば、ユーザ２００の原因推論リクエストに対して受付番号を発行したとき、ユーザ２００が原因推論システムＧＵＩ１４０の実行基盤構築失敗内容入力画面６１０に入力しアプリケーション名のアプリケーションIDを特定したとき、ユーザ２００が原因推論システムＧＵＩ１４０の実行基盤構築失敗内容入力画面６１０に入力した異常時基盤構築情報およびエラー内容テキスト情報を受け付けたとき、エラー内容特徴量および基盤特徴量を作成したとき、推論結果を算出したとき、に別々に行ってもよい。

図９に、基盤特徴量作成処理部１０２が実行基盤構築情報から実行基盤に関する特徴量を作成する処理の一例を示す。以下の処理は、原因推論システム１００によって基盤特徴量作成処理部１０２が呼び出されたことを契機に実行される。

まず、ステップ１０２１において、基盤特徴量作成処理部１０２が、正常動作データベース１２０の正常時実行基盤構築情報テーブル１２１のアプリケーション名１２１１を参照し、実行基盤構築に失敗したアプリケーションと同じアプリケーションのアプリケーションID１２１２と正常時基盤構築情報１２１３を取得する。

以降、コンテナ技術によるアプリケーションおよびその実行基盤の構築ツールとして、Kubernetesを利用したアプリケーションを構築する場合を例に、図４Aに示すような項目（key）７１１と値（Value）７１２による実行基盤構築情報７１０が入力されたと仮定して処理方法を述べる。

ステップ１０２２において基盤構築情報から項目（key）７１１をひとつ選択する。
次に、ステップ１０２３において選択した項目（key）７１１について正常時と異常時の値（Value）７１２を比較する。

次に、ステップ１０２４において前ステップの比較結果に基づいて選択した項目（key）７１１に対応する特徴量のベクトル値を設定する。例えば、正常時と異常時の値（Value）７１２が等しい場合にはその旨を表すベクトル値（例えば0）を設定し、正常時と異常時の値（Value）７１２が異なる場合にはその旨を表すベクトル値（例えば1）を設定することや、値（Value）７１２の大小によってベクトル値（例えば-0.5）を設定すること、正常時と異常時のどちらかにしか値が存在しない場合にはその旨を表すベクトル値（例えば-1）を設定するなどが考えられる。

次に、ステップ１０２５において選択した項目（key）７１１が最後の実行基盤の構築情報の項目（key）７１１であるかを確認し、最後の項目（key）７１１であればステップ１０２６へ進み、最後でなければステップ１０２２へ戻る。

最後に、ステップ１０２６において、作成した実行基盤に関する特徴量を原因推論システム１００に返す。

なお、基盤に関する特徴量は、基盤構築情報から作成されるものであれば、基盤構築情報が項目（key）７１１と値（Value）７１２以外の形式で入力される場合は上記以外の方法で行われてもよいし、基盤構築情報が項目（key）７１１と値（Value）７１２以外の形式で入力される場合であっても、上記以外の方法で基盤に関する特徴量の作成を行ってもよい。

図１０に、基盤特徴量グループ化処理部１０３が実行基盤に関する特徴量をグループ化する処理の一例を示す。以下の処理は、原因推論システム１００によって基盤特徴量グループ化処理部１０３が呼び出されたことを契機に実行される。

まず、ステップ１０３１において、基盤に関する特徴量のベクトル値をひとつ選択する。
次に、ステップ１０３２において、基盤グループ化テーブル１１１のグループ化に関する条件１１１３を参照し、対応するグループに振り分ける。このグループ化に関する条件１１１３は、基盤に関する特徴量の作成元である実行基盤構築の定義情報の関連性が強い特徴量同士でグループ化するための条件である。例えば、Kubernetesを利用したアプリケーションの構築の場合には、YAML形式で記載された実行基盤の構築情報の項目（key）７１１に注目し、ネットワークに関する項目（key）７１１に関する特徴量のグループ、ストレージに関する項目（key）７１１に関する特徴量のグループ、のように、アプリケーションを構成するリソースごとのグループを設定し、各特徴量のベクトル値がどのリソースを定義する項目（key）７１１から作成されたかを判断基準とした条件を設定してグループ化することが考えられる。

次に、ステップ１０３３において、選択した基盤に関する特徴量のベクトル値が最後のベクトル値であるかを確認し、最後のベクトル値であればステップ１０３４へ進み、最後でなければステップ１０３１へ戻る。

最後に、ステップ１０３４において、グループ化した基盤に関する特徴量を原因推論システム１００に返す。

図１１に、基盤特徴量推論処理部１０４がグループ化された特徴量を用いて実行基盤構築の失敗原因に関する推論を行う処理の一例を示す。以下の処理は、原因推論システム１００によって基盤特徴量推論処理部１０４が呼び出されたことを契機に実行される。

まず、ステップ１０４１において、グループ化した基盤に関する特徴量をひとつ選択する。
次に、ステップ１０４２において、過去事例蓄積データベース１３０の過去事例テーブル１３２から、前ステップで選択した基盤に関する特徴量のグループと同じグループの基盤特徴量１３２６をすべてまたは一部取得し、推論モデルの構築（学習）処理を行う。この際に用いる推論方法は決定木やSupport Vector Machineなどの機械学習方法を用いることが考えられる。

次に、ステップ１０４３において、前ステップにおいて構築（学習）した推論モデルを用いて、実行基盤構築の失敗原因を推論する。
次に、ステップ１０４４において、選択したグループが最後のグループであるかを確認し、最後のグループであればステップ１０４５へ進み、最後でなければステップ１０４１へ戻る。
最後に、ステップ１０４５において、推論結果を原因推論システム１００に返す。

図１２に、エラー内容特徴量作成・推論処理部１０５において、ユーザ２００が入力したエラー内容テキスト情報に基づいてエラー内容に関する特徴量を作成し、実行基盤構築の失敗原因に関する推論を行う処理の一例を示す。以下の処理は、原因推論システム１００によってエラー内容特徴量作成・推論処理部１０５が呼び出されたことを契機に実行される。

まず、ステップ１０５１において、ユーザ２００が入力したエラー内容テキスト情報に基づいてエラー内容に関する特徴量を作成する。エラー内容に関する特徴量作成の方法として、たとえば、word2vec（MIKOLOV, Tomas, et al, “Efficient estimation of word representations in vector space”, arXiv preprint arXiv:1301.3781, 2013.）のような単語をベクトル化する手法を用いてエラー内容に関するテキスト情報に含まれる単語をベクトル化して利用する方法や、doc2vec(Le, Quoc, et al, "Distributed representations of sentences and documents." International conference on machine learning. 2014.)やtf-idf(term frequency-inverse document frequency)のような文書全体の特徴をベクトル化する手法を用いる方法が考えられる。また、エラー内容に関する特徴量作成には、ユーザ２００が入力したエラー内容テキスト情報に加えて、過去事例蓄積データベース１３０の過去事例テーブル１３２から、すべてまたは一部のエラー内容テキスト情報１３２４を用いたり、事前にエラー内容テキストとして入力されうる情報（たとえば、kubernetesなどのツールが出力するエラーメッセージなど）をデータベース化した情報などを用いたり、その両方を用いてもよい。また、エラー内容テキスト情報として入力されたテキスト全体を用いて特徴量を作成してもよいし、一部だけを抽出して特徴量を作成してもよい。

次に、ステップ１０５２において、過去事例蓄積データベース１３０の過去事例テーブル１３２から、エラー内容特徴量１３２５をすべてまたは一部取得し、推論モデルの構築（学習）処理を行う。この際に用いる推論方法は決定木やSupport Vector Machineなどの機械学習方法を用いることが考えられる。また、本ステップ１０５２で用いる推論モデルの構築方法は、基盤特徴量推論処理部１０４のステップ１０４２で用いる方法と同一であってもよいし、異なってもよい。

次に、ステップ１０５３において、前ステップにおいて構築（学習）した推論モデルを用いて、実行基盤構築の失敗原因を推論する。
最後に、ステップ１０５４において、推論結果を原因推論システム１００に返す。
なお、上記ステップ１０５１の特徴量作成処理と上記ステップ１０５２の推論モデル構築処理は、それぞれ独立した処理部として構成されていてもよい。

図１３に、基盤・エラー内容関連付処理部１０６が基盤グループ・エラー内容対応テーブル１１２と基盤グループ化テーブル１１１に基づいて、エラー内容に関する特徴量を実行基盤と関連付けた後、さらに基盤に関する特徴量のグループと関連付ける処理の一例を示す。以下の処理は、原因推論システム１００によってエラー内容特徴量作成・推論処理部１０５が呼び出されたことを契機に実行される。

まず、ステップ１０６１において、基盤グループ・エラー内容対応テーブル１１２の条件ID１１２１をひとつ選択する。

次に、ステップ１０６２において、選択した条件ID１１２１の条件１１２２が、ユーザ２００が入力したエラー内容テキスト情報に合致するか確認する。条件が合致すればステップ１０６３へ進み、合致しなければステップ１０６１へ戻る。この基盤グループとエラー内容の対応付けに関する条件１１２２は、実行基盤構築情報とエラー内容という異なる二つの情報を持つ基盤に関する特徴量とエラー内容に関する特徴量を関連付けするための条件である。その例として、例えばエラーはアプリケーションを構成するリソース（ネットワークやストレージ）のどこで発生したかに基づいて条件を設定する方法や、エラーメッセージを出力したコンポーネントがアプリケーションを構成するリソースのうち何を管理するかに基づいて条件を設定する方法などが考えられる。

次に、ステップ１０６３において、基盤グループ・エラー内容対応テーブル１１２を参照し、条件に合致するグループID１１２３を取得し、基盤グループ化テーブル１１１のグループID１１１１と対応付けることで、エラー内容に関する特徴量のグループを決定する。
最後に、ステップ１０６４において、グループ決定結果を原因推論システム１００に返す。

図１４に、組み合わせ決定処理部１０７が、過去事例蓄積データベース１３０の組み合わせ相性テーブル１３１に基づいて、基盤に関する特徴量による推論結果とエラー内容に関する特徴量による推論結果の組み合わせを決定する処理の一例を示す。以下の処理は、原因推論システム１００によってエラー内容特徴量作成・推論処理部１０５が呼び出されたことを契機に実行される。

まず、ステップ１０７１において、過去事例蓄積データベース１３０の組み合わせ相性テーブル１３１から、過去事例の受付番号１３１１をひとつ選ぶ。
次に、ステップ１０７２において、選択した受付番号１３１１の過去事例のグループID１３１３が、基盤・エラー内容関連付処理部１０６で決定したエラー内容に関する特徴量のグループ１１２３と一致するか確認し、一致すればステップ１０７３へ進み、一致しなければステップ１０７４へ進む。

ステップ１０７３では、選択した受付番号の過去事例を組み合わせ相手グループ決定の参考事例としてマークする。
次に、ステップ１０７４において、選択した受付番号の過去事例が最後の過去事例であるかを確認し、最後であればステップ１０７５へ進み、最後でなければステップ１０７１へ戻る。

次に、ステップ１０７５において、参考候補の情報に基づいて組み合わせを決定する。組み合わせ決定方法の例として、例えば、組み合わせ相性テーブル１３１の組み合わせ相性１３１４に各グループと組み合わせた場合の推論結果の正誤が記載されている場合には正しい推論が最も多いグループとの組み合わせを組み合わせ相手とする方法や、組み合わせ相性テーブル１３１の組み合わせ相性１３１４に推論時に計算される推論結果に対する精度の確率値が記載されている場合にはその平均値が最も高いグループとの組み合わせを組み合わせ相手とする方法、各グループと組み合わせた場合の推論結果の正誤と推論結果に対する精度の確率値の両方を考慮して組み合わせ相手を決定する方法が挙げられる。

最後に、ステップ１０７６において組み合わせ相手を原因推論システム１００に返す。
なお、決定する組み合わせ相手は1グループに限らず、複数であってもよい。また、組み合わせのバリエーションも1パターンに限らず、複数提案してもよいし、その中で推論精度が高いと考えられる順に順位付けされていてもよい。また、ステップ１０７３でマークした過去事例を組み合わせ相手グループ決定の参考事例を、組み合わせ相性テーブル１３１のアプリケーションID１３１２を参考に絞り込んでから組み合わせ相手を決定してもよい。

図１５に、推論結果組み合わせ処理部１０８が、組み合わせ決定処理部１０７において決定した組み合わせに基づいて、基盤に関する特徴量による推論結果とエラー内容に関する特徴量による推論結果を組み合わせ、コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗原因について最終的な推論結果を導く処理の一例を示す。以下の処理は、原因推論システム１００によってエラー内容特徴量作成・推論処理部１０５が呼び出されたことを契機に実行される。

まず、ステップ１０８１において、組み合わせ決定処理部１０７において決定した組み合わせを一つ選択し、エラー内容に関する特徴量の推論結果と、組み合わせる基盤に関する特徴量の推論結果を取得する。

次に、ステップ１０８２において、エラー内容に関する特徴量の推論結果と、組み合わせる基盤に関する特徴量の推論結果とを組み合わせ、失敗原因についての最終的な推論結果を導く。組み合わせの例としては、たとえば、過去事例蓄積データベース１３０に蓄積された過去の推論精度や、推論時に推論結果に対する精度の確率値が計算される場合にはその確率値に基づいて推論結果に重みづけを行って最終的な推論結果を導く方法や、組み合わせる推論結果の中で最も多く原因であると推論された結果を採用する方法や、推論に用いるグループの特性に応じて、あらかじめ設定した条件により推論結果を決定する（たとえば、グループAの推論結果がaであり推論時に計算される精度の確率値がn以下である場合にはグループBの結果を採用する、組み合わせにグループCが含まれる場合には推論時に計算されるグループCとグループDの確率値を足し合わせてグループEと比較する、など）方法などが考えられる。

次に、ステップ１０８３において、選択した組み合わせが最後の組み合わせであるかを確認し、最後であればステップ１０８４へ進み、最後でなければステップ１０８１へ戻る。
最後に、ステップ１０８４において、最終的な推論結果を原因推論システム１００に返す。

なお、失敗原因に基づいてアプリケーションの開発者がアプリケーションのパッケージに含まれるソースコードを修正する場合と、アプリケーションの利用者が実行基盤を構築しようとする環境を修正する場合が想定されるが、推論結果組み合わせ処理部１０８が導く最終的な失敗原因の推論結果は、実行基盤構築の失敗原因箇所そのものであってもよいし、失敗箇所が発生する原因となったユーザ２００（たとえばアプリケーション開発者または利用者）であってもよいし、その両方であってもよい。

実施例１では、ユーザ２００が原因推論システムＧＵＩ１４０の実行基盤構築失敗内容入力画面６１０に入力した、または実行基盤およびアプリケーションが原因推論システム１００と通信可能な場合は実行基盤構築失敗内容入力画面６１０を介さずに直接原因推論システム１００に入力された、基盤構築情報とエラー内容情報に基づいて、コンテナ技術を用いたアプリケーションおよびその実行基盤構築の失敗原因の推論を行う例を述べた。しかし、推論の過程においては、基盤特徴量推論処理部１０４における推論モデル構築（学習）処理ステップやエラー内容特徴量作成・推論処理部１０５における推論モデル構築（学習）処理ステップのように時間がかかる処理が存在する。また、各処理部における処理をひとつずつ順番に行っている。よって、原因推論結果のユーザ２００への提示が遅くなってしまう。

これを改善するため、上述のような時間がかかる処理を事前に行ってその処理結果を原因推論システムのメモリまたは記憶装置に保持しておき、失敗原因の推論時に参照することで、ユーザ２００による情報入力から原因推論結果の提示までにかかる時間を短縮できる。また、基盤構築情報とエラー内容情報の一方だけで行える処理を並列して行ってその処理結果を原因推論システムのメモリまたは記憶装置９２０に保持しておき、その処理結果を用いて両方の情報が必要な処理を行うことで、さらに時間を短縮できる。処理結果を保持する場所は原因推論システムのメモリまたは記憶装置９２０上だけでなく、別にネットワークアクセス可能なデータベースを設けてそこに保持しても良いし、端末のメモリまたは記憶装置９１０に保持しても良い。

本実施例では、実行環境構築失敗時（異常時）の基盤構築情報とエラー内容情報を用いない処理を事前に行うことができ、また、実行環境構築失敗時（異常時）の基盤構築情報とエラー内容情報の一方だけで行える処理は並列して実行可能である。

まず、事前の実施が適用できる処理について述べる。具体的には、基盤特徴量推論処理部１０４における推論モデル構築（学習）処理ステップ１０４２やエラー内容特徴量作成・推論処理部１０５における推論モデル構築（学習）処理ステップ１０５２、などの処理が事前に実施可能である。

例えば、基盤特徴量推論処理部１０４における推論モデル構築（学習）処理ステップ１０４２とエラー内容特徴量作成・推論処理部１０５における推論モデル構築（学習）処理ステップ１０５２は、図８に示すアプリケーション実行基盤の情報とエラー内容を表すテキスト文章を用いたアプリケーション実行基盤の構築失敗原因推論処理の一例において、結果を保存するステップ１００９によって過去事例蓄積データベース１３０の過去事例テーブル１３２にエラー内容特徴量と基盤特徴量が保存されたことを契機に行うことができる。

または、エラー内容特徴量作成・推論処理部１０５の特徴量作成ステップ１０５１によりエラー内容に関する特徴量が作成された際に過去事例蓄積データベース１３０の過去事例テーブル１３２にエラー内容特徴量１３２５が登録される場合は、その際にエラー内容特徴量作成・推論処理部１０５における推論モデル構築（学習）処理ステップ１０５２を行ってもよいし、基盤特徴量グループ化処理部１０３により基盤に関する特徴量が作成された際に過去事例蓄積データベース１３０の過去事例テーブル１３２に基盤特徴量１３２６が登録される場合は、その際にエラー内容特徴量作成・推論処理部１０５における推論モデル構築（学習）処理ステップ１０５２を行ってもよい。ただし、その場合には、失敗原因の推論は原因を推論したい失敗に関する特徴量（直前に作成した新しい特徴量）を含まない過去の事例だけを使って構築（学習）されたモデルを使って推論を行うものとする。

以下では、並列化可能な処理について述べる。具体的には、図８に示すアプリケーション実行基盤の情報とエラー内容を表すテキスト文章を用いたアプリケーション実行基盤の構築失敗原因推論処理の一例のうち、基盤特徴量作成処理部１０２による基盤に関する特徴量の作成処理（ステップ１００１）から基盤特徴量グループ化処理部１０３による基盤に関する特徴量のグループ化（ステップ１００２）を経て基盤特徴量推論処理部１０４による基盤に関する特徴量を用いた推論処理（ステップ１００３）を行うまでの一連の流れと、エラー内容特徴量作成・推論処理部１０５によるエラー内容に関する特徴量の作成と同特徴量を用いた推論処理（ステップ１００４）と、基盤・エラー内容関連付処理部１０６による基盤グループとエラー内容の関連付け処理（ステップ１００５）から組み合わせ決定処理部１０７による推論結果の組み合わせを決定する処理（ステップ１００６）を行うまでの一連の流れ、の最大3つの処理フローを並列化できる。これら3つの処理フローは、すべてが独立して並列化されていてもよいし、このうち任意の2つの処理フローが1つのフローとして順番に行われてもよい。また、その場合の順番は問わないものとする。

また、上記の処理以外であっても、ユーザ２００が原因推論システムＧＵＩ１４０の実行基盤構築失敗内容入力画面６１０に入力する実行環境構築失敗時（異常時）の基盤構築情報とエラー内容情報を用いなくても行える処理であれば、当該情報の入力を待たずに事前に処理を実行しておき、その結果を検索時に呼び出す形をとっても良いし、実行環境構築失敗時（異常時）の基盤構築情報とエラー内容情報の一方だけで行える処理は並列して行ってもよい。

上述してきたように、本実施の形態によれば、原因推論システムは、コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、前記構築の成功時の前記実行基盤の情報を保存するデータベースと、前記構築の失敗時の実行基盤の情報を受け付けるとともに、前記失敗時のエラー内容を表すテキスト情報を受け付けるインタフェースと、前記失敗時および前記成功時の前記実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理部と、前記テキスト情報に基づいて作成した特徴量を使って、前記失敗原因の推論を行う第２の推論処理部と、前記第１の推論処理部による推論結果と、前記第２の推論処理部による推論結果とを組み合わせ、前記実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理部と、を備える。
かかる構成及び動作により、原因推論システムは、コンテナ技術を用いたアプリケーションおよびその実行基盤の構築に失敗した際に、アプリ実行基盤の構築先環境とエラー報告文書に記載されるエラー内容の両方を考慮して自動で原因を推論することが可能となる。また、エラー報告文書のみを用いて推論を行う場合に比べ、より精度の高い推論の実現することができる。
このため、本実施の形態によれば、コンテナアプリケーションのデプロイ（アプリケーション実行基盤の構築およびアプリケーションそのものの構築）時に発生する障害の対応を支援することができる。

また、本実施の形態に係る原因推論システムは、前記失敗時および前記成功時の実行基盤の情報の差分から基盤特徴量を作成する基盤特徴量作成処理部と、前記基盤特徴量を、関連するリソースの種類ごとにグループ化するグループ化処理部と、をさらに備え、前記第１の推論処理部は、前記グループ化された基盤特徴量を用い、前記リソースの種類ごとに前記失敗原因の推論を行う。
このため、膨大な実行基盤構築の定義情報から作成される膨大な特徴量を分割してから推論を行うことで、特徴量の次元を下げることができ、精度の高い推論を行うことが可能となる。また、実行基盤構築の定義情報の関連性に基づいて特徴量をグループ化することから、統計処理による数値的なグループ化に比べて各グループに対して明確に基盤の情報を反映することが可能であり、このような特徴量を用いて基盤特徴量推論処理を行うことによって、得られる推論結果と実行基盤との結びつけを保つことが可能となる。さらに、実行基盤との関連性を保持した推論結果を用いて推論結果の組み合わせを行うことで、より精度の高い組み合わせ結果を得ることが可能となる。

また、本実施の形態に係る原因推論システムは、前記テキスト情報を、前記リソースの種類に関連付ける関連付処理部と、前記テキスト情報に関連付けられたリソースの種類に基づいて推論結果の組み合わせを決定する組み合わせ決定処理部と、をさらに備える。また、過去の推論結果に関する情報を蓄積する過去事例蓄積部をさらに備え、前記組み合わせ決定処理部は、前記過去事例蓄積部を参照して、推論結果の組合せを決定する。
かかる構成及び動作により、過去の事例を利用して実行基盤に基づく推論結果と、エラーログに基づく推論結果とを適切に組み合わせることができる。

また、本実施の形態に係る原因推論システムは、前記組み合わせ処理部による最終的な結論を表示出力する表示出力部をさらに備える。また、前記組み合わせ処理部は、前記最終的な結論として複数の原因の候補を順位付けし、前記表示出力部は、順位付けされた複数の原因の候補を表示出力する。
かかる構成及び動作により、推論結果をユーザに提示し、コンテナアプリケーションのデプロイ時に発生する障害の対応を支援することができる。

また、本実施の形態によれば、前記組み合わせ処理部は、前記最終的な結論として、前記失敗が前記アプリケーションの開発者に起因するか、前記アプリケーションの利用者に起因するかを判別することができる。
このため、障害の対応を行うべき適切なユーザへの通知が可能である。

なお、本発明は上述の実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、かかる構成の削除に限らず、構成の置き換えや追加も可能である。

例えば、図１に示したデータベースを外部に設けた、原因推論装置として実施してもよい。

１００……原因推論システム、１０２……基盤特徴量作成処理部、１０３……基盤特徴量グループ化処理部、１０４……基盤特徴量推論処理部、１０５……エラー内容特徴量作成・推論処理部、１０６……基盤・エラー内容関連付処理部、１０７……組み合わせ決定処理部、１０８……推論結果組み合わせ処理部、１２０……正常動作データベース、１３０……過去事例蓄積データベース１３０、１４０……原因推論システムＧＵＩ

Claims

コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、前記構築の成功時の前記実行基盤の情報を保存するデータベースと、
前記構築の失敗時の実行基盤の情報を受け付けるとともに、前記失敗時のエラー内容を表すテキスト情報を受け付けるインタフェースと、
前記失敗時および前記成功時の前記実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理部と、
前記テキスト情報に基づいて作成した特徴量を使って、前記失敗原因の推論を行う第２の推論処理部と、
前記第１の推論処理部による推論結果と、前記第２の推論処理部による推論結果とを組み合わせ、前記実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理部と、
を備えたことを特徴とする原因推論システム。
前記失敗時および前記成功時の実行基盤の情報から基盤特徴量を作成する基盤特徴量作成処理部と、
前記基盤特徴量を、関連するリソースの種類ごとにグループ化するグループ化処理部と、をさらに備え、
前記第１の推論処理部は、前記グループ化された基盤特徴量を用い、前記リソースの種類ごとに前記失敗原因の推論を行う
ことを特徴とする請求項１に記載の原因推論システム。
前記テキスト情報を、前記リソースの種類に関連付ける関連付処理部と、
前記テキスト情報に関連付けられたリソースの種類に基づいて推論結果の組み合わせを決定する組み合わせ決定処理部と、
をさらに備えたことを特徴とする請求項２に記載の原因推論システム。
過去の推論結果に関する情報を蓄積する過去事例蓄積部をさらに備え、
前記組み合わせ決定処理部は、前記過去事例蓄積部を参照して、推論結果の組合せを決定する
ことを特徴とする請求項３に記載の原因推論システム。
前記組み合わせ処理部による最終的な結論を表示出力する表示出力部をさらに備えたことを特徴とする請求項１に記載の原因推論システム。
前記組み合わせ処理部は、前記最終的な結論として複数の原因の候補を順位付けし、
前記表示出力部は、順位付けされた複数の原因の候補を表示出力する
ことを特徴とする請求項５に記載の原因推論システム。
前記組み合わせ処理部は、前記最終的な結論として、前記失敗が前記アプリケーションの開発者に起因するか、前記アプリケーションの利用者に起因するかを判別することを特徴とする請求項１に記載の原因推論システム。
コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、前記構築の失敗時の実行基盤の情報を受け付けるとともに、前記失敗時のエラー内容を表すテキスト情報を受け付けるインタフェースと、
前記構築の成功時の前記実行基盤の情報を保存するデータベースを参照し、前記失敗時および前記成功時の前記実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理部と、
前記テキスト情報に基づいて作成した特徴量を使って、前記失敗原因の推論を行う第２の推論処理部と、
前記第１の推論処理部による推論結果と、前記第２の推論処理部による推論結果とを組み合わせ、前記実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理部と、
を備えたことを特徴とする原因推論装置。
コンテナ技術を用いたアプリケーションおよびその実行基盤の構築について、前記構築の失敗時の実行基盤の情報を受け付けるとともに、前記失敗時のエラー内容を表すテキスト情報を受け付ける受付ステップと、
前記構築の成功時の前記実行基盤の情報を参照し、前記失敗時および前記成功時の前記実行基盤の情報に基づいて作成した特徴量を使って、失敗原因の推論を行う第１の推論処理ステップと、
前記テキスト情報に基づいて作成した特徴量を使って、前記失敗原因の推論を行う第２の推論処理ステップと、
前記第１の推論処理ステップによる推論結果と、前記第２の推論処理ステップによる推論結果とを組み合わせ、前記実行基盤の構築が失敗した原因について最終的な結論を導く組み合わせ処理ステップと、
を含むことを特徴とする原因推論方法。