JPWO2019073894A1 - 構成管理装置、構成管理方法および構成管理プログラム - Google Patents

構成管理装置、構成管理方法および構成管理プログラム Download PDF

Info

Publication number
JPWO2019073894A1
JPWO2019073894A1 JP2019548160A JP2019548160A JPWO2019073894A1 JP WO2019073894 A1 JPWO2019073894 A1 JP WO2019073894A1 JP 2019548160 A JP2019548160 A JP 2019548160A JP 2019548160 A JP2019548160 A JP 2019548160A JP WO2019073894 A1 JPWO2019073894 A1 JP WO2019073894A1
Authority
JP
Japan
Prior art keywords
procedure
configuration management
parameter
trial
management device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019548160A
Other languages
English (en)
Other versions
JP6908126B2 (ja
Inventor
学 中野谷
学 中野谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2019073894A1 publication Critical patent/JPWO2019073894A1/ja
Application granted granted Critical
Publication of JP6908126B2 publication Critical patent/JP6908126B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/70Software maintenance or management
    • G06F8/71Version control; Configuration management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Stored Programmes (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

構成管理装置10は、管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習する構成管理装置であって、試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算する類似性計算手段11と、計算された類似性の度合いを用いてパラメータの候補が試行対象の変更手順に含まれる確率を計算する確率計算手段12とを備える。

Description

本発明は、構成管理装置、構成管理方法および記録媒体に関し、特に強化学習により構成が管理および変更されるシステムの変更操作手順を学習できる構成管理装置、構成管理方法および記録媒体に関する。
IT(Information Technology)システムの構成管理および構成変更で繰り返し実行される作業は、大きく3つに分けられる。1つ目の作業は、現在運用中のシステムの構成を把握する作業である。2つ目の作業は、変更要件を定義する作業である。3つ目の作業は、1つ目の作業の実行結果と2つ目の作業の実行結果とから導出される変更操作手順(以下、変更手順と呼ぶ。)を生成する作業、および生成された変更手順を実行する作業である。
上記の3つの作業のうち、変更手順が生成され、生成された変更手順が実行される3つ目の作業は、特に手動で実行された時に工数の掛かる作業である。3つ目の作業に掛かる工数を削減できる様々な自動化技術が、開発および提案されている。
例えば、非特許文献1〜2には、変更操作を自動で実行するソフトウェアツールが記載されている。非特許文献1〜2に記載されているソフトウェアツールは、システムが変更された後の状態や、変更時の変更操作順序に関する定義情報を入力として、システムの変更や設定を自動で行うツールである。
ただし、非特許文献1〜2に記載されているソフトウェアツールは、変更操作のみを自動で実行し、変更手順を自動で生成しない。変更手順を自動で生成する技術として、特許文献1には、ITシステムの構成要素の動作状態と動作状態間の制約を定義することによって変更に要する手順を生成する変更計画システムが記載されている。
また、部品の状態と制約との関係を状態遷移図で表現する手法では、一般的にシステムの設計情報と状態遷移図との変換方法が課題になる。特許文献2には、上記の課題を解決できる、状態を有するモデルを効率的に記述する変更管理システムが記載されている。
特許文献1に記載されている変更計画システム、および特許文献2に記載されている変更管理システムが使用されると、非特許文献1〜2に記載されている変更手順を自動で実行するソフトウェアツールの入力形式で構成の変更手順を示す情報が生成される。すなわち、変更手順の生成から実行まで全て自動で行われる。
上記のように、システム管理者は、特許文献1に記載されている変更計画システム、および特許文献2に記載されている変更管理システムを使用すると、変更手順を自動で生成できる。しかし、変更計画システムおよび変更管理システムを使用するにあたり、システム管理者には、ITシステムの構成要素の動作状態と、動作状態間の制約を事前に定義することが求められる。
ITシステムの構成要素の動作状態と、動作状態間の制約を示す定義情報は、管理対象のITシステムの構成要素の動作を熟知した技術者が手動で生成するという方法以外の方法では生成が困難な情報である。すなわち、上記の定義情報の生成は、システム構成変更に掛かる工数を増大させる新たな要因になる。
定義情報を容易に生成するためには、例えば、処理を実行してシステムの構成要素間の依存関係を確認し、構成要素間の依存関係を示す情報を検出することが考えられる。依存関係は、構成要素の全ての組み合わせに対して確認されることが求められる。
また、処理を実行して適切な変更手順を導出する技術のうち、強化学習が用いられる技術が普及している。例えば、非特許文献3〜4には、CPU(Central Processing Unit )やメモリ割り当て量等のサーバのリソースやアプリケーションの様々な組み合わせに対して変更操作を試行し、試行結果を評価および学習することによって、最適な変更手順や変更パラメータを導出する技術が記載されている。
強化学習では、制御対象の状態や所定の状態における制御に対して、状態や制御の「好ましさ」を表す報酬と呼ばれるスカラー値が定義される。一般的にエージェントと呼ばれる学習する主体は、学習対象の制御が実行される外部の環境から報酬を逐次的に取得することによって学習を行う。取得された様々な状態や制御に対する報酬の中で相対的に大きな値は、「高い報酬」と表現される。
強化学習の分野では、学習対象の制御(例えば、変更操作)の組み合わせが膨大である場合に現実的な時間内に学習を完了させるための高速化技術が研究されている。
例えば、非特許文献5には、ロボットの制御等、操作が実数等の連続空間で規定される強化学習問題に対して、学習の効率化を実現する技術が記載されている。操作が連続空間で規定されると、適当な離散化が行われても強化学習問題における組み合わせが膨大になりやすい。
非特許文献5に記載されている技術は、具体的には、高い報酬が得られた制御に近い値を有する制御から同様に高い報酬が得られやすいという前提に基づいて、学習対象の制御を高い報酬が得られた制御を平均とする正規分布等で逐次定義することによって、学習の効率化を実現する。
また、特許文献3には、効率的学習を実現するために、どの試行または動作を次に試すかを選択する自動化された動作選択方法が記載されている。また、特許文献4には、変更可能性のある項目の値のみが異なる変更要求であっても、正しく処理することが可能なシステム変更支援システムが記載されている。
特開2015−215885号公報 特開2015−215887号公報 特表2008−508581号公報 国際公開第2017/033389号
"Puppet 5.1 reference manual" 、[online]、Puppet、[ 平成29年 9月 5日検索] 、インターネット<https://docs.puppet.com/puppet/5.1/index.html> "Ansible(登録商標) v2.4"、[online]、Ansible 、[ 平成29年 9月 5日検索] 、インターネット<http://docs.ansible.com/ansible/latest/intro.html> J. Rao, X. Bu, C. Z. Xu and K. Wang, "A Distributed Self-Learning Approach for Elastic Provisioning of Virtualized Cloud Resources," In 19th Annual IEEE International Symposium on Modelling, Analysis, and Simulation of Computer and Telecommunication Systems, IEEE, 2011, pages 45-54. I. J. Jureta, S. Faulkner, Y. Achbany and M. Saerens, "Dynamic Web Service Composition within a Service-Oriented Architecture," In IEEE International Conference on Web Services, IEEE, 2007, pages 1-8. Cheng-Jian Lin and Chin-Teng Lin, "Reinforcement learning for an ART-based fuzzy adaptive learning control network," IEEE TRANSACTIONS ON NEURAL NETWORKS, IEEE, 1996, 7(3), pages 709-731.
非特許文献3〜4に記載されている実験的に多くのパターンを試行する研究法には、試行候補である変更手順のパターンが膨大になると現実的な時間内に試行や学習が完了しないという問題がある。すなわち、非特許文献3〜4に記載されている研究法の適用範囲は、変更手順のパターンやパラメータが少ない特殊な場合に限定される。
しかし、一般的にITシステムの変更手順において、変更箇所や変更時に指定されるパラメータの値の組み合わせは膨大になることが多い。よって、上述した非特許文献3〜4に記載されている手法が使用される一般的な強化学習技術は、ITシステムの変更手順を学習することが困難である。
非特許文献5に記載されている技術は、制御を決定するパラメータが、類似性の度合いが自明に定義される実数等のように連続空間で規定される場合に対してのみ適用される。よって、順序性や類似性の度合い(距離)が自明に定義されないパラメータが含まれるITシステムの変更手順の学習に非特許文献5に記載されている技術を適用することは困難である。
また、特許文献3に記載されている動作選択方法、および特許文献4に記載されているシステム変更支援システムにおいても、順序性や類似性の度合い(距離)が自明に定義されないパラメータが含まれるITシステムの変更手順を学習することは想定されていない。
[発明の目的]
そこで、本発明は、上述した課題を解決する、ITシステムの変更手順を学習する際の試行回数を削減できる構成管理装置、構成管理方法および記録媒体を提供することを目的とする。
本発明による構成管理装置は、管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習する構成管理装置であって、試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算する類似性計算手段と、計算された類似性の度合いを用いてパラメータの候補が試行対象の変更手順に含まれる確率を計算する確率計算手段とを備えることを特徴とする。
本発明による構成管理方法は、管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習する構成管理装置において実行される構成管理方法であって、試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算し、計算された類似性の度合いを用いてパラメータの候補が試行対象の変更手順に含まれる確率を計算することを特徴とする。
本発明による構成管理プログラムを記録したコンピュータ読み取り可能な記録媒体は、管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習するコンピュータにおいて実行される構成管理プログラムであって、コンピュータで実行されるときに、試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算し、計算された類似性の度合いを用いてパラメータの候補が試行対象の変更手順に含まれる確率を計算する構成管理プログラムを記憶する。
本発明によれば、ITシステムの変更手順を学習する際の試行回数を削減できる。
本発明による構成管理装置の第1の実施形態の構成例を示すブロック図である。 第1の実施形態の確率分布決定部110の構成例を示すブロック図である。 包含関係を基に生成される距離関数の例を示す説明図である。 パラメータとしてIPv4アドレスが指定された場合の距離関数の例を示す説明図である。 重みスコアの生成式の例を示す説明図である。 パラメータの選択確率の生成式とIPv4アドレスにおいて生成された確率分布の例を示す説明図である。 第1の実施形態の構成管理装置100による変更手順生成処理の動作を示すフローチャートである。 本発明による構成管理装置の第1の実施形態の他の構成例を示すブロック図である。 本発明の他の実施形態に係る構成管理装置の概要を示すブロック図である。 本発明の各実施形態に係る構成管理装置を実行可能なハードウェア構成例を示す説明図である。
==第1の実施の形態==
[構成の説明]
以下、本発明の実施形態を、図面を参照して説明する。図1は、本発明による構成管理装置の第1の実施形態の構成例を示すブロック図である。
本実施形態の構成管理装置は、定量化が困難な質的パラメータの間に類似性の度合い(距離)を定義し、定義された類似性の度合いを用いて学習(試行)対象のパターンに優先度を付与する。
付与された優先度は、類似性の度合いと学習経過情報を基に決定されたスコアに対応している。また、パラメータ間の類似性の度合い(距離)は、パラメータ間の包含関係を基に定義される。また、包含関係の定義は、パラメータの種類ごとに事前に指定される。
本実施形態の構成管理装置は、優先度を基に試行内容が選択される確率の確率分布を生成する。次いで、構成管理装置は、生成された確率分布に従って試行内容を決定することによって、構成の変更に有効な操作が含まれる正しい変更手順を、他の多くの無効な変更手順よりも優先的に学習する。
図1に示すように、本実施形態の構成管理装置100は、確率分布決定部110と、学習管理部120と、試行決定部130と、状態把握部140と、手順導出部150と、学習データ格納部160とを備える。
また、図1に示すように、確率分布決定部110には、パラメータ集合定義、および重み付け関数が入力される。また、学習管理部120には、要件データが入力される。また、手順導出部150は、変更手順を出力する。
確率分布決定部110は、試行内容が効率的に決定されるために使用される各試行内容の選択確率を決定する機能を有する。確率分布決定部110は、各試行内容の選択確率が規定された確率分布を生成する。
学習管理部120は、入力された要件データを基に試行を繰り返し実行することによって要件を満たす変更手順を学習するための各ステップを制御する機能を有する。
図1に示すように、学習管理部120は、管理対象のITシステムの複製がインストールされた試行環境200と通信可能に接続されている。学習管理部120は、試行決定部130が決定した試行内容を試行環境200で実行する。
次いで、学習管理部120は、状態把握部140が指定した内容に従って試行結果を試行環境200から抽出する。状態把握部140は、入力された要件データを基に試行環境200で稼動する現在のITシステムの要件充足状況を確認する機能を有する。学習管理部120は、抽出された試行結果を評価する。
試行決定部130は、入力された要件データ、および確認された現在のITシステムの要件充足状況を基に次の試行内容を決定する機能を有する。
学習データ格納部160は、試行内容と試行後のITシステムの要件充足状況に基づいた試行結果の評価データを格納する機能を有する。すなわち、学習データ格納部160には、過去の試行結果が格納されている。なお、学習の開始時に、学習データ格納部160に格納されているデータは空である。
手順導出部150は、格納されている学習データに基づいて要件を充足するITシステムに対する変更手順を導出する機能を有する。
以下、本実施形態の構成管理装置100による変更手順を学習する動作を説明する。利用者は、対象システムの変更要件が定義された要件データを学習管理部120に入力する。要件データには、利用者が充足を要求するシステムの要件、および要件の充足に求められる可能性がある制御操作が含まれる。
学習管理部120は、入力された要件データに基づいて学習を開始する。最初に、学習管理部120は、状態把握部140に要件データを入力する。
状態把握部140は、入力された要件データが示す要件を現在の試行環境200が充足しているか否かを確認するための確認処理を特定する。次いで、状態把握部140は、特定された確認処理を学習管理部120に入力する。
学習管理部120は、入力された確認処理を実行する。次いで、学習管理部120は、確認処理が実行された後の試行環境200の状態を記憶する。次いで、学習管理部120は、試行される制御操作を決定するために、要件データに指定されている要件の充足に求められる可能性がある制御操作のリストを試行決定部130に入力する。
試行決定部130は、入力された制御操作のリスト、および学習データ格納部160から取得された過去の試行結果に基づいて、次の試行内容を確率分布を用いて決定する。試行決定部130による決定方法は、強化学習におけるε-greedy 法等の試行選択手法の代替方法である。
次の試行内容を確率分布を用いて決定するために、試行決定部130は、確率分布決定部110に決定対象のパラメータの種類、および過去の試行結果を入力する。
図2は、第1の実施形態の確率分布決定部110の構成例を示すブロック図である。図2に示すように、確率分布決定部110は、距離計算部111と、重み割当部112と、分布化部113とを含む。
また、図2に示すように、距離計算部111には、予めパラメータ集合定義が入力されている。また、重み割当部112には、予め重み付け関数が入力されている。
距離計算部111は、パラメータの種類に応じたパラメータ間の類似性の度合い(距離)を計算する機能を有する。
重み割当部112は、過去の試行結果の評価データと、試行結果におけるパラメータと試行内容に含まれるパラメータとの距離に応じた重みを割り当てる機能を有する。重みを割り当てることによって、重み割当部112は、試行内容に含まれるパラメータにスコアを付与する。
分布化部113は、重み割当部112が算出したスコアを基に確率分布を生成する機能を有する。
本実施形態のパラメータ集合定義には、集合の種類に応じた要素の親子関係(包含関係)が規定されている。集合の種類は、例えば、Linux (登録商標)ファイルシステムのディレクトリや、IP(Internet Protocol) アドレスである。
例えば、IPv4アドレスの集合の要素である「192.168.255.248 」は、ネットワークアドレスとして解釈されると、最短のサブネットマスク長が29である。サブネットマスク長が29である場合のネットワークアドレスと同一のサブネットに属するIPv4アドレスは、ネットワークアドレス自身も含めて「192.168.255.248 」「192.168.255.249 」「192.168.255.250 」「192.168.255.251 」「192.168.255.252 」「192.168.255.253 」「192.168.255.254 」「192.168.255.255 」の8つのアドレスである。
包含関係上、8つのアドレスの中で「192.168.255.248 」は親にあたり、残りの7つのアドレスは子にあたる。本実施形態のパラメータ集合定義には、上記のようなパラメータの種類ごとの親子関係の計算方法がそれぞれ具体的に規定されている。
図2に示すように、試行決定部130が入力したデータのうち、パラメータ種別情報は距離計算部111に入力される。また、試行決定部130が入力したデータのうち、過去の試行結果情報は、重み割当部112に入力される。
距離計算部111は、入力されたパラメータ種別情報が示すパラメータの種類に対応する距離関数を重み割当部112に入力する。距離関数は、例えば図3に示す定義に基づいて生成される。図3は、包含関係を基に生成される距離関数の例を示す説明図である。
図3に示すように、パラメータ集合A がA={ai|i=1,・・・,N} と表現されるとき、パラメータの親の集合をP(ai) ⊆A とする。ただし、ai∈P(ai) であるため、P(ai) には親と子の両方が含まれる。また、パラメータのサイズ(子の要素数)は、|ai|と表現される。
上記の表現を用いて、図3に示す例ではパラメータ間の距離が、dij=mina∈{P(ai)∩P(aj)}|a| (ただし、i=j の場合0)と表現される。すなわち、距離dij は、親の集合の積集合の元の最小値を意味する。
距離計算部111は、2つのパラメータ間の類似性の度合い(距離)を、各パラメータを包含する親のパラメータ集合の積集合の元のうち、最小の要素数として定量化する。本実施形態の距離関数は、パラメータ集合の種類ごとに規定され、上述した集合要素の包含関係を基に決定される。なお、本実施形態の距離関数は、図3に示す定義以外の定義に基づいて生成されてもよい。
図4は、パラメータとしてIPv4アドレスが指定された場合の距離関数の例を示す説明図である。図4に示すように、パラメータ集合A は、A=192.168.0.0/28である。すなわち、集合要素の数は、ネットワークアドレスが除かれるため、15である。
図4に示す行列内の値が、距離関数で算出される値である。なお、図4に示す行と列の各ラベルの値は、「192.168.0.x 」のx の数値である。また、図4に示す行列内の値は、対角成分において同じ値である。なお、図4に示す例では、行列の右上半分の値の記載が省略されている。
距離関数が入力された重み割当部112は、過去の試行結果情報と重み付け関数とを用いて、高い報酬が得られた過去の試行結果情報が示すデータの近傍に存在するパラメータほど高得点となるように重み付けされたスコアを生成する。重み割当部112は、生成されたスコアを分布化部113に入力する。
図5は、重みスコアの生成式の例を示す説明図である。図5に示す例では、パラメータakに割り当てられる重みw(ak) が、過去の行動に対する報酬列R(aj) と重み付け関数f(x)の正規化された距離d’kjにおける値との積の、j=1~M に渡る和として算出される。
すなわち、重み割当部112は、試行候補のパラメータの有力度を、距離計算部111が計算した要件充足へ寄与する度合い(価値)と、過去の試行結果におけるパラメータと試行候補のパラメータとの距離を用いてスコアリングする。
生成されたスコアが入力された分布化部113は、スコアを基に確率分布を生成する。分布化部113は、生成された確率分布を試行決定部130に入力する。分布化部113は、例えばスコアの合計が「1」になるように正規化した上で、確率分布を生成する。
図6は、パラメータの選択確率の生成式とIPv4アドレスにおいて生成された確率分布の例を示す説明図である。図6(a)は、パラメータakの選択確率u(ak) の定義式の例を示す。なお、R(aj) とf(x)の各定義は、図5に示す各定義と同様である。
図6(b)は、図4に示す距離関数の例を基に生成された確率分布を示す。パラメータ集合A は、図4に示す集合A と同様である。また、報酬列R(aj) はR(aj)={3(i=192.168.0.14),6(i=192.168.0.7)}である。また、重み付け関数f(x)はf(x)=exp(-x)、すなわちλ=1の指数分布である。
図6(b)は、上記の条件の下で生成された、図6(a)に示す定義式で算出されたパラメータの選択確率の確率分布を示す。縦軸の数値は、選択確率である。横軸の数値は、「192.168.0.x 」のx の数値である。図6(b)に示すように、パラメータ「192.168.0.7 」が最も選択される確率が高い確率分布が生成されている。
生成された確率分布が入力された試行決定部130は、入力された確率分布に従って生成されたパラメータが含まれる手順を次の試行内容(変更手順)として採用する。次いで、試行決定部130は、採用された変更手順の試行を学習管理部120に依頼する。
試行決定部130から具体的な試行内容(変更手順)が入力された学習管理部120は、試行環境200で変更手順を実行する。変更手順を実行した後、学習管理部120は、実行結果を確認するために、上述した状態把握部140が特定した確認処理を再度実行する。
確認処理を実行した後、学習管理部120は、各試行内容の変更手順と各試行結果の評価データを学習データ格納部160に蓄積する。
以上の処理が繰り返し実行された結果、要件を満たす状態へITシステムを導く変更操作が十分に学習されると、手順導出部150は、学習データ格納部160を参照して、要件を満たす変更手順を抽出する。なお、学習が完了したとみなされる条件は、一般的な強化学習等の学習における停止条件と同様である。
手順導出部150は、抽出された変更手順を出力する。よって、本実施形態の構成管理装置100は、上記の一連の処理を実行することによって、入力された要件データを基に要件を満たす変更手順を自動で生成できる。
上述したように、本実施形態の構成管理装置100は、変更手順のパラメータの膨大なパターンや組み合わせが考えられるシステムの変更要件を利用者が強化学習システムに入力した場合であっても、確率上有力なパラメータの組み合わせを優先的に選択する。すなわち、構成管理装置100は、有力な制御操作を効率的に学習することによって、現実的な時間内に学習を完了させることができる。
本実施形態の構成管理装置100は、強化学習に代表されるITシステムの操作を何度も試行することによって評価および学習する手法において、現実的な時間内に完了させることが困難な程操作のパターンが膨大になる場合であっても、現実的な時間内に評価および学習を完了させることができる。また、構成管理装置100は、学習結果を基に適切な変更手順を生成できる。
[動作の説明]
以下、本実施形態の構成管理装置100が変更手順を生成する動作を図7を参照して説明する。図7は、第1の実施形態の構成管理装置100による変更手順生成処理の動作を示すフローチャートである。
利用者は、対象システムの変更要件が定義された要件データを学習管理部120に入力する。すなわち、学習管理部120は、要件データを取得する(ステップS101)。
次いで、学習管理部120は、状態把握部140に要件データを入力する。状態把握部140は、入力された要件データを基に試行環境200の状態を確認するための確認処理を特定する(ステップS102)。次いで、状態把握部140は、特定された確認処理を学習管理部120に入力する。
学習管理部120は、入力された確認処理を実行する(ステップS103)。次いで、学習管理部120は、確認処理を実行することによって確認された現在の試行環境200の状態を記憶する(ステップS104)。
次いで、学習管理部120は、現在の試行環境200の状態を評価し、評価結果を学習データとして学習データ格納部160に格納する(ステップS105)。評価結果等に基づいて、学習管理部120は、変更手順の学習が完了したか否かを判定する(ステップS106)。
学習が完了したと判定された場合(ステップS106におけるYes )、手順導出部150は、学習データ格納部160を参照して、変更要件を満たす変更手順を抽出する。次いで、手順導出部150は、抽出された変更手順を出力する(ステップS111)。変更手順を出力した後、構成管理装置100は、変更手順生成処理を終了する。
学習が完了していないと判定された場合(ステップS106におけるNo)、学習管理部120は、試行内容の変更手順を決定するように試行決定部130に指示する。指示を受けた試行決定部130は、確率分布を生成するように確率分布決定部110に指示する。
指示を受けた確率分布決定部110の距離計算部111は、入力されたパラメータ種別情報を基に距離関数を生成する(ステップS107)。次いで、距離計算部111は、生成された距離関数を重み割当部112に入力する。
距離関数が入力された重み割当部112は、入力された過去の試行結果情報と重み付け関数とを用いて、重み付けされたスコアを生成する(ステップS108)。次いで、重み割当部112は、生成されたスコアを分布化部113に入力する。
スコアが入力された分布化部113は、スコアを基に確率分布を生成する(ステップS109)。次いで、分布化部113は、生成された確率分布を試行決定部130に入力する。
確率分布が入力された試行決定部130は、確率分布に基づいて次の試行内容の変更手順を決定する。次いで、試行決定部130は、決定された変更手順を学習管理部120に入力する。
変更手順が入力された学習管理部120は、試行環境200で変更手順を実行する(ステップS110)。次いで、学習管理部120は、再度ステップS103の処理を行う。ステップS101〜S110の処理が、変更手順の学習処理に相当する。
[効果の説明]
本実施形態の構成管理装置100は、ITシステムの変更手順の学習および生成時に、広大な空間における質的パラメータが行動空間に含まれる強化学習を高速に実行できる。
具体的には、構成管理装置100の試行決定部130が試行候補である膨大なパターンの中から学習に有効なパターンを効率的に選択することによって、学習に要する時間を短縮する。有効なパターンが効率的に選択されるように、確率分布決定部110は、パラメータ選択用の確率分布を生成する。
確率分布決定部110は、順序性や類似性の度合いが自明でない質的なパラメータに関してパラメータ間の包含関係を基に類似性の度合いを定義することによって、有効なパラメータに類似するパラメータの組み合わせがより選択されやすくなるような確率分布を生成する。生成された確率分布に従って試行対象のパラメータが選択されることによって、構成管理装置100は、有効であると推測されるパラメータを効率的に試行および学習できる。
なお、構成管理装置は、生成された変更手順を示すデータを、実運用環境に自動で適用してもよい。図8は、本発明による構成管理装置の第1の実施形態の他の構成例を示すブロック図である。
図8に示すように、本実施形態の構成管理装置101は、確率分布決定部110と、学習管理部120と、試行決定部130と、状態把握部140と、手順導出部150と、学習データ格納部160と、手順実行部170とを備える。
図1に示す構成管理装置100と異なり、図8に示す構成管理装置101には、手順実行部170が追加されている。手順実行部170以外の図8に示す構成管理装置101の構成は、図1に示す構成管理装置100の構成と同様である。
手順実行部170は、手順導出部150が生成した変更手順を、対象システムが運用されている環境である実運用環境300に適用する。手順実行部170は、変更手順を入力とし、実運用環境300で変更作業を実行する。
本実施形態の構成管理装置101は、生成された変更手順を利用者の操作を要することなく自動で実運用環境に適用できる。
なお、本実施形態の構成管理装置100〜101は、例えば、非一時的な記憶媒体に格納されているプログラムに従って処理を実行するCPUによって実現されてもよい。すなわち、確率分布決定部110、学習管理部120、試行決定部130、状態把握部140、手順導出部150、および手順実行部170は、例えば、プログラム制御に従って処理を実行するCPUによって実現されてもよい。
また、学習データ格納部160は、例えばRAM(Random Access Memory)で実現されてもよい。
また、本実施形態の構成管理装置100〜101における各部は、ハードウェア回路によって実現されてもよい。一例として、確率分布決定部110、学習管理部120、試行決定部130、状態把握部140、手順導出部150、学習データ格納部160、および手順実行部170が、それぞれLSI(Large Scale Integration )で実現される。また、それらが1つのLSIで実現されていてもよい。
次に、本発明の他の実施形態を説明する。図9は、本発明の他の実施形態に係る構成管理装置の概要を示すブロック図である。本実施形態による構成管理装置10は、管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習する構成管理装置であって、試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算する類似性計算手段11(例えば、距離計算部111)と、計算された類似性の度合いを用いてパラメータの候補が試行対象の変更手順に含まれる確率を計算する確率計算手段12(例えば、分布化部113)とを備える。
そのような構成により、構成管理装置は、ITシステムの変更手順を学習する際の試行回数を削減できる。
また、構成管理装置10は、計算された確率を基に次の試行対象の変更手順に含まれるパラメータを選択する選択手段(例えば、学習管理部120)と、選択されたパラメータが含まれている試行対象の変更手順の実行結果を記憶する記憶手段(例えば、学習データ格納部160)とを備えてもよい。
そのような構成により、構成管理装置は、高い確率で選択されるパラメータの候補を次の試行対象の変更手順に採用できる。
また、構成管理装置10は、記憶手段に記憶されている実行結果と計算された類似性の度合いとを用いてパラメータの候補にスコアを付与する付与手段(例えば、重み割当部112)を備え、確率計算手段12は、付与されたスコアを用いてパラメータの候補が試行対象の変更手順に含まれる確率を計算してもよい。
そのような構成により、構成管理装置は、過去の変更手順の実行結果に基づいて確率分布を生成できる。
また、構成管理装置10は、記憶手段に記憶されている実行結果に基づいて管理対象システムの構成変更に使用される変更手順を導出する導出手段(例えば、手順導出部150)を備えてもよい。
そのような構成により、構成管理装置は、学習結果に基づいて変更手順を導出できる。
また、構成管理装置10は、導出された変更手順を管理対象システムが運用されている環境で実行する実行手段(例えば、手順実行部170)を備えてもよい。
そのような構成により、構成管理装置は、導出された変更手順を自動で実行できる。
また、類似性計算手段11は、パラメータの種類ごとに規定されている複数のパラメータの値の包含関係を用いて類似性の度合いを計算してもよい。
そのような構成により、構成管理装置は、定量化が困難な質的パラメータ間の類似性の度合いをより容易に計算できる。
また、構成管理装置10には、利用者が充足を要求する管理対象システムの要件、および要件の充足に求められる可能性がある制御操作が含まれる要件データが入力されてもよい。
上述した各実施形態を例に説明した本発明を、上述したごとくCPU等のプロセッサを利用して実現する場合の具体例を説明する。図10は、本発明の各実施形態に係る構成管理装置を実行可能なハードウェア構成例を示す説明図である。
図10に示す構成管理装置は、CPU21と、主記憶部22と、補助記憶部23とを備える。また、ユーザが操作するための入力部24や、ユーザに処理結果または処理内容の経過を提示するための出力部25を備えてもよい。
なお、図10に示す構成管理装置は、CPU21の代わりにDSP(Digital Signal Processor)を備えてもよい。または、図10に示す構成管理装置は、CPU21とDSPとを併せて備えてもよい。
主記憶部22は、データの作業領域やデータの一時退避領域として用いられる。主記憶部22は、例えばRAMである。
補助記憶部23は、一時的でない有形の記憶媒体である。一時的でない有形の記憶媒体として、例えば磁気ディスク、光磁気ディスク、CD−ROM(Compact Disk Read Only Memory )、DVD−ROM(Digital Versatile Disk Read Only Memory )、半導体メモリが挙げられる。
入力部24は、データや処理命令を入力する機能を有する。入力部24は、例えばキーボードやマウス等の入力デバイスである。
出力部25は、データを出力する機能を有する。出力部25は、例えば液晶ディスプレイ装置等の表示装置、またはプリンタ等の印刷装置である。
また、図10に示すように、構成管理装置において、各構成要素は、システムバス26に接続されている。
補助記憶部23は、例えば、確率分布決定部110、学習管理部120、試行決定部130、状態把握部140、手順導出部150、および手順実行部170を実現するためのプログラムを記憶している。
また、構成管理装置は、図10に示すCPU21が各構成要素が有する機能を提供するプログラムを実行することによって、ソフトウェアにより実現されてもよい。
ソフトウェアにより実現される場合、CPU21が補助記憶部23に格納されているプログラムを、主記憶部22にロードして実行し、構成管理装置の動作を制御することによって、各機能がソフトウェアにより実現される。
また、各構成要素の一部または全部は、汎用の回路(circuitry )または専用の回路、プロセッサ等やこれらの組み合わせによって実現されてもよい。これらは、単一のチップによって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。
各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成および詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2017年10月10日に出願された日本特許出願2017−197022を基礎とする優先権を主張し、その開示の全てをここに取り込む。
産業上の利用の可能性
本発明は、ITシステムの仕様変更時や障害対応時に求められる変更操作のプロセスの設計や、設計されたプロセスの検証および実行を自動で行うシステム構成管理ツールやシステム変更管理ツールに好適に適用される。
10、100、101 構成管理装置
11 類似性計算手段
12 確率計算手段
21 CPU
22 主記憶部
23 補助記憶部
24 入力部
25 出力部
26 システムバス
110 確率分布決定部
111 距離計算部
112 重み割当部
113 分布化部
120 学習管理部
130 試行決定部
140 状態把握部
150 手順導出部
160 学習データ格納部
170 手順実行部
200 試行環境
300 実運用環境
本発明は、構成管理装置、構成管理方法および構成管理プログラムに関し、特に強化学習により構成が管理および変更されるシステムの変更操作手順を学習できる構成管理装置、構成管理方法および構成管理プログラムに関する。
[発明の目的]
そこで、本発明は、上述した課題を解決する、ITシステムの変更手順を学習する際の試行回数を削減できる構成管理装置、構成管理方法および構成管理プログラムを提供することを目的とする。
本発明による構成管理プログラは、管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習するコンピュータにおいて実行される構成管理プログラムであって、コンピューに、試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算する類似性計算処理、および計算された類似性の度合いを用いてパラメータの候補が試行対象の変更手順に含まれる確率を計算する確率計算処理を実行させることを特徴とする。

Claims (10)

  1. 管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習する構成管理装置であって、
    試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算する類似性計算手段と、
    計算された類似性の度合いを用いて前記パラメータの候補が試行対象の変更手順に含まれる確率を計算する確率計算手段とを備える
    ことを特徴とする構成管理装置。
  2. 計算された確率を基に次の前記試行対象の変更手順に含まれるパラメータを選択する選択手段と、
    選択されたパラメータが含まれている前記試行対象の変更手順の実行結果を記憶する記憶手段とを備える
    請求項1記載の構成管理装置。
  3. 前記記憶手段に記憶されている実行結果と計算された類似性の度合いとを用いて前記パラメータの候補にスコアを付与する付与手段を備え、
    前記確率計算手段は、付与されたスコアを用いて前記パラメータの候補が前記試行対象の変更手順に含まれる確率を計算する
    請求項2記載の構成管理装置。
  4. 前記記憶手段に記憶されている実行結果に基づいて前記管理対象システムの構成変更に使用される変更手順を導出する導出手段を備える
    請求項2または請求項3記載の構成管理装置。
  5. 導出された変更手順を前記管理対象システムが運用されている環境で実行する実行手段を備える
    請求項4記載の構成管理装置。
  6. 前記類似性計算手段は、パラメータの種類ごとに規定されている複数のパラメータの値の包含関係を用いて類似性の度合いを計算する
    請求項1から請求項5のうちのいずれか1項に記載の構成管理装置。
  7. 管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習する構成管理装置において実行される構成管理方法であって、
    試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算し、
    計算された類似性の度合いを用いて前記パラメータの候補が試行対象の変更手順に含まれる確率を計算する
    ことを特徴とする構成管理方法。
  8. 計算された確率を基に次の前記試行対象の変更手順に含まれるパラメータを選択し、
    選択されたパラメータが含まれている前記試行対象の変更手順の実行結果を記憶する
    請求項7記載の構成管理方法。
  9. 管理対象システムの構成の変更手順のうち試行対象の変更手順を実行することによって変更手順を学習するコンピュータにおいて実行される構成管理プログラムであって、
    前記コンピュータで実行されるときに、
    試行対象の変更手順に含まれるパラメータの候補と実行済の変更手順に含まれているパラメータとの間の類似性の度合いをパラメータの種類に応じて計算し、
    計算された類似性の度合いを用いて前記パラメータの候補が試行対象の変更手順に含まれる確率を計算する
    構成管理プログラム
    を記録したコンピュータ読み取り可能な記録媒体。
  10. コンピュータで実行されるときに、
    計算された確率を基に次の前記試行対象の変更手順に含まれるパラメータを選択し、
    選択されたパラメータが含まれている前記試行対象の変更手順の実行結果を記憶する
    請求項9記載の記録媒体。
JP2019548160A 2017-10-10 2018-10-04 構成管理装置、構成管理方法および構成管理プログラム Active JP6908126B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2017197022 2017-10-10
JP2017197022 2017-10-10
PCT/JP2018/037182 WO2019073894A1 (ja) 2017-10-10 2018-10-04 構成管理装置、構成管理方法および記録媒体

Publications (2)

Publication Number Publication Date
JPWO2019073894A1 true JPWO2019073894A1 (ja) 2020-10-22
JP6908126B2 JP6908126B2 (ja) 2021-07-21

Family

ID=66100785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019548160A Active JP6908126B2 (ja) 2017-10-10 2018-10-04 構成管理装置、構成管理方法および構成管理プログラム

Country Status (3)

Country Link
US (1) US20200272851A1 (ja)
JP (1) JP6908126B2 (ja)
WO (1) WO2019073894A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010034915A (ja) * 2008-07-30 2010-02-12 Fujitsu Ltd ネットワーク構成管理プログラム、ネットワーク構成管理装置およびネットワーク構成管理方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602004028005D1 (de) * 2004-07-27 2010-08-19 Sony France Sa Ein automatisiertes System zur Aktionsanwahl, sowie das Verfahren und dessen Anwendung, um Prognosemaschinen auszubilden und die Entwicklung sich selbst entwickelnder Geräte zu unterstützen
JP4525477B2 (ja) * 2005-02-23 2010-08-18 ソニー株式会社 学習制御装置および学習制御方法、並びに、プログラム
US8180886B2 (en) * 2007-11-15 2012-05-15 Trustwave Holdings, Inc. Method and apparatus for detection of information transmission abnormalities
US20150323916A1 (en) * 2014-05-09 2015-11-12 Vanderbilt University Fast change planning system, fast change planning method, and fast change planning program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010034915A (ja) * 2008-07-30 2010-02-12 Fujitsu Ltd ネットワーク構成管理プログラム、ネットワーク構成管理装置およびネットワーク構成管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BU, XIANGPING, RAO, JIA AND XU, CHENG-ZHONG: "A Reinforcement Learning Approach to Online Web Systems Auto-configuration", 2009 29TH IEEE INTERNATIONAL CONFERENCE ON DISTRIBUTED COMPUTING SYSTEMS, JPN6018048018, 7 July 2009 (2009-07-07), US, pages 2 - 11, ISSN: 0004519887 *
沼田晋作、神谷法正、橋本昭二、柏 大: "自動構築スクリプトを用いた構成管理情報によるシステムの変更管理に関する一考察", 電子情報通信学会技術研究報告, vol. 116, no. 124, JPN6018048022, 30 June 2016 (2016-06-30), JP, pages 45 - 50, ISSN: 0004519888 *

Also Published As

Publication number Publication date
JP6908126B2 (ja) 2021-07-21
WO2019073894A1 (ja) 2019-04-18
US20200272851A1 (en) 2020-08-27

Similar Documents

Publication Publication Date Title
Tuli et al. COSCO: Container orchestration using co-simulation and gradient based optimization for fog computing environments
Karim et al. BHyPreC: a novel Bi-LSTM based hybrid recurrent neural network model to predict the CPU workload of cloud virtual machine
JP6954049B2 (ja) 知識グラフを完成させるための方法および装置
US9235801B2 (en) Managing computer server capacity
US8056046B2 (en) Integrated system-of-systems modeling environment and related methods
CN115066694A (zh) 计算图优化
US10740209B2 (en) Tracking missing data using provenance traces and data simulation
JP6888737B2 (ja) 学習装置、学習方法、及びプログラム
US11663413B2 (en) Dialog apparatus, dialog system, and computer-readable recording medium
CN114089889B (zh) 模型训练方法、装置以及存储介质
Nguyen et al. iQuantum: a case for modeling and simulation of quantum computing environments
Jrad et al. STRATFram: A framework for describing and evaluating elasticity strategies for service-based business processes in the cloud
Araújo‐de‐Oliveira et al. A procedural and flexible approach for specification, modeling, definition, and analysis for self‐adaptive systems
Tuli et al. SimTune: Bridging the simulator reality gap for resource management in edge-cloud computing
JP6908126B2 (ja) 構成管理装置、構成管理方法および構成管理プログラム
Nguyen et al. iQuantum: A toolkit for modeling and simulation of quantum computing environments
Sheikhi et al. Using a recurrent artificial neural network for dynamic self-adaptation of cluster-based web-server systems
Kalibatiene et al. Implementing a rule-based dynamic business process modelling and simulation
US20220067101A1 (en) Concept prediction to create new intents and assign examples automatically in dialog systems
US20210286785A1 (en) Graph-based application performance optimization platform for cloud computing environment
Aye et al. Layman analytics system: A cloud-enabled system for data analytics workflow recommendation
Chtourou et al. A hybrid approach for training recurrent neural networks: application to multi-step-ahead prediction of noisy and large data sets
Jrad et al. STRATModel: Elasticity model description language for evaluating elasticity strategies for business processes
Funika et al. Towards a scalable distributed fitness evaluation service
Du et al. Stargazer: Toward efficient data analytics scheduling via task completion time inference

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200401

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210601

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210614

R150 Certificate of patent or registration of utility model

Ref document number: 6908126

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150