JP6234759B2 - Information system - Google Patents

Information system Download PDF

Info

Publication number
JP6234759B2
JP6234759B2 JP2013203554A JP2013203554A JP6234759B2 JP 6234759 B2 JP6234759 B2 JP 6234759B2 JP 2013203554 A JP2013203554 A JP 2013203554A JP 2013203554 A JP2013203554 A JP 2013203554A JP 6234759 B2 JP6234759 B2 JP 6234759B2
Authority
JP
Japan
Prior art keywords
data
soundness
configuration data
item
evaluation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013203554A
Other languages
Japanese (ja)
Other versions
JP2015069449A (en
Inventor
大島 義明
義明 大島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2013203554A priority Critical patent/JP6234759B2/en
Publication of JP2015069449A publication Critical patent/JP2015069449A/en
Application granted granted Critical
Publication of JP6234759B2 publication Critical patent/JP6234759B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数の物理サーバ上に仮想化基盤を構築し複数のユーザでシステムを使用する環境下の障害発生を未然に防止するために、システム構成の健全性をチェックする情報システムに関する。   The present invention relates to an information system for checking the soundness of a system configuration in order to prevent a failure from occurring in an environment in which a virtualization infrastructure is constructed on a plurality of physical servers and the system is used by a plurality of users.

近年、企業で増え続けるサーバの台数削減や稼働率が低いサーバの統合など、サーバ運用を効率化する切り札として仮想化が注目され、このコンピュータシステムの仮想化技術の発展と企業におけるITシステムに対する経営理念がシステム所有だけでなくシステム利用も必要としている。   In recent years, virtualization has been attracting attention as a trump card for improving server operation efficiency, such as the reduction in the number of servers and the integration of servers with low operating rates. The development of virtualization technology for computer systems and management of IT systems in companies The philosophy requires not only system ownership but also system usage.

このような社会変化に伴って、コンピュータリソースを必要に応じて必要なだけ利用する仮想化ホスティングサービスやパブリッククラウドサービス等の利用が増加している。なお、パブリッククラウドサービスとは、クラウドコンピューティングによって運用されるサービスのうち、一般利用者を対象に提供されるクラウドサービスのことである。このパブリッククラウドは、多種多様な企業や組織、あるいは個人といった、不特定多数の利用者を対象に広く提供されている。   With such social changes, the use of virtual hosting services and public cloud services that use computer resources as necessary is increasing. The public cloud service is a cloud service provided to general users among services operated by cloud computing. This public cloud is widely provided for a large number of unspecified users such as various companies, organizations, and individuals.

それに対し、企業が自社内でクラウドコンピューティングのシステムを構築し、企業内の部門やグループ会社などに対してクラウドサービスを提供する形態をプライベートクラウドという。これは、また、自社に専用の仮想化基盤のサーバを用意し、従来のユーザ端末や管理サーバ、ストレージ装置などの物理装置と組み合わせて運用するものである。   On the other hand, a form in which a company constructs a cloud computing system in-house and provides cloud services to departments and group companies in the company is called a private cloud. In addition, a dedicated virtualization infrastructure server is prepared in-house and operated in combination with a conventional physical device such as a user terminal, a management server, or a storage device.

前述の仮想化技術を利用した環境では、仮想サーバに対するCPU(Central
Processing Unit)、メモリ、ディスクといったリソースを柔軟に変更することや、負荷に応じてサーバ台数を増減させるといったことが可能である。企業では、これらの技術を利用して、サーバ負荷状況に合わせリソースを効率よく利用することで、ITシステムに対するコスト削減を図っている。
In an environment using the above-described virtualization technology, a CPU (Central
It is possible to flexibly change resources such as (Processing Unit), memory, and disk, and to increase or decrease the number of servers according to the load. Companies use these technologies to efficiently use resources according to server load conditions to reduce costs for IT systems.

前述のITシステムは、365日24時間に亘り、正常な稼働が求められる。その正常稼働を判断する尺度に健全性がある。その健全性の度合い(健全度)により障害発生を未然に防止する技術として、特許文献1記載のものがある。この技術は、複数のノードをネットワーク上に配置して処理を行う分散サーバシステムにおいて、各ノードの利用状態の推定を行う装置に関するものである。   The above-mentioned IT system is required to operate normally for 24 hours on 365 days. There is soundness in the scale for judging normal operation. As a technique for preventing a failure from occurring according to the degree of soundness (health degree), there is one described in Patent Document 1. This technology relates to an apparatus that estimates the usage state of each node in a distributed server system that performs processing by arranging a plurality of nodes on a network.

具体的には、複数のノードを有する分散サーバシステムにおいて、各ノードの駆動状態を管理する管理ノードを備え、管理ノードは、各ノードの駆動状態を複数のパラメータとして定期的に受信するノードパラメータ受信部と、各ノードパラメータから所定式に基づいて健全度を算出するノード健全度判定部と、算出した健全度を履歴情報として記録する健全度履歴管理部と、算出した現在の健全度と健全度履歴によりノード状態を判定するノード状態判定部を備えることで状態推定装置を構成するものである。   Specifically, in a distributed server system having a plurality of nodes, a management node that manages the driving state of each node is provided, and the management node periodically receives the driving state of each node as a plurality of parameters. A node health level determination unit that calculates a health level based on a predetermined formula from each node parameter, a health level history management unit that records the calculated health level as history information, and a calculated current health level and health level A state estimation device is configured by including a node state determination unit that determines a node state based on a history.

日本公開特許2012−8935号公報Japanese Published Patent No. 2012-8935

特許文献1記載の従来技術では、分散ファイルシステムを構成する物理サーバでの物理リソース(負荷、ファン回転数、電源、HDD容量など)での健全度については言及されているが、仮想化環境での仮想サーバ追加、仮想化機能の追加等による健全性の判断及び発生する可能があるリスクに対しては言及されていない。そのため、背景技術で説明したプライベートクラウドやパブリッククラウドにおける仮想化基盤における問題を事前に検出して障害発生を防止することができなかった。   In the prior art described in Patent Document 1, the soundness of physical resources (load, fan speed, power supply, HDD capacity, etc.) in physical servers constituting a distributed file system is mentioned. There is no mention of soundness judgment and risks that may occur due to the addition of virtual servers and the addition of virtualization functions. For this reason, problems in the virtualization infrastructure in the private cloud and public cloud described in the background art cannot be detected in advance to prevent failure.

上記課題を解決するために、本発明の情報システムでは、情報システムが複数の物理サーバと管理サーバと複数のユーザ端末を備え、物理サーバに仮想サーバを動作させユーザ端末で使用する仮想マシンが動作する仮想化基盤を仮想サーバ上に構築して、管理サーバは装置全体を制御するCPUと、収集データや分析結果を一時的に格納するメモリ部と、収集データや分析結果を記憶する記憶デバイス部とを備え、メモリ部ないし記憶デバイス部に仮想化基盤の健全性を判断する健全性項目マスタデータと、複数回の健全性評価結果を特定パターンに分類するパターンマスタデータと、特定パターンで構成データの収集頻度を増減させるパターンデータが格納され、管理サーバのCPUは仮想サーバ各々から構成データを収集し、収集した構成データより仮想化基盤の規模を算出し、算出規模で健全性を判定する項目及びその評価基準を健全性項目マスタデータから抽出して基準データを生成し、基準データと仮想サーバの構成データとを比較して健全性を判定する。   In order to solve the above-described problems, in the information system of the present invention, the information system includes a plurality of physical servers, a management server, and a plurality of user terminals, and operates a virtual machine that operates the physical server on the physical server and operates a virtual machine. The management server is configured to build a virtualization infrastructure on the virtual server, the management server controls the entire apparatus, a memory unit that temporarily stores collected data and analysis results, and a storage device unit that stores collected data and analysis results And the health item master data for determining the health of the virtualization infrastructure in the memory unit or the storage device unit, the pattern master data for classifying the health evaluation results of multiple times into a specific pattern, and the configuration data in the specific pattern The pattern data that increases or decreases the collection frequency of the virtual server is stored, and the CPU of the management server collects the configuration data from each virtual server and collects the collected configuration data. Calculate the scale of the virtualization platform from the data, extract the items for judging the soundness based on the calculated scale and the evaluation criteria from the soundness master data, generate the reference data, and generate the reference data and the configuration data of the virtual server. Compare to determine soundness.

本発明の情報システムでは、仮想化基盤を構成するシステムの規模から健全性をチェックする項目を抽出し、その項目で所定回数のチェックを実施し、その結果の傾向から発生すると考えられるリスクを特定できる。そのため、障害発生を未然に防止できるので、仮想化基盤の信頼性及び可用性を向上できる。前述以外の課題、構成及び効果は、以下の実施形態の説明により明らかにされる。   In the information system of the present invention, an item to be checked for soundness is extracted from the scale of the system that constitutes the virtualization infrastructure, a predetermined number of checks are performed on the item, and a risk that is considered to occur from the tendency of the result is identified it can. Therefore, the occurrence of a failure can be prevented in advance, so that the reliability and availability of the virtualization infrastructure can be improved. Problems, configurations, and effects other than those described above will become apparent from the following description of embodiments.

図1は、本発明の概要を示す図である。FIG. 1 is a diagram showing an outline of the present invention. 図2は、本発明を適用した情報システムの全体構成を示すブロック図である。FIG. 2 is a block diagram showing the overall configuration of the information system to which the present invention is applied. 図3は、物理サーバの内部構成を示すブロック図である。FIG. 3 is a block diagram showing the internal configuration of the physical server. 図4は、ユーザ端末の内部構成を示すブロック図である。FIG. 4 is a block diagram showing an internal configuration of the user terminal. 図5は、構成データの構成例を示す図である。FIG. 5 is a diagram illustrating a configuration example of configuration data. 図6は、健全性項目マスタデータの構成例を示す図である。FIG. 6 is a diagram illustrating a configuration example of soundness item master data. 図7は、基準データの構成例を示す図である。FIG. 7 is a diagram illustrating a configuration example of the reference data. 図8は、第1の分析結果データ(分析結果1)の構成例を示す図である。FIG. 8 is a diagram illustrating a configuration example of the first analysis result data (analysis result 1). 図9は、健全性トレンドデータの構成例を示す図である。FIG. 9 is a diagram illustrating a configuration example of the health trend data. 図10は、第2の分析結果データ(分析結果2)の構成例を示す図である。FIG. 10 is a diagram illustrating a configuration example of the second analysis result data (analysis result 2). 図11は、構成チェック結果の傾向を分類するためのパターンマスタデータの構成例を示す図である。FIG. 11 is a diagram illustrating a configuration example of pattern master data for classifying the tendency of the configuration check result. 図12は、適合したパターンデータでの構成データ収集頻度の増減を決定するパターンデータの構成例を示す図である。FIG. 12 is a diagram illustrating a configuration example of pattern data for determining increase / decrease in configuration data collection frequency with the adapted pattern data. 図13は、仮想化基盤の健全性チェックの全体処理を示すフローチャート図である。FIG. 13 is a flowchart showing the overall processing of the virtualization infrastructure soundness check. 図14は、構成データの収集処理を示すフローチャート図である。FIG. 14 is a flowchart showing the configuration data collection process. 図15は、構成データの分析処理を示すフローチャート図である。FIG. 15 is a flowchart showing configuration data analysis processing. 図16は、構成データの比較処理を示すフローチャート図である。FIG. 16 is a flowchart showing the configuration data comparison process. 図17は、健全性の判定処理を示すフローチャート図である。FIG. 17 is a flowchart showing soundness determination processing. 図18は、健全性項目・チェック頻度更新処理を示すフローチャート図である。FIG. 18 is a flowchart showing soundness item / check frequency update processing.

以下、図面を参照しながら本発明の実施の形態を説明する。なお、以下の説明では、「管理テーブル」等の表現にて各種情報を説明することがあるが、各種情報は、テーブル以外のデータ構造で表現されていてもよい。また、データ構造に依存しないことを示すために「管理テーブル」を「管理情報」と呼ぶことができる。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. In the following description, various types of information may be described using an expression such as “management table”, but the various types of information may be expressed using a data structure other than a table. Further, the “management table” can be referred to as “management information” to indicate that it does not depend on the data structure.

また、「プログラム」を主語として処理を説明する場合がある。そのプログラムは、プロセッサ、例えば、MP(Micro Processor)やCPU(Central Processing Unit)によって実行されるもので、定められた処理をするものである。なお、適宜に記憶資源(例えば、メモリ)及び通信インタフェース装置(例えば、通信ポート)を用いながら行うため、処理の主語がプロセッサとされてもよい。プロセッサは、CPUの他に専用ハードウェアを有していても良い。コンピュータプログラムは、プログラムソースから各コンピュータにインストールされても良い。プログラムソースは、例えば、プログラム配布サーバ又は記憶メディアなどで提供されるものであっても良い。   Further, the process may be described with “program” as the subject. The program is executed by a processor, for example, an MP (Micro Processor) or a CPU (Central Processing Unit), and performs a predetermined process. Note that the processing subject may be a processor because the storage resource (for example, a memory) and a communication interface device (for example, a communication port) are used as appropriate. The processor may have dedicated hardware in addition to the CPU. The computer program may be installed on each computer from a program source. The program source may be provided by, for example, a program distribution server or a storage medium.

また、各要素、例えば、コントローラは番号などで識別可能であるが、識別可能な情報であれば、名前など他種の識別情報が用いられても良い。本発明の図及び説明において同一部分には同一符号を付与しているが、本発明が本実施例に制限されることは無く、本発明の思想に合致するあらゆる応用例が本発明の技術的範囲に含まれる。また、特に限定しない限り、各構成要素は複数でも単数でも構わない。   Each element, for example, the controller can be identified by a number or the like, but other types of identification information such as a name may be used as long as the information can be identified. In the drawings and description of the present invention, the same reference numerals are given to the same parts, but the present invention is not limited to the present embodiment, and any application examples that meet the idea of the present invention are technical. Included in the range. Further, unless specifically limited, each component may be plural or singular.

<発明概要>
図1は、本発明の概要を示す図である。本発明では、仮想化基盤の健全性を迅速に把握して障害発生リスクを低減するために、管理サーバ16が仮想サーバ12の構成データを収集し、収集した構成データを分析・比較処理を実行して健全性を判定するものである。更に、判定された健全性で構成データの収集頻度を更新して健全性の悪化を迅速に把握するものである。そこで、管理サーバ16は、下記(a1)から(a5)の処理を実行する。
<Invention Summary>
FIG. 1 is a diagram showing an outline of the present invention. In the present invention, the management server 16 collects the configuration data of the virtual server 12 and performs analysis / comparison processing on the collected configuration data in order to quickly grasp the soundness of the virtualization infrastructure and reduce the risk of failure occurrence. The soundness is judged. Furthermore, the collection frequency of configuration data is updated with the determined soundness to quickly grasp the deterioration of soundness. Therefore, the management server 16 executes the following processes (a1) to (a5).

(a1)構成データ収集(S101):各仮想サーバの構成データを収集し、差分データを構成データDB21に格納。
(a2)構成データ分析(S102):構成データから規模量(仮想化基盤を構成する仮想サーバの規模(例えば、台数、仮想CPU数/周波数、仮想メモリ/ストレージ容量))を算出し、対応する健全性チェック項目を抽出し取得。
(a3)構成データ比較(S103):チェック項目を元に構成チェック処理を実施(使用許容期間、優先度、重要度で健全度(評価値)を算出)。
(a4)健全性判定(S104):チェック項目を元に健全性の判定を実施。過去に算出した健全度(評価値)と新規に算出した健全度(評価値)で健全度の傾向を把握する。そして、発生するリスクをシステム管理者や保守センタに通知。
(a5)健全性項目&チェック頻度更新(S105):構成チェック処理での分析結果を基に、健全性チェック項目や重要度等の更新(追加、修正、削除)を実施。また、前述の傾向から収集頻度を更新。
(A1) Configuration data collection (S101): Collect configuration data of each virtual server and store difference data in the configuration data DB 21.
(A2) Configuration data analysis (S102): Calculate the scale amount (the scale of the virtual server (for example, the number, the number of virtual CPUs / frequency, virtual memory / storage capacity) constituting the virtualization infrastructure) from the configuration data Extract and obtain soundness check items.
(A3) Configuration data comparison (S103): A configuration check process is performed based on the check items (a soundness level (evaluation value) is calculated based on an allowable use period, a priority level, and an importance level).
(A4) Soundness determination (S104): Soundness determination is performed based on the check items. The tendency of the soundness level is grasped by the soundness level (evaluation value) calculated in the past and the newly calculated soundness level (evaluation value). The system manager and maintenance center are notified of the risks that occur.
(A5) Soundness item & check frequency update (S105): Update (addition, correction, deletion) of the soundness check item and the importance level based on the analysis result in the configuration check process. In addition, the collection frequency has been updated from the above-mentioned tendency.

以下、概要の詳細を説明する。処理の主体を管理サーバ16とするが、管理サーバ16のCPU(図示せず)でもよいし、CPU上で動作するプログラム、例えば仮想環境監視プログラムなど仮想環境を監視・管理するプログラムでもよい。   Details of the outline will be described below. The management subject is the management server 16, but it may be a CPU (not shown) of the management server 16 or a program operating on the CPU, for example, a program for monitoring and managing a virtual environment such as a virtual environment monitoring program.

管理サーバ16は、仮想サーバのグループで、新規に仮想サーバ(例えば、仮想サーバ11 12a)が追加されたか、仮想サーバ12上で動作する機能(例えば、図1では“Auto Deploy機能”が追加されたかを判断するため、定期的に仮想サーバ構成と仮想サーバ上の機能構成(この構成情報と機能情報を合わせて構成データと呼ぶ)を収集する。その処理がS101で、管理サーバ16は収集した構成データ50を構成データDB21に保存を行う。この保存では、取集した構成データ50全て収集日時とともに保存してもよいが、本実施例では、管理サーバ16の効率的な記憶領域使用のため前回収集した構成データとの差分部分のデータのみを世代管理(世代番号及び収集日時)する。例えば、前回収集した構成データが“第4世代”であれば、今回収集した構成データの差分データは“第5世代”となる。   The management server 16 is a group of virtual servers, and a new virtual server (for example, virtual server 11 12a) is added or a function that operates on the virtual server 12 (for example, “Auto Deployment function” in FIG. 1 is added). In order to determine whether or not the virtual server configuration and the functional configuration on the virtual server are periodically collected (the configuration information and the functional information are collectively referred to as configuration data). The configuration data 50 is stored in the configuration data DB 21. In this storage, all collected configuration data 50 may be stored together with the collection date and time, but in this embodiment, for efficient use of the storage area of the management server 16. Generation management (generation number and collection date / time) is performed only on data that is different from the previously collected configuration data. If it is “fourth generation”, the difference data of the configuration data collected this time is “fifth generation”.

次に、処理S102で、処理S101で収集した構成データを直接または構成データDB21に保存した第5世代までの差分データから今回の構成データを構築して、その構成データを取得する。取得した構成データから仮想化基盤を構成する仮想サーバの規模、例えば、動作仮想サーバ台数、仮想CPU数/周波数、仮想メモリ/ストレージ容量などから規模量を算出する。例えば、仮想化基盤で動作している仮想サーバが10台以下であれば“小規模”、11台以上30台以下は“中規模”、31台以上は“大規模”と分類する。   Next, in step S102, the current configuration data is constructed from the difference data up to the fifth generation in which the configuration data collected in step S101 is stored directly or in the configuration data DB 21, and the configuration data is acquired. From the acquired configuration data, the scale amount is calculated from the scale of the virtual server constituting the virtualization platform, for example, the number of operating virtual servers, the number of virtual CPUs / frequency, the virtual memory / storage capacity, and the like. For example, if the number of virtual servers operating on the virtualization infrastructure is 10 or less, it is classified as “small”, 11 or more and 30 or less are classified as “medium”, and 31 or more are classified as “large”.

図1では、仮想サーバ数は最初10台(仮想サーバ1から仮想サーバ10まで)であったので“小規模”と管理サーバ16は判断し識別している。仮想サーバ11 12aが追加されたことにより、仮想化基盤の規模量は“小規模”から“中規模”に変わり、管理サーバ16は“中規模”と識別する。管理サーバ16は、この規模量(“中規模”)を用いて健全性チェック項目(または基準データとも呼ぶ)を健全性項目マスタデータDB22から抽出し取得する。健全性項目マスタデータDB22は、後述する健全性を評価する上での基準となる構成データの評価項目と評価基準を保持するものである。   In FIG. 1, since the number of virtual servers is 10 (from virtual server 1 to virtual server 10) at first, the management server 16 determines and identifies “small”. With the addition of the virtual server 1112a, the scale amount of the virtualization infrastructure changes from “small” to “medium”, and the management server 16 identifies “medium”. The management server 16 uses this scale amount (“medium scale”) to extract and obtain the health check item (also referred to as reference data) from the health item master data DB 22. The soundness item master data DB 22 holds the evaluation items and evaluation criteria of the configuration data that serve as a reference for evaluating the soundness described later.

次に、処理S103で管理サーバ16は、処理S102で抽出した健全性チェック項目を取得する。管理サーバ16は、取得した健全性チェック項目とS101で取得した構成データ50とを比較してチェックする構成チェック処理を各仮想サーバに対し実施する。そして、管理サーバ16は、S103で実施した各仮想サーバでの比較結果(または分析結果と呼ぶが、以降分析結果とする)を分析結果データDB23に格納する。この分析結果データDB23には、各仮想サーバの過去の分析結果(評価項目と項目毎の評価結果及び評価結果を数値化した評価値、世代情報など)を保持する。   Next, in process S103, the management server 16 acquires the soundness check item extracted in process S102. The management server 16 performs a configuration check process for comparing the acquired soundness check item and the configuration data 50 acquired in S101 on each virtual server. Then, the management server 16 stores the comparison results (or referred to as analysis results, which will be referred to as analysis results hereinafter) in each virtual server performed in S103 in the analysis result data DB 23. The analysis result data DB 23 holds past analysis results (evaluation items, evaluation results for each item, evaluation values obtained by quantifying the evaluation results, generation information, etc.) of each virtual server.

次に、処理S104で、管理サーバ16は分析結果を分析結果データDB23から取得するか、または処理S103から直接取得して、仮想サーバ毎または仮想化基盤全体の健全性判定を行う。具体的には、管理サーバ16は、分析結果での評価結果と評価値により健全性の度合い(健全度)を求め、健全性トレンドデータ(健全性の傾向)を生成する。そして、健全性トレンドデータと評価項目毎の評価結果及び評価値により、起こり得るリスク内容(性能劣化、データバックアップ不可、記憶容量増大など)を特定する。その特定されたリスクに対する対応策を分析結果データDB23から取得する。そして、前述の健全性の度合い及びその傾向と共に、システム管理者へ報告する。   Next, in process S104, the management server 16 acquires the analysis result from the analysis result data DB 23 or directly from the process S103, and determines the soundness of each virtual server or the entire virtualization infrastructure. Specifically, the management server 16 obtains the degree of soundness (health degree) from the evaluation result and the evaluation value in the analysis result, and generates soundness trend data (health tendency). Then, possible risk contents (performance deterioration, data backup impossibility, increase in storage capacity, etc.) are specified by the health trend data and the evaluation result and evaluation value for each evaluation item. A countermeasure for the identified risk is acquired from the analysis result data DB 23. And it reports to a system administrator with the above-mentioned soundness degree and its tendency.

このようにして、管理サーバ16は、現時点での仮想サーバ毎の健全性を把握できる。また、各仮想サーバの分析結果を総合的に解析(各仮想サーバの評価値の累積値での健全性の評価、統計分析による改善を要する仮想サーバの特定と、改善の優先順位付けなど)することで、仮想化基盤全体の健全性も把握できる。   In this way, the management server 16 can grasp the soundness of each virtual server at the present time. Also, comprehensively analyze the analysis results of each virtual server (evaluation of soundness by the cumulative value of evaluation values of each virtual server, identification of virtual servers that require improvement through statistical analysis, and prioritization of improvements) As a result, it is possible to grasp the soundness of the entire virtualization infrastructure.

更に、管理サーバ16は、各仮想サーバにおける世代別の評価値で健全性トレンドを求めることで、仮想サーバ自身及び仮想化基盤全体の健全性がどのようになっているのか、どのように推移していくのかを把握できる。また、管理サーバ16は、各仮想サーバの評価項目毎の評価値で健全性トレンドデータ(健全性の傾向)を生成することで、どの仮想サーバのどの評価項目が仮想化基盤の健全性に影響を与えているかを判断できる。   Furthermore, the management server 16 obtains a health trend from the evaluation value for each generation in each virtual server, and how the health of the virtual server itself and the entire virtualization infrastructure changes. You can see how it will go. In addition, the management server 16 generates health trend data (health tendency) with the evaluation value for each evaluation item of each virtual server, and which evaluation item of which virtual server affects the health of the virtualization infrastructure. Can be determined.

例えば、評価値が下がる傾向であれば仮想サーバを含めた仮想化基盤の健全性が悪化していると判断できるし、また、評価値が上がる傾向であれば悪化していた健全性が改善されていると判断できる。加えて、高い評価値が継続すれば、仮想化基盤は高健全性を維持していると判断できるし、また、評価値が高低と振動していれば、仮想化基盤全体が不安定と判断でき、その要因となっている仮想サーバを仮想サーバ毎の評価値の傾向で特定できる。   For example, if the evaluation value tends to decrease, it can be judged that the soundness of the virtualization infrastructure including the virtual server has deteriorated. If the evaluation value tends to increase, the soundness that has deteriorated has been improved. Can be judged. In addition, if the high evaluation value continues, it can be determined that the virtualization infrastructure maintains high soundness, and if the evaluation value vibrates as high or low, the entire virtualization infrastructure is determined to be unstable. It is possible to identify the virtual server that is the cause by the tendency of the evaluation value for each virtual server.

また、管理サーバ16は健全性や起こり得るリスク内容、対応策をシステム管理者や保守センタ6へ報告することができる。なお、以上の健全性の判定結果は、構成データ収集の世代毎に分類され、管理サーバ16によりパターンマスタデータDB24に格納される。   Further, the management server 16 can report soundness, possible risk contents, and countermeasures to the system administrator and the maintenance center 6. The soundness determination results described above are classified for each generation of configuration data collection, and are stored in the pattern master data DB 24 by the management server 16.

最後に、管理サーバ16は、処理S105で、分析結果をもとに、評価項目や重要度、構成データの収集頻度等を更新する。例えば、前回(第4世代)の構成データには、Auto Deploy機能はなく、今回(第5世代)で新規追加となった場合、評価項目を追加し次回以降の健全性判断を行う必要がある。そこで、管理サーバ16は、健全性項目マスタデータDB22の内容を更新する。機能が削除された場合や仮想サーバが追加された場合も同様に管理サーバ16は、健全性項目マスタデータDB22の内容を更新する。   Finally, in step S105, the management server 16 updates evaluation items, importance levels, configuration data collection frequency, and the like based on the analysis results. For example, the previous (fourth generation) configuration data does not have an Auto Deploy function, and if it is newly added at this time (fifth generation), it is necessary to add an evaluation item and make a soundness judgment after the next time. . Therefore, the management server 16 updates the contents of the soundness item master data DB 22. Similarly, when the function is deleted or a virtual server is added, the management server 16 updates the content of the soundness item master data DB 22.

また、過去数世代での分析結果より、所定期間(例えば、1日)当たりの構成データ収集回数(収集頻度)を変動させる。すなわち、分析結果における評価結果、OKまたはNGの連続回数や所定期間のOK回数で収集回数を増減させ、収集頻度を変える。例えば、現在1回/日の収集頻度の時、評価結果でNGが3回以上連続した場合は1日当たりの収集回数を1回増やし2回/日とし、短い期間で健全性を判断し不具合の発生リスクの低減、リスク要因の早期抽出を図る。そのため、分析結果を解析し管理サーバ16は、評価項目や重要度、構成データの収集頻度等を更新し、その更新結果を健全性項目マスタデータDB22に格納する。   Further, the number of collections of the configuration data (collection frequency) per predetermined period (for example, one day) is changed based on the analysis results of the past several generations. That is, the collection frequency is changed by increasing or decreasing the number of collections according to the evaluation result in the analysis result, the number of continuous OK or NG, or the number of OKs in a predetermined period. For example, at the current collection frequency of once / day, if the evaluation result is NG three or more consecutive times, increase the number of collections per day by 1 to 2 times / day, and judge the soundness in a short period of time. Reduce the risk of occurrence and identify risk factors at an early stage. Therefore, the analysis result is analyzed, and the management server 16 updates the evaluation item, the importance, the collection frequency of the configuration data, and the like, and stores the update result in the soundness item master data DB 22.

以上のように、仮想化基盤の健全性を迅速に把握して障害発生リスクを低減するために、管理サーバ16が仮想サーバ12の構成データを収集し、収集した構成データを分析・比較処理を実行して健全性を判定できる。また、判定された健全性で構成データの収集頻度を更新して健全性の悪化を迅速に把握することができる。更に、発生すると考えられるリスクに対する対応策をシステム管理者に提示できる。これにより、仮想化基盤全体の安定的な運用と効率的な管理が可能となる。   As described above, in order to quickly grasp the soundness of the virtualization infrastructure and reduce the risk of failure occurrence, the management server 16 collects the configuration data of the virtual server 12, and analyzes and compares the collected configuration data. Run to determine health. In addition, it is possible to quickly grasp the deterioration of the soundness by updating the collection frequency of the configuration data with the determined soundness. Furthermore, it is possible to present a countermeasure for a risk that may occur to the system administrator. This enables stable operation and efficient management of the entire virtualization infrastructure.

<全体構成>
図2は、本発明を適用した情報システムの全体構成を示すブロック図である。情報システムは、データセンタ1、3、4,5とネットワーク7を介し接続される保守センタ6を備える。
<Overall configuration>
FIG. 2 is a block diagram showing the overall configuration of the information system to which the present invention is applied. The information system includes a maintenance center 6 connected to the data centers 1, 3, 4, 5 via a network 7.

データセンタ1は、2つ以上の物理サーバ11、2つ以上の仮想サーバ12、複数の仮想マシン(以下、VM)14を有するVMグループ13、共有ストレージ15、管理サーバ16、ユーザ端末17を備え、各装置はネットワーク18a及びネットワーク18bを介して相互に接続される。   The data center 1 includes two or more physical servers 11, two or more virtual servers 12, a VM group 13 having a plurality of virtual machines (hereinafter referred to as VMs) 14, a shared storage 15, a management server 16, and a user terminal 17. The devices are connected to each other via a network 18a and a network 18b.

仮想サーバ12は、1つの物理サーバ11上で動作してもよいし、2つの物理サーバ11を共有して動作してもよいし、また、1つの物理サーバ11を2つの仮想サーバ12で共有して動作してもよい。仮想サーバ12上で、ゲストOS(Operating System)とゲストOS上で動作するAP(Application Program)を有するVM13が複数動作する。ユーザ端末17がこのVM13を使用して所定の作業実行やサービスの提供を受ける。   The virtual server 12 may operate on one physical server 11, may operate by sharing two physical servers 11, or may share one physical server 11 with two virtual servers 12. May operate as well. On the virtual server 12, a plurality of VMs 13 having a guest OS (Operating System) and an AP (Application Program) operating on the guest OS operate. The user terminal 17 uses this VM 13 to receive predetermined work execution and service provision.

仮想サーバ12には、各種の仮想化機能がインストールされ、例えば、図1の仮想/物理サーバ12bで示すようにゲストOSの性能最適化やゲストOSと仮想サーバとの連携が必要な機能の実現と管理の効率化を実現するための仮想化ツールプログラム、VMや仮想サーバに対し運用・管理の自動化、物理リソースの最適化、高可用性、全体管理の一元化という機能を提供する仮想データセンタ管理などの各種プログラムを有する。   Various virtual functions are installed in the virtual server 12, and for example, as shown by the virtual / physical server 12b in FIG. 1, the performance of the guest OS needs to be optimized and the function that requires cooperation between the guest OS and the virtual server is realized. Virtual tool management program that realizes efficiency of management and management, virtual data center management that provides functions such as automation of operation and management, optimization of physical resources, high availability, and centralized management of VMs and virtual servers, etc. There are various programs.

共有ストレージ15は、ネットワーク18aを介して物理サーバ11と接続し、物理サーバ11ないし仮想サーバ12、VM14で共有して使用される。ユーザは、ユーザ端末17から前述の仮想データセンタ管理を用いて、物理サーバ11及び共有ストレージ15の物理リソース上に構築された仮想サーバ12及びVM群13の仮想化基盤を利用する。   The shared storage 15 is connected to the physical server 11 via the network 18a, and is shared and used by the physical server 11 to the virtual server 12 and the VM 14. The user uses the virtual infrastructure of the virtual server 12 and the VM group 13 constructed on the physical resources of the physical server 11 and the shared storage 15 by using the virtual data center management described above from the user terminal 17.

管理サーバ16は、前述の物理リソースである物理サーバ11及び共有ストレージ15の稼働状態と仮想化基盤の利用状況や健全性を監視するサーバである。管理サーバは、各データセンタに設けてもよいし、図1のように各データセンタの管理サーバ16を総合的に管理する管理サーバ61を保守センタ6に設けて各データセンタの運用状況を監視・管理し障害発生時にリモートで障害を解消するようにしてもよい。   The management server 16 is a server that monitors the operating state of the physical server 11 and the shared storage 15 that are the physical resources described above, and the usage status and soundness of the virtualization infrastructure. The management server may be provided in each data center, or a management server 61 that comprehensively manages the management server 16 of each data center as shown in FIG. 1 is provided in the maintenance center 6 to monitor the operation status of each data center. -It is possible to manage and resolve the failure remotely when a failure occurs.

<内部構成>
図3は、物理サーバの内部構成を示すブロック図である。物理サーバ11は、CPU111、メモリ112、記憶部113、入力部114、出力部115、表示部116、通信部117を備える。管理サーバ16や保守センタ6の管理サーバ61も物理サーバ11と同様の内部構成を有する。
<Internal configuration>
FIG. 3 is a block diagram showing the internal configuration of the physical server. The physical server 11 includes a CPU 111, a memory 112, a storage unit 113, an input unit 114, an output unit 115, a display unit 116, and a communication unit 117. The management server 16 and the management server 61 of the maintenance center 6 also have the same internal configuration as the physical server 11.

CPU111は、物理サーバ11全体を制御するプロセッサである。メモリ112は、各種プログラム及び後述する各種データなどを一時的に記憶するデバイスである。記憶部113は、各種プログラム及び後述する各種データなどを恒久的に記憶するデバイスである。入力部114は、入力を受け付けるデバイスで、例えば、キーボードである。出力部115は、情報やデータを出力するデバイスで、例えば、スピーカやプリンタである。表示部116は、情報やデータを表示するデバイスで、例えば、液晶ディスプレイである。通信部117は、ネットワークを介し物理サーバ11と他の装置とを接続するデバイスである。以上の構成要素は内部バスで相互に接続される。   The CPU 111 is a processor that controls the entire physical server 11. The memory 112 is a device that temporarily stores various programs and various data described below. The storage unit 113 is a device that permanently stores various programs and various data described below. The input unit 114 is a device that accepts input, and is, for example, a keyboard. The output unit 115 is a device that outputs information and data, and is, for example, a speaker or a printer. The display unit 116 is a device that displays information and data, and is, for example, a liquid crystal display. The communication unit 117 is a device that connects the physical server 11 and another device via a network. The above components are connected to each other via an internal bus.

また、共有ストレージ15も物理サーバ11と同様の構成であるが、点線部分で表記した入力部114、出力部115、表示部116は必ずしも備える必要はなく、それら構成要素が接続できるインタフェースのみを設けるだけでもよい。   The shared storage 15 has the same configuration as that of the physical server 11, but the input unit 114, the output unit 115, and the display unit 116 indicated by dotted lines are not necessarily provided, and only an interface that can connect these components is provided. Just be fine.

図4は、ユーザ端末の内部構成を示すブロック図である。ユーザ端末17は、CPU171、メモリ172、記憶部173、入力部174、出力部175、表示部176、通信部177を備える。   FIG. 4 is a block diagram showing an internal configuration of the user terminal. The user terminal 17 includes a CPU 171, a memory 172, a storage unit 173, an input unit 174, an output unit 175, a display unit 176, and a communication unit 177.

CPU171は、ユーザ端末17全体を制御するプロセッサである。メモリ172は、各種プログラム及び後述する各種データなどを一時的に記憶するデバイスである。記憶部173は、各種プログラム及び後述する各種データなどを恒久的に記憶するデバイスである。入力部174は、入力を受け付けるデバイスで、例えば、キーボードである。出力部175は、情報やデータを出力するデバイスで、例えば、スピーカやプリンタである。 表示部176は、情報やデータを表示するデバイスで、例えば、液晶ディスプレイである。通信部177は、ネットワークを介しユーザ端末17と管理サーバ16や他の装置とを接続するデバイスである。以上の構成要素は内部バスで相互に接続される。   The CPU 171 is a processor that controls the entire user terminal 17. The memory 172 is a device that temporarily stores various programs and various data described below. The storage unit 173 is a device that permanently stores various programs and various data described below. The input unit 174 is a device that receives input, and is, for example, a keyboard. The output unit 175 is a device that outputs information and data, and is, for example, a speaker or a printer. The display unit 176 is a device that displays information and data, and is, for example, a liquid crystal display. The communication unit 177 is a device that connects the user terminal 17 to the management server 16 and other devices via a network. The above components are connected to each other via an internal bus.

メモリ172には、OS提供会社の各種OSと各OS上で動作する各種AP(Application Program)が格納される。前述の各種OSが、仮想化基盤でゲストOSとして仮想サーバ上で動作できる。   The memory 172 stores various OSs of the OS provider and various application programs (APs) operating on the OSs. The various OSs described above can operate on a virtual server as a guest OS on a virtualization platform.

<構成データ>
図5は、構成データの構成例を示す図である。管理サーバ16は、各仮想サーバから構成データを収集し、収集した構成データ群より、仮想化基盤の規模量を算出する。例えば、仮想化基盤で動作している仮想サーバが10台以下であれば“小規模”、11台以上30台以下は“中規模”、31台以上は“大規模”と分類する。構成データ50は、ホスト名501、評価項目502、評価項目502の状態503、世代504、構成データの取得日時505で構成する。
<Configuration data>
FIG. 5 is a diagram illustrating a configuration example of configuration data. The management server 16 collects configuration data from each virtual server, and calculates the scale amount of the virtualization platform from the collected configuration data group. For example, if the number of virtual servers operating on the virtualization infrastructure is 10 or less, it is classified as “small”, 11 or more and 30 or less are classified as “medium”, and 31 or more are classified as “large”. The configuration data 50 includes a host name 501, an evaluation item 502, a status 503 of the evaluation item 502, a generation 504, and a configuration data acquisition date 505.

ホスト名501は、仮想サーバを一意に識別するための情報である。評価項目502は、健全性を評価する項目で、仮想サーバ毎ないしは仮想化基盤全体で定義される項目で、仮想サーバの機能や仮想化基盤の構成の変更に従い、項目のエントリの追加・削除、項目内容の変更が行われる。   The host name 501 is information for uniquely identifying a virtual server. The evaluation item 502 is an item for evaluating the soundness, and is an item defined for each virtual server or for the entire virtualization infrastructure. Addition / deletion of item entries according to changes in the function of the virtual server or the configuration of the virtualization infrastructure, The item content is changed.

状態503は、収集した時点での評価項目502に対する状態を示すものである。世代504は、構成データ50を取得した回数を世代として管理するものである。なお、一世代前の構成データと現世代の構成データとの差分を取得した世代の差分データとして、前述の構成データDB21に格納する。また、構成データDB21または共有ストレージ15に十分な記憶領域を有するのであれば、差分データではなく世代毎の構成データ全てを格納してもよい。構成データの取得日時505は、構成データを収集し取得した日時を一意に識別するための情報である。   A state 503 indicates a state for the evaluation item 502 at the time of collection. The generation 504 manages the number of times the configuration data 50 is acquired as a generation. Note that the difference between the configuration data of the previous generation and the configuration data of the current generation is stored in the configuration data DB 21 as the difference data of the acquired generation. If the configuration data DB 21 or the shared storage 15 has a sufficient storage area, all the configuration data for each generation may be stored instead of the difference data. The acquisition date / time 505 of the configuration data is information for uniquely identifying the date / time when the configuration data was collected and acquired.

図5の例では、ホスト名501が“仮想サーバ01”の仮想サーバが、評価項目502が“仮想化ツール”から“分散仮想スイッチ”までの項目の状態と、取得世代504及び取得日時505と共に管理サーバ16が取得する。そして、管理サーバ16は、一世代前の構成データと比較し差分を検出してその差分データを構成データDB21に格納する。   In the example of FIG. 5, the virtual server whose host name 501 is “virtual server 01”, the evaluation item 502 is the item status from “virtualization tool” to “distributed virtual switch”, the acquisition generation 504 and the acquisition date and time 505. Acquired by the management server 16. Then, the management server 16 detects the difference by comparing with the configuration data of the previous generation, and stores the difference data in the configuration data DB 21.

<健全性項目マスタデータ>
図6は、健全性項目マスタデータの構成例を示す図である。管理サーバ16は、算出された規模より健全性チェック項目を抽出し、評価基準(推奨値)と共に基準データを生成する。健全性項目マスタデータ60は、評価項目601、評価基準(推奨値)602、使用許容期間(日)603、優先度604、重要度605、規模606、起こり得るリスク内容(以下、リスク内容)607で構成する。
<Health property master data>
FIG. 6 is a diagram illustrating a configuration example of soundness item master data. The management server 16 extracts soundness check items from the calculated scale, and generates reference data together with evaluation criteria (recommended values). The soundness item master data 60 includes an evaluation item 601, an evaluation criterion (recommended value) 602, an allowable use period (days) 603, a priority 604, an importance 605, a scale 606, a possible risk content (hereinafter, risk content) 607. Consists of.

評価項目601は、健全性を評価する項目を示す。この評価項目601は、仮想サーバ12毎に、または仮想化基盤全体で1つ設ける。評価基準(推奨値)602は、仮想サーバ12ないしは仮想化基盤全体のあるべき姿を示す基準である。この評価基準と取得した構成データを比較して健全性の目安を判定するものである。使用許容期間(日)603は、評価基準602を満足しなくとも許される期間を示す。この使用許容期間(日)603を超えて評価項目に示す機能の使用や構成の維持継続を行うと後述するリスクが発生する。   An evaluation item 601 indicates an item for evaluating soundness. One evaluation item 601 is provided for each virtual server 12 or for the entire virtualization platform. The evaluation standard (recommended value) 602 is a standard indicating the ideal state of the virtual server 12 or the entire virtualization infrastructure. This evaluation criterion is compared with the acquired configuration data to determine a measure of soundness. The allowable use period (days) 603 indicates a period allowed even if the evaluation standard 602 is not satisfied. If the use of the function indicated in the evaluation item or the maintenance of the configuration is continued beyond the allowable use period (days) 603, a risk described later occurs.

優先度604は、健全でない評価項目において、どの項目を優先して改善していくかの順番を示す項目で、“高”、“中”、“小”の3分類とし、それぞれの分類に対し5段階(1点から5点)の点数付けがされ、分類の後の括弧内にその点数(評価点)が表記されている。例えば、評価項目601が“仮想化ツール”では、優先度604が“高(5)”なので、分類が“高”で点数が“5点”を意味する。同様に、“配置”では、優先度604が“中(3)”なので、分類が“中”で点数が“3点”を意味する。   Priority 604 is an item indicating the order in which items are prioritized and improved in unsatisfactory evaluation items, and is classified into three categories of “high”, “medium”, and “small”. The score is given in five stages (1 to 5 points), and the score (evaluation score) is shown in parentheses after classification. For example, when the evaluation item 601 is “virtualization tool”, the priority 604 is “high (5)”, which means that the classification is “high” and the score is “5 points”. Similarly, in the “arrangement”, since the priority 604 is “medium (3)”, the classification is “medium” and the score is “3 points”.

重要度605は、健全性の項目で重要性の度合いを示すもので、“高”、“中”、“小”の3分類とし、それぞれの分類に対し10段階(1点から10点)の点数付け(評価点)がされ、分類の後の括弧内にその点数が表記されている。例えば、評価項目601が“仮想化ツール”では優先度604が“高(10)”ではあるので、分類が“高”、点数が“10点”を意味する。同様に、“配置”では優先度604が“中(5)”であるので、分類が“中”、点数が“5点”を意味する。   The importance 605 indicates the degree of importance in the soundness item, and is classified into three categories of “high”, “medium”, and “small”, and there are 10 levels (1 to 10 points) for each category. A score is assigned (evaluation score), and the score is shown in parentheses after classification. For example, when the evaluation item 601 is “virtualization tool”, the priority 604 is “high (10)”, which means that the classification is “high” and the score is “10 points”. Similarly, in the “placement”, since the priority 604 is “medium (5)”, it means that the classification is “medium” and the score is “5 points”.

規模606は、算出された規模量で評価項目601を選択する場合の条件が設定するもので、“共通”は規模量に関係なく評価項目601が選択されることを意味し、“中規模”は仮想サーバ12が11台以上30台以下の規模で、“大規模”は仮想サーバ12が31台以上の規模を示す。   The scale 606 is set as a condition for selecting the evaluation item 601 with the calculated scale amount, and “common” means that the evaluation item 601 is selected regardless of the scale amount, and “medium scale”. Indicates the scale of 11 to 30 virtual servers 12, and “large scale” indicates the scale of 31 or more virtual servers 12.

リスク内容607は、各評価項目で健全でない場合(評価基準602が満足しない、使用許容期間(日)603が超過している等)に発生すると考えられるリスク内容を示すものである。例えば、評価項目601が“仮想化ツール”では、パフォーマンス劣化(処理&応答性能の劣化)が起こり得るリスク内容である。“SnapShot”では、バックアック不可ないしディスク使用容量の増加のリスクが発生する可能性がある。   The risk content 607 indicates a risk content that is considered to occur when each evaluation item is not sound (e.g., the evaluation standard 602 is not satisfied, or the allowable use period (days) 603 is exceeded). For example, when the evaluation item 601 is “virtualization tool”, the risk content may cause performance degradation (degradation of processing and response performance). In “SnapShot”, there is a possibility that back-up is not possible or there is a risk of an increase in disk usage capacity.

<基準データ>
図7は、基準データの構成例を示す図である。基準データは、収集した構成データと比較して各仮想サーバ及び仮想化基盤全体の健全性をチェックするためのデータである。基準データ70は、ホスト名701、評価項目702、評価基準703、所定期間(一日当たり)の収集頻度上限(回/日)704、収集頻度(回/日)705で構成する。ホスト名701は構成データ50のホスト名501と、評価項目702及び評価基準703は健全性項目マスタデータ60の構成データの評価項目601及び評価基準602と同じであるので説明を省く。
<Reference data>
FIG. 7 is a diagram illustrating a configuration example of the reference data. The reference data is data for checking the health of each virtual server and the entire virtualization infrastructure in comparison with the collected configuration data. The reference data 70 includes a host name 701, an evaluation item 702, an evaluation reference 703, a collection frequency upper limit (times / day) 704, and a collection frequency (times / day) 705 for a predetermined period (per day). Since the host name 701 is the same as the host name 501 of the configuration data 50, and the evaluation item 702 and the evaluation criterion 703 are the same as the evaluation item 601 and the evaluation criterion 602 of the configuration data of the soundness item master data 60, description thereof will be omitted.

収集頻度上限(回/日)704は、構成データの1日当たりの収集回数の上限であり、この上限を設けることで構成データ収集処理による仮想化基盤全体のパフォーマンス劣化を防止する。また、収集頻度(回/日)705は、評価結果の分類結果で回数が増減されるものである。増減等の詳細については後述する。   The collection frequency upper limit (times / day) 704 is an upper limit of the number of times configuration data is collected per day, and by setting this upper limit, performance degradation of the entire virtualization platform due to the configuration data collection process is prevented. The collection frequency (times / day) 705 is a number that is increased or decreased according to the classification result of the evaluation results. Details of the increase and decrease will be described later.

<分析結果>
図8は、第1の分析結果データ(分析結果1)の構成例を示す図である。分析結果1 80は、構成データ50と基準データ70とを比較して分析した結果を纏めたものである。分析結果1 80は、ホスト名801、評価項目802、状態803、設定期間(日)804、評価結果805、評価値806、分析番号(世代)807、分析日時808で構成する。ホスト名801/評価項目802/状態803は、構成データ50のホスト名501/評価項目502/状態503と同じであるので説明を省く。
<Analysis results>
FIG. 8 is a diagram illustrating a configuration example of the first analysis result data (analysis result 1). The analysis result 180 is a summary of the results of comparison between the configuration data 50 and the reference data 70 and analysis. The analysis result 1 80 includes a host name 801, an evaluation item 802, a status 803, a setting period (day) 804, an evaluation result 805, an evaluation value 806, an analysis number (generation) 807, and an analysis date and time 808. Since the host name 801 / evaluation item 802 / status 803 is the same as the host name 501 / evaluation item 502 / status 503 of the configuration data 50, a description thereof will be omitted.

設定期間(日)804は、設定項目802の機能や構成が設定されて使用されている期間を表す。例えば、評価項目802が“SnapShop”であれば、状態803が“有”で、設定期間(日)804が“16日”となっている。ちなみに、基準データ70での評価項目702が“SnapShop”の評価基準703は“無”で、“有”の場合でも使用許容期間(日)603は最大14日である。   A setting period (day) 804 represents a period in which the function and configuration of the setting item 802 are set and used. For example, if the evaluation item 802 is “SnapShop”, the state 803 is “present” and the set period (day) 804 is “16 days”. Incidentally, when the evaluation item 702 in the reference data 70 is “SnapShop”, the evaluation criterion 703 is “No”, and even when “Yes”, the allowable use period (days) 603 is a maximum of 14 days.

評価結果805、評価項目802毎の健全性を評価した結果が格納される。例えば、評価項目802が“仮想化ツール”であれば、状態803が“最新”で、設定期間(日)804が“−”となっている。ちなみに、基準データ70での評価項目702が“仮想化ツール”の評価基準(推奨基準)703は“最新”であるので、分析結果1 80の評価結果805は、“○”(適合/健全)となる。   The evaluation result 805 and the result of evaluating the soundness of each evaluation item 802 are stored. For example, if the evaluation item 802 is “virtualization tool”, the status 803 is “latest” and the setting period (day) 804 is “−”. Incidentally, since the evaluation item (recommended criterion) 703 of the “virtualization tool” as the evaluation item 702 in the reference data 70 is “latest”, the evaluation result 805 of the analysis result 180 is “◯” (conformity / healthy). It becomes.

また、評価項目802が“SnapShop”であれば、状態803が“有”で、設定期間(日)804が“16日”となっている。ちなみに、基準データ70での評価項目702が“SnapShop”の評価基準703は“無”で、“有”の場合でも使用許容期間(日)603は最大14日である。状態803も不適合で、設定期間(日)804も超過しているので、分析結果1 80の評価結果805は、“×”(不適合/不健全)となる。   If the evaluation item 802 is “SnapShop”, the state 803 is “present” and the set period (day) 804 is “16 days”. Incidentally, when the evaluation item 702 in the reference data 70 is “SnapShop”, the evaluation criterion 703 is “No”, and even when “Yes”, the allowable use period (days) 603 is a maximum of 14 days. Since the state 803 is also non-conforming and the set period (days) 804 has also been exceeded, the evaluation result 805 of the analysis result 180 is “x” (non-conforming / unhealthy).

一方、評価項目802が“DVD Mount”であれば、状態803が“有”で、設定期間(日)804が“7日”となっている。ちなみに、基準データ70での評価項目702が“DVD Mount”の評価基準703は“無”で、“有”の場合でも使用許容期間(日)は最大14日である。そのため、状態803は不適合であっても、設定期間(日)804が使用許容期間内なので、分析結果1 80の評価結果805は、“○”(適合/健全)となる。また、管理サーバ16は、設定期間(日)804が使用許容期間(日)603の半分以下の期間であれば、使用状況メッセージを、半分以上で上限以下の場合は注意喚起メッセージを、超えている場合は改善指示ないし緊急警告メッセージを表示部116に表示してシステム管理者へ通報することで、障害発生リスクを示すことができる。   On the other hand, if the evaluation item 802 is “DVD Mount”, the state 803 is “present” and the set period (day) 804 is “7 days”. Incidentally, even when the evaluation item 702 in the reference data 70 is “DVD Mount”, the evaluation criterion 703 is “None”, and even if it is “Yes”, the allowable use period (days) is 14 days at the maximum. Therefore, even if the state 803 is nonconforming, the set period (days) 804 is within the allowable use period, and therefore the evaluation result 805 of the analysis result 180 is “◯” (conforming / healthy). In addition, the management server 16 exceeds the usage status message if the set period (day) 804 is a period less than half of the allowable use period (day) 603, and exceeds the alert message if it is more than half and less than the upper limit. If there is a problem, an improvement instruction or an emergency warning message is displayed on the display unit 116 and reported to the system administrator to indicate the risk of failure.

評価値806は、各評価項目802における優先度604での評価点と重要度605での評価点を乗算して、その算出結果を評価結果805が“○”の場合はプラス(+)、“×”の場合はマイナス(−)とするものである。例えば、評価項目802が“仮想化ツール”であれば、優先度604が“高(5)、重要度605が“高(10)、評価結果805が“○”なので最終算出結果は+50となる。また、評価項目802が“SnapShop”であれば、4*9*(−1)=−36と、評価項目802が“DVD Mount”であれば、4*8*(+1)=+32と算出できる。   The evaluation value 806 is obtained by multiplying the evaluation score at the priority level 604 and the evaluation score at the importance level 605 in each evaluation item 802, and the calculation result is plus (+) when the evaluation result 805 is “◯”. In the case of “x”, a minus (−) is assumed. For example, if the evaluation item 802 is “virtualization tool”, the priority 604 is “high (5)”, the importance 605 is “high (10)”, and the evaluation result 805 is “◯”, so the final calculation result is +50. . If the evaluation item 802 is “SnapShop”, 4 * 9 * (− 1) = − 36, and if the evaluation item 802 is “DVD Mount”, 4 * 8 * (+ 1) = + 32. .

各評価項目での評価値を加算した累積値が、ホスト名801が“仮想サーバ01”である仮想サーバでの評価値である。また、各仮想サーバでの評価値を加算し累積した値を仮想化基盤全体の評価値としてもよい。   The cumulative value obtained by adding the evaluation values in each evaluation item is the evaluation value in the virtual server whose host name 801 is “virtual server 01”. Further, a value obtained by adding and accumulating evaluation values in each virtual server may be used as an evaluation value for the entire virtualization infrastructure.

分析番号(世代)807は、構成データ50と基準データ70と比較し分析した結果を管理する番号で、構成データの世代番号504と同じである。分析日時808は、上記分析を実行した日時を管理するものである。   An analysis number (generation) 807 is a number for managing the result of comparison between the configuration data 50 and the reference data 70 and is the same as the generation number 504 of the configuration data. The analysis date and time 808 manages the date and time when the analysis is performed.

以上の分析結果は、構成データを収集する度に管理サーバ16で算出され、分析結果データDB23に格納される。   The above analysis results are calculated by the management server 16 every time configuration data is collected and stored in the analysis result data DB 23.

図9は、健全性トレンドデータの構成例を示す図である。健全性トレンドデータ90は、各仮想サーバの健全性のトレンドないしは仮想化基盤全体の健全性のトレンドを示し、この健全性トレンドデータで管理サーバ16は、仮想サーバ及び仮想化基盤全体の健全性がどのようになっているのか、どのように推移していくのかを把握する。また、管理サーバ16は、各仮想サーバの評価項目毎の評価値で生成した健全性トレンド(健全性の傾向)を求めることで、どの仮想サーバのどの評価項目が健全性に影響を与えているかを判断できる。   FIG. 9 is a diagram illustrating a configuration example of the health trend data. The health trend data 90 indicates the health trend of each virtual server or the health trend of the entire virtualization infrastructure. With this health trend data, the management server 16 indicates the health of the virtual server and the entire virtualization infrastructure. Understand how it is and how it will change. Moreover, the management server 16 obtains the health trend (soundness tendency) generated with the evaluation value for each evaluation item of each virtual server, and which evaluation item of which virtual server has an effect on the health. Can be judged.

健全性トレンドデータ90は、分析番号(世代)901と、各世代での評価値902で構成する。分析番号(世代)901は、分析を実行した順番を表すもので、世代管理されている。各世代での評価値902は、図8で説明した1台の仮想サーバにおいて、各評価項目での評価値を加算し累積した値で、世代毎に算出された累積評価値が格納される。   The health trend data 90 includes an analysis number (generation) 901 and an evaluation value 902 for each generation. An analysis number (generation) 901 represents the order in which the analysis is executed, and is generation-managed. The evaluation value 902 for each generation is a value obtained by adding the evaluation values for each evaluation item and accumulating in one virtual server described with reference to FIG. 8, and the accumulated evaluation value calculated for each generation is stored.

この健全性トレンドデータ90は、仮想サーバ12毎に設けて各仮想サーバ12による仮想化基盤に与える影響を把握する。また、分析番号(世代)901毎に仮想サーバ12の累積評価値を合計して、仮想化基盤全体の健全性の傾向を把握してもよい。   The health trend data 90 is provided for each virtual server 12 and grasps the influence of each virtual server 12 on the virtualization infrastructure. Alternatively, the cumulative evaluation values of the virtual servers 12 may be totaled for each analysis number (generation) 901 to grasp the health trend of the entire virtualization infrastructure.

図10は、第2の分析結果データ(分析結果2)の構成例を示す図である。分析結果2 100は、構成データ50と基準データ70とを比較し分析した世代毎の分析結果を纏めたものである。分析結果2 100は、ホスト名1001、評価項目1002、結果1 1003から結果5 1007と適合パターン1008で構成する。ホスト名1001及び評価項目1002は、分析結果1 80のホスト名801及び評価項目802と同じであるので説明を省く。   FIG. 10 is a diagram illustrating a configuration example of the second analysis result data (analysis result 2). The analysis result 2 100 is a summary of the analysis results for each generation in which the configuration data 50 and the reference data 70 are compared and analyzed. The analysis result 2 100 includes a host name 1001, an evaluation item 1002, a result 1 1003 to a result 5 1007, and a matching pattern 1008. Since the host name 1001 and the evaluation item 1002 are the same as the host name 801 and the evaluation item 802 of the analysis result 180, description thereof is omitted.

結果1 1003から結果5 1007は、各世代での分析結果であり、結果1 1003が第1世代での分析結果、結果2 1004が第2世代での分析結果、結果3 1005が第3世代での分析結果、結果4 1006が第4世代での分析結果、結果5 1007が第5世代(最新世代)での分析結果である。それぞれのエントリには、各評価項目での評価結果を格納する。ちなみに、“○”は適合/健全を表し、“×”は不適合/不健全を表す。   Result 1 1003 to Result 5 1007 are analysis results in each generation, Result 1 1003 is the analysis result in the first generation, Result 2 1004 is the analysis result in the second generation, and Result 3 1005 is in the third generation. The result 4 1006 is the analysis result in the fourth generation, and the result 5 1007 is the analysis result in the fifth generation (latest generation). Each entry stores an evaluation result for each evaluation item. Incidentally, “◯” represents conformity / sound, and “x” represents non-conformity / unsound.

適合パターン1008は、結果1 1003から結果5 1007により分析結果がどのような適合パターンに合致するかの結果を格納するものである。つまり、結果1 1003から結果5 1007の内容が、図11(1)ないし(2)のどのパターンに分類されるかを管理サーバ16が判断し、その判断結果を適合パターン1008に格納する。図10の例では、分類されるパターンは、パターンP1からパターンP4と、どのパターンにも該当しない“不定”及び分類不要を表す“−”である。   The matching pattern 1008 stores the result of what matching pattern the analysis result matches with the result 1 1003 to the result 5 1007. That is, the management server 16 determines which pattern in FIGS. 11A to 11B the contents of the result 1 1003 to the result 5 1007 are classified, and stores the determination result in the matching pattern 1008. In the example of FIG. 10, the patterns to be classified are the patterns P1 to P4, “undefined” that does not correspond to any pattern, and “−” indicating that classification is not necessary.

<パターン分類>
図11は、構成チェック結果の傾向を分類するためのパターンマスタデータの構成例を示す図である。パターンマスタデータ110は、分析結果2 100の分析結果1 1003から分析結果5 1007がどのパターンに適合するかを判別し分類するためのデータである。パターンマスタデータ110には、健全(OK)または不健全(NG)の連続した回数で判別するマスタデータ1 110aと、所定分析回数においての健全(OK)または不健全(NG)の回数で判別するマスタデータ2 110bの2種類がある。マスタデータ1 110aもマスタデータ2 110bもパターン1101と分類1102から構成する。
<Pattern classification>
FIG. 11 is a diagram illustrating a configuration example of pattern master data for classifying the tendency of the configuration check result. The pattern master data 110 is data for discriminating and classifying which pattern the analysis result 1 1003 to the analysis result 5 1007 of the analysis result 2 100 matches. The pattern master data 110 is discriminated by master data 1 110a that is determined by the number of consecutive healthy (OK) or unhealthy (NG), and by the number of healthy (OK) or unhealthy (NG) at a predetermined number of analysis times. There are two types of master data 2 110b. Both master data 1 110 a and master data 2 110 b are composed of a pattern 1101 and a classification 1102.

(1)マスタデータ1
連続して4回以上NGとなった場合のパターンは、マスタデータ1 110aのパターン1101が“パターンP1”に適合する。同じく、連続して3回以上NGとなった場合のパターンは“パターンP2”に適合する。逆に、連続して3回以上OKとなった場合のパターンは“パターンP3”で、連続して4回以上OKとなった場合のパターンは“パターンP4”に適合する。このように、健全(OK)または不健全(NG)の連続数でパターン分類し、分析結果2 100と照合して後述する構成データの収集頻度を更新する。
(1) Master data 1
When the pattern is NG four or more times in succession, the pattern 1101 of the master data 1 110a matches the “pattern P1”. Similarly, the pattern when it becomes NG three times or more continuously matches the “pattern P2”. On the other hand, the pattern when the pattern is OK three times or more is “pattern P3”, and the pattern when the pattern is OK four or more times is “pattern P4”. In this way, pattern classification is performed based on the number of consecutive healthy (OK) or unhealthy (NG), and the collection frequency of configuration data to be described later is updated by comparing with the analysis result 2100.

(2)マスタデータ2
所定分析回数(例えば、5回)において、5回以上NGとなった場合のパターンは、マスタデータ2 110bのパターン1101が“パターンP1”に適合する。同じく、3回以上NGとなった場合のパターンは“パターンP1”に適合する。逆に、3回以上OKとなった場合のパターンは“パターンP3”で、5回以上OKとなった場合のパターンは“パターンP4”に適合する。このように、所定分析回数においての健全(OK)または不健全(NG)の数でパターン分類し、分析結果2 100と照合して後述する構成データの収集頻度を更新する。
(2) Master data 2
The pattern 1101 of the master data 2110b matches the “pattern P1” when the number of analysis is NG 5 times or more in a predetermined number of analyzes (for example, 5 times). Similarly, the pattern when it becomes NG three times or more matches the “pattern P1”. Conversely, the pattern when it is OK three or more times is “pattern P3”, and the pattern when it is OK five or more times is “pattern P4”. In this way, pattern classification is performed based on the number of healthy (OK) or unhealthy (NG) in a predetermined number of analysis times, and the collection frequency of configuration data described later is updated by collating with the analysis result 2100.

図12は、適合したパターンデータでの構成データ収集頻度の増減を決定するパターンデータの構成例を示す図である。パターンデータ120は、パターン1201、分類(増減数)1202、収集頻度への増減数1203で構成する。パターン1201は、前述のパターンP1からパターンP4のエントリが格納される。分類(増減数)1202は、パターン毎に増減する収集回数を定義するものである。パターン1201が“パターンP1”であれば分類(増減数)1202は“2回増やす”と定義され、収集頻度の現在値に2回を加算して収集頻度を高くする。同じく、“パターンP2”では1回増やし、“パターンP3”では現状維持、“パターンP4”では1回減らす。   FIG. 12 is a diagram illustrating a configuration example of pattern data for determining increase / decrease in configuration data collection frequency with the adapted pattern data. The pattern data 120 includes a pattern 1201, a classification (increase / decrease number) 1202, and an increase / decrease number 1203 to the collection frequency. The pattern 1201 stores the entries of the above-described patterns P1 to P4. The classification (number of increase / decrease) 1202 defines the number of collections that increase / decrease for each pattern. If the pattern 1201 is “pattern P1”, the classification (increase / decrease number) 1202 is defined as “increase twice”, and the collection frequency is increased by adding twice to the current value of the collection frequency. Similarly, “pattern P2” is increased once, “pattern P3” is maintained as it is, and “pattern P4” is decreased once.

このように、連続的ないしは所定回数中、NG(不健全)ないしはOK(健全)となった回数をカウントし、それに適合するパターンを抽出することで、構成データ50の収集頻度を更新する。これにより、健全状態という傾向が続いていると判断した場合は、少ない収集頻度として、管理サーバ16による仮想化基盤への構成データ収集を低減し、負荷を軽減する。また、逆に不健全という傾向が続いていると判断した場合は、高い頻度で構成データ50を収集し、収集した構成データ50を直ぐに分析することで仮想サーバ12ないしは仮想化基盤全体の健全性を悪化させている要因を素早く的確に抽出し、適切な対応策を講じることができるようにする。   In this manner, the frequency of collecting the configuration data 50 is updated by counting the number of times of NG (unhealthy) or OK (healthy) continuously or during a predetermined number of times, and extracting a pattern that matches that. As a result, if it is determined that the trend of a healthy state continues, the collection data is collected to the virtualization infrastructure by the management server 16 with a low collection frequency, and the load is reduced. On the contrary, if it is determined that the unhealthy tendency continues, the configuration data 50 is collected at a high frequency, and the collected configuration data 50 is immediately analyzed, whereby the health of the virtual server 12 or the entire virtualization infrastructure is collected. It is possible to quickly and accurately extract the factors that are deteriorating and take appropriate countermeasures.

<全体処理>
図13は、仮想化基盤の健全性チェックの全体処理を示すフローチャート図である。本例では処理の主体を管理サーバ16のCPU111とするが、CPU111上で動作する制御プログラムでも、管理サーバ16自体でもよい。なお、本処理は、管理サーバ16のスケジューラで実行されるものであるが、システム管理者からの実行指示を管理サーバ16が受け付けて実行してもよい。
<Overall processing>
FIG. 13 is a flowchart showing the overall processing of the virtualization infrastructure soundness check. In this example, the subject of processing is the CPU 111 of the management server 16, but it may be a control program running on the CPU 111 or the management server 16 itself. This process is executed by the scheduler of the management server 16, but the management server 16 may receive and execute an execution instruction from the system administrator.

S1301で、管理サーバ16のCPU111は、健全性のチェックを開始するかを判断する。チェックを開始する場合(Yes)、CPU111はS1302を実行し、しない場合(No)は、仮想化基盤の健全性チェックの全体処理を終了する。S1302で、CPU111は、構成データ収集処理(図14)を実行する。S1303で、CPU111は、構成データ分析処理(図15)を実行する。S1304で、CPU111は、構成データ比較処理(図16)を実行する。S1305で、CPU111は、健全性判定処理(図17)を実行する。   In step S1301, the CPU 111 of the management server 16 determines whether to start a soundness check. When the check is started (Yes), the CPU 111 executes S1302, and when not (No), the entire process of the virtualization infrastructure health check is terminated. In S1302, the CPU 111 executes configuration data collection processing (FIG. 14). In step S1303, the CPU 111 executes configuration data analysis processing (FIG. 15). In step S1304, the CPU 111 executes configuration data comparison processing (FIG. 16). In step S1305, the CPU 111 executes soundness determination processing (FIG. 17).

S1306で、CPU111は、健全性の判定結果及びその結果に応じた対応策を管理サーバ16の表示部116に表示するかを判断する。表示しない場合(No)はS1308を、表示する場合(Yes)はS1307を、CPU111は実行する。S1307で、CPU111は、管理サーバ16の表示部116に判定結果及び対応策を表示させる。S1308で、CPU111は、保守センタ6の管理サーバ61へ判定結果及び対応策を送信する。S1309で、CPU111は、健全性項目・チェック頻度更新処理(図18)を実行する。S1309での処理の完了後にCPU111は、仮想化基盤の健全性チェックの全体処理を終了する。   In step S <b> 1306, the CPU 111 determines whether to display the soundness determination result and a countermeasure corresponding to the result on the display unit 116 of the management server 16. When not displaying (No), S1308 is executed, when displaying (Yes), S1307 is executed, and the CPU 111 executes. In step S <b> 1307, the CPU 111 displays the determination result and countermeasure on the display unit 116 of the management server 16. In step S <b> 1308, the CPU 111 transmits the determination result and the countermeasure to the management server 61 of the maintenance center 6. In step S1309, the CPU 111 executes soundness item / check frequency update processing (FIG. 18). After completing the processing in S1309, the CPU 111 ends the overall processing of the virtualization infrastructure soundness check.

また、上記の全体処理を図2の各データセンタに実施して各データセンタから構成データ/障害情報/健全性傾向等を収集し健全性項目マスタデータを更新することで、様々なタイプの仮想化基盤の健全性をチェックすることが可能となる。   Further, the above-described overall processing is performed on each data center in FIG. 2 to collect configuration data / failure information / health tendency from each data center and update the soundness item master data, so that various types of virtual It is possible to check the soundness of the infrastructure.

<収集処理>
図14は、構成データの収集処理を示すフローチャート図である。S1401で、管理サーバ16のCPU111は、各仮想サーバ12(仮想サーバ01から仮想サーバ11まで)の構成データ50を収集する。S1402で、CPU111は、過去に取得した構成データと比較し、差分データを構成データDB21に格納する。なお、処理を簡便にするため、収集した構成データそのものを構成データDB21に格納してもよい。
<Collection processing>
FIG. 14 is a flowchart showing the configuration data collection process. In S1401, the CPU 111 of the management server 16 collects the configuration data 50 of each virtual server 12 (from the virtual server 01 to the virtual server 11). In step S1402, the CPU 111 compares the configuration data acquired in the past and stores the difference data in the configuration data DB 21. In order to simplify the process, the collected configuration data itself may be stored in the configuration data DB 21.

<分析処理>
図15は、構成データの分析処理を示すフローチャート図である。S1501で、管理サーバ16のCPU111は、取得した構成データ50より仮想化基盤の規模量を算出する。これは、前述のように仮想サーバ数、すなわち取得した構成データ数から小規模/中規模/大規模のいずれかに分類する。
<Analysis processing>
FIG. 15 is a flowchart showing configuration data analysis processing. In step S <b> 1501, the CPU 111 of the management server 16 calculates a virtual infrastructure scale amount from the acquired configuration data 50. As described above, this is classified into one of small / medium / large scale based on the number of virtual servers, that is, the number of acquired configuration data.

S1502で、CPU111は、算出した規模量で、健全性項目マスタデータ60から健全性チェック項目を抽出し、基準データ70を生成する。S1503で、CPU111は、基準データ70を健全性項目マスタデータDB22に格納する。これにより、規模量に応じた健全性を判断するための基準データを生成できる。   In step S <b> 1502, the CPU 111 extracts soundness check items from the soundness item master data 60 with the calculated scale amount, and generates reference data 70. In step S1503, the CPU 111 stores the reference data 70 in the soundness item master data DB 22. Thereby, the reference data for judging the soundness according to the scale amount can be generated.

<比較処理>
図16は、構成データの比較処理を示すフローチャート図である。S1601で、管理サーバ16のCPU111は、各仮想サーバの構成データ50を構成データDB21から取得する。S1602で、CPU111は、基準データ70を健全性項目マスタデータDB22から取得する。
<Comparison process>
FIG. 16 is a flowchart showing the configuration data comparison process. In S <b> 1601, the CPU 111 of the management server 16 acquires the configuration data 50 of each virtual server from the configuration data DB 21. In S1602, the CPU 111 acquires the reference data 70 from the soundness item master data DB 22.

S1603で、CPU111は、構成データ50と基準データ70を比較する。つまり、同一の評価項目(構成データ50の評価項目502と基準データ70の評価項目702)における状態503と基準値703を比較する。その比較処理を全評価項目についてCPU111は実行し、その処理結果を比較結果とする。S1604で、CPU111は、比較結果を分析結果1 80として分析結果データDB23に格納する。この分析結果1 80は仮想サーバ毎に生成され、分析結果データDB23に格納にCPU111により格納される。   In step S1603, the CPU 111 compares the configuration data 50 with the reference data 70. That is, the state 503 and the reference value 703 in the same evaluation item (the evaluation item 502 of the configuration data 50 and the evaluation item 702 of the reference data 70) are compared. The CPU 111 executes the comparison processing for all the evaluation items, and uses the processing result as the comparison result. In step S <b> 1604, the CPU 111 stores the comparison result as the analysis result 180 in the analysis result data DB 23. This analysis result 180 is generated for each virtual server and stored in the analysis result data DB 23 by the CPU 111.

<健全性判定>
図17は、健全性の判定処理を示すフローチャート図である。S1701で、管理サーバ16のCPU111は、各仮想サーバ12における最新の分析結果を分析結果データDB23から取得する。S1702で、CPU111は、取得した分析結果と過去の分析結果から各仮想サーバにおける健全性トレンドデータ90を生成する。S1703で、CPU111は、生成した健全性トレンドデータ90と最新の分析結果1 80から発生する可能性が高いリスクを、健全性項目マスタデータ60のリスク内容607より特定する。
<Health assessment>
FIG. 17 is a flowchart showing soundness determination processing. In step S <b> 1701, the CPU 111 of the management server 16 acquires the latest analysis result in each virtual server 12 from the analysis result data DB 23. In S1702, the CPU 111 generates the health trend data 90 in each virtual server from the acquired analysis result and the past analysis result. In S <b> 1703, the CPU 111 identifies a risk that is highly likely to occur from the generated health trend data 90 and the latest analysis result 180 from the risk content 607 of the health item master data 60.

S1704で、CPU111は、特定したリスクに対する対応策を分析結果データDB23から取得する。例えば、リスクがパフォーマンス劣化であれば、評価項目601の仮想化ツールの最新バージョンへの更新ないし、変更された配置を元に戻すような対応先を抽出する。この対応策を最新の分析結果1 80を提示することで、システム管理者に仮想化基盤の健全性を把握できる。   In S <b> 1704, the CPU 111 acquires a countermeasure for the identified risk from the analysis result data DB 23. For example, if the risk is performance deterioration, a response destination that extracts the evaluation item 601 to the latest version of the virtualization tool or restores the changed arrangement is extracted. By presenting the latest analysis result 180 of this countermeasure, the system administrator can grasp the soundness of the virtualization infrastructure.

<チェック頻度更新処理>
図18は、健全性項目・チェック頻度更新処理を示すフローチャート図である。S1801で、管理サーバ16のCPU111は、最新の分析結果を分析結果データDB23から取得する。例えば、仮想サーバ01における最新の分析結果を、CPU111が分析結果データDB23から取得する。S1802で、CPU111は、数世代分過去の分析結果を分析結果データDB23から取得する。例えば、仮想サーバ01における過去の分析結果を、CPU111が分析結果データDB23から取得する。そして、CPU111は、各仮想サーバにおける分析結果2 100を生成する。
<Check frequency update process>
FIG. 18 is a flowchart showing soundness item / check frequency update processing. In step S <b> 1801, the CPU 111 of the management server 16 acquires the latest analysis result from the analysis result data DB 23. For example, the CPU 111 acquires the latest analysis result in the virtual server 01 from the analysis result data DB 23. In step S <b> 1802, the CPU 111 acquires past analysis results for several generations from the analysis result data DB 23. For example, the past analysis results in the virtual server 01 are acquired by the CPU 111 from the analysis result data DB 23. Then, the CPU 111 generates an analysis result 2100 in each virtual server.

S1803で、CPU111は、仮想サーバ01における最新の分析結果と過去の分析結果から、どのパターンに分類されるかをパターンマスタデータ110aないしパターンマスタデータ110b(パターンマスタデータDB24に格納)を用いて分析する。つまり、CPU111は、分析結果2 100がどの適合パターンであるか(パターンP1からパターンP4のいずれか)を特定する。   In S1803, the CPU 111 analyzes which pattern is classified from the latest analysis result and the past analysis result in the virtual server 01 using the pattern master data 110a to the pattern master data 110b (stored in the pattern master data DB 24). To do. That is, the CPU 111 identifies which matching pattern is the analysis result 2 100 (any one of the patterns P1 to P4).

S1804で、CPU111は、特定した適合パターンをパターンデータ120に照合して、構成データ50の収集頻度の増減値を決定する。例えば、分析結果2 100の評価項目1002が“高可用性”であれば、適合パターン1008が“パターンP4”となる。そして、パターンデータ120の分類1202から“1回減らす”と特定され、構成データ50の収集頻度を1回減らす。   In step S <b> 1804, the CPU 111 collates the specified matching pattern against the pattern data 120 and determines an increase / decrease value of the collection frequency of the configuration data 50. For example, if the evaluation item 1002 of the analysis result 2 100 is “high availability”, the matching pattern 1008 is “pattern P4”. Then, it is specified as “decrease once” from the classification 1202 of the pattern data 120, and the collection frequency of the configuration data 50 is reduced once.

図10の例では、評価項目毎に適合パターンを特定して構成データの評価項目の収集頻度の更新を示している。これにより、仮想サーバの健全性に悪影響を与えている評価項目は高い頻度でデータを収集して問題の早期抽出と対応策の迅速な実行が可能となる。また、評価項目単位でなく仮想サーバ単位で適合パターンを特定して、構成データの収集頻度を変えてもよい。   In the example of FIG. 10, the matching pattern is specified for each evaluation item, and the update of the collection frequency of the evaluation item of the configuration data is shown. As a result, it is possible to collect data at a high frequency for evaluation items that adversely affect the soundness of the virtual server, thereby enabling early extraction of problems and quick execution of countermeasures. In addition, the adaptation frequency may be specified not in the evaluation item unit but in the virtual server unit to change the collection frequency of the configuration data.

S1805で、CPU111は、現在の収集頻度を決定した増減値で更新する。つまり、CPU111は、基準データ70の収集頻度705に決定した増減値を加算して更新する。 S1806で、CPU111は、収集頻度を更新された基準データを、まず、健全性項目マスタデータDB22に格納する。   In step S1805, the CPU 111 updates the current collection frequency with the determined increase / decrease value. That is, the CPU 111 adds and updates the determined increase / decrease value to the collection frequency 705 of the reference data 70. In step S1806, the CPU 111 first stores the reference data whose collection frequency has been updated in the soundness item master data DB 22.

S1807で、CPU111は、今回の分析結果と過去の分析結果から、評価項目の差分を仮想サーバ毎に抽出する。差分があれば、その差分内容で仮想サーバ毎の基準データ70を更新するとともに、健全性項目マスタデータ60も更新する。例えば、図1のようにAutoDeploy機能が追加になったのであれば、AutoDeploy機能に関する項目を追加する。S1808で、CPU111は、更新された健全性項目マスタデータ及び基準データ70を健全性項目マスタデータDB22に格納する。   In step S1807, the CPU 111 extracts the difference between the evaluation items for each virtual server from the current analysis result and the past analysis result. If there is a difference, the reference data 70 for each virtual server is updated with the difference contents, and the soundness item master data 60 is also updated. For example, if the AutoDeploy function is added as shown in FIG. 1, an item related to the AutoDeploy function is added. In S1808, the CPU 111 stores the updated soundness item master data and the reference data 70 in the soundness item master data DB 22.

以上のように、仮想化基盤を構成するシステムの規模から健全性をチェックする項目を抽出し、その項目で所定回数のチェックを実施し、その結果の傾向から発生すると考えられるリスクを特定できる。そのため、障害を事前特定と対応策の実施が可能で仮想化基盤の信頼性及び可用性を向上できる。   As described above, it is possible to extract an item for checking the soundness from the scale of the system constituting the virtualization infrastructure, perform a predetermined number of checks on the item, and identify a risk that is considered to be generated from the tendency of the result. Therefore, it is possible to identify faults in advance and implement countermeasures, thereby improving the reliability and availability of the virtualization infrastructure.

なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。 また、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。   In addition, this invention is not limited to an above-described Example, Various modifications are included. The above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described. Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment. Further, it is possible to add, delete, and replace other configurations for a part of the configuration of each embodiment.

また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置いてもよい。また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。   Each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit. Each of the above-described configurations, functions, and the like may be realized by software by interpreting and executing a program that realizes each function by the processor. Information such as programs, tables, and files for realizing each function may be stored in a memory, a hard disk, a recording device such as an SSD (Solid State Drive), or a recording medium such as an IC card, an SD card, or a DVD. Further, the control lines and information lines are those that are considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.

1、3、4、5:データセンタ、6:保守センタ、7:ネットワーク、11:物理サーバ、12:仮想サーバ、13:仮想マシングループ、14:仮想マシン、15:共有ストレージ、16:管理サーバ、17:ユーザ端末、18:ネットワーク、21:構成データDB、22:健全性項目マスタデータDB、23:分析結果データDB、24:パターンマスタデータDB、50:構成データ、60:基準データ、61:管理サーバ、70:健全性項目マスタデータ、80:分析結果1、90:健全性トレンドデータ、100:分析結果2、110:パターンマスタデータ、120:パターンデータ、111、171:CPU、112、172:メモリ、113、173:記憶装置、114、174:入力装置、115、175:出力装置、116、176:表示装置、117、177:通信装置

1, 3, 4, 5: Data center, 6: Maintenance center, 7: Network, 11: Physical server, 12: Virtual server, 13: Virtual machine group, 14: Virtual machine, 15: Shared storage, 16: Management server 17: user terminal, 18: network, 21: configuration data DB, 22: soundness item master data DB, 23: analysis result data DB, 24: pattern master data DB, 50: configuration data, 60: reference data, 61 : Management server, 70: Soundness item master data, 80: Analysis result 1, 90: Soundness trend data, 100: Analysis result 2, 110: Pattern master data, 120: Pattern data, 111, 171: CPU, 112, 172: Memory, 113, 173: Storage device, 114, 174: Input device, 115, 175: Output device, 16,176: display device, 117,177: communication device

Claims (8)

複数の物理サーバと管理サーバと複数のユーザ端末を備える情報システムであって、
前記物理サーバに仮想サーバを動作させ、前記ユーザ端末で使用する仮想マシンが動作する仮想化基盤を仮想サーバ上に構築して、
前記管理サーバは、
装置全体を制御するCPUと、収集データや分析結果を一時的に格納するメモリ部と、
収集データや分析結果を記憶する記憶デバイス部とを備え、
前記メモリ部ないし前記記憶デバイス部に仮想化基盤の健全性を判断する健全性項目マスタデータと、複数回の健全性評価結果を特定パターンに分類するパターンマスタデータと、前記特定パターンで構成データの収集回数を増減させるパターンデータが格納され、
前記管理サーバのCPUは、
前記仮想サーバ各々から構成データを収集し、
前記収集した構成データより前記仮想化基盤の規模を算出し、前記算出された規模で健全性を判定する項目及びその評価基準を前記健全性項目マスタデータから抽出して基準データを生成し、
前記基準データと前記仮想サーバの構成データとを比較して健全性を判定する
ことを特徴とする情報システム。
An information system comprising a plurality of physical servers, a management server, and a plurality of user terminals,
A virtual server is operated on the physical server, and a virtualization platform on which a virtual machine used in the user terminal operates is constructed on the virtual server,
The management server
A CPU for controlling the entire apparatus, a memory unit for temporarily storing collected data and analysis results,
A storage device unit for storing collected data and analysis results,
Health item master data for determining the health of the virtualization infrastructure in the memory unit or the storage device unit, pattern master data for classifying a plurality of health evaluation results into a specific pattern, and configuration data of the specific pattern Stores pattern data that increases or decreases the number of collections.
The CPU of the management server
Collecting configuration data from each of the virtual servers;
Calculate the scale of the virtualization platform from the collected configuration data, extract the items for judging the soundness at the calculated scale and the evaluation criteria thereof from the soundness item master data, and generate the reference data,
The information system, wherein the soundness is determined by comparing the reference data with the configuration data of the virtual server.
請求項1記載の情報システムであって、前記健全性項目マスタデータは、健全性を判断する項目と各項目における評価基準に加え、使用許容期間、優先度、重要度及び発生リスクを有する
ことを特徴とする情報システム。
The information system according to claim 1, wherein the soundness item master data has an allowable use period, a priority, an importance level, and an occurrence risk in addition to an item for determining soundness and an evaluation standard for each item. Characteristic information system.
請求項2記載の情報システムであって、前記基準データは、健全性を判断する項目と各項目における評価基準、単位時間当たりの構成データ収集回数及び単位時間当たりの構成データ収集回数の上限で構成される
ことを特徴とする情報システム。
3. The information system according to claim 2, wherein the reference data includes items for judging soundness, evaluation criteria for each item, the number of times of collecting configuration data per unit time, and the upper limit of the number of times of collecting configuration data per unit time. An information system characterized by
請求項3記載の情報システムであって、前記健全性の判定で、評価基準を満足する、あるいは使用許容期間以内である項目を健全と、それ以外を不健全と判定して、判定した項目毎に判定結果と前記優先度及び前記重要度から健全性の評価値を算出する
ことを特徴とする情報システム。
The information system according to claim 3, wherein in the determination of soundness, items that satisfy the evaluation criteria or are within the allowable use period are determined to be healthy, and other items are determined to be unhealthy, and each determined item is determined. A soundness evaluation value is calculated from the determination result, the priority, and the importance.
請求項4記載の情報システムであって、構成データの収集毎に算出した健全性の評価値から健全性の度合いの傾向を生成して発生リスク内容を特定する
ことを特徴とする情報システム。
The information system according to claim 4, wherein the risk of occurrence is specified by generating a tendency of the degree of soundness from the evaluation value of soundness calculated for each collection of the configuration data.
請求項5記載の情報システムであって、健全性の判定結果の傾向で構成データの収集回数を増減させることを特徴とする情報システム。   6. The information system according to claim 5, wherein the number of collections of the configuration data is increased or decreased according to the tendency of the soundness determination result. 請求項3記載の情報システムであって、前記健全性の判定結果で前記健全性項目マスタデータの内容を更新することを特徴とする情報システム。   4. The information system according to claim 3, wherein the contents of the soundness master data are updated with the soundness determination result. 請求項5記載の情報システムであって、前記情報システムは、更に保守センタ用管理サーバを有する保守センタと、前記物理サーバと前記仮想サーバとを組み合わせて前記仮想化基盤とは別の仮想化基盤を1つ以上構成し、構成された仮想化基盤それぞれから構成データ、健全性評価結果、発生リスクを前記保守センタ用管理サーバが取得する
ことを特徴とする情報システム。
6. The information system according to claim 5, wherein the information system further includes a maintenance center having a management server for a maintenance center, and a virtualization platform different from the virtualization platform by combining the physical server and the virtual server. 1 or more, and the maintenance center management server obtains configuration data, soundness evaluation results, and occurrence risk from each configured virtualization platform.
JP2013203554A 2013-09-30 2013-09-30 Information system Expired - Fee Related JP6234759B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013203554A JP6234759B2 (en) 2013-09-30 2013-09-30 Information system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013203554A JP6234759B2 (en) 2013-09-30 2013-09-30 Information system

Publications (2)

Publication Number Publication Date
JP2015069449A JP2015069449A (en) 2015-04-13
JP6234759B2 true JP6234759B2 (en) 2017-11-22

Family

ID=52836035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013203554A Expired - Fee Related JP6234759B2 (en) 2013-09-30 2013-09-30 Information system

Country Status (1)

Country Link
JP (1) JP6234759B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210219159A1 (en) * 2018-05-31 2021-07-15 Sony Corporation Information processing apparatus, information processing system, information processing method, and program
WO2023218517A1 (en) * 2022-05-10 2023-11-16 日本電信電話株式会社 Server monitoring device, server monitoring system, server monitoring method, and program

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5416833B2 (en) * 2010-04-06 2014-02-12 株式会社日立製作所 Performance monitoring device, method and program
US20130198370A1 (en) * 2010-05-14 2013-08-01 Hitachi, Ltd. Method for visualizing server reliability, computer system, and management server

Also Published As

Publication number Publication date
JP2015069449A (en) 2015-04-13

Similar Documents

Publication Publication Date Title
US8046466B2 (en) System and method for managing resources
US10462027B2 (en) Cloud network stability
US8799709B2 (en) Snapshot management method, snapshot management apparatus, and computer-readable, non-transitory medium
US7840517B2 (en) Performance evaluating apparatus, method, and computer-readable medium
JP5477602B2 (en) Server reliability visualization method, computer system, and management server
US9575814B2 (en) Identifying hung condition exceeding predetermined frequency threshold and modifying hanging escalation tasks to avoid hang conditions
US9146793B2 (en) Management system and management method
US20100332661A1 (en) Computer System and Its Operation Information Management Method
US9921877B2 (en) Intelligent auto-scaling
US20120066376A1 (en) Management method of computer system and management system
US9355009B2 (en) Performance of scheduled tasks via behavior analysis and dynamic optimization
US9852007B2 (en) System management method, management computer, and non-transitory computer-readable storage medium
US20130111497A1 (en) Staggering Execution of Scheduled Tasks Based on Behavioral Information
WO2015040688A1 (en) Management system for managing computer system and management method thereof
JP4918668B2 (en) Virtualization environment operation support system and virtualization environment operation support program
JP5740338B2 (en) Virtual environment operation support system
JP6119767B2 (en) Coping method creation program, coping method creation method, and information processing apparatus
EP2668564A1 (en) Importance class based data management
Rathfelder et al. Workload-aware system monitoring using performance predictions applied to a large-scale e-mail system
JP6234759B2 (en) Information system
US20140165058A1 (en) System resource management method for virtual system
CN112445677A (en) Health state checking and repairing method of computer cluster and storage medium
JP2004164610A (en) Management device
Straube et al. Model-driven resilience assessment of modifications to HPC infrastructures
US11836055B1 (en) Backup management system, management calculator, and non-temporary computer-readable recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170621

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170713

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171024

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171025

R150 Certificate of patent or registration of utility model

Ref document number: 6234759

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees