JP5443686B2 - Information processing apparatus, information processing method, and program - Google Patents
Information processing apparatus, information processing method, and program Download PDFInfo
- Publication number
- JP5443686B2 JP5443686B2 JP2007326450A JP2007326450A JP5443686B2 JP 5443686 B2 JP5443686 B2 JP 5443686B2 JP 2007326450 A JP2007326450 A JP 2007326450A JP 2007326450 A JP2007326450 A JP 2007326450A JP 5443686 B2 JP5443686 B2 JP 5443686B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- computer system
- future
- state
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 18
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000012544 monitoring process Methods 0.000 claims description 54
- 230000008859 change Effects 0.000 claims description 44
- 238000004891 communication Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012508 change request Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 9
- 238000000034 method Methods 0.000 description 8
- 238000012806 monitoring device Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000014759 maintenance of location Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Description
本発明は、対象となるコンピュータシステムを自律的に管理する自律型コンピューティングに適用可能な技術に関するものである。 The present invention relates to a technique applicable to autonomous computing that autonomously manages a target computer system.
人間によるコンピュータシステムの管理の負荷を軽減するためにコンピュータが自ら管理する仕組み、所謂自律型コンピューティングが知られている。自律型コンピューティングでは、コンピュータシステムに障害等が発生すると、所定の運用指針(ポリシー)に基づいて、自律的な自己の障害を修復することができる。 A so-called autonomous computing system is known in which a computer manages itself in order to reduce the burden of managing a computer system by humans. In autonomous computing, when a failure or the like occurs in a computer system, an autonomous self failure can be repaired based on a predetermined operation guideline (policy).
特許文献1には、ある障害等イベントが発生した場合、当該事象を検知したコンピュータシステム以外のコンピュータシステムの稼働状態を加味して適切な操作を行う発明が開示されている。 Patent Document 1 discloses an invention in which when an event such as a failure occurs, an appropriate operation is performed in consideration of the operating state of a computer system other than the computer system that detected the event.
しかしながら、特許文献1に開示される発明は、発生したイベントに対して画一的に構成変更の処理を行っていた。即ち、サービスを提供するシステムの状況を全く考慮していなかった。 However, in the invention disclosed in Patent Document 1, a configuration change process is uniformly performed on an event that has occurred. That is, the situation of the system that provides the service was not considered at all.
そこで、本発明の目的は、サービスを提供するシステムの状況に応じたコンピュータシステムの構成変更を可能とすることにある。 Therefore, an object of the present invention is to make it possible to change the configuration of a computer system in accordance with the status of a system that provides a service.
本発明の情報処理装置は、サービスを提供する少なくとも一つのコンピュータから構成されるコンピュータシステムと通信回線を介して接続される情報処理装置であって、前記サービスを提供する前記コンピュータシステムの状態を示す監視データを取得し、取得した監視データからリソース状態変化を含む障害に関する第1のイベント情報を生成すると共に、当該第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報を生成するイベント情報生成手段と、前記サービスを提供する前記コンピュータシステムを構成するコンピュータに関する構成情報を取得する構成情報取得手段と、前記サービスを提供する前記コンピュータシステムの運用指針を示すポリシー情報を取得するポリシー情報取得手段と、前記構成情報取得手段によって得られた構成情報と、前記イベント情報生成手段によって生成された前記第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報とに基づいて、未来の複数の時点の時系列に対応した前記サービスを提供する際に必要とされる前記コンピュータシステム全体の状態に関するシステム状態情報を算出するシステム状態情報算出手段と、前記システム状態情報と前記ポリシー情報とに基づいて、前記コンピュータシステムの構成を変更するための要求情報であって、未来の複数の時点の時系列に対応した要求情報を生成する要求情報生成手段とを有することを特徴とする。
本発明の情報処理方法は、サービスを提供する少なくとも一つのコンピュータから構成されるコンピュータシステムと通信回線を介して接続される情報処理装置による情報処理方法であって、前記サービスを提供する前記コンピュータシステムの状態を示す監視データを取得し、取得した監視データからリソース状態変化を含む障害に関する第1のイベント情報を生成すると共に、当該第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報を生成するイベント情報生成ステップと、前記サービスを提供する前記コンピュータシステムを構成するコンピュータに関する構成情報を取得する構成情報取得ステップと、前記サービスを提供する前記コンピュータシステムの運用指針を示すポリシー情報を取得するポリシー情報取得ステップと、前記構成情報取得ステップによって得られた構成情報と、前記イベント情報生成ステップによって生成された前記第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報とに基づいて、未来の複数の時点の時系列に対応した前記サービスを提供する際に必要とされる前記コンピュータシステム全体の状態に関するシステム状態情報を算出するシステム状態情報算出ステップと、前記システム状態情報と前記ポリシー情報とに基づいて、前記コンピュータシステムの構成を変更するための要求情報であって、未来の複数の時点の時系列に対応した要求情報を生成する要求情報生成ステップとを含むことを特徴とする。
本発明のプログラムは、サービスを提供する少なくとも一つのコンピュータから構成されるコンピュータシステムと通信回線を介して接続される情報処理装置による情報処理方法をコンピュータに実行させるためのプログラムであって、前記サービスを提供する前記コンピュータシステムの状態を示す監視データを取得し、取得した監視データからリソース状態変化を含む障害に関する第1のイベント情報を生成すると共に、当該第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報を生成するイベント情報生成ステップと、前記サービスを提供する前記コンピュータシステムを構成するコンピュータに関する構成情報を取得する構成情報取得ステップと、前記サービスを提供する前記コンピュータシステムの運用指針を示すポリシー情報を取得するポリシー情報取得ステップと、前記構成情報取得ステップによって得られた構成情報と、前記イベント情報生成ステップによって生成された前記第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報とに基づいて、未来の複数の時点の時系列に対応した前記サービスを提供する際に必要とされる前記コンピュータシステム全体の状態に関するシステム状態情報を算出するシステム状態情報算出ステップと、前記システム状態情報と前記ポリシー情報とに基づいて、前記コンピュータシステムの構成を変更するための要求情報であって、未来の複数の時点の時系列に対応した要求情報を生成する要求情報生成ステップとをコンピュータに実行させることを特徴とする。
An information processing apparatus according to the present invention is an information processing apparatus connected via a communication line to a computer system including at least one computer that provides a service, and indicates a state of the computer system that provides the service The monitoring data is acquired, first event information relating to a failure including a change in resource state is generated from the acquired monitoring data, the change in the first event information is compared with the past monitoring data, and the computer Configuration relating to a computer constituting the computer system for providing the service, and event information generating means for generating second event information corresponding to a time series from the past to the future, including prediction contents of future state changes of the system Configuration information acquisition means for acquiring information and providing the service Change in that the policy information acquiring means for acquiring policy information that indicates the operational guidelines of the computer system, the configuration information obtained by the configuration information acquisition unit, wherein the first event information generated by the event information generator Based on the second event information corresponding to the time series from the past to the future, including the predicted contents of the future state change of the computer system . Based on system state information calculating means for calculating system state information relating to the state of the entire computer system required when providing the service corresponding to a time series of time points, based on the system state information and the policy information Request information for changing the configuration of the computer system, and a plurality of future information And having a request information generation means for generating request information when corresponding to a sequence of points.
The information processing method of the present invention is an information processing method by an information processing apparatus connected via a communication line to a computer system comprising at least one computer that provides a service, the computer system providing the service Monitoring data indicating the status of the current state is generated, first event information relating to a failure including a change in the resource state is generated from the acquired monitoring data, and the change in the first event information is compared with the past monitoring data. An event information generating step for generating second event information corresponding to a time series from the past to the future, including prediction contents of future state changes of the computer system, and the computer system for providing the service Configuration information acquisition step for acquiring configuration information about the computer to be executed And flop, and policy information acquiring step of acquiring policy information that indicates the operational guidelines of the computer system for providing the service, the configuration information obtained by the configuration information acquisition step, said generated by the event information generating step By comparing the change in the first event information with the past monitoring data, the second event information corresponding to the time series from the past to the future, including the predicted contents of the future state change of the computer system A system state information calculating step for calculating system state information relating to the state of the entire computer system, which is required when providing the service corresponding to a time series of a plurality of times in the future, and the system state information; The configuration of the computer system is changed based on the policy information. A request information to, characterized in that it comprises a request information generating step of generating a request information corresponding to the time series of the future of the plurality of time points.
The program of the present invention is a program for causing a computer to execute an information processing method by an information processing apparatus connected via a communication line to a computer system including at least one computer that provides the service. Monitoring data indicating a state of the computer system that provides the information, and generating first event information related to a failure including a resource state change from the acquired monitoring data, and the change of the first event information and the past Providing the service with an event information generating step for generating second event information corresponding to a time series from the past to the future, including the predicted contents of future state changes of the computer system by collating with monitoring data A computer constituting the computer system A configuration information acquisition step for acquiring configuration information, a policy information acquisition step for acquiring policy information indicating an operation guideline of the computer system that provides the service, a configuration information obtained by the configuration information acquisition step, By comparing the change in the first event information generated by the event information generation step with the past monitoring data, including the predicted contents of the future state change of the computer system, the time series from the past to the future System state information for calculating system state information relating to the state of the entire computer system required when providing the service corresponding to a time series of a plurality of future points in time based on the corresponding second event information Based on the calculating step, the system state information, and the policy information. Te, a request information for changing the configuration of the computer system, characterized in that to execute a request information generating step of generating a request information corresponding to the time series of the future of the plurality of time points to the computer.
サービスを提供するシステムの状況に応じたコンピュータシステムの構成変更を可能とすることにある。 An object of the present invention is to make it possible to change the configuration of a computer system in accordance with the status of a system that provides a service.
以下、本発明を適用した好適な実施形態を、添付図面を参照しながら詳細に説明する。 DESCRIPTION OF EXEMPLARY EMBODIMENTS Hereinafter, preferred embodiments to which the invention is applied will be described in detail with reference to the accompanying drawings.
図1は、本発明の実施形態に係る自律型コンピューティング装置の機能的な構成を示すブロック図である。図1に示すように、本実施形態に係る自律型コンピューティング装置100は、サーバ類1001、ストレージ類1002及びネットワーク(N/W)装置類1003から構成される自律型コンピューティング環境であるコンピュータシステムとLAN(Local Area Network)等の通信回線で接続され、この通信回線を介して各装置の状態を監視することが可能である。なお、自律型コンピューティング環境とは、本実施形態における自律型コンピューティングの技術を適用する環境である。
FIG. 1 is a block diagram showing a functional configuration of an autonomous computing device according to an embodiment of the present invention. As shown in FIG. 1, the
上述したサーバ類1001とは、Webサーバ、APサーバ及びDBサーバ等の各種サーバのことであり、ストレージ類1002とは、DB等の情報を記録可能な装置類である。ネットワーク装置類1003とは、サーバ類1001及びストレージ類1002の各装置間を接続するLAN等の通信ネットワークである。
The
モニタリング装置101は、サーバ類1001、ストレージ類1002及びネットワーク装置類1003の各ノードから監視データを適宜取得する。以下に、モニタリング内容の例を記す。サーバ類1001からは、監視データとしてCPU利用率を示すデータ及びメモリ使用量を示すデータ、ネットワーク流量やディスクアクセス回数等のリソース使用状況データ、各サーバの処理履歴を示すログデータ等を取得する。また、モニタリング装置101は、監視データとしてストレージ類1002からディスク使用量やディスクキャッシュヒット率等のデータを取得する。さらに、モニタリング装置101は、ネットワーク装置類1003から監視データとして、それらの通信回線の流量や通信エラーの有無を示すログデータを取得する。また、モニタリング装置101は、各ノードに障害が発生したときには、障害発生を監視データとして取得する。
The
モニタリング装置101は、取得した監視データに基づいて自律型コンピューティング環境の状態を示すイベント情報を生成し、モニタリング結果データベース102に蓄積する。
The
また、モニタリング装置101は、自律型コンピューティング環境の構成を適宜監視し、その結果を構成情報として生成し、ポリシー管理データベース105に蓄積する。
In addition, the
ポリシー管理データベース105は、上述した構成情報のほかにポリシーを格納する。ポリシーとは、本自律型コンピューティング環境の運用に関する指針を示すデータである。
The
分析部103は、モニタリング結果データベース102に格納されたイベント情報を取得し、過去からの自律型コンピューティング環境の状態変化の推移履歴を示すイベント情報を生成したり、取得するイベント情報の値の変化と過去のイベント情報の値の変化履歴とを照合して、自律型コンピューティング環境の将来の状態変化の予測内容を示すイベント情報を生成する。
The analysis unit 103 acquires event information stored in the
判断部104は、分析部103或いはモニタリング結果データベース102からイベント情報を入力すると、ポリシー管理データベース105から当該イベント情報に該当する構成情報及びポリシーを取得し、自律型コンピューティング環境の構成変更の要求情報である構成変更要求を生成し、プロビジョニング装置107へ出力する。
When the event information is input from the analysis unit 103 or the
プロビジョニング装置107は、構成変更要求に応じたノードの追加、削除、入れ替え等の所謂プロビジョニングを行う。
The
図2は、自律型コンピューティング装置100のハードウェア構成を示すブロック図である。CPU201は、システムバスに接続される各デバイスやコントローラを統括的に制御する。ROM203又はHD207には、CPU201の制御プログラムであるBIOS(Basic Input/Output System)やオペレーティングシステムプログラム等、自律型コンピューティング装置100が実行する例えば図3に示す処理のプログラム等が記憶されている。
FIG. 2 is a block diagram illustrating a hardware configuration of the
なお、図2の例では、ハードディスク(HD)207は自律型コンピューティング装置100の内部に配置された構成としているが、他の実施形態としてHD207に相当する構成が自律型コンピューティング装置100の外部に配置された構成としてもよい。本実施形態に係る例えば図3に示す処理を行うためのプログラムは、フレキシブルディスク(FD)206やCD−ROM等、コンピュータ読み取り可能な記録媒体に記録され、それらの記録媒体から供給される構成としてもよいし、インターネット等の通信媒体を介して供給される構成としてもよい。
In the example of FIG. 2, the hard disk (HD) 207 is configured to be arranged inside the
RAM202は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をRAM202にロードして、プログラムを実行することで各種動作を実現するものである。
The
ディスクコントローラ205は、HD207やFD206等の外部メモリへのアクセスを制御する。通信IFコントローラ204は、インターネットやLANと接続し、例えばTCP/IPによって外部との通信を制御するものである。
The
ディスプレイコントローラ208は、ディスプレイ209における画像表示を制御する。
The
KB(キーボード)コントローラ210は、キーボード(KB)211からの操作入力を受け付け、CPU201に対して送信する。なお、図示していないが、キーボード211の他に、マウス等のポインティングデバイスもユーザの操作手段として本実施形態に係る自律型コンピューティング装置に適用可能である。
The KB (keyboard)
また、図1のモニタリング装置101、分析部103、判断部104、プロビジョニング装置107は、例えばHD207内に記憶され、必要に応じてRAM202にロードされるプログラム及びそれを実行するCPU201に相当する構成である。
Also, the
図1のポリシー管理データベース105、モニタリング結果データベース102は、例えばHD207内の一部記憶領域に相当する構成である。なお、ポリシー管理データベース105、モニタリング結果データベース102は、本自律型コンピューティング装置100の外部に備えた構成としてもよい。
The
図3は、本実施形態に係る自律型コンピューティング装置100の動作の流れを示すフローチャートである。図3において、先ずモニタリング装置100は、自律型コンピューティング環境の各ノードから監視データを取得し、取得した監視データからリソース状態変化等障害に関するイベント情報を生成する(ステップS301)。
FIG. 3 is a flowchart showing an operation flow of the
続いて、モニタリング装置101は、生成したイベント情報をモニタリング結果データベース102に蓄積する(ステップS302)。
Subsequently, the
続いて、分析部103は、モニタリング結果データベース102からイベント情報を取得し、取得したイベント情報に基づいて過去からの自律型コンピューティングの状態変化の推移履歴を示すイベント情報を生成したり、取得したイベント情報の値の変化と過去の監視データの値の変化履歴とを照合して、自律型コンピューティング環境の将来の状態変化の予測内容を示すイベント情報を生成する(ステップS303)。将来の状態変化の予測には、過去から現在にかけてのイベント情報の経時変化に対して、各種分析手法を適用することで行う。例えば、現在のCPU利用率が40%で、過去から現在にかけて、CPU利用率が30分に10%ずつ上昇しているとき、線形予測を用いて未来のCPU利用率を算出し、現在から4時間後にはCPU利用率が閾値80%を超えると予測する。イベントの種類や変化の度合い等により、線形近似以外の手法を活用することも当然可能である。
Subsequently, the analysis unit 103 acquires event information from the
続いて、判断部104は、分析部103或いはモニタリング結果データベース102より出力されたイベント情報に該当するポリシー及び現在の構成情報をポリシー管理データベース105から取得する。そして、判断部104は、イベント情報、ポリシー及び現在の構成情報に基づいて現在の構成変更要求を生成する(ステップS304)。この構成変更要求の生成処理の詳細は後述する。
Subsequently, the
続いて、プロビジョニング装置107は、判断部104より出力された構成変更要求に応じたプロビジョニングを自律型コンピューティング環境に対して実行する(ステップS305)。
Subsequently, the
図4は、本実施形態において監視対象とする自律型コンピューティング環境の一例を示す図である。ここでは、サーバ類1001であるWebサーバ1〜4、APサーバ1〜2及びDBサーバ1〜2、並びにストレージ類1002であるDBが、互いにネットワーク装置類103である通信回線を介して接続されるコンピュータシステムを例に挙げている。
FIG. 4 is a diagram illustrating an example of an autonomous computing environment to be monitored in the present embodiment. Here, Web servers 1 to 4 that are
図5は、図4に示す自律型コンピューティング環境を監視対象とした場合の構成情報を示す図である。図5に示すように、構成情報には、例えば、日時情報、各サーバ(ノード)の名称、サービス名、役割、スペック及びステータスが含まれる。日時情報は、構成情報がモニタリング装置101によって生成された日時を示す。サービス名は、該当するコンピュータシステムのサービス名を示す。役割は、コンピュータシステム内におけるサーバの役割を示す。ステータスは、サーバが動作中の状態にあるか否かを示す。なお、上述の構成情報は本実施形態を行うに当っての一例である。例えば、該当サーバが動作しているか否かをステータスで管理する代わりに、サーバやサービス、役割、スペック等の項目を空白で管理することで、該当サーバが稼働していない状態にあることを管理しても当然よい。
FIG. 5 is a diagram showing configuration information when the autonomous computing environment shown in FIG. 4 is a monitoring target. As shown in FIG. 5, the configuration information includes, for example, date and time information, the name of each server (node), service name, role, specification, and status. The date / time information indicates the date / time when the configuration information was generated by the
図6は、判断部104が取得するイベント情報の構成を概念的に示す図である。従って、実際には、コンピュータが理解できるようプログラミング言語で表現されている。なお、イベント情報の構成に関する他の図においても同様である。
FIG. 6 is a diagram conceptually illustrating a configuration of event information acquired by the
図6においては、3つのイベント情報の例を示している。イベント情報には、日時情報、発生場所、内容が含まれる。日時情報は、モニタリング装置101が監視データを取得した日時に関する情報、或いは、分析部103によって予測されたイベントが起こりうる日時を示す情報である。発生場所は、モニタリング装置101が監視データを取得した場所を示す情報である。内容は、モニタリング装置101が取得した監視データが示す障害発生やリソース状態変化等を示す情報、或いは、分析部103が分析した結果予測された障害発生やリソース状態変化等を示す情報である。ここでは、イベント情報1の内容として、「現在のCPU利用率は50%」が示されている。また、イベント情報2の内容として、「現在のCPU利用率は30%」が示されている。イベント情報1〜2は、モニタリング装置101によって生成され、判断部104によって取得されたものである。また、イベント情報3は、分析部103によって将来の状態変化の予測を示すイベント情報として生成されたものであり、判断部104によって取得されたものである。イベント情報3の内容として、「30分後のCPU利用率は70%、60分後のCPU利用率は90%、90分後のCPU利用率は110%」が示されている。この内容は、分析部103においてイベント情報に基づいて生成された30〜90分後のCPU利用率の予測内容である。
FIG. 6 shows three examples of event information. The event information includes date / time information, occurrence location, and contents. The date / time information is information related to the date / time when the
図7は、図6に示すイベント情報に該当し得るポリシーの構成を概念的に示す図である。ここでは、イベント情報1〜3の発生場所のサービスA及びAPサーバに関係するポリシー1〜3が列挙されている。 FIG. 7 is a diagram conceptually showing a policy configuration that can correspond to the event information shown in FIG. Here, policies 1 to 3 related to the service A and the AP server where the event information 1 to 3 occurs are listed.
ポリシーには、適用箇所、ルールが含まれる。適用箇所は、当該ポリシーを適用する箇所を示す情報である。ルールは、当該ポリシーの適用内容であるルールを示す情報である。図7に示すように、ポリシーの適用箇所は、サービスAを提供するコンピュータシステムのAPサーバであることが示されている。また、ポリシーのルールとしては、「ノード1台当たりのCPU利用率を60%以下で運用する」ことが示されている。なお、ノードとは、サーバ類1001、ストレージ類1002又はネットワーク装置類1003の何れかに属する個々の装置を称する用語である。図7では説明のためにルールを文書的に表現しているが、実際にはコンピュータプログラミング言語でよく使われるif/then形式等で記載し、コンピュータがルールを判断できるようにする。ポリシーの構成に関する他の図においても同様である。
The policy includes application points and rules. The application location is information indicating a location to which the policy is applied. The rule is information indicating a rule that is the application content of the policy. As shown in FIG. 7, it is indicated that the application point of the policy is an AP server of the computer system that provides the service A. The policy rule indicates that “the CPU usage rate per node is operated at 60% or less”. Note that a node is a term that refers to an individual device belonging to any of the
判断部104は、図6に示すイベント情報を取得した場合、図7に示すポリシーのほかに、当該自律型コンピューティング環境に該当する図5に示す現在の構成情報をポリシー管理データベース105から取得する。
When the event information shown in FIG. 6 is acquired, the
判断部104におけるポリシーの選択方法を説明する。例えば、判断部104によってイベント情報1が取得された場合、判断部104は、イベント情報1の内容(現在のCPU利用率50%)、即ち、APサーバのCPU利用率に該当するルールを含むポリシー、且つ、イベント情報1の発生場所(サービスA、APサーバ)に該当するルールを含むポリシーを選択する。判断部104は、APサーバのCPU利用率に関する内容を持ち、且つ、イベント情報1の発生場所をルールの適用箇所とする、例えば図7に示すポリシーを選択し、選択されたポリシーと現在の構成情報を基に構成変更要求を生成する。イベント情報2或いはイベント情報3についても同様である。
A policy selection method in the
なお、ここではCPU利用率を例に挙げたが、メモリ等のリソース利用率に対しても適用可能であることは勿論である。 Note that although the CPU utilization rate is described here as an example, it is needless to say that the present invention can also be applied to a resource utilization rate such as a memory.
図11は、判断部104によって生成される構成変更要求の構成を概念的に示す図である。図11に示すように、構成変更要求には、対象と期限と内容とが含まれる。対象は、当該構成変更要求により構成変更を要求する対象を示す。期限とは、当該構成変更要求の内容を実現すべき期限である。内容は、その対象について要求する構成変更の内容である。なお、図11では説明のために概念的に示しているが、実際には、コンピュータが理解できるようプログラミング言語で表現されている。なお、構成変更要求に関する他の図においても同様である。
FIG. 11 is a diagram conceptually illustrating the configuration of the configuration change request generated by the
次に、判断部104における構成変更要求の生成方法を説明する。まず、判断部104が現在の構成情報を取得し、上述の処理の通りポリシーを選択する。次に、判断部104は、取得した現在の構成情報とポリシーを、図8に示すサービスAの稼動にシステム全体として要する負荷量を算出する式に適用させ、サービスAの稼動にシステム全体として要する負荷量を算出する。具体的には、図9を用いて後述する。また、この例では、負荷量として、APサーバのCPU性能比及びCPU利用率を使用しているが、サービスAへのアクセス量など他の値を利用してもよい。CPU性能比とは、CPUの性能を表わす指標であり、クロック周波数、ベンチマーク試験の結果等の値を利用して算出する。
Next, a method for generating a configuration change request in the
図9を用いて、サービスAの稼動にシステム全体として要する負荷量の算出処理を具体的に説明する。例えば、判断部104は、取得した現在の構成情報から、サービスAを提供しているサーバが2台構成であることを把握し、図6に示すイベント情報1〜3を取得すると、現在より30分前のCPU利用率が30%、現在のCPU利用率が50%、30分後のCPU利率が70%、60分後のCPU利用率が90%、90分後のCPU利用率が110%、であることを把握するので、図9に示すように、2台分の、CPU性能比×CPU利用率、の合計を算出する。ここでは、APサーバ1、2がともにCPU性能比が1である場合を例示しているが、これに限らないことは勿論である。
The load amount calculation process required for the entire system to operate the service A will be specifically described with reference to FIG. For example, when the
次に、このような処理によって算出した、各時間におけるサービスAの稼動にかかるシステム全体の負荷量と選択したポリシーに基づいて、サービスAの稼働において、ポリシーを満たす為に必要とされるシステム構成を算出する。具体的には、判断部104が取得した図7に示すポリシー「1台あたりのCPU利用率を60%以下で運用する」から、現在の負荷量、30分後の負荷量、60分後の負荷量、90分後の負荷量を1台で処理できる負荷量(60%)で割る。判断部104がこの処理を行うことによって、ポリシーを満たしてサービスAを稼働するのに、現在必要なサーバ台数、30分後に必要なサーバ台数、60分後に必要なサーバ台数、90分後に必要なサーバ台数を算出する。また、割り切れない場合は、繰り上げた値を必要なサーバ台数とした運用としてもよい。
Next, the system configuration required to satisfy the policy in the operation of the service A based on the load amount of the entire system for the operation of the service A at each time and the selected policy calculated by such processing. Is calculated. Specifically, from the policy shown in FIG. 7 acquired by the
図10は、判断部104による必要なサーバ台数の算出方法を示す図である。図10に示すように、必要なサーバ台数は、サービスAを提供する際に要されるコンピュータシステム全体の負荷量をポリシーに示される1台あたりのCPU利用率60%で除算して次の結果が算出される。現在必要なサーバ台数は2台、30分後に必要なサーバ台数は3台、60分後に必要なサーバ台数は3台、90分後に必要なサーバ台数は4台と算出される。
FIG. 10 is a diagram illustrating a method for calculating the necessary number of servers by the
図11は、判断部104が上述の処理を行ったことによって生成した構成変更要求である。例えば、図11の構成変更要求1には「2007/10/11 10:00までに2台構成にする」、構成変更要求2には「2007/10/11 10:30までに3台構成にする」等といったように、現在又は算出された未来の負荷量に応じて、図7に示すポリシーを満たしてサービスAを提供するのに必要なサーバ台数が記述された構成変更要求が、時系列に生成される。
FIG. 11 shows a configuration change request generated by the
また、図12は、図9で算出された値をもとに時間と負荷量の関係をグラフで表わしたものである。時間とサービスへの負荷量の関係を導き出すことにより、急激な負荷量の変動や、サービスを提供するシステムを構成するサーバ台数に応じて、必要なサーバ台数を算出することができ、サービスを提供するシステムの状況に応じた構成変更要求を生成することができる。 FIG. 12 is a graph showing the relationship between time and load amount based on the values calculated in FIG. By deriving the relationship between time and the load on the service, it is possible to calculate the required number of servers according to sudden load fluctuations and the number of servers that make up the service providing system. It is possible to generate a configuration change request according to the status of the system to be executed.
プロビジョニング装置107は、判断部104によって出力される構成変更要求に従って自律型コンピューティング環境の構成変更を行う。
The
以上のように、本実施形態においては、予め設定した運用ルールを満たしてサービスを提供する為に、いつまでにどのようなシステム構成であるべきかという情報を、自律的に生成し、それを実現するシステムの構成変更が可能となる。 As described above, in the present embodiment, in order to provide services by satisfying preset operation rules, information on what system configuration should be generated by the time is autonomously generated and realized. The system configuration can be changed.
また本発明を実施するにあたって、イベント情報とは、標準的なフォーマットの一つであるCBE(Common Base Event)データに変換されていてもよいことは言うまでも無い。 Needless to say, the event information may be converted into CBE (Common Base Event) data, which is one of the standard formats, in implementing the present invention.
100:自律型コンピューティング装置
101:モニタリング装置
102:モニタリング結果データベース
103:分析部
104:判断部
105:ポリシー管理データベース
107:プロビジョニング装置
1001:サーバ類
1002:ストレージ類
1003:ネットワーク装置類
100: Autonomous computing device 101: Monitoring device 102: Monitoring result database 103: Analysis unit 104: Determination unit 105: Policy management database 107: Provisioning device 1001: Servers 1002: Storages 1003: Network devices
Claims (5)
前記サービスを提供する前記コンピュータシステムの状態を示す監視データを取得し、取得した監視データからリソース状態変化を含む障害に関する第1のイベント情報を生成すると共に、当該第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報を生成するイベント情報生成手段と、
前記サービスを提供する前記コンピュータシステムを構成するコンピュータに関する構成情報を取得する構成情報取得手段と、
前記サービスを提供する前記コンピュータシステムの運用指針を示すポリシー情報を取得するポリシー情報取得手段と、
前記構成情報取得手段によって得られた構成情報と、前記イベント情報生成手段によって生成された前記第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報とに基づいて、未来の複数の時点の時系列に対応した前記サービスを提供する際に必要とされる前記コンピュータシステム全体の状態に関するシステム状態情報を算出するシステム状態情報算出手段と、
前記システム状態情報と前記ポリシー情報とに基づいて、前記コンピュータシステムの構成を変更するための要求情報であって、未来の複数の時点の時系列に対応した要求情報を生成する要求情報生成手段とを有することを特徴とする情報処理装置。 An information processing apparatus connected via a communication line to a computer system composed of at least one computer providing a service,
The monitoring data indicating the state of the computer system that provides the service is acquired, first event information relating to a failure including a resource state change is generated from the acquired monitoring data, and the change in the first event information and the past Event information generating means for generating second event information corresponding to a time series applied from the past to the future, including the predicted contents of future state changes of the computer system.
Configuration information acquisition means for acquiring configuration information about a computer constituting the computer system that provides the service;
Policy information acquisition means for acquiring policy information indicating an operation guideline of the computer system providing the service;
By comparing the configuration information obtained by the configuration information acquisition unit, the change in the first event information generated by the event information generation unit with the past monitoring data, the future state change of the computer system The computer required for providing the service corresponding to the time series at a plurality of times in the future based on the second event information corresponding to the time series applied from the past to the future including the predicted contents of System state information calculating means for calculating system state information related to the state of the entire system;
Request information generation means for generating request information corresponding to a time series of a plurality of future time points, which is request information for changing the configuration of the computer system based on the system state information and the policy information; An information processing apparatus comprising:
前記サービスを提供する前記コンピュータシステムの状態を示す監視データを取得し、取得した監視データからリソース状態変化を含む障害に関する第1のイベント情報を生成すると共に、当該第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報を生成するイベント情報生成ステップと、
前記サービスを提供する前記コンピュータシステムを構成するコンピュータに関する構成情報を取得する構成情報取得ステップと、
前記サービスを提供する前記コンピュータシステムの運用指針を示すポリシー情報を取得するポリシー情報取得ステップと、
前記構成情報取得ステップによって得られた構成情報と、前記イベント情報生成ステップによって生成された前記第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報とに基づいて、未来の複数の時点の時系列に対応した前記サービスを提供する際に必要とされる前記コンピュータシステム全体の状態に関するシステム状態情報を算出するシステム状態情報算出ステップと、
前記システム状態情報と前記ポリシー情報とに基づいて、前記コンピュータシステムの構成を変更するための要求情報であって、未来の複数の時点の時系列に対応した要求情報を生成する要求情報生成ステップとを含むことを特徴とする情報処理方法。 An information processing method by an information processing apparatus connected via a communication line to a computer system comprising at least one computer providing a service,
The monitoring data indicating the state of the computer system that provides the service is acquired, first event information relating to a failure including a resource state change is generated from the acquired monitoring data, and the change in the first event information and the past Event information generation step of generating second event information corresponding to a time series applied from the past to the future, including the predicted contents of the future state change of the computer system.
A configuration information acquisition step of acquiring configuration information about a computer constituting the computer system that provides the service;
A policy information acquisition step of acquiring policy information indicating an operation guideline of the computer system providing the service;
By comparing the configuration information obtained in the configuration information acquisition step with the change in the first event information generated in the event information generation step and the past monitoring data, a future state change of the computer system The computer required for providing the service corresponding to the time series at a plurality of times in the future based on the second event information corresponding to the time series applied from the past to the future including the predicted contents of A system state information calculating step for calculating system state information relating to the state of the entire system;
A request information generation step for generating request information corresponding to a time series of a plurality of times in the future, which is request information for changing the configuration of the computer system based on the system state information and the policy information; An information processing method comprising:
前記サービスを提供する前記コンピュータシステムの状態を示す監視データを取得し、取得した監視データからリソース状態変化を含む障害に関する第1のイベント情報を生成すると共に、当該第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報を生成するイベント情報生成ステップと、
前記サービスを提供する前記コンピュータシステムを構成するコンピュータに関する構成情報を取得する構成情報取得ステップと、
前記サービスを提供する前記コンピュータシステムの運用指針を示すポリシー情報を取得するポリシー情報取得ステップと、
前記構成情報取得ステップによって得られた構成情報と、前記イベント情報生成ステップによって生成された前記第1のイベント情報の変化と過去の前記監視データとを照合して、前記コンピュータシステムの将来の状態変化の予測内容を含む、過去から未来にかける時系列に対応した第2のイベント情報とに基づいて、未来の複数の時点の時系列に対応した前記サービスを提供する際に必要とされる前記コンピュータシステム全体の状態に関するシステム状態情報を算出するシステム状態情報算出ステップと、
前記システム状態情報と前記ポリシー情報とに基づいて、前記コンピュータシステムの構成を変更するための要求情報であって、未来の複数の時点の時系列に対応した要求情報を生成する要求情報生成ステップとをコンピュータに実行させるためのプログラム。 A program for causing a computer to execute an information processing method by an information processing apparatus connected via a communication line to a computer system including at least one computer providing a service,
The monitoring data indicating the state of the computer system that provides the service is acquired, first event information relating to a failure including a resource state change is generated from the acquired monitoring data, and the change in the first event information and the past Event information generation step of generating second event information corresponding to a time series applied from the past to the future, including the predicted contents of the future state change of the computer system.
A configuration information acquisition step of acquiring configuration information about a computer constituting the computer system that provides the service;
A policy information acquisition step of acquiring policy information indicating an operation guideline of the computer system providing the service;
By comparing the configuration information obtained in the configuration information acquisition step with the change in the first event information generated in the event information generation step and the past monitoring data, a future state change of the computer system The computer required for providing the service corresponding to the time series at a plurality of times in the future based on the second event information corresponding to the time series applied from the past to the future including the predicted contents of A system state information calculating step for calculating system state information relating to the state of the entire system;
A request information generation step for generating request information corresponding to a time series of a plurality of times in the future, which is request information for changing the configuration of the computer system based on the system state information and the policy information; A program that causes a computer to execute.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007326450A JP5443686B2 (en) | 2007-12-18 | 2007-12-18 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007326450A JP5443686B2 (en) | 2007-12-18 | 2007-12-18 | Information processing apparatus, information processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009151381A JP2009151381A (en) | 2009-07-09 |
JP5443686B2 true JP5443686B2 (en) | 2014-03-19 |
Family
ID=40920505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007326450A Active JP5443686B2 (en) | 2007-12-18 | 2007-12-18 | Information processing apparatus, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5443686B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023243896A1 (en) * | 2022-06-17 | 2023-12-21 | 삼성전자 주식회사 | Electronic device for determining inference distribution ratio of artificial neural network and operation method thereof |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2011096314A1 (en) * | 2010-02-05 | 2013-06-10 | 日本電気株式会社 | Web service construction management method, apparatus, and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07302242A (en) * | 1994-04-30 | 1995-11-14 | Mitsubishi Electric Corp | Load distribution system |
JP4066932B2 (en) * | 2003-11-10 | 2008-03-26 | 株式会社日立製作所 | Computer resource allocation method based on prediction |
JP2005250548A (en) * | 2004-03-01 | 2005-09-15 | Fujitsu Ltd | Relay control method, relay control program, and relay controller |
JP2006092449A (en) * | 2004-09-27 | 2006-04-06 | Oki Electric Ind Co Ltd | Operation number control system, terminal control device, and operation number control method |
-
2007
- 2007-12-18 JP JP2007326450A patent/JP5443686B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023243896A1 (en) * | 2022-06-17 | 2023-12-21 | 삼성전자 주식회사 | Electronic device for determining inference distribution ratio of artificial neural network and operation method thereof |
Also Published As
Publication number | Publication date |
---|---|
JP2009151381A (en) | 2009-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4374378B2 (en) | Operation performance evaluation apparatus, operation performance evaluation method, and program | |
US20050132379A1 (en) | Method, system and software for allocating information handling system resources in response to high availability cluster fail-over events | |
US9699053B2 (en) | IT system infrastructure prediction based on epidemiologic algorithm | |
JP4705484B2 (en) | Performance monitoring device, performance monitoring method and program | |
US11658920B2 (en) | System and method for autonomous and dynamic resource allocation in storage systems | |
US20190324652A1 (en) | System and method for capacity forecasting in backup systems | |
JP4866636B2 (en) | Operation quality control method in distributed program execution environment | |
JP2009528649A (en) | Improvements on distributed computing | |
US10462026B1 (en) | Probabilistic classifying system and method for a distributed computing environment | |
JPWO2014054230A1 (en) | Information system construction device, information system construction method, and information system construction program | |
Sousa et al. | Cloud infrastructure planning considering different redundancy mechanisms | |
JP5321195B2 (en) | Monitoring control system, monitoring control method, monitoring control server, and monitoring control program | |
JP5155699B2 (en) | Information processing apparatus, information processing method, and program | |
JP5443686B2 (en) | Information processing apparatus, information processing method, and program | |
JP2009032052A (en) | Information processor, information processing method and program | |
JP5544929B2 (en) | Operation management device, operation management method, operation management program | |
Checiu et al. | Observability and controllability of autonomic computing systems for composed web services | |
JP6065843B2 (en) | Service level management apparatus, program, and method | |
JP2007265244A (en) | Performance monitoring device for web system | |
JP5500301B2 (en) | Monitoring control system, monitoring control method, monitoring control server, and monitoring control program | |
WO2013114911A1 (en) | Risk assessment system, risk assessment method, and program | |
JP5349876B2 (en) | Information processing apparatus, information processing method, and program | |
JP5691529B2 (en) | Performance evaluation system, performance evaluation method and performance evaluation program | |
JP2016130962A (en) | Data saving control method, data saving control program and data saving controller | |
WO2015146081A1 (en) | Risk-management apparatus, recording medium with risk-management program recorded thereon, and risk-management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130311 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130423 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130611 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130716 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131002 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20131009 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131203 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5443686 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |