JP6364203B2 - Monitoring server for monitoring system operating status and monitoring server control method - Google Patents
Monitoring server for monitoring system operating status and monitoring server control method Download PDFInfo
- Publication number
- JP6364203B2 JP6364203B2 JP2014034800A JP2014034800A JP6364203B2 JP 6364203 B2 JP6364203 B2 JP 6364203B2 JP 2014034800 A JP2014034800 A JP 2014034800A JP 2014034800 A JP2014034800 A JP 2014034800A JP 6364203 B2 JP6364203 B2 JP 6364203B2
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- application
- monitoring server
- agent
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012544 monitoring process Methods 0.000 title claims description 322
- 238000000034 method Methods 0.000 title claims description 35
- 230000008859 change Effects 0.000 claims description 79
- 238000013508 migration Methods 0.000 claims description 7
- 230000005012 migration Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims 12
- 230000006870 function Effects 0.000 description 94
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010276 construction Methods 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 1
- 230000004308 accommodation Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011900 installation process Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
Images
Landscapes
- Computer And Data Communications (AREA)
Description
本発明は、クラウドコンピューティングサービスを利用して構築されたシステムの稼働状態を監視する監視サーバ及び監視サーバの制御方法に関する。 The present invention relates to a monitoring server that monitors the operating state of a system constructed using a cloud computing service, and a monitoring server control method.
本技術分野の背景技術として、特開2001−298454号公報(特許文献1)がある。特許文献1には、「監視コンピュータを設置するとともに、監視コンピュータと監視センタ用コンピュータとを、ネットワークを介して情報を送受して、監視対象ネットワークの性能や稼働状況等を、離れた監視センタで、迅速かつ的確に把握することが可能なネットワーク監視システム及び監視コンピュータと監視センタ用コンピュータ並びに記録媒体を提供する。」と記載されている。 As a background art in this technical field, there is JP-A-2001-298454 (Patent Document 1). Patent Document 1 states that “a monitoring computer is installed and information is sent and received between the monitoring computer and the monitoring center computer via the network, and the performance and operating status of the monitoring target network are monitored at a remote monitoring center. Provides a network monitoring system, a monitoring computer, a monitoring center computer, and a recording medium that can be grasped quickly and accurately. "
また、特開2012−015762号公報(特許文献2)がある。特許文献2には、「顧客システム等にエージェントを設置して行うリモート監視システムにおいて、監視対象機器の増大によって発生するエージェントの処理性能不足、及びエージェントと監視対象機器との間に存在するルータやファイアウォールによる通信遮蔽を回避させる方式を提供する。」と記載されている。
Moreover, there exists Unexamined-Japanese-Patent No. 2012-015762 (patent document 2).
また、US2012/0159232A1(特許文献3)がある。特許文献3には、「情報処理サービスを提供する情報処理装置をクラスタ化しなくても、障害が発生した情報処理サービスを直ちに復旧することを可能にする。」と記載されている。
Further, there is US2012 / 0159232A1 (Patent Document 3).
システムの稼働状況の監視を行う際には、監視対象となるシステムが構築されている環境に、監視機能を備えたエージェントソフトウェアを導入して設定を行い、機能を有効化する必要がある。 When monitoring the operating status of the system, it is necessary to install and set up agent software having a monitoring function in the environment where the system to be monitored is constructed, and to activate the function.
しかしながら、CPU(Central Processing Unit)や仮想マシンの利用数でサービス利用コストが生じるクラウドサービスを提供するデータセンタ上に、監視対象となる待機系システムを構築する場合、待機状態の間から監視機能を導入すると、稼働していない状態で監視が不要なシステムのために、監視機能を動かすためのリソース利用コストが発生してしまう。 However, when building a standby system to be monitored on a data center that provides a cloud service where service usage costs are incurred due to the number of CPUs (Central Processing Units) and virtual machines used, the monitoring function can be used from the standby state. Introducing a system that does not require monitoring when it is not in operation will incur resource usage costs for running the monitoring function.
また、監視対象システムが構築されている環境と、監視ログを収集する統合監視サーバが設置された監視センタとの間のネットワーク回線が共用回線の場合、稼働していない状態で監視が不要なシステムのためにネットワークの回線リソースを確保してしまうと、共用回線の利用効率が悪くなる。 Also, if the network line between the environment where the monitored system is built and the monitoring center where the integrated monitoring server that collects monitoring logs is installed is a shared line, the system that is not in operation and does not require monitoring For this reason, if the network line resources are secured, the utilization efficiency of the shared line is deteriorated.
また、監視ログを収集する統合監視サーバを、ストレージの利用量によって課金されるクラウドサービスを提供するデータセンタ上で稼働させる場合、監視対象システムが待機状態にある間から監視機能が稼働し、監視用ネットワークを介して監視ログが通知され、この監視ログを蓄積することになると、稼働していない状態で監視が不要なシステムのために、ストレージ利用コストが余計に発生してしまう。 In addition, when the integrated monitoring server that collects monitoring logs is operated on a data center that provides a cloud service that is charged according to the amount of storage used, the monitoring function operates while the monitored system is in the standby state. If the monitoring log is notified through the network and the monitoring log is accumulated, an extra storage usage cost occurs because the system is not in operation and does not require monitoring.
本発明は、上述のような事情を鑑みてなされてものであり、クラウドコンピューティングサービスを利用して構築されたシステムの稼働状況の監視に伴うリソースの消費及びリソース利用コストを削減することを目的とする。 The present invention has been made in view of the circumstances as described above, and an object of the present invention is to reduce resource consumption and resource utilization costs associated with monitoring the operating status of a system constructed using a cloud computing service. And
上記課題に鑑み、本実施例における監視サーバは、データセンタのリソースを用いて構築されているシステムの構成変更を検知すると、構成変更に伴い新たに監視が必要になった部位に対して、その部位を監視するためのエージェントソフトウェアをデプロイし、デプロイしたエージェントソフトウェアから監視情報を収集するための論理ネットワークを開設する。具体的には、1又は2以上のデータセンタにネットワーク回線を介して接続され、前記1又は2以上のデータセンタ内の1又は2以上の計算機上に構築されたシステムを構成するアプリケーションの稼働状態を監視する監視サーバは、アプリケーションの稼働数の増加又は配置先の変更を検知すると、アプリケーションの稼働状態を監視するためのエージェントソフトウェアを、変更又は増加されたアプリケーションが稼働する計算機が設置されたデータセンタ内の計算機へデプロイする。そして、監視サーバは、変更又は増加されたアプリケーションの稼働状態の監視情報をデプロイしたエージェントソフトウェアから受信するために利用する論理ネットワークをネットワーク回線上に開設する。 In view of the above problems, when the monitoring server in the present embodiment detects a configuration change of a system constructed using data center resources, the monitoring server newly detects a portion that needs to be monitored due to the configuration change. Deploy agent software for monitoring parts, and establish a logical network to collect monitoring information from the deployed agent software. Specifically, the operating state of the application constituting the system connected to one or more data centers via a network line and constructed on one or more computers in the one or more data centers. When the monitoring server that monitors the application detects an increase in the number of operating applications or a change in the location of the application, the agent software for monitoring the operating status of the application is installed on the computer where the changed or increased applications are installed. Deploy to computers in the center. Then, the monitoring server opens a logical network on the network line to be used for receiving the monitoring information of the operating state of the changed or increased application from the deployed agent software.
システムの稼働状態の監視に必要となるリソースの利用コスト削減と、リソースの有効活用が可能になる。 This makes it possible to reduce the cost of using resources necessary for monitoring the operating status of the system and to effectively use the resources.
以下、実施例を図面を用いて説明する。 Hereinafter, examples will be described with reference to the drawings.
本実施例では、DR(Disaster Recovery)システムやHA(High Availability)システムのように、災害や障害により稼働中のシステムが停止した場合に、待機系のシステムに系切替を行うシステムを監視する例について説明する。
図1は、本実施例の構成変更追従型監視システムの構成図の例、図2は、本実施例の構成変更追従型監視システムの処理の流れを説明するシーケンス図の例である。この例では、稼働中システム6が顧客サイト1の1又は2以上の計算機上に構築され、稼働中システムを監視する顧客サイト1の監視エージェント10aは、取得した監視ログを、広域網2を介して、監視センタ3に設置されている統合監視サーバ8に送り、監視ログ収集機能部11に格納する。監視エージェント10aは、顧客サイト1の計算機に配置されていればよく、単一の計算機に配置されても、複数の計算機に配置されてもよい。
In this embodiment, an example of monitoring a system that performs system switching to a standby system when an operating system stops due to a disaster or failure, such as a DR (Disaster Recovery) system or an HA (High Availability) system. Will be described.
FIG. 1 is an example of a configuration diagram of the configuration change tracking type monitoring system according to the present embodiment, and FIG. 2 is an example of a sequence diagram illustrating a processing flow of the configuration change tracking type monitoring system according to the present embodiment. In this example, the
一方、待機系システム7は、パブリッククラウドサービスを提供するデータセンタであるパブリッククラウド5の1又は2以上の計算機に構築されている。稼働中システム6の状態および切替契機はパブリッククラウド5の構成変更監視機能12が監視する。構成変更監視機能12はDRシステムやHAシステムの稼働中システム6の系切替契機を監視し(S20)、系切替が発生する際には統合監視サーバ8の動的デプロイ機能13に構成変更通知を送る(S21)。この構成変更通知には、どのシステムの構成変更が発生したか判別できるようにするための識別子情報を含む。系切替契機は、構成変更監視機能12が能動的に監視する形態でも構わないし、DRシステムやHAシステムからの通知を監視する受動的な形態でも構わない。構成変更通知を受け取った動的デプロイ機能13は、待機系システム7を監視するための監視エージェント10bを、待機系システム7が準備されているパブリッククラウド5に導入する(S23)。
On the other hand, the standby system 7 is constructed in one or more computers of the
また、構成変更通知を受け取った動的デプロイ機能13は、パブリッククラウド5と監視センタ3との間の共用専用線4に、監視用論理ネットワーク14を開設する(S22)。この監視用論理ネットワーク14は、待機系システム7が待機状態から稼働状態に切り替わり、監視エージェント10bが監視ログを統合監視サーバ8の監視ログ収集機能部11に送るための通信回線となる。
The
また、構成変更通知を受け取った動的デプロイ機能13は、待機状態から稼働状態に切り替わるシステム7の監視ログを蓄積するために、監視ログ収集機能部11の監視ログ記憶領域を確保する。
The
なお、上記構成例はあくまで一実施形態であり、上記構成例に限定されるものではなく、様々な変形例が含まれる。例えば、図1では構成変更監視機能12は顧客サイト1に設置するようにみえるが、監視センタ3側に設置して、監視対象をリモート監視する形態でも構わない。構成変更の契機を把握する方法についても、監視対象システムから通知を貰うPush型の監視方法でも構わないし、監視対象システムの稼働状態を定期的にポーリング監視するPull型の監視方法でも構わない。
In addition, the said structural example is one Embodiment to the last, It is not limited to the said structural example, Various modifications are included. For example, although the configuration
また、上記構成例では稼働中システム6を顧客サイト1に構築する形態について説明したが、稼働中システム6は、待機系システム7が構築されているパブリッククラウド5とは運営者や地理的場所が異なる別のパブリッククラウド上に構築する形態でも構わない。
Further, in the above configuration example, the form in which the
図3は、本実施例の統合監視サーバ装置8の構成図の例である。ハードウェア構成は図示していないが、CPU(Central Processing Unit)、メモリ、記憶装置といった一般的にサーバ装置が備える構成要素を備え、必要に応じて外部のターミナル装置から接続したり、ディスプレイやキーボード,マウスといった入出力デバイスを直結したりできるハードウェア装置を利用する。統合監視サーバ装置8は、監視ログ収集機能11と動的デプロイ機能13を備える。図3の構成例では、両機能が同一のハードウェア装置で稼働する形態を示しているが、物理的に異なるハードウェア装置で稼働する形態でも構わない。また、同一のハードウェア装置で稼働する場合でも、図4に示すようなハイパバイザ41上の異なるユーザ空間44の各々で稼働する形態でも構わない。
FIG. 3 is an example of a configuration diagram of the integrated monitoring server device 8 of the present embodiment. Although the hardware configuration is not shown in the drawing, it includes components that are generally provided in a server device such as a CPU (Central Processing Unit), memory, and storage device, and can be connected from an external terminal device as necessary, or can be connected to a display or keyboard Hardware devices that can be directly connected to input / output devices such as mice are used. The integrated monitoring server device 8 includes a monitoring
図4は、監視エージェント10や構成変更監視機能12のデプロイ先の装置、すなわち顧客サイト1及びパブリッククラウド5の計算機の構成図の例である。また、前記のように、監視ログ収集機能11や動的デプロイ機能13を稼働させる統合管理サーバの構成図の例でもある。本装置は、ハードウェア40上にハイパバイザ41を搭載し、ハイパバイザ41の上で仮想分割した領域に、ドライバ42、OS(Operating System)43を乗せて、ユーザ空間44を生成する。監視エージェント10や構成変更監視機能12、監視ログ収集機能11や動的デプロイ機能13を導入する場合も、このユーザ空間44にそれぞれ導入する形態となる。監視エージェント10や構成変更監視機能12のデプロイ先は、稼働中システム6や待機中システム7が構築されている計算機と同一であってもよいし、異なる計算機であってもよい。
FIG. 4 is an example of a configuration diagram of a device to which the monitoring agent 10 and the configuration
図3に戻って、監視ログ収集機能11について説明する。監視エージェント10から送られてくる監視ログは、通信インタフェースのような入力インタフェース30を介して受信し、監視ログ収集機能部31に送られる。監視ログ収集機能部31は受け取った監視ログを、監視対象システム毎に分別して監視ログ格納部33に記録する。監視ログ格納部33は、データベースやストレージのような記録装置で構成され、物理的には別装置で構成する形態でも構わない。収集した監視ログは、ログ分析機能部34で、必要に応じて閾値監視などのデータ解析を行った後、出力インタフェース31を介して外部のターミナル装置や直結したディスプレイ装置に逐次出力する。
Returning to FIG. 3, the monitoring
次に、動的デプロイ機能13について、図5および図6のフローチャートや、図7から図9のテーブル構成図を参照しながら説明する。
Next, the
通信インタフェースのような入力インタフェース30を介して、構成変更監視機能12から構成変更通知を受信(S50)した実行契機監視部37は、受信した構成変更通知に含まれる識別子情報70や、構成変更発生元となる稼働中システム6のアドレス情報71をもとに、切替システム管理テーブル300を検索し、新たに監視対象となるシステム(待機系システム7)のアドレス情報72を識別する(S51)。新たな監視対象システムが判ったら、監視ログの収集に必要となる一連の機能導入および設定を実施する(S52)。切替システム管理テーブル300は、統合監視サーバ8の構成要素として実装する形態でも、統合監視サーバ8とは別のデータベース装置に実装する形態でも構わない。
The execution opportunity monitoring unit 37 that has received the configuration change notification from the configuration
構成変更通知メッセージの構成例を図15に示す。図15に示す構成は、通信パケットのボディ部に格納される内容を示しており、ヘッダ部に関する記載は省略している。本実施例のように、系切替に伴う監視対象の変更をいざなう場合は、コマンド150として「切替」を指定し、対象システムの識別子70もしくは稼働中システムのアドレス情報71を151に含めて構成変更通知メッセージを構成する。
A configuration example of the configuration change notification message is shown in FIG. The configuration shown in FIG. 15 shows the contents stored in the body part of the communication packet, and the description regarding the header part is omitted. As in this embodiment, when changing the monitoring target due to system switching, “switch” is designated as the
監視機能導入部の処理(S52)の詳細については、図6を用いて説明する。新たな監視対象となる待機系システム7を監視するための監視エージェント10bの導入手順は次のようになる。監視エージェントデプロイ機能部39が監視対象管理テーブル36を参照し(S60)、監視ログの通知先となるホスト(本実施例の場合、統合監視サーバ。特に監視ログ収集機能が動作しているサーバ。)のアドレス情報82や、通知周期83、アラート通知を行う場合に必要となる閾値情報81など、監視エージェント10bの設定に必要となる情報を抽出し、監視対象アドレス80(本実施例の場合、待機系システムのアドレス情報72と同一)に基づき、監視エージェント10bをデプロイする(S61)。
Details of the processing (S52) of the monitoring function introduction unit will be described with reference to FIG. The procedure for introducing the
監視用論理ネットワーク14の開設手順は次のようになる。監視ネットワーク設定機能38が監視ネットワーク管理テーブル35を参照し(S62)、対象システムの識別子情報70をもとに、監視用論理ネットワークの開設設定を行う対象となるルータやスイッチなどのネットワーク装置(両端の2装置)のアドレス情報90、論理ネットワーク(例えばVLAN:Virtual Local Area Network)のID(識別子,Identifier)情報91、帯域幅の情報92などを抽出し、前記ネットワーク装置に対して監視用論理ネットワークの設定を行う(S63)。
The procedure for opening the monitoring
また、監視機能導入処理(S52)としては、新たに収集する管理ログを蓄積する記憶領域をストレージ装置に確保する(S64)。 Further, as the monitoring function introduction process (S52), a storage area for accumulating newly collected management logs is secured in the storage device (S64).
監視エージェントの導入処理(S60〜S61)、監視用論理ネットワークの開設処理(S62〜S63)、監視ログ収集領域確保処理(S64)の順番については、図6のフローチャートに示すように並列実行する方式でも構わないし、図6のフローチャートとは異なりシーケンシャルに実行する方式でも構わない。但し、収集した監視ログを蓄積する領域や、監視ログを統合管理サーバ8に送るための通信回線の導入が完了しなければ、監視エージェントの導入が完了していても、新たな監視対象を統合管理サーバ8で監視することはできない。よって、望ましい監視機能導入手順の1形態は、最初に監視ログ収集領域を確保し(S64)、次に監視用論理ネットワークを開設し(S62〜S63)、その上で監視エージェントの導入(S60〜S61)を行う形態である。 The order of the monitoring agent installation process (S60 to S61), the monitoring logical network establishment process (S62 to S63), and the monitoring log collection area securing process (S64) is executed in parallel as shown in the flowchart of FIG. However, unlike the flowchart of FIG. 6, a sequential execution method may be used. However, if the installation of the collected monitoring log and the communication line for sending the monitoring log to the integrated management server 8 are not completed, the new monitoring target is integrated even if the installation of the monitoring agent is completed. It cannot be monitored by the management server 8. Accordingly, one desirable form of the monitoring function introduction procedure is to first secure a monitoring log collection area (S64), then open a monitoring logical network (S62 to S63), and then install a monitoring agent (S60 to S60). (S61).
本実施例では、切替システム管理テーブル300、監視対象管理テーブル36、監視ネットワーク管理テーブル35の情報は、システム構築時に登録しておくことを前提とする。但し、論理ネットワークのID情報91に関しては、利用中のIDを監視ネットワーク管理テーブル35で登録管理し、S63では未だ利用していないIDを1つ抽出して割り当て、S63で新たに割り当てたIDを監視ネットワーク管理テーブル35に登録する形態が望ましい。
In this embodiment, it is assumed that information of the switching system management table 300, the monitoring target management table 36, and the monitoring network management table 35 is registered at the time of system construction. However, regarding the
上記説明では、監視エージェント10bをデプロイする際に設定情報を与える方式を述べたが、図4に示したような仮想化環境で監視エージェント10bを動かす場合には、予め、設定情報を与えた監視エージェント10bを含むイメージファイルを作成しておき、構成変更通知を受信(S50)した際の監視機能導入(S52)時には、前記イメージファイルを利用可能な状態にする方式でも構わない。この場合は、更に、構成変更通知を受信するまでは、作成したイメージファイルは統合監視サーバ8の監視エージェントデプロイ機能部39で管理し、構成変更通知を受信(S50)した後に、待機系システム7が準備されているパブリッククラウド5に導入(S23)する形態をとっても構わない。構成変更通知を受信するまでは、イメージファイルを導入しないことにより、新たに監視対象となるシステムが稼働するまではパブリッククラウド5を使用しないことになるため、リソース使用に応じて発生する課金コストを抑制することができる。
In the above description, the method of giving the setting information when deploying the
上記実施例はDRシステムやHAシステムを例にとり説明したが、待機系システムを用意せず、異なるシステム環境にマイグレーションするケースに関しても、同様の効果が得られる。マイグレーションのケースでは、構成変更監視機能12がマイグレーション契機を監視し、構成変更監視機能12からの通知に基づき動的デプロイ機能13が監視機能の導入(S52)を行うことで、マイグレーション先でシステムが稼働し始めるタイミングで監視機能を動的に導入することができる。
The above embodiment has been described by taking the DR system and the HA system as an example, but the same effect can be obtained also in the case of migrating to a different system environment without preparing a standby system. In the migration case, the configuration
以上、系切替やマイグレーションに伴う監視対象の切替変更手順について説明したが、系切替やマイグレーションが発生する以前に稼働していたシステムからの監視機能の削除手順は、実施例3で説明する。 As described above, the switching change procedure of the monitoring target accompanying the system switching or migration has been described, but the procedure for deleting the monitoring function from the system that was operating before the system switching or migration occurred will be described in the third embodiment.
本実施例では、クラウドサービスで提供されるオートスケール機能のように、サーバの負荷が閾値を超えた際に、自動的にサーバが追加もしくは削除される場合にも、サーバの増減に追従して監視を行う、構成変更追従型監視システムの例を説明する。 In this example, even when servers are automatically added or deleted when the server load exceeds the threshold, as in the auto-scaling function provided by the cloud service, the server increases and decreases. An example of a configuration change tracking type monitoring system that performs monitoring will be described.
図10は、実施例2における構成変更追従型監視システムの構成図の例である。既に説明した図1に示された同一の符号を付された構成と、同一の機能を有する部分については、説明を省略する。 FIG. 10 is an example of a configuration diagram of a configuration change tracking type monitoring system according to the second embodiment. The description of the components having the same functions as those shown in FIG. 1 already described with reference to FIG. 1 is omitted.
ある1つのゾーンA(105)でサーバ101が稼働している時に、オートスケール機能108は、設定された閾値情報に基づき、サーバ101の負荷の閾値監視を行う。サーバ101の負荷が閾値を超えると、オートスケール機能108は新たなサーバを増設する。この時、新たに増設されるサーバは、サーバ101と同一のゾーンA(105)に追加される形態でも、サーバ101とは異なるゾーンB(106)に追加される形態でも構わない。構成変更追従型監視システムは、新たに増設されるサーバ(102または103)を監視対象として加えるべく、監視機能の導入設定を行う。
When the
サーバ増設に追従して監視機能の導入設定を行うために、構成変更監視機能12は、オートスケール機能108の変化またはオートスケール機能108からの通知を監視する。オートスケール機能108からサーバの増設などの構成変更契機を得た構成変更監視機能12は、動的デプロイ機能13に構成変更通知を送る。構成変更契機の取得に関しては、構成変更監視機能12がオートスケール機能108を定期的にポーリング監視する形態でも、構成変更監視機能12がオートスケール機能108から通知を貰う形態でも構わない。
The configuration
構成変更通知を受け取った動的デプロイ機能13は、新たに増設されるサーバを監視するための監視エージェントを導入する。基本的な動作フローは、実施例1で説明した図5の手順と同様である。実施例1と異なるのは、新たな監視対象(実施例2では、オートスケールにより新たに増設されるサーバ)を識別する処理(S52)である。実施例1では切替システム管理テーブル300を検索して、新たな監視対象となる待機系システム7のアドレス情報72を取得したが、実施例2では切替システム管理テーブル300は存在しない。実施例2では、新たな監視対象(オートスケールにより新たに増設されるサーバ)のアドレス情報は、構成変更監視機能12がオートスケール機能108から取得する情報に含まれ、構成変更監視機能12はこのアドレス情報を動的デプロイ機能13に伝える。
Upon receiving the configuration change notification, the
このことを図15に示す構成変更通知メッセージで示すと、コマンド150には「追加」を指定し、新たに増設されるサーバのアドレス(新たに監視対象となるサーバのアドレス)情報を151に含める形となる。
When this is shown in the configuration change notification message shown in FIG. 15, “addition” is designated in the
実施例2では、監視対象管理テーブル36の用法も実施例1とは異なる。前述のとおり、実施例2では、監視対象アドレス80はオートスケール機能108から構成変更監視機能12経由で取得する情報であり、実施例1のようにシステム構築時に登録されるものではない。実施例2の監視対象管理テーブル36は、図11に示すような構成になる。動的デプロイ機能13は、新たな監視対象のアドレス情報をもとに、該アドレスが含まれるアドレスレンジ111を検索し、システム構築時などに予め設定されている監視情報の通知に必要となる情報70,81〜83を取得する。実施例2では、識別子情報70をゾーンの識別子と一致させても良い。
In the second embodiment, the usage of the monitoring target management table 36 is also different from that of the first embodiment. As described above, in the second embodiment, the
監視エージェントの導入に関しては、2通りのケースがある。1つのケースは、サーバ101と同一のネットワークゾーンであるゾーンA(105)に増設されるサーバ102を新たな監視対象とする場合である。この場合、既に導入されている監視エージェント10bがサーバ102の監視も同時に許容できるならば、監視エージェントを新たに導入する必要はなく、監視エージェント10bの設定に新たな監視対象となるサーバ102のアドレス情報などを追加するだけで良い。逆に、監視エージェント10bがサーバ102を新たな監視対象として追加するだけの余力がない場合は、新規に監視エージェントを導入する必要がある。
There are two cases regarding the introduction of the monitoring agent. One case is a case where the
もう1つのケースは、サーバ101とは異なるネットワークゾーンであるゾーンB(106)に増設されるサーバ103を新たな監視対象とする場合である。この場合はゾーンが異なるため、監視エージェント10bとは別の監視エージェント10cがサーバ103の監視を担う。この場合も既にゾーンB(106)に監視エージェント10cが導入済みで、且つ、サーバ103を新たな監視対象として追加する余力がある場合は、監視エージェント10cの設定に新たな監視対象となるサーバ103のアドレス情報を追加するだけで良い。一方、ゾーンB(106)には監視エージェントが未導入であったり、導入済みであっても、導入済みの監視エージェントがサーバ103を監視対象として追加する余力がない場合は、新規に監視エージェントを導入する。
The other case is a case where the
同一ゾーンに新たな監視対象が増設されるケース、異なるゾーンに新たな監視対象が増設されるケースとも、監視エージェントの導入設定に関する処理手順は共通で、図12に示すようなフローチャートになる。すなわち、当該ゾーンに監視エージェントが導入済みか確認する(S120)。監視エージェントが導入済みの場合は、既に導入されている監視エージェントで新たな監視対象の監視を許容できるか確認する(S121)。許容できる場合は、既存の監視エージェントに新たな監視対象に関する情報を登録する(S122)。一方、当該ゾーンに監視エージェントが導入されていない場合や、導入済みでも新たな監視対象の監視を許容できない場合は、新たに監視エージェントを導入する(S123)。図12に示す手順は、図6のS60とS61を置き換えるものである。 The processing procedure related to the installation setting of the monitoring agent is the same in both the case where a new monitoring target is added to the same zone and the case where a new monitoring target is added to a different zone, and the flowchart shown in FIG. That is, it is confirmed whether the monitoring agent has been installed in the zone (S120). If the monitoring agent has been installed, it is checked whether the monitoring agent already installed can permit monitoring of a new monitoring target (S121). If it is acceptable, information on the new monitoring target is registered in the existing monitoring agent (S122). On the other hand, if a monitoring agent has not been installed in the zone, or if monitoring of a new monitoring target is not permitted even if it has been installed, a new monitoring agent is introduced (S123). The procedure shown in FIG. 12 replaces S60 and S61 in FIG.
監視エージェントが導入済みか否かは、監視対象管理テーブル36で管理する。具体的には、監視エージェントを導入する際(S123)に、監視対象管理テーブル36の該当するゾーン70または該当するアドレスレンジ111の項目エリア112に、監視エージェントの識別子を登録することで管理する。
Whether the monitoring agent has been installed is managed by the monitoring target management table 36. Specifically, when a monitoring agent is introduced (S123), management is performed by registering the identifier of the monitoring agent in the corresponding
また、導入済みの監視エージェントの許容状況に関しては、図13に示す監視エージェント管理テーブル130で管理する。この監視エージェント管理テーブル130も、監視対象管理テーブル36と同様に、動的デプロイ機能部13が管理する。監視エージェント管理テーブル130に関わる処理の流れは次のとおりである。監視エージェントを導入する際(S123)にエージェント毎131の情報を記録する領域を作成し、監視対象132の情報と共に管理する。既存の監視エージェントに監視対象を追加する際は、該当する監視エージェントの監視対象欄132に情報を追加する。既存の監視エージェントに新たな監視対象を追加可能か否かは、追加収容可否欄133の情報を参照する。例えば、各監視対象を監視するために要する監視エージェントの負荷は一定である場合は、予め試算した監視対象の許容数を初期値として登録し、監視対象が追加される度にカウントを減じ、カウントがゼロとなったら新たな監視対象の追加は不能と判断する。
Further, the permissible status of installed monitoring agents is managed by the monitoring agent management table 130 shown in FIG. The monitoring agent management table 130 is also managed by the dynamic
監視用論理ネットワーク14に関しては、監視対象のサーバが増加することに伴う監視トラフィック量の増加に応じて、監視用論理ネットワーク14の帯域幅を増加させる。この監視用論理ネットワーク14の帯域幅の増加も、構成変更通知を受け取った動的デプロイ機能13が実施する。但し、既存の帯域幅が充分に確保されている場合は、必ずしも帯域幅を増加させなくても構わないし、帯域幅を増加させる代わりに、新たな監視用論理ネットワークを開設しても構わない。一つの実施形態の例は、監視エージェント10を導入する際に、該監視エージェント10が許容可能な監視対象サーバ数分の監視トラフィック量を包含する帯域幅92を確保する形態である。この実施形態では、監視サーバの増加に伴う監視用論理ネットワーク14の帯域幅変更は不要となり、監視用論理ネットワーク14の制御は新規に監視エージェント10を導入する際に行えば済む。
Regarding the monitoring
また、構成変更通知を受け取った動的デプロイ機能13は、実施例1と同様に、新たに増設されるサーバの監視ログを蓄積するための監視ログ記憶領域を、監視ログ収集機能部11に確保する。
The
本実施例では、監視対象の停止もしくは削除といった構成変更に伴い、不要となる監視機能を削除する、構成変更追従型監視システムの例について説明する。システム構成および構成要素については、実施例1または実施例2に準じる。すなわち、稼働中システム6の停止や、オートスケール108の縮退を構成変更監視機能12が監視し、構成変更監視機能12からの通知を契機に動的デプロイ機能13が処理を行うという流れは共通である。
In the present embodiment, an example of a configuration change tracking type monitoring system that deletes unnecessary monitoring functions in accordance with a configuration change such as suspension or deletion of a monitoring target will be described. The system configuration and components are the same as those in the first or second embodiment. That is, the configuration
違いは、構成変更通知(S21)で通知される内容が、新たな監視対象のアドレスではなく、監視対象から削除する対象のアドレスという点である。動的デプロイ機能13の処理手順としては、構成変更監視機能12から構成変更通知を受信(S50)し、受信したメッセージの内容を解析するところまでは図5と同様で、S51相当の処理として、受信メッセージの解析結果を監視対象の削除と判定し、S52相当の処理として、監視機能の削除処理を行うところが異なる。また、図15に示す構成変更通知メッセージのコマンド150には「削除」を指定し、監視対象から削除する対象のアドレス情報を151に含める形となる。
The difference is that the content notified by the configuration change notification (S21) is not a new monitoring target address but a target address to be deleted from the monitoring target. The processing procedure of the
監視機能の削除処理の詳細手順を図14に示す。構成変更通知(S21)として監視対象の削除通知を受信(S140)した動的デプロイ機能13は、監視対象管理テーブル36や監視エージェント管理テーブル130を確認する。削除すべき監視対象を監視している監視エージェントの監視対象132の数が1つ(S141)ならば、本構成変更通知により監視対象を削除すると当該監視エージェントは不要になるため、これを削除する(S142)。監視エージェントと対で監視用論理ネットワークを導入している場合は、この監視用論理ネットワークも不要になる。監視対象管理テーブルを削除する監視対象のアドレスで検索して識別子を特定し、この識別子を用いて監視ネットワーク管理テーブル36を検索して、削除する管理用論理ネットワークのID(91)や対象装置のアドレス(90)を特定し、この情報を用いて管理用論理ネットワークの削除処理を行う(S143)。
The detailed procedure of the monitoring function deletion process is shown in FIG. The
一方、S141の確認処理の結果、削除通知を受けた監視対象を削除しても、監視エージェントが監視する監視対象が残る場合は、監視エージェントの削除は行わず、通知された監視対象を監視エージェントの設定から除く(S144)。具体的には、監視エージェント管理テーブル130の監視対象項目132から、通知された監視対象を取り除く。監視用論理ネットワークについても削除するのではなく、監視対象1つの監視データを通知する分の帯域幅が不要になるだけなので、不要になる帯域幅を削減する(S145)。この場合も、監視対象管理テーブルを検索して、削除する監視対象に関わる識別子70を特定し、この識別子情報を元に監視ネットワーク管理テーブルを検索して、帯域幅の設定を変更するネットワーク装置のアドレス(90)を特定して変更設定を行う。
On the other hand, as a result of the confirmation processing in S141, even if the monitoring target that received the deletion notification is deleted, if the monitoring target monitored by the monitoring agent remains, the monitoring agent is not deleted and the notified monitoring target is used as the monitoring agent. (S144). Specifically, the notified monitoring target is removed from the
以上に述べた監視機能の削除処理手順では、監視機能を導入する手順と違い、監視ログ収集領域については処理を行っていないが、これは取得済みの監視データを残しておくためである。不要になった監視データや監視ログ収集領域の削除は、監視対象を削除するタイミングとは異なる契機で処理を行う。 In the monitoring function deletion processing procedure described above, unlike the procedure for introducing the monitoring function, the monitoring log collection area is not processed, but this is to keep the acquired monitoring data. Deletion of monitoring data and monitoring log collection area that are no longer required is processed at a different timing from the timing of deleting the monitoring target.
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。 In addition, this invention is not limited to an above-described Example, Various modifications are included. For example, the above-described embodiments describe the present invention in an easy-to-understand manner, and are not necessarily limited to those having all the configurations described. In addition, it is possible to add, delete, and replace other configurations for a part of the configuration of the embodiment.
3 監視センタ
4 共用専用線
5 パブリッククラウド
8 統合監視サーバ
10 監視エージェント
12 構成変更監視機能
13 動的デプロイ機能
14 監視用論理ネットワーク
3
Claims (12)
前記監視サーバは、前記アプリケーションの稼働数の増加又は配置先の変更を検知すると、アプリケーションの稼働状態を監視するためのエージェントソフトウェアを、変更又は増加された前記アプリケーションが稼働する計算機が設置されたデータセンタの計算機へデプロイし、変更又は増加された前記アプリケーションの稼働状態の監視情報を前記エージェントソフトウェアから受信するために利用する論理ネットワークを前記ネットワーク回線上に開設し、
稼働数の増加又は配置先の変更前の前記アプリケーションを監視するために設置されたソフトウェアエージェントから監視情報を収集するための論理ネットワークが前記ネットワーク回線上に設定されており、
前記アプリケーションの稼働数の増加又は配置先の変更を検知すると、変更又は増加された前記アプリケーションの稼働状態を、設置されていた前記ソフトウェアエージェントで監視可能かを判断し、監視可能と判断した場合、設定されていた前記論理ネットワークの帯域幅を拡大する。 A monitoring server that is connected to one or more data centers via a network line and monitors an operating state of an application constituting a system constructed on one or more computers of the one or more data centers. There,
When the monitoring server detects an increase in the number of operation of the application or a change in the arrangement destination, agent software for monitoring the operation state of the application is installed in the computer in which the computer that operates the changed or increased application is installed. deploy to the center of the computer, to open a logical network using monitoring information Health changes or increased the application to receive from the agent software on the network line,
A logical network for collecting monitoring information from a software agent installed to monitor the application before the increase in the number of operations or the change of the placement destination is set on the network line,
When detecting an increase in the number of operation of the application or a change in the arrangement destination, it is determined whether the operation state of the application that has been changed or increased can be monitored by the installed software agent. The bandwidth of the set logical network is expanded .
前記アプリケーションの配置先の変更の検知とは、稼働中の前記システムから待機系のシステムへの切り替えの検知である。 The monitoring server according to claim 1,
The detection of the change of the application destination is detection of switching from the operating system to the standby system.
前記アプリケーションの配置先の変更の検知とは、稼働中の前記システムのマイグレーションの検知である。 The monitoring server according to claim 1,
The detection of the change of the application destination is detection of migration of the system in operation.
前記アプリケーションの稼働数の増加の検知とは、稼働中の前記システムのスケールアウトの検知である。 The monitoring server according to claim 1,
The detection of an increase in the number of operating applications is detection of scale-out of the operating system.
配置先が変更される前の前記アプリケーションを監視するためのソフトウェアエージェントが設置されており、
前記監視サーバは、前記アプリケーションの配置先の変更に伴い、変更前の前記アプリケーションが削除された場合、削除された前記アプリケーションを監視するためのエージェントソフトウェアを削除する。 The monitoring server according to claim 4 ,
A software agent is installed to monitor the application before the deployment destination is changed,
The monitoring server deletes the agent software for monitoring the deleted application when the application before the change is deleted in accordance with the change of the arrangement destination of the application.
前記監視サーバは、前記エージェントソフトウェアのデプロイに伴い、前記エージェントソフトウェアから収集する前記監視情報を記憶するための記憶領域を確保する。 The monitoring server according to claim 1 ,
The monitoring server secures a storage area for storing the monitoring information collected from the agent software as the agent software is deployed.
前記監視サーバは、前記アプリケーションの稼働数の増加又は配置先の変更を検知すると、アプリケーションの稼働状態を監視するためのエージェントソフトウェアを、変更又は増加された前記アプリケーションが稼働する計算機が設置されたデータセンタの計算機へデプロイし、変更又は増加された前記アプリケーションの稼働状態の監視情報を前記エージェントソフトウェアから受信するために利用する論理ネットワークを前記ネットワーク回線上に開設し、
稼働数の増加又は配置先の変更前の前記アプリケーションを監視するために設置されたソフトウェアエージェントから監視情報を収集するための論理ネットワークが前記ネットワーク回線上に設定されており、
前記監視サーバは、前記アプリケーションの稼働数の増加又は配置先の変更を検知すると、変更又は増加された前記アプリケーションの稼働状態を、設置されていた前記ソフトウェアエージェントで監視可能かを判断し、監視可能と判断した場合、設定されていた前記論理ネットワークの帯域幅を拡大する。 A monitoring server that is connected to one or more data centers via a network line and monitors an operating state of an application constituting a system constructed on one or more computers of the one or more data centers. A control method,
When the monitoring server detects an increase in the number of operation of the application or a change in the arrangement destination, agent software for monitoring the operation state of the application is installed in the computer in which the computer that operates the changed or increased application is installed. deploy to the center of the computer, to open a logical network using monitoring information Health changes or increased the application to receive from the agent software on the network line,
A logical network for collecting monitoring information from a software agent installed to monitor the application before the increase in the number of operations or the change of the placement destination is set on the network line,
When the monitoring server detects an increase in the number of operations of the application or a change in the arrangement destination, it can determine whether or not the operating state of the application that has been changed or increased can be monitored by the installed software agent. If it is determined, the bandwidth of the set logical network is expanded .
前記アプリケーションの配置先の変更の検知とは、稼働中の前記システムから待機系のシステムへの切り替えの検知である。 The monitoring server control method according to claim 7 ,
The detection of the change of the application destination is detection of switching from the operating system to the standby system.
前記アプリケーションの配置先の変更の検知とは、稼働中の前記システムのマイグレーションの検知である。 The monitoring server control method according to claim 7 ,
The detection of the change of the application destination is detection of migration of the system in operation.
前記アプリケーションの稼働数の増加の検知とは、稼働中の前記システムのスケールアウトの検知である。 The monitoring server control method according to claim 7 ,
The detection of an increase in the number of operating applications is detection of scale-out of the operating system.
配置先が変更される前の前記アプリケーションを監視するためのソフトウェアエージェントが設置されており、
前記監視サーバは、前記アプリケーションの配置先の変更に伴い、変更前の前記アプリケーションが削除された場合、削除された前記アプリケーションを監視するためのエージェントソフトウェアを削除する。 The monitoring server control method according to claim 10 , comprising:
A software agent is installed to monitor the application before the deployment destination is changed,
The monitoring server deletes the agent software for monitoring the deleted application when the application before the change is deleted in accordance with the change of the arrangement destination of the application.
前記監視サーバは、前記エージェントソフトウェアのデプロイに伴い、前記エージェントソフトウェアから収集する前記監視情報を記憶するための記憶領域を確保する。 The monitoring server control method according to claim 7 ,
The monitoring server secures a storage area for storing the monitoring information collected from the agent software as the agent software is deployed.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014034800A JP6364203B2 (en) | 2014-02-26 | 2014-02-26 | Monitoring server for monitoring system operating status and monitoring server control method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014034800A JP6364203B2 (en) | 2014-02-26 | 2014-02-26 | Monitoring server for monitoring system operating status and monitoring server control method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015161954A JP2015161954A (en) | 2015-09-07 |
JP6364203B2 true JP6364203B2 (en) | 2018-07-25 |
Family
ID=54185038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014034800A Expired - Fee Related JP6364203B2 (en) | 2014-02-26 | 2014-02-26 | Monitoring server for monitoring system operating status and monitoring server control method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6364203B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023084670A1 (en) * | 2021-11-11 | 2023-05-19 | 日本電気株式会社 | Monitoring apparatus, monitoring method, and computer-readable storage medium |
US12003371B1 (en) | 2022-12-13 | 2024-06-04 | Sap Se | Server configuration anomaly detection |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5416156B2 (en) * | 2011-03-29 | 2014-02-12 | 株式会社日立システムズ | Integrated monitoring system and integrated monitoring program |
JP5342615B2 (en) * | 2011-08-15 | 2013-11-13 | 株式会社日立システムズ | Virtual server control system and program |
JP5998577B2 (en) * | 2012-03-29 | 2016-09-28 | 日本電気株式会社 | Cluster monitoring apparatus, cluster monitoring method, and program |
-
2014
- 2014-02-26 JP JP2014034800A patent/JP6364203B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015161954A (en) | 2015-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9450700B1 (en) | Efficient network fleet monitoring | |
CN110740072B (en) | Fault detection method, device and related equipment | |
US20160306710A1 (en) | Method and system for recovering virtual network | |
JP6354901B2 (en) | Virtual machine failure detection and recovery management system | |
CN110351313B (en) | Data caching method, device, equipment and storage medium | |
CN111046011A (en) | Log collection method, system, node, electronic device and readable storage medium | |
JP5617304B2 (en) | Switching device, information processing device, and fault notification control program | |
CN112738295B (en) | IP address exception handling method, device, computer system and storage medium | |
CN102591717A (en) | Method, device and system for processing service information of access device and virtual device | |
WO2012176337A1 (en) | Information processing system, information processing system control method, administration device, and system switching program | |
CN102523209B (en) | Dynamic adjustment method and device of safety inspection virtual machines | |
WO2013171865A1 (en) | Management method and management system | |
JP6364203B2 (en) | Monitoring server for monitoring system operating status and monitoring server control method | |
JP2014010772A (en) | System management device, system management method, and system management program | |
JP6421516B2 (en) | Server device, redundant server system, information takeover program, and information takeover method | |
JP4566148B2 (en) | Network communication monitoring system, network communication monitoring method, central device, relay device, and computer program | |
US8036105B2 (en) | Monitoring a problem condition in a communications system | |
CN114124803B (en) | Device management method and device, electronic device and storage medium | |
KR101776662B1 (en) | Data storage and processing method for collecting and analyzing real-time events, and network system using the same | |
JP5483784B1 (en) | CONTROL DEVICE, COMPUTER RESOURCE MANAGEMENT METHOD, AND COMPUTER RESOURCE MANAGEMENT PROGRAM | |
CN112131201B (en) | Method, system, equipment and medium for high availability of network additional storage | |
JP6394212B2 (en) | Information processing system, storage device, and program | |
CN110213364B (en) | Express cabinet monitoring method, system, storage medium and equipment | |
KR20190116512A (en) | Network construction apparatus, network construction method, and program stored in computer readable recording medium | |
CN114356625A (en) | Distributed system redundancy diagnosis method, device, electronic device and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170116 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170123 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20170123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170123 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180605 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180702 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6364203 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |