JP5998577B2 - クラスタ監視装置、クラスタ監視方法、及びプログラム - Google Patents
クラスタ監視装置、クラスタ監視方法、及びプログラム Download PDFInfo
- Publication number
- JP5998577B2 JP5998577B2 JP2012077741A JP2012077741A JP5998577B2 JP 5998577 B2 JP5998577 B2 JP 5998577B2 JP 2012077741 A JP2012077741 A JP 2012077741A JP 2012077741 A JP2012077741 A JP 2012077741A JP 5998577 B2 JP5998577 B2 JP 5998577B2
- Authority
- JP
- Japan
- Prior art keywords
- server
- virtual
- virtual server
- agent
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/12—Network monitoring probes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L69/00—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
- H04L69/40—Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45533—Hypervisors; Virtual machine monitors
- G06F9/45558—Hypervisor-specific management and integration aspects
- G06F2009/4557—Distribution of virtual machine instances; Migration and load balancing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0668—Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/40—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using virtualisation of network functions or resources, e.g. SDN or NFV entities
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Description
前記複数のサーバの中から、前記業務用のアプリケーションプログラムが動作しているサーバを特定する、業務サーバ特定部と、
特定された前記サーバに基づいて、前記複数のサーバの中から、前記監視エージェントを起動させるサーバを選択する、エージェントサーバ選択部と、
を備えていることを特徴とする。
(a)前記複数のサーバの中から、前記業務用のアプリケーションプログラムが動作しているサーバを特定する、ステップと、
(b)特定された前記サーバに基づいて、前記複数のサーバの中から、前記監視エージェントを起動させるサーバを選択する、ステップと、
を有することを特徴とする。
前記コンピュータに、
(a)前記複数のサーバの中から、前記業務用のアプリケーションプログラムが動作しているサーバを特定する、ステップと、
(b)特定された前記サーバに基づいて、前記複数のサーバの中から、前記監視エージェントを起動させるサーバを選択する、ステップと、
を実行させることを特徴とする。
例えば、HAクラスタシステムが、1又は2以上の物理サーバが提供する仮想環境下で動作する仮想サーバによって構成されているとする。この場合、従来から、業務サービスを提供するためのアプリケーションプログラム(以下「業務アプリケーション」と表記する。)が切替の単位(フェイルオーバグループ)として定義されており、任意の仮想サーバでの起動、及び業務アプリケーションを起動する仮想サーバの切替が可能となっている。
以下、本発明の実施の形態1における、クラスタ監視装置、クラスタ監視方法、及びプログラムについて、図1〜図2を参照しながら説明する。
最初に、図1を用いて、本実施の形態1で対象となるクラスタシステムについて説明する。図1は、本発明の実施の形態1におけるクラスタ監視装置によって構築されたクラスタシステムの構成を示す図である。
続いて、図2を用いて、本実施の形態1におけるクラスタ監視装置の構成について説明する。図2は、本発明の実施の形態1におけるクラスタ監視装置の構成を示すブロック図である。また、本実施の形態では、各仮想サーバにおけるクラスタ監視装置は、全て同様の構成を備えているため、図2においては、そのうちの一つのみが図示されている。
次に、本発明の実施の形態1におけるクラスタ監視装置10の動作について図3を用いて説明する。図3は、本発明の実施の形態1におけるクラスタ監視装置の動作を示すフロー図である。以下の説明においては、適宜図1及び図2を参酌する。また、本実施の形態1では、クラスタ監視装置10を動作させることによって、クラスタ監視方法が実施される。よって、本実施の形態におけるクラスタ監視方法の説明は、以下のクラスタ監視装置10の動作説明に代える。
(条件2)ステップA3で特定された仮想サーバ(業務アプリケーションが起動している仮想サーバ)とは異なる仮想サーバを優先する。
(条件3)クラスタシステムが管理している他の業務アプリケーションが起動していない物理サーバ上で動作している仮想サーバ(監視エージェント52〜82が監視対象としていないアプリケーションを動作させていない物理サーバ上で動作している仮想サーバ)を優先する。
(条件4)業務アプリケーションを動作させる際の優先度が最も低い仮想サーバを優先する。
本実施の形態1におけるプログラムは、コンピュータに、図3に示すステップA1〜A15を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態1におけるクラスタ監視装置10とクラスタ監視方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、監視エージェント制御装置20及び業務アプリケーション制御装置30として機能し、処理を行なう。
以上のように、本実施の形態1によれば、クラスタシステム300において、監視エージェントの起動場所を動的に切り替えることができる。また、監視エージェントが起動している仮想サーバがダウンした場合でも、自動的に他の仮想サーバ上に監視エージェントを切り替えることで、監視を継続することができる。
次に、本発明の実施の形態2における、クラスタ監視装置、クラスタ監視方法、及びプログラムについて、図4〜図6を参照しながら説明する。
最初に、図4を用いて、本実施の形態2におけるクラスタ監視装置の構成について説明する。図4は、本発明の実施の形態2におけるクラスタ監視装置の構成を示すブロック図である。
次に、本発明の実施の形態2におけるクラスタ監視装置11の動作について図5及び図6を用いて説明する。図5は、本発明の実施の形態2におけるクラスタ監視装置の動作を示すフロー図である。図6は、本発明の実施の形態2におけるクラスタ監視装置の動作を模式的に表わした図である。
本実施の形態2におけるプログラムは、コンピュータに、図5に示すステップB1〜B15を実行させるプログラムであれば良い。このプログラムをコンピュータにインストールし、実行することによって、本実施の形態2におけるクラスタ監視装置11とクラスタ監視方法とを実現することができる。この場合、コンピュータのCPU(Central Processing Unit)は、監視エージェント制御装置20及び業務アプリケーション制御装置30として機能し、処理を行なう。
以上のように、本実施の形態2によれば、外部からのマイグレーションなどで運用中に構成が変更された場合でも、異なる物理サーバからの監視を継続することができる(図6参照)。また、本実施の形態2を用いた場合も、実施の形態1で述べた効果を得ることができる。
本実施の形態1及び2は、クラウドシステムに応用することができる。つまり、近年、利用が拡大しているクラウドシステムは、仮想化を使用して実現されており、本実施の形態1及び2におけるクラスタ監視装置を適用できる。更に、遠隔間にまたがるクラウド間で、高可用性クラスタシステムが実現されている場合が考えられ、この場合にも、本実施の形態1及び2におけるクラスタ監視装置を適用できる。また、この場合では、監視エージェントを起動させるサーバを特定する条件として、物理サーバが業務アプリケーションを起動しているかどうかという条件等に、更に、距離的にクライアントの方により近いかどうかという条件等を追加しても良い。
複数のサーバ装置を備えるクラスタシステムにおいて業務用のアプリケーションプログラム及び監視エージェントの起動を制御するための装置であって、
前記複数のサーバの中から、前記業務用のアプリケーションプログラムが動作しているサーバを特定する、業務サーバ特定部と、
特定された前記サーバに基づいて、前記複数のサーバの中から、前記監視エージェントを起動させるサーバを選択する、エージェントサーバ選択部と、
を備えていることを特徴とするクラスタ監視装置。
前記監視エージェントが、前記複数のサーバ装置のうちのいずれかによって起動している場合において、前記監視エージェントを起動しているサーバに障害が発生すると、そのことを契機として、前記業務サーバ特定部が、前記業務用のアプリケーションプログラムが動作しているサーバを特定し、前記エージェントサーバ選択部が、前記監視エージェントを起動させるサーバを選択する、
付記1に記載のクラスタ監視装置。
前記監視エージェントが、前記複数のサーバ装置のうちのいずれかによって起動している場合において、前記業務アプリケーションプログラムに関連する障害が発生し、前記業務アプリケーションプログラムのフェイルオーバが実行されると、そのことを契機として、前記業務サーバ特定部が、前記フェイルオーバによる引き継ぎ先となるサーバを特定し、前記エージェントサーバ選択部が、前記監視エージェントを起動させるサーバを選択する、
付記1または2に記載のクラスタ監視装置。
前記複数のサーバ装置それぞれが、1又は2以上の物理サーバが提供する仮想環境下で動作する仮想サーバであり、
前記業務サーバ特定部が、複数の仮想サーバの中から、業務用のアプリケーションプログラムが動作している仮想サーバを特定し、
前記エージェントサーバ選択部が、特定された前記仮想サーバに基づいて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、
付記1〜3のいずれかに記載のクラスタ監視装置。
前記仮想サーバを動作させている物理サーバを特定するための情報を取得する、サーバ照合部を更に備え、
前記エージェントサーバ選択部が、取得された前記情報を更に用いて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、
付記4に記載のクラスタ監視装置。
前記エージェントサーバ選択部が、
前記予め設定された、特定された前記仮想サーバが動作している物理サーバとは別の物理サーバによって動作している仮想サーバを優先する第1の条件、特定された前記仮想サーバ以外の仮想サーバを優先する第2の条件、前記監視エージェントが監視対象としていないアプリケーションプログラムを動作させていない物理サーバによって動作している仮想サーバを優先する第3の条件、前記業務用のアプリケーションプログラムを動作させる際の優先度が最も低い仮想サーバを優先する第4の条件、のうち少なくとも1つを適用して、前記監視エージェントを起動させる仮想サーバを選択する、
付記4または5に記載のクラスタ監視装置。
前記仮想サーバを動作させている物理サーバを別の物理サーバへと変更させるマイグレーションを検知する、マイグレーション検知部を更に備え、
前記マイグレーション検知部によって前記マイグレーションが検知された場合に、前記業務サーバ特定部が、再度、前記業務用のアプリケーションプログラムが動作しているサーバを特定し、前記エージェントサーバ選択部が、再度、前記監視エージェントを起動させるサーバを選択する、
付記4〜6のいずれかに記載のクラスタ監視装置。
前記複数のサーバ装置の中から、それぞれに設定されている優先度に応じて、前記業務用のアプリケーションプログラムを動作させるサーバを特定し、特定したサーバに、前記業務用のアプリケーションプログラムを動作させる、業務アプリケーション起動部を、更に備えている、
付記1〜7のいずれかに記載のクラスタ監視装置。
複数のサーバ装置を備えるクラスタシステムにおいて業務用のアプリケーションプログラム及び監視エージェントの起動を制御するための方法であって、
(a)前記複数のサーバの中から、前記業務用のアプリケーションプログラムが動作しているサーバを特定する、ステップと、
(b)特定された前記サーバに基づいて、前記複数のサーバの中から、前記監視エージェントを起動させるサーバを選択する、ステップと、
を有することを特徴とするクラスタ監視方法。
前記監視エージェントが、前記複数のサーバ装置のうちのいずれかによって起動している場合において、前記監視エージェントを起動しているサーバに障害が発生すると、そのことを契機として、前記(a)のステップ及び前記(b)のステップを再度実行する、
付記9に記載のクラスタ監視方法。
前記監視エージェントが、前記複数のサーバ装置のうちのいずれかによって起動している場合において、前記業務アプリケーションプログラムに関連する障害が発生し、前記業務アプリケーションプログラムのフェイルオーバが実行されると、そのことを契機として、
前記(a)のステップを、前記複数のサーバの中から、前記フェイルオーバによる引き継ぎ先となるサーバを特定するために再度実行し、更に、前記(b)のステップも再度実行する、
付記9または10に記載のクラスタ監視方法。
前記複数のサーバ装置それぞれが、1又は2以上の物理サーバが提供する仮想環境下で動作する仮想サーバであり、
前記(a)のステップにおいて、複数の仮想サーバの中から、業務用のアプリケーションプログラムが動作している仮想サーバを特定し、
前記(b)のステップにおいて、特定された前記仮想サーバに基づいて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、
付記9〜11のいずれかに記載のクラスタ監視方法。
(c)前記仮想サーバを動作させている物理サーバを特定するための情報を取得する、ステップを更に有し、
前記(b)のステップにおいて、前記(c)のステップで取得された前記情報を更に用いて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、
付記12に記載のクラスタ監視方法。
前記(b)のステップにおいて、
前記予め設定された、特定された前記仮想サーバが動作している物理サーバとは別の物理サーバによって動作している仮想サーバを優先する第1の条件、特定された前記仮想サーバ以外の仮想サーバを優先する第2の条件、前記監視エージェントが監視対象としていないアプリケーションプログラムを動作させていない物理サーバによって動作している仮想サーバを優先する第3の条件、前記業務用のアプリケーションプログラムを動作させる際の優先度が最も低い仮想サーバを優先する第4の条件を、順に適用して、前記監視エージェントを起動させる仮想サーバを選択する、
付記12または13に記載のクラスタ監視方法。
(d)前記仮想サーバを動作させている物理サーバを別の物理サーバへと変更させるマイグレーションを検知する、ステップを更に有し、
前記(d)のステップによって前記マイグレーションが検知された場合に、前記(a)のステップ及び前記(b)のステップを再度実行する、
付記12〜14のいずれかに記載のクラスタ監視方法。
(e)前記複数のサーバ装置の中から、それぞれに設定されている優先度に応じて、前記業務用のアプリケーションプログラムを動作させるサーバを特定し、特定したサーバに、前記業務用のアプリケーションプログラムを動作させる、ステップを更に有している、
付記9〜15のいずれかに記載のクラスタ監視方法。
コンピュータによって、複数のサーバ装置を備えるクラスタシステムにおける業務用のアプリケーションプログラム及び監視エージェントの起動を制御するためのプログラムであって、
前記コンピュータに、
(a)前記複数のサーバの中から、前記業務用のアプリケーションプログラムが動作しているサーバを特定する、ステップと、
(b)特定された前記サーバに基づいて、前記複数のサーバの中から、前記監視エージェントを起動させるサーバを選択する、ステップと、
を実行させるプログラム。
前記監視エージェントが、前記複数のサーバ装置のうちのいずれかによって起動している場合において、前記監視エージェントを起動しているサーバに障害が発生すると、そのことを契機として、前記コンピュータに、前記(a)のステップ及び前記(b)のステップを再度実行させる、
付記17に記載のプログラム。
前記監視エージェントが、前記複数のサーバ装置のうちのいずれかによって起動している場合において、前記業務アプリケーションプログラムに関連する障害が発生し、前記業務アプリケーションプログラムのフェイルオーバが実行されると、そのことを契機として、
前記(a)のステップを、前記複数のサーバの中から、前記フェイルオーバによる引き継ぎ先となるサーバを特定するために再度実行し、更に、前記(b)のステップも再度実行する、
付記17または18に記載のプログラム。
前記複数のサーバ装置それぞれが、1又は2以上の物理サーバが提供する仮想環境下で動作する仮想サーバであり、
前記(a)のステップにおいて、複数の仮想サーバの中から、業務用のアプリケーションプログラムが動作している仮想サーバを特定し、
前記(b)のステップにおいて、特定された前記仮想サーバに基づいて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、
付記17〜19のいずれかに記載のプログラム。
(c)前記仮想サーバを動作させている物理サーバを特定するための情報を取得する、ステップを更に前記コンピュータに実行させる、
前記(b)のステップにおいて、前記(c)のステップで取得された前記情報を更に用いて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、
付記20に記載のプログラム。
前記(b)のステップにおいて、
前記予め設定された、特定された前記仮想サーバが動作している物理サーバとは別の物理サーバによって動作している仮想サーバを優先する第1の条件、特定された前記仮想サーバ以外の仮想サーバを優先する第2の条件、前記監視エージェントが監視対象としていないアプリケーションプログラムを動作させていない物理サーバによって動作している仮想サーバを優先する第3の条件、前記業務用のアプリケーションプログラムを動作させる際の優先度が最も低い仮想サーバを優先する第4の条件を、順に適用して、前記監視エージェントを起動させる仮想サーバを選択する、
付記20または21に記載のプログラム。
前記コンピュータに、
(d)前記仮想サーバを動作させている物理サーバを別の物理サーバへと変更させるマイグレーションを検知する、ステップを、更に実行させ、
前記(d)のステップによって前記マイグレーションが検知された場合に、前記(a)のステップ及び前記(b)のステップを再度実行させる、
付記20〜22のいずれかに記載のプログラム。
前記コンピュータに、
(e)前記複数のサーバ装置の中から、それぞれに設定されている優先度に応じて、前記業務用のアプリケーションプログラムを動作させるサーバを特定し、特定したサーバに、前記業務用のアプリケーションプログラムを動作させる、ステップを更に実行させる、
付記17〜23のいずれかに記載のプログラム。
11 クラスタ監視装置(実施の形態2)
20 監視エージェント制御装置
21 業務サーバ特定部
22 エージェントサーバ選択部
23 エージェント指示部
24 サーバ照合部
25 マイグレーション検知部
30 業務アプリケーション制御装置
31 業務アプリケーション起動部
40 記憶装置
41 業務サーバ記憶部
42 エージェントサーバ記憶部
50、60、70、80 仮想サーバ
51、62、71、81 業務アプリケーション
52、62、72、82 監視エージェント
91 フェイルオーバグループ
92 監視用フェイルオーバグループ
100、200 物理サーバ
110 コンピュータ
111 CPU
112 メインメモリ
113 記憶装置
114 入力インターフェイス
115 表示コントローラ
116 データリーダ/ライタ
117 通信インターフェイス
118 入力機器
119 ディスプレイ装置
120 記録媒体
121 バス
300 クラスタシステム
310 ネットワーク
320 クライアント
330、340 仮想化基盤管理装置
Claims (8)
- 1又は2以上の物理サーバが提供する仮想環境下で動作する複数の仮想サーバを備えるクラスタシステムにおいて業務用のアプリケーションプログラム及び監視エージェントの起動を制御するための装置であって、
前記複数の仮想サーバの中から、前記業務用のアプリケーションプログラムが動作している仮想サーバを特定する、業務サーバ特定部と、
特定された前記仮想サーバに基づいて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、エージェントサーバ選択部と、
を備え、
前記エージェントサーバ選択部は、
前記予め設定された、特定された前記仮想サーバが動作している物理サーバとは別の物理サーバによって動作している仮想サーバを優先する第1の条件、特定された前記仮想サーバ以外の仮想サーバを優先する第2の条件、前記監視エージェントが監視対象としていないアプリケーションプログラムを動作させていない物理サーバによって動作している仮想サーバを優先する第3の条件、前記業務用のアプリケーションプログラムを動作させる際の優先度が最も低い仮想サーバを優先する第4の条件を、順に適用して、前記監視エージェントを起動させる仮想サーバを選択する、
ことを特徴とするクラスタ監視装置。 - 前記監視エージェントが、前記複数の仮想サーバのうちのいずれかによって起動している場合において、前記監視エージェントを起動している仮想サーバに障害が発生すると、そのことを契機として、前記業務サーバ特定部が、前記業務用のアプリケーションプログラムが動作している仮想サーバを特定し、前記エージェントサーバ選択部が、前記監視エージェントを起動させる仮想サーバを選択する、
請求項1に記載のクラスタ監視装置。 - 前記監視エージェントが、前記複数の仮想サーバのうちのいずれかによって起動している場合において、前記業務アプリケーションプログラムに関連する障害が発生し、前記業務アプリケーションプログラムのフェイルオーバが実行されると、そのことを契機として、前記業務サーバ特定部が、前記フェイルオーバによる引き継ぎ先となる仮想サーバを特定し、前記エージェントサーバ選択部が、前記監視エージェントを起動させる仮想サーバを選択する、
請求項1または2に記載のクラスタ監視装置。 - 前記仮想サーバを動作させている物理サーバを特定するための情報を取得する、サーバ照合部を更に備え、
前記エージェントサーバ選択部が、取得された前記情報を更に用いて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、
請求項1に記載のクラスタ監視装置。 - 前記仮想サーバを動作させている物理サーバを別の物理サーバへと変更させるマイグレーションを検知する、マイグレーション検知部を更に備え、
前記マイグレーション検知部によって前記マイグレーションが検知された場合に、前記業務サーバ特定部が、再度、前記業務用のアプリケーションプログラムが動作している仮想サーバを特定し、前記エージェントサーバ選択部が、再度、前記監視エージェントを起動させるサーバを選択する、
請求項1〜4のいずれかに記載のクラスタ監視装置。 - 前記複数の仮想サーバの中から、それぞれに設定されている優先度に応じて、前記業務用のアプリケーションプログラムを動作させる仮想サーバを特定し、特定した仮想サーバに、前記業務用のアプリケーションプログラムを動作させる、業務アプリケーション起動部を、更に備えている、
請求項1〜5のいずれかに記載のクラスタ監視装置。 - 1又は2以上の物理サーバが提供する仮想環境下で動作する複数の仮想サーバを備えるクラスタシステムにおいて業務用のアプリケーションプログラム及び監視エージェントの起動を制御するための方法であって、
(a)前記複数の仮想サーバの中から、前記業務用のアプリケーションプログラムが動作している仮想サーバを特定する、ステップと、
(b)特定された前記仮想サーバに基づいて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、ステップと、
を有し、
前記(b)のステップにおいて、
前記予め設定された、特定された前記仮想サーバが動作している物理サーバとは別の物理サーバによって動作している仮想サーバを優先する第1の条件、特定された前記仮想サーバ以外の仮想サーバを優先する第2の条件、前記監視エージェントが監視対象としていないアプリケーションプログラムを動作させていない物理サーバによって動作している仮想サーバを優先する第3の条件、前記業務用のアプリケーションプログラムを動作させる際の優先度が最も低い仮想サーバを優先する第4の条件を、順に適用して、前記監視エージェントを起動させる仮想サーバを選択する、
することを特徴とするクラスタ監視方法。 - コンピュータによって、1又は2以上の物理サーバが提供する仮想環境下で動作する複数の仮想サーバを備えるクラスタシステムにおける業務用のアプリケーションプログラム及び監視エージェントの起動を制御するためのプログラムであって、
前記コンピュータに、
(a)前記複数の仮想サーバの中から、前記業務用のアプリケーションプログラムが動作している仮想サーバを特定する、ステップと、
(b)特定された前記仮想サーバに基づいて、前記複数の仮想サーバの中から、前記監視エージェントを起動させる仮想サーバを選択する、ステップと、
を実行させ、
前記(b)のステップにおいて、
前記予め設定された、特定された前記仮想サーバが動作している物理サーバとは別の物理サーバによって動作している仮想サーバを優先する第1の条件、特定された前記仮想サーバ以外の仮想サーバを優先する第2の条件、前記監視エージェントが監視対象としていないアプリケーションプログラムを動作させていない物理サーバによって動作している仮想サーバを優先する第3の条件、前記業務用のアプリケーションプログラムを動作させる際の優先度が最も低い仮想サーバを優先する第4の条件を、順に適用して、前記監視エージェントを起動させる仮想サーバを選択する、
プログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012077741A JP5998577B2 (ja) | 2012-03-29 | 2012-03-29 | クラスタ監視装置、クラスタ監視方法、及びプログラム |
US13/765,821 US9049101B2 (en) | 2012-03-29 | 2013-02-13 | Cluster monitor, method for monitoring a cluster, and computer-readable recording medium |
EP13155374.5A EP2645635B1 (en) | 2012-03-29 | 2013-02-15 | Cluster monitor, method for monitoring a cluster, and computer-readable recording medium |
BR102013003822-9A BR102013003822A2 (pt) | 2012-03-29 | 2013-02-19 | Monitor de agrupamento, método para monitorar um agrupamento e meio de gravação lido por computador |
CN201310106707.6A CN103368789B (zh) | 2012-03-29 | 2013-03-29 | 集群监视器、用于监视集群的方法及计算机可读记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012077741A JP5998577B2 (ja) | 2012-03-29 | 2012-03-29 | クラスタ監視装置、クラスタ監視方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013206379A JP2013206379A (ja) | 2013-10-07 |
JP5998577B2 true JP5998577B2 (ja) | 2016-09-28 |
Family
ID=47832909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012077741A Active JP5998577B2 (ja) | 2012-03-29 | 2012-03-29 | クラスタ監視装置、クラスタ監視方法、及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US9049101B2 (ja) |
EP (1) | EP2645635B1 (ja) |
JP (1) | JP5998577B2 (ja) |
CN (1) | CN103368789B (ja) |
BR (1) | BR102013003822A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11262732B2 (en) | 2017-03-31 | 2022-03-01 | Mitsubishi Heavy Industries, Ltd. | Plant monitoring system, plant operation assistance system, plant monitoring method, and program |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6111791B2 (ja) * | 2013-03-28 | 2017-04-12 | 日本電気株式会社 | ネットワーク管理システム、ネットワーク管理装置、サーバ、ネットワーク管理方法、及びプログラム |
JP6364203B2 (ja) * | 2014-02-26 | 2018-07-25 | 株式会社日立システムズ | システムの稼働状態を監視する監視サーバ及び監視サーバの制御方法 |
JP6295759B2 (ja) * | 2014-03-20 | 2018-03-20 | 富士通株式会社 | ネットワーク管理装置,情報処理システム及びプログラム |
JP6562744B2 (ja) * | 2015-07-13 | 2019-08-21 | キヤノン株式会社 | システム、及び制御方法 |
CN111600742B (zh) * | 2020-04-02 | 2023-03-24 | 华东计算技术研究所(中国电子科技集团公司第三十二研究所) | 动态切换分布式存储系统主监视器的方法及系统 |
WO2023152535A1 (en) * | 2022-02-08 | 2023-08-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Proactive malicious actor monitoring in a network using a virtual security agent (vsa) |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003114811A (ja) * | 2001-10-05 | 2003-04-18 | Nec Corp | 自動障害復旧方法及びシステム並びに装置とプログラム |
US7379989B2 (en) | 2003-07-31 | 2008-05-27 | International Business Machines Corporation | Method for dual agent processes and dual active server processes |
JP2007293603A (ja) * | 2006-04-25 | 2007-11-08 | Mitsubishi Electric Corp | 情報処理装置及び情報処理方法及びプログラム |
JP5110315B2 (ja) * | 2006-05-24 | 2012-12-26 | 日本電気株式会社 | 仮想マシン管理装置、仮想マシン管理方法およびプログラム |
CN101136900B (zh) * | 2006-10-16 | 2011-08-10 | 中兴通讯股份有限公司 | 一种面向服务的快速透明故障转移装置及实现方法 |
JP4869057B2 (ja) * | 2006-12-27 | 2012-02-01 | 富士通株式会社 | ネットワーク接続復旧方法及びaaaサーバ及び無線アクセス網ゲートウェイ装置 |
JP4980792B2 (ja) | 2007-05-22 | 2012-07-18 | 株式会社日立製作所 | 仮想計算機の性能監視方法及びその方法を用いた装置 |
KR100956638B1 (ko) | 2007-12-11 | 2010-05-11 | 한국전자통신연구원 | 대규모 클러스터 모니터링 시스템과 그의 자동 구축 및복구 방법 |
CA2616229A1 (en) | 2007-12-21 | 2009-06-21 | Ibm Canada Limited - Ibm Canada Limitee | Redundant systems management frameworks for network environments |
JP5526784B2 (ja) * | 2007-12-26 | 2014-06-18 | 日本電気株式会社 | 縮退構成設計システムおよび方法 |
CN102148707A (zh) * | 2011-01-28 | 2011-08-10 | 浪潮(北京)电子信息产业有限公司 | 监控代理的故障处理方法和系统 |
CN102231681B (zh) * | 2011-06-27 | 2014-07-30 | 中国建设银行股份有限公司 | 一种高可用集群计算机系统及其故障处理方法 |
-
2012
- 2012-03-29 JP JP2012077741A patent/JP5998577B2/ja active Active
-
2013
- 2013-02-13 US US13/765,821 patent/US9049101B2/en active Active
- 2013-02-15 EP EP13155374.5A patent/EP2645635B1/en not_active Not-in-force
- 2013-02-19 BR BR102013003822-9A patent/BR102013003822A2/pt not_active Application Discontinuation
- 2013-03-29 CN CN201310106707.6A patent/CN103368789B/zh active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11262732B2 (en) | 2017-03-31 | 2022-03-01 | Mitsubishi Heavy Industries, Ltd. | Plant monitoring system, plant operation assistance system, plant monitoring method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP2013206379A (ja) | 2013-10-07 |
US20130262916A1 (en) | 2013-10-03 |
BR102013003822A2 (pt) | 2014-07-15 |
CN103368789A (zh) | 2013-10-23 |
EP2645635A1 (en) | 2013-10-02 |
US9049101B2 (en) | 2015-06-02 |
EP2645635B1 (en) | 2014-12-31 |
CN103368789B (zh) | 2017-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5998577B2 (ja) | クラスタ監視装置、クラスタ監視方法、及びプログラム | |
JP5851503B2 (ja) | 高可用性仮想機械環境におけるアプリケーションの高可用性の提供 | |
US9110717B2 (en) | Managing use of lease resources allocated on fallover in a high availability computing environment | |
US7814364B2 (en) | On-demand provisioning of computer resources in physical/virtual cluster environments | |
US7992032B2 (en) | Cluster system and failover method for cluster system | |
US9489274B2 (en) | System and method for performing efficient failover and virtual machine (VM) migration in virtual desktop infrastructure (VDI) | |
US7925923B1 (en) | Migrating a virtual machine in response to failure of an instruction to execute | |
US9912535B2 (en) | System and method of performing high availability configuration and validation of virtual desktop infrastructure (VDI) | |
US8713352B2 (en) | Method, system and program for securing redundancy in parallel computing system | |
WO2011074284A1 (ja) | 仮想計算機の移動方法、仮想計算機システム及びプログラムを格納した記憶媒体 | |
JP4669487B2 (ja) | 情報処理システムの運用管理装置および運用管理方法 | |
US11157373B2 (en) | Prioritized transfer of failure event log data | |
US9792150B1 (en) | Detecting site change for migrated virtual machines | |
JP2014522052A (ja) | ハードウェア故障の軽減 | |
US8990608B1 (en) | Failover of applications between isolated user space instances on a single instance of an operating system | |
CN106537354B (zh) | 虚拟化基础设施管理装置、系统、方法和记录介质 | |
KR20200080458A (ko) | 클라우드 멀티-클러스터 장치 | |
US9195528B1 (en) | Systems and methods for managing failover clusters | |
WO2013190694A1 (ja) | 計算機の復旧方法、計算機システム及び記憶媒体 | |
JP2013117889A (ja) | 広域分散構成変更システム | |
JP5597293B2 (ja) | 計算機システム及びプログラム | |
US11755438B2 (en) | Automatic failover of a software-defined storage controller to handle input-output operations to and from an assigned namespace on a non-volatile memory device | |
US10855521B2 (en) | Efficient replacement of clients running large scale applications | |
US8595349B1 (en) | Method and apparatus for passive process monitoring | |
US10365934B1 (en) | Determining and reporting impaired conditions in a multi-tenant web services environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20150123 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160428 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160815 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5998577 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |