JP2008026954A - Operation management system, operation management server device, operation management method, operation management program, and management object node - Google Patents

Operation management system, operation management server device, operation management method, operation management program, and management object node Download PDF

Info

Publication number
JP2008026954A
JP2008026954A JP2006195664A JP2006195664A JP2008026954A JP 2008026954 A JP2008026954 A JP 2008026954A JP 2006195664 A JP2006195664 A JP 2006195664A JP 2006195664 A JP2006195664 A JP 2006195664A JP 2008026954 A JP2008026954 A JP 2008026954A
Authority
JP
Japan
Prior art keywords
operation management
operation mode
unit
storage unit
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006195664A
Other languages
Japanese (ja)
Inventor
Fumio Daimatsu
史生 大松
Tatsuya Yamashita
竜也 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Mitsubishi Electric Information Systems Corp
Mitsubishi Electric Information Technology Corp
Original Assignee
Mitsubishi Electric Corp
Mitsubishi Electric Information Systems Corp
Mitsubishi Electric Information Technology Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Mitsubishi Electric Information Systems Corp, Mitsubishi Electric Information Technology Corp filed Critical Mitsubishi Electric Corp
Priority to JP2006195664A priority Critical patent/JP2008026954A/en
Publication of JP2008026954A publication Critical patent/JP2008026954A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system for carrying out maintenance/update while continuing to provide required minimum operation management service in carrying out maintenance/shift attended with the stop of the system. <P>SOLUTION: This operation management system 1000 comprises management object nodes 140 etc., an operation management server device 100p of a main system, and an operation management server device 100s of a sub-system. Each management object node comprises first and second agent parts. The operation management server device 100p comprises a first operation mode storage part 102p storing the "operation mode" of an operation management function to the first agent part, and a first operation management control part 110p carrying out the operation management function to the first agent part based on the reference result by referring to the "operation mode". The operation management server device 100s comprises a second operation mode storage part 102s storing the "operation mode" of the operation management function to the second agent part, and a second operation management control part 110s carrying out the operation management function to the second agent part based on the reference result by referring to the "operation mode". <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

この発明は、管理対象ノードの運用管理を行う運用管理システム及び運用管理サーバ装置及び運用管理方法及び運用管理プログラム及び管理対象ノードに関する。   The present invention relates to an operation management system, an operation management server device, an operation management method, an operation management program, and a management target node that perform operation management of managed nodes.

従来のシステム運用方式では、二重化システムを利用して復旧を行う際に、必要最低限のリソースを持ったプロセスを起動することにより障害時に自律的に障害復旧することが提案されていた(例えば、特許文献1)。   In the conventional system operation method, when performing recovery using a redundant system, it has been proposed to automatically recover from a failure at the time of failure by starting a process having the minimum necessary resources (for example, Patent Document 1).

また、ネットワーク保守装置では、安価な装置で緊急性の高いメッセージや警報のみを検知可能とすることによって、何らかの事態が発生した場合に、必要最小限の運用管理が行えるようにする方法が提案されていた(例えば、特許文献2)。   For network maintenance devices, a method has been proposed that enables only the most urgent messages and alarms to be detected with an inexpensive device so that the minimum necessary operation management can be performed in the event of a situation. (For example, Patent Document 2).

従来のシステム運用方式(特許文献1)では、同じ計算機上で運用管理ソフトウェアを二重化する技術であるため、システムの更新やハードウェアのメンテナンス時に対応できないという課題があった。   In the conventional system operation method (Patent Document 1), since the operation management software is duplicated on the same computer, there is a problem that it cannot be handled at the time of system update or hardware maintenance.

また、従来のネットワーク保守装置(特許文献2)では、システム停止や保守・移行に対応可能な構成とはなっていないため、運用を継続したままシステムの保守・更新を実施できないという課題があった。
特開2000−215074号公報(第2図) 特開平7−162419号公報(第1図)
In addition, the conventional network maintenance device (Patent Document 2) has a problem that the system cannot be maintained / updated while the operation is continued because it is not configured to cope with the system stop or maintenance / migration. .
Japanese Patent Laid-Open No. 2000-215074 (FIG. 2) Japanese Patent Laid-Open No. 7-162419 (FIG. 1)

この発明は、システム停止を伴う保守・移行時に、必要最低限の運用管理サービスの提供を継続したまま保守・更新を実現するシステムの提供を目的とする。   An object of the present invention is to provide a system that realizes maintenance / update while continuing to provide the minimum necessary operation management service at the time of maintenance / migration accompanied by a system stop.

この発明の運用管理システムは、
ネットワークに分散して設置された1以上の管理対象ノードと、
前記1以上の管理対象ノードを運用管理する第1運用管理サーバ装置と、
前記1以上の管理対象ノードを運用管理する第2運用管理サーバ装置と
を備えた運用管理システムにおいて、
前記管理対象ノードは、
前記第1運用管理サーバ装置と通信して運用管理の制御を受ける第1エージェント部と、
前記第2運用管理サーバ装置と通信して運用管理の制御を受ける第2エージェント部と
を備え、
前記第1運用管理サーバ装置は、
前記第1エージェント部を運用管理する運用管理機能の動作モードを記憶する第1動作モード記憶部と、
前記第1エージェント部に対する運用管理機能を実行しようとするときに前記第1動作モード記憶部に記憶された動作モードを参照し、参照結果に基づいて前記第1エージェント部に対する運用管理機能を実行するかどうかを決定する第1運用管理制御部と
を備え、
前記第2運用管理サーバ装置は、
前記第2エージェント部を運用管理する運用管理機能の動作モードを記憶する第2動作モード記憶部と、
前記第2エージェント部に対する運用管理機能を実行しようとするときに前記第2動作モード記憶部に記憶された動作モードを参照し、参照結果に基づいて前記第2エージェント部に対する運用管理機能を実行するかどうかを決定する第2運用管理制御部と
を備えたことを特徴とする。
The operation management system of this invention is
One or more managed nodes distributed across the network;
A first operation management server device that operates and manages the one or more managed nodes;
An operation management system comprising a second operation management server device that operates and manages the one or more managed nodes,
The managed node is
A first agent unit that communicates with the first operation management server device and receives operation control;
A second agent unit that communicates with the second operation management server device and receives operation control;
The first operation management server device includes:
A first operation mode storage unit for storing an operation mode of an operation management function for operation management of the first agent unit;
When an operation management function for the first agent unit is to be executed, the operation mode stored in the first operation mode storage unit is referred to, and the operation management function for the first agent unit is executed based on the reference result. A first operation management control unit that determines whether or not
The second operation management server device
A second operation mode storage unit for storing an operation mode of an operation management function for operating and managing the second agent unit;
When an operation management function for the second agent unit is to be executed, the operation mode stored in the second operation mode storage unit is referred to, and the operation management function for the second agent unit is executed based on the reference result. And a second operation management control unit for determining whether or not.

この発明により、システム停止を伴う保守・移行時に、必要最低限の運用管理サービスの提供を継続したまま保守・更新を実現することができる。   According to the present invention, maintenance / update can be realized while continuing to provide the minimum necessary operation management service at the time of maintenance / migration accompanied by a system stop.

実施の形態1.
図1〜図6を用いて実施の形態1の運用管理システム1000を説明する。以下に説明する運用管理システム1000は、サーバ・クライアント型の運用管理システムであって、2系統(主系と従系)の独立した運用管理マネージャ・エージェントと、運用管理機能の現在のモードを記憶し制御する手段を持つことにより、必要最低限のサービス提供を維持したまま保守・更新を可能とする。
Embodiment 1 FIG.
The operation management system 1000 according to the first embodiment will be described with reference to FIGS. The operation management system 1000 described below is a server / client type operation management system, and stores two systems (primary and slave) independent operation manager / agents and the current mode of the operation management function. By having a means for controlling, it is possible to maintain and update while maintaining the minimum service provision.

図1は、運用管理システム1000のシステム構成図である。なお「主系(primary)」に関する構成要素には「p」の符号を付しており、「従系(secondary)」に関する構成要素には「s」の符号を付して区別した。   FIG. 1 is a system configuration diagram of the operation management system 1000. Note that the component related to “primary” is marked with “p”, and the component related to “secondary” is marked with “s”.

運用管理システム1000は、主系の運用管理サーバ100p(第1運用管理サーバ装置)、従系の運用管理サーバ100s(第2運用管理サーバ装置)、制御端末120(制御端末装置)、運用管理システムの管理対象ノードである管理対象ノード140〜160を備える。これらの装置はWAN(Wide Area Network)130に接続しており、互いに通信可能である。   The operation management system 1000 includes a master operation management server 100p (first operation management server device), a slave operation management server 100s (second operation management server device), a control terminal 120 (control terminal device), and an operation management system. Management target nodes 140 to 160 which are management target nodes. These devices are connected to a WAN (Wide Area Network) 130 and can communicate with each other.

図2は、コンピュータである主系の運用管理サーバ100pの外観の一例を示す図である。従系の運用管理サーバ100sも同様である。図2において、運用管理サーバ100pは、システムユニット830、CRT(Cathode Ray Tube)やLCD(液晶)の表示画面を有する表示装置813、キーボード814(Key Board:K/B)、マウス815、FDD817(Flexible Disk Drive)、コンパクトディスク装置818(CDD:Compact Disk Drive)、プリンタ装置819などのハードウェア資源を備え、これらはケーブルや信号線で接続されている。   FIG. 2 is a diagram showing an example of the appearance of the primary operation management server 100p which is a computer. The same applies to the secondary operation management server 100s. In FIG. 2, the operation management server 100p includes a system unit 830, a display device 813 having a CRT (Cathode Ray Tube) or LCD (liquid crystal) display screen, a keyboard 814 (Key Board: K / B), a mouse 815, an FDD 817 ( Hardware resources such as a flexible disk drive (CDD), a compact disk device 818 (CDD: Compact Disk Drive), and a printer device 819 are provided, and these are connected by cables and signal lines.

システムユニット830はコンピュータであり、ネットワークに接続されている。ネットワークには、従系の運用管理サーバ100s、制御端末120、管理対象ノード140等が接続されている。運用管理サーバ100pは、ネットワークを介して運用管理サーバ100s、管理対象ノード、制御端末120等と通信可能である。   The system unit 830 is a computer and is connected to a network. A slave operation management server 100s, a control terminal 120, a management target node 140, and the like are connected to the network. The operation management server 100p can communicate with the operation management server 100s, the management target node, the control terminal 120, and the like via a network.

図3は、運用管理サーバ100pのハードウェア資源の一例を示す図である。図3において、運用管理サーバ100pは、プログラムを実行するCPU810(中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU810は、バス825を介してROM(Read Only Memory)811、RAM(Random Access Memory)812、表示装置813、キーボード814、マウス815、通信ボード816、FDD817、CDD818、プリンタ装置819、磁気ディスク装置820と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置820の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。   FIG. 3 is a diagram illustrating an example of hardware resources of the operation management server 100p. In FIG. 3, the operation management server 100p includes a CPU 810 (also referred to as a central processing unit, a processing unit, an arithmetic unit, a microprocessor, a microcomputer, or a processor) that executes a program. The CPU 810 includes a ROM (Read Only Memory) 811, a RAM (Random Access Memory) 812, a display device 813, a keyboard 814, a mouse 815, a communication board 816, an FDD 817, a CDD 818, a printer device 819, and a magnetic disk device 820 via a bus 825. And control these hardware devices. Instead of the magnetic disk device 820, a storage device such as an optical disk device or a memory card read / write device may be used.

RAM812は、揮発性メモリの一例である。ROM811、FDD817、CDD818、磁気ディスク装置820等の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置あるいは記憶部、格納部の一例である。通信ボード816、キーボード814、FDD817などは、入力部、入力装置の一例である。また、通信ボード816、表示装置813、プリンタ装置819などは、出力部、出力装置の一例である。通信ボード816は、ネットワークに接続されている。   The RAM 812 is an example of a volatile memory. Storage media such as the ROM 811, the FDD 817, the CDD 818, and the magnetic disk device 820 are examples of nonvolatile memories. These are examples of a storage device, a storage unit, or a storage unit. The communication board 816, the keyboard 814, the FDD 817, and the like are examples of an input unit and an input device. The communication board 816, the display device 813, the printer device 819, and the like are examples of an output unit and an output device. The communication board 816 is connected to the network.

磁気ディスク装置820には、オペレーティングシステム821(OS)、ウィンドウシステム822、プログラム群823、ファイル群824が記憶されている。プログラム群823のプログラムは、CPU810、オペレーティングシステム821、ウィンドウシステム822により実行される。   The magnetic disk device 820 stores an operating system 821 (OS), a window system 822, a program group 823, and a file group 824. The programs in the program group 823 are executed by the CPU 810, the operating system 821, and the window system 822.

上記プログラム群823には、以下に述べる実施の形態の説明において「〜部」として説明する機能を実行するプログラムが記憶されている。プログラムは、CPU810により読み出され実行される。   The program group 823 stores a program that executes a function described as “˜unit” in the description of the embodiment described below. The program is read and executed by the CPU 810.

ファイル群824には、以下に述べる実施の形態の説明において、「〜の判定結果」、「〜の確認結果」、「〜の処理結果」として説明する情報や、データや信号値や変数値やパラメータなど、あるいは「動作モード」が、「〜ファイル」や「〜データベース」の各項目として記憶されている。「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU810によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPUの動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。   The file group 824 includes information, data, signal values, variable values, and the like described as “determination results of”, “confirmation results of”, and “processing results of” in the description of the embodiments described below. Parameters and the like or “operation mode” are stored as items of “˜file” and “˜database”. The “˜file” and “˜database” are stored in a recording medium such as a disk or a memory. Information, data, signal values, variable values, and parameters stored in a storage medium such as a disk or memory are read out to the main memory or cache memory by the CPU 810 via a read / write circuit, and extracted, searched, referenced, compared, and calculated. Used for CPU operations such as calculation, processing, output, printing, and display. Information, data, signal values, variable values, and parameters are temporarily stored in the main memory, cache memory, and buffer memory during the CPU operations of extraction, search, reference, comparison, operation, calculation, processing, output, printing, and display. Is remembered.

また、以下に述べる実施の形態の説明においては、データや信号値は、RAM812のメモリ、FDD817のフレキシブルディスク、CDD818のコンパクトディスク、磁気ディスク装置820の磁気ディスク、その他光ディスク、ミニディスク、DVD(Digital Versatile Disk)等の記録媒体に記録される。また、データや信号は、バス825や信号線やケーブルその他の伝送媒体によりオンライン伝送される。   In the description of the embodiments described below, data and signal values are stored in the memory of RAM 812, the flexible disk of FDD 817, the compact disk of CDD 818, the magnetic disk of magnetic disk device 820, other optical disks, mini disks, DVDs (Digital). Recorded on a recording medium such as Versatile Disk). Data and signals are transmitted on-line via the bus 825, signal lines, cables, and other transmission media.

また、以下に述べる実施の形態の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」、「手段」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ROM811に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。プログラムはCPU810により読み出され、CPU810により実行される。すなわち、プログラムは、以下に述べる「〜部」としてコンピュータを機能させるものである。あるいは、以下に述べる「〜部」の手順や方法をコンピュータに実行させるものである。   In addition, what is described as “to part” in the description of the embodiment described below may be “to circuit”, “to device”, “to device”, “means”, and “to step”. ”,“ ˜procedure ”, or“ ˜processing ”. That is, what is described as “˜unit” may be realized by firmware stored in the ROM 811. Alternatively, it may be implemented only by software, or only by hardware such as elements, devices, substrates, and wirings, by a combination of software and hardware, or by a combination of firmware. Firmware and software are stored as programs in a recording medium such as a magnetic disk, a flexible disk, an optical disk, a compact disk, a mini disk, and a DVD. The program is read by the CPU 810 and executed by the CPU 810. That is, the program causes the computer to function as “to part” described below. Alternatively, the procedure or method of “to part” described below is executed by a computer.

(主系の運用管理サーバ100pの構成)
図1のブロック図を参照して、運用管理サーバ100pの構成を説明する。運用管理サーバ100pは、運用管理マネージャ101p、第1動作モード記憶部102p、動作モード制御部103pを備える。運用管理マネージャ101pと第1動作モード制御部103pとは、第1運用管理制御部110pを構成する。
(Configuration of main operation management server 100p)
The configuration of the operation management server 100p will be described with reference to the block diagram of FIG. The operation management server 100p includes an operation management manager 101p, a first operation mode storage unit 102p, and an operation mode control unit 103p. The operation management manager 101p and the first operation mode control unit 103p constitute a first operation management control unit 110p.

(1)主系の運用管理マネージャ101pは、各管理対象ノードの運用管理エージェント141p、151p、161pと通信して、管理対象ノードを制御する。実際のシステム上ではプログラム(プロセス・デーモン等)により実現する。なお、従系の運用管理マネージャ101sは、従系に対応する各管理対象ノードの運用管理エージェント141s、151s、161sと通信する。
(2)第1動作モード記憶部102pは、主系の運用管理マネージャ101pの「動作モード」を記憶する。「動作モード」は、図4において後述する「テーブル1」と「テーブル2」とからなる。詳細は後述するが、「テーブル1」は、運用管理(監視・制御)の各機能について、独立動作するか、あるいは非独立で動作するかを定義し、「テーブル2」は、運用管理マネージャ101pが、現在、サービス/独立/停止のうち、いずれのモードでの動作が認められているかを記憶する。第1動作モード記憶部102pは、動作モード制御部103pから制御される。
(3)動作モード制御部103pは、制御端末120から運用管理マネージャ101pのサービス/独立/停止のいずれかのモードを指定した場合、「テーブル2」に、制御端末120から指定されたモードを記録する。また、2台ある運用管理サーバ(運用管理マネージャ)において、両方がサービスモードで動作することを許可しないための制御をする。当該制御を具体的に言うと、制御端末120から一方の運用管理サーバをサービスモードに指定した際、サービスモードに指定された方の「動作モード制御部」は、もう一方の運用管理サーバの「動作モード制御部」に問い合わせ、そのもう一方の動作モードが現在すでにサービスモードの場合には、制御端末120から指定されたサービスモードのリクエストを拒否する。また、動作モード制御部103pは、運用管理マネージャ101pが運用管理機能を実行しようとするときに運用管理マネージャ101pから問合せを受け、運用管理マネージャ101pが実行しようとする運用管理機能が第1動作モード記憶部102pに記憶された「動作モード」と合致するかどうかを確認し、合致する場合にのみ、運用管理マネージャ101pに運用管理機能の動作の実行を許可する。
(4)このように、運用管理マネージャ101pは、管理対象ノードに対する監視・制御の各機能を実行する際、動作モード制御部103pに問い合わせを行なう。動作モード制御部103pは、運用管理マネージャ101pから問合せを受けると、現在の動作モード(テーブル2)を参照し、運用管理マネージャ101pが実行しようとしている運用管理機能が、「テーブル2」の現在のモード(サービス/独立/停止のいずれかになっている)に合致するかどうか、「テーブル1」から判断する。合致しない場合は、運用管理マネージャ101pによる動作をリジェクトし、合致する場合にのみ動作を許可する。
(1) The primary operation management manager 101p communicates with the operation management agents 141p, 151p, and 161p of each managed node to control the managed node. In an actual system, it is realized by a program (process daemon, etc.). Note that the slave operation management manager 101s communicates with the operation management agents 141s, 151s, and 161s of each management target node corresponding to the slave.
(2) The first operation mode storage unit 102p stores the “operation mode” of the primary operation management manager 101p. The “operation mode” includes “table 1” and “table 2” which will be described later with reference to FIG. Although details will be described later, “table 1” defines whether each operation management (monitoring / control) function operates independently or non-independently, and “table 2” is the operation management manager 101p. Stores in which mode the service / independent / stop operation is currently permitted. The first operation mode storage unit 102p is controlled by the operation mode control unit 103p.
(3) When the operation mode control unit 103p designates one of the service / independent / stop modes of the operation management manager 101p from the control terminal 120, the mode designated by the control terminal 120 is recorded in “table 2”. To do. In addition, the two operation management servers (operation management managers) perform control so as not to permit both to operate in the service mode. Specifically, when one operation management server is designated as the service mode from the control terminal 120, the “operation mode control unit” designated as the service mode has the “operation mode control unit” of the other operation management server. The operation mode control unit "is inquired, and if the other operation mode is already in the service mode, the service mode request designated from the control terminal 120 is rejected. The operation mode control unit 103p receives an inquiry from the operation management manager 101p when the operation management manager 101p tries to execute the operation management function, and the operation management function to be executed by the operation management manager 101p is the first operation mode. It is confirmed whether or not it matches the “operation mode” stored in the storage unit 102p, and only when it matches, the operation management manager 101p is permitted to execute the operation of the operation management function.
(4) As described above, the operation management manager 101p makes an inquiry to the operation mode control unit 103p when executing the monitoring and control functions for the managed node. When the operation mode control unit 103p receives an inquiry from the operation management manager 101p, the operation mode control unit 103p refers to the current operation mode (table 2), and the operation management function to be executed by the operation management manager 101p is the current one of “table 2”. It is determined from “table 1” whether the mode (service / independent / stopped) is met. If they do not match, the operation by the operation management manager 101p is rejected, and the operation is permitted only when they match.

(従系の運用管理サーバ100sの構成)
従系の運用管理サーバ100sの構成を説明する。従系の運用管理サーバ100sの構成は、主系の運用管理サーバ100pと同様である。なお、従系の運用管理マネージャ101sは、各管理対象ノードの運用管理エージェント141s、151s、161sと通信して、これらの管理対象ノードを運用管理する。また運用管理マネージャ101sと動作モード制御部103sとは第2運用管理制御部110sを構成する。
(Configuration of Subordinate Operation Management Server 100s)
The configuration of the secondary operation management server 100s will be described. The configuration of the secondary operation management server 100s is the same as that of the main operation management server 100p. Note that the secondary operation management manager 101s communicates with the operation management agents 141s, 151s, and 161s of the respective management target nodes to manage the management target nodes. Further, the operation management manager 101s and the operation mode control unit 103s constitute a second operation management control unit 110s.

(制御端末120)
制御端末120は、運用管理サーバ100p、100sに対して、動作モードの制御を実行する。
(Control terminal 120)
The control terminal 120 controls the operation mode for the operation management servers 100p and 100s.

(管理対象ノード)
それぞれの管理対象ノードは、主系の運用管理サーバ100pの運用管理マネージャ101pと通信する運用管理エージェント(第1エージェント部)と、従系の運用管理サーバ100sの運用管理マネージャ101sと通信する運用管理エージェント(第2エージェント部)とを備える。
(Managed node)
Each managed node has an operation management agent (first agent unit) that communicates with the operation management manager 101p of the primary operation management server 100p and an operation management that communicates with the operation management manager 101s of the subordinate operation management server 100s. An agent (second agent unit).

次に、運用管理機能に関する「動作モード」について説明する。 Next, the “operation mode” regarding the operation management function will be described.

図4は、「動作モード」を示す図である。第1動作モード記憶部102pに記憶される「動作モード」は、図4に示す「テーブル1」と「テーブル2」とから構成される。第2動作モード記憶部102sに記憶される「動作モード」も同様である。   FIG. 4 is a diagram illustrating an “operation mode”. The “operation mode” stored in the first operation mode storage unit 102p includes “table 1” and “table 2” shown in FIG. The same applies to the “operation mode” stored in the second operation mode storage unit 102s.

図4の「動作モード」について、さらに説明する。運用管理システム1000の機能は、主系・従系の両系で独立して動作が可能な運用管理機能と、どちらかの系のみで動作する運用管理機能に分類される。   The “operation mode” in FIG. 4 will be further described. The functions of the operation management system 1000 are classified into an operation management function that can operate independently in both the primary and secondary systems, and an operation management function that operates only in one of the systems.

(両系の独立動作が可能な運用管理機能)
例えば、イベント(ログ)監視、プロセス稼動監視、システムリソース監視(CPU/メモリ/ディスク容量等の監視)、ノード生死監視、リモートコマンド実行などの運用管理機能は、両系で独立動作可能である。
(Operation management function that enables independent operation of both systems)
For example, operation management functions such as event (log) monitoring, process operation monitoring, system resource monitoring (CPU / memory / disk capacity monitoring), node life / death monitoring, remote command execution, and the like can be operated independently in both systems.

(両系の独立動作が不可である運用管理機能)
一方、ソフトウェア配布、データバックアップ、バッチジョブ制御、運用管理機能の設定変更(監視内容の変更や、管理対象ノードの追加・変更・削除など)などは、系切替を実施した場合にマネージャ側のデータの引継ぎが発生し、両系で同時に動作させると不整合が発生するため、独立動作することはできない。
(Operation management function that cannot operate both systems independently)
On the other hand, software distribution, data backup, batch job control, operation management function setting changes (changes in monitoring contents, addition / change / deletion of managed nodes, etc.) Inheritance takes place, and if they are operated simultaneously in both systems, inconsistency occurs, so independent operation is not possible.

従って、図4における「テーブル2」の動作モードは、以下に示す「1.サービスモード」、「2.独立モード」、「3.停止モード」の3つに分類される。   Therefore, the operation modes of “Table 2” in FIG. 4 are classified into the following three categories: “1. service mode”, “2. independent mode”, and “3. stop mode”.

(1.サービスモード)
サービスモードは、全ての機能を提供するモードである。同一時点では1つの運用管理サーバのみが、このモードで動作可能な様に実装する。このモードで動作する機能において、モード切替時のデータの引継ぎが発生する。
(1. Service mode)
The service mode is a mode that provides all functions. It is mounted so that only one operation management server can operate in this mode at the same time. In the function operating in this mode, data transfer occurs at the time of mode switching.

(2.独立モード)
独立モードは、独立動作可能な運用管理機能のみを提供するモードである。同時に2つの運用管理サーバ(運用管理マネージャ)が、このモードで動作することが可能である。このモードで動作する機能において、モード切替時のデータの引継ぎは発生しない。
(2. Independent mode)
The independent mode is a mode that provides only an operation management function that can operate independently. At the same time, two operation management servers (operation management managers) can operate in this mode. In the function operating in this mode, data transfer does not occur when the mode is switched.

(3.停止モード)
停止モードは、メンテナンス(リブートやシステムバックアップを含む)、あるいはアップグレードを実行するために運用管理機能を停止した状態である。
(3. Stop mode)
The stop mode is a state in which the operation management function is stopped to perform maintenance (including reboot and system backup) or upgrade.

(1)このように図4の「テーブル1」は、それぞれの運用管理機能を独立動作の可否で分類したテーブルである。
(2)また「テーブル2」は、制御端末120から指示された現在の動作モード(サービス/独立/停止のいずれか)を記憶するテーブルである。なお、動作モード制御部103p(あるいは動作モード制御部103s)は、両方の運用管理マネージャがサービスモードになることを許可しないように動作する。すなわち、前述のように、制御端末120から一方の運用管理サーバをサービスモードに指示した際、サービスモードに指示された方の「動作モード制御部」は、もう一方の運用管理サーバの「動作モード制御部」に問い合わせ、その動作モードが現在すでにサービスモードの場合は、制御端末120から指定されたサービスモードのリクエストを拒否する。
(1) As described above, “Table 1” in FIG. 4 is a table in which each operation management function is classified according to whether or not independent operation is possible.
(2) “Table 2” is a table that stores the current operation mode (any of service / independent / stop) instructed from the control terminal 120. Note that the operation mode control unit 103p (or the operation mode control unit 103s) operates so as not to allow both operation management managers to enter the service mode. That is, as described above, when one operation management server is instructed to the service mode from the control terminal 120, the “operation mode control unit” instructed to the service mode has the “operation mode” of the other operation management server. When the operation mode is already in the service mode, the service mode request designated from the control terminal 120 is rejected.

(運用管理マネージャ及び運用管理エージェントの動作)
図5は、運用管理マネージャ、及び運用管理マネージャが制御する運用管理エージェントの動作を説明するフローチャートである。図5を参照して、運用管理マネージャ、運用管理エージェントの動作を説明する。以下の動作説明では、主系の運用管理マネージャ101pを主体に説明する。従系の運用管理マネージャ101sの動作は同様であるので説明は省略する。
(Operations of operation manager and operation management agent)
FIG. 5 is a flowchart for explaining the operation of the operation management manager and the operation management agent controlled by the operation management manager. With reference to FIG. 5, operations of the operation management manager and the operation management agent will be described. In the following description of the operation, the main operation management manager 101p will be mainly described. Since the operation of the subordinate operation management manager 101s is the same, the description thereof is omitted.

(S101)
まず、システム管理者(あるいは運用オペレータ、以下同様)が、運用管理機能を図4の「テーブル1」の様に独立動作の可否で分類し、第1動作モード記憶部102pの「テーブル1」中に定義する。このように、システム管理者は、管理対象ノードに対して運用管理システムを提供するにあたり、どの運用管理機能を独立動作で提供し、また、どの運用管理機能を非独立動作で提供するかを決めて定義する。具体的には、システム管理者が制御端末120を用いて定義操作を行なうと、運用管理サーバ100pの動作モード制御部103pがその定義を受け付け、受け付けた定義を第1動作モード記憶部102pの「テーブル1」、「テーブル2」に記憶する。運用管理サーバ100sについても同様である。
(S101)
First, a system administrator (or an operation operator, the same applies below) classifies the operation management functions according to whether or not independent operation is possible as shown in “Table 1” in FIG. 4 and stores them in “Table 1” of the first operation mode storage unit 102p. Defined in In this way, the system administrator decides which operation management functions are provided in an independent operation and which operation management functions are provided in an independent operation when providing an operation management system to a managed node. Define. Specifically, when the system administrator performs a definition operation using the control terminal 120, the operation mode control unit 103p of the operation management server 100p accepts the definition, and the accepted definition is stored in the "1" of the first operation mode storage unit 102p. It is stored in “Table 1” and “Table 2”. The same applies to the operation management server 100s.

(S102)
運用管理マネージャ101pが、「テーブル1」に記載された機能のうち、ある運用管理機能を起動する。
(S102)
The operation management manager 101p activates a certain operation management function among the functions described in “Table 1”.

(S103)
運用管理マネージャ101pは、ある運用管理機能を起動すると、その運用管理機能を実行する際、その運用管理機能が「テーブル2」の動作モードに合致しているかどうかを、動作モード制御部103pに問い合わせる。なお「テーブル2」の現在の動作モードが「停止モード」の場合は、動作モード制御部103pは、運用管理マネージャ101pの動作を抑制し、運用管理マネージャ101pによる運用管理エージェント141p、151p、161pへの運用管理機能を停止させる。
(S103)
When starting an operation management function, the operation management manager 101p inquires of the operation mode control unit 103p whether the operation management function matches the operation mode of “Table 2” when executing the operation management function. . When the current operation mode of “table 2” is “stop mode”, the operation mode control unit 103p suppresses the operation of the operation management manager 101p and moves to the operation management agents 141p, 151p, 161p by the operation management manager 101p. Stop the operation management function.

(S104以降)
動作モード制御部103pは、運用管理マネージャ101pから問い合わせを受けると第1動作モード記憶部102pを参照し、各機能の動作モードを示す「テーブル1」と、現在の動作モードを示す「テーブル2」とを比較して、問合せの動作を確認する。動作モード制御部103pは、「テーブル2」の現在の動作モードが「独立モード」の場合は、起動した機能に対するテーブル1の独立/非独立が、「独立」の場合にのみ動作を許可(S104のYes、S105)する。この場合、運用管理マネージャ101pは起動した運用管理機能の動作を実行する(S106)。それ以外の場合、すなわち、非独立の場合には、運用管理マネージャ101pが起動させた運用管理機能の動作を許可しない(S104のNO、S107)。この場合、運用管理マネージャ101pは起動した運用管理機能の動作を実行しない(S108)。また、「テーブル2」の現在の動作モードが「サービスモード」の場合は、起動した機能に対する「テーブル1」の独立/非独立が、いずれであっても動作を許可し(S104のYes、S105)、運用管理マネージャ101pは起動した運用管理機能の動作を実行する(S106)。
(S104 and later)
When receiving an inquiry from the operation management manager 101p, the operation mode control unit 103p refers to the first operation mode storage unit 102p, and “table 1” indicating the operation mode of each function and “table 2” indicating the current operation mode. And confirm the operation of the query. When the current operation mode of “table 2” is “independent mode”, the operation mode control unit 103p permits the operation only when the independent / non-independence of table 1 for the activated function is “independent” (S104). Yes, S105). In this case, the operation management manager 101p executes the operation of the activated operation management function (S106). In other cases, that is, in the case of non-independence, the operation of the operation management function activated by the operation management manager 101p is not permitted (NO in S104, S107). In this case, the operation management manager 101p does not execute the operation of the activated operation management function (S108). Further, when the current operation mode of “Table 2” is “Service mode”, the operation is permitted regardless of whether “Table 1” is independent or not independent of the activated function (Yes in S104, S105). ), The operation management manager 101p executes the operation of the activated operation management function (S106).

次に、運用管理システムの保守・更新の一例として、運用管理システムのソフトウェア更新を行う場合を説明する。   Next, as an example of maintenance / update of the operation management system, a case where software update of the operation management system is performed will be described.

運用管理システム1000では、通常時は、主系の運用管理マネージャ101pがサービスモードで動作し、従系の運用管理マネージャ101sが独立モードで動作する。すなわち、通常時には、第1動作モード記憶部102pの「テーブル2」の動作モードは「サービスモード」となっており、第2動作モード記憶部102sの「テーブル2」の動作モードは「独立モード」となっている。この場合、主系はサービスモードなので、「テーブル1」における運用管理機能の全サービスを提供しており、従系は主系がサービスモードから別のモードに移行した場合には、いつでもサービスモードに移行可能な状態で運用する。   In the operation management system 1000, at the normal time, the primary operation management manager 101p operates in the service mode, and the secondary operation management manager 101s operates in the independent mode. That is, at the normal time, the operation mode of “table 2” in the first operation mode storage unit 102p is “service mode”, and the operation mode of “table 2” in the second operation mode storage unit 102s is “independent mode”. It has become. In this case, since the main system is in the service mode, all services of the operation management function in “Table 1” are provided, and the sub system is always in the service mode when the main system shifts from the service mode to another mode. Operate in a state where migration is possible.

運用管理システム1000のソフトウェア更新を行う場合は、後述のように、主系の運用管理マネージャ101pを独立モードに移行する。これによって、主系・従系の両方が独立モードとなり、どちらか一方で独立動作可能な運用管理機能のみをサービス提供したまま、もう一方の系のソフトウェア更新を実施する。   When updating the software of the operation management system 1000, as will be described later, the main operation management manager 101p is shifted to the independent mode. As a result, both the primary system and the secondary system are set to the independent mode, and the software update of the other system is performed while only the operation management function that can operate independently is provided.

図6は、運用管理ソフトウェアを更新する場合の動作を示すフローチャートである。図6を参照して、運用管理ソフトウェアを更新する場合の具体的な動作を説明する。   FIG. 6 is a flowchart showing an operation when the operation management software is updated. A specific operation when the operation management software is updated will be described with reference to FIG.

最初に、システム管理者は、主系の運用管理マネージャ101pを独立モードとし(S201)、運用管理サービスを従系の運用管理サーバ100sで提供する。具体的には制御端末120から動作モード制御部103pへの指示により実施する。すなわち動作モード制御部103pは制御端末120から指示を受けると、第1動作モード記憶部102pの「テーブル2」の現在の動作モードを「サービスモード」から「独立モード」に書き換える。   First, the system administrator sets the primary operation management manager 101p to the independent mode (S201), and provides an operation management service by the secondary operation management server 100s. Specifically, it is implemented by an instruction from the control terminal 120 to the operation mode control unit 103p. That is, when receiving an instruction from the control terminal 120, the operation mode control unit 103p rewrites the current operation mode of “table 2” in the first operation mode storage unit 102p from “service mode” to “independent mode”.

次に、システム管理者が、主系の運用管理マネージャ101pと運用管理エージェント141p、151p、161pのソフトウェアを全て停止する(S202)。   Next, the system administrator stops all the software of the primary operation management manager 101p and the operation management agents 141p, 151p, 161p (S202).

さらに、システム管理者が、主系の運用管理マネージャ101p、運用管理エージェント141p、151p、161pのソフトウェアを更新する(S203)。システム管理者は、ソフトウェアが更新された運用管理マネージャ101p、運用管理エージェント141p、151p、161pを起動し、運用管理マネージャ101pと、運用管理エージェント141p、151p、161pとの接続を確認する(S204)。システム管理者は、接続が確認できた場合には、主系をサービスモードに戻す(S205)。即ち、制御端末120により動作モード制御部103pを介して第1動作モード記憶部102pの「テーブル2」の動作モードを「独立モード」から「サービスモード」に書き換える。これにより運用管理サーバ100pにより全サービスの提供を行う。   Further, the system administrator updates the software of the primary operation management manager 101p and the operation management agents 141p, 151p, 161p (S203). The system administrator activates the operation management manager 101p and the operation management agents 141p, 151p, and 161p whose software has been updated, and confirms the connection between the operation management manager 101p and the operation management agents 141p, 151p, and 161p (S204). . When the connection is confirmed, the system administrator returns the main system to the service mode (S205). That is, the control terminal 120 rewrites the operation mode of “table 2” in the first operation mode storage unit 102p from the “independent mode” to the “service mode” via the operation mode control unit 103p. Thereby, all the services are provided by the operation management server 100p.

以上のように、運用管理ソフトウェアの更新時に、どちらか一方の系で独立動作可能な運用管理機能のみをサービス提供したままソフトウェア更新が可能となるので、提供できない運用管理機能を極小化することができる。   As described above, when updating the operation management software, it is possible to update the software while providing only the operation management function that can operate independently on either system, so the operation management functions that cannot be provided can be minimized. it can.

また、独立した運用管理機能のみを動作させるモードによって、データの引継ぎを行わずに主系・従系の系切り替えが可能であるため、ソフトウェア更新終了時のシステム切り戻しが容易となる。   In addition, since the system can be switched between the primary system and the secondary system without taking over the data by the mode in which only the independent operation management function is operated, the system switchback at the end of the software update becomes easy.

実施の形態1の運用管理システム1000は、各管理対象ノードが第1エージェント部と第2エージェント部とを備え、主系の運用管理サーバ100pが第1運用管理制御部110pを備え、従系の運用管理サーバ100sが第2運用管理制御部110sを備えたので、運用管理サービスの提供を継続したまま、保守・更新を実施することができる。   In the operation management system 1000 according to the first embodiment, each managed node includes a first agent unit and a second agent unit, the primary operation management server 100p includes a first operation management control unit 110p, Since the operation management server 100s includes the second operation management control unit 110s, it is possible to perform maintenance / update while continuing to provide the operation management service.

実施の形態1の運用管理システム1000は、第1運用管理制御部110pと第2運用管理制御部110sとは、互いにデータの引継ぎを必要としない独立モードの運用管理機能を実行するので、運用管理サービスの提供を継続したまま保守・更新を実施することができるとともに、システムの切り戻しが容易になる。   In the operation management system 1000 according to the first embodiment, the first operation management control unit 110p and the second operation management control unit 110s execute an independent mode operation management function that does not require data transfer to each other. Maintenance and updating can be performed while the service is being provided, and the system can be easily switched back.

実施の形態1の運用管理システム1000は、制御端末120を備えたので、システムの保守・更新に柔軟に対応することができる。   Since the operation management system 1000 of the first embodiment includes the control terminal 120, it can flexibly cope with system maintenance / update.

実施の形態1の運用管理サーバは、動作モード記憶部と、運用管理制御部とを備えたので、運用管理サービスの提供を継続したまま、保守・更新を実施することができる。   Since the operation management server according to the first embodiment includes the operation mode storage unit and the operation management control unit, it is possible to perform maintenance / update while continuing to provide the operation management service.

実施の形態1の管理対象ノードは、第1エージェント部と第2エージェント部とを備えたので、運用管理サービスの提供を継続したまま、保守・更新を実施することができる。   Since the management target node according to the first embodiment includes the first agent unit and the second agent unit, it is possible to perform maintenance / update while continuing to provide the operation management service.

実施の形態2.
図7を用いて実施の形態2を説明する。実施の形態1では、運用管理ソフトウェアの更新の場合を説明した。実施の形態2では、ハードウェアの保守、システムバックアップ、リブートのような、「システム停止」を伴う場合を説明する。システム構成は、実施の形態1と同様である。
Embodiment 2. FIG.
The second embodiment will be described with reference to FIG. In the first embodiment, the case of updating the operation management software has been described. In the second embodiment, a case involving “system stop” such as hardware maintenance, system backup, and reboot will be described. The system configuration is the same as in the first embodiment.

図7は、リブートのような、「システム停止」を伴う場合の動作を説明するフローチャートである。図7を参照して「システム停止」を伴う場合の動作を説明する。   FIG. 7 is a flowchart for explaining the operation in the case of “system stop” such as reboot. With reference to FIG. 7, the operation in the case of “system stop” will be described.

最初に、実施の形態1と同様に、第1動作モード記憶部102p、第2動作モード記憶部102sにおける運用管理機能を図4に示したように独立動作可否に分類し、定義する。   First, as in the first embodiment, the operation management functions in the first operation mode storage unit 102p and the second operation mode storage unit 102s are classified and defined as independent operation availability as shown in FIG.

実施の形態1と同様に、通常時は、主系の運用管理マネージャ101pが「サービスモード」で動作し、従系の運用管理マネージャ101sが独立モードで動作する(S301)。この場合、主系はサービスモードなので、運用管理機能の全サービスを提供しており、従系は主系がサービスモードから別のモードに移行すればいつでもサービスモードに移行可能な状態で運用する。   As in the first embodiment, in the normal state, the primary operation management manager 101p operates in the “service mode”, and the secondary operation management manager 101s operates in the independent mode (S301). In this case, since the primary system is in the service mode, all services of the operation management function are provided, and the secondary system operates in a state where it can be shifted to the service mode whenever the primary system shifts from the service mode to another mode.

ハードウェア保守・システムバックアップ・リブートを実施する場合には、主系の運用管理マネージャ101pを「停止モード」に移行する(S302)。実施の形態1で述べたように、「停止モード」の場合には、動作モード制御部103pは、運用管理マネージャ101pによる運用管理機能を停止させる。この停止状態において、システム管理者はハードウェア保守・システムバックアップ・リブート等を実施する(S303)。   When performing hardware maintenance / system backup / reboot, the main operation management manager 101p is shifted to the “stop mode” (S302). As described in the first embodiment, in the “stop mode”, the operation mode control unit 103p stops the operation management function by the operation management manager 101p. In this stopped state, the system administrator performs hardware maintenance, system backup, reboot, and the like (S303).

システム管理者は、主系の運用管理マネージャ101pを起動し及び運用管理マネージャ101pと運用管理エージェント141p,151p,161pとの接続を確認する(S304)。   The system administrator activates the primary operation management manager 101p and confirms the connection between the operation management manager 101p and the operation management agents 141p, 151p, 161p (S304).

システム管理者は、制御端末120により、主系である第1動作モード記憶部102pのテーブル2の動作モードを「サービスモード」に書き換える(S305)。   The system administrator rewrites the operation mode of the table 2 of the first operation mode storage unit 102p, which is the main system, to “service mode” using the control terminal 120 (S305).

以上の動作によって、従系では独立動作可能な運用管理機能のみをサービス提供したまま、もう一方の系に対して停止を伴う保守が可能となる。   With the above operation, maintenance with a stop is possible for the other system while providing only the operation management function that can operate independently in the slave system.

以上のように、停止を伴うサーバ保守時に、どちらか一方の系で独立動作可能な運用管理機能のみをサービス提供したまま保守が可能となるので、提供不可な運用管理機能を極小化することができる。
また、独立した運用管理機能のみを動作させるモードによって、データの引継ぎを行わずに主系・従系の系切り替えが可能であるため、保守終了時のシステム切り戻しが容易となる。
As described above, during server maintenance with a stop, maintenance can be performed while providing only the operation management function that can operate independently on either system, so the operation management functions that cannot be provided can be minimized. it can.
In addition, since the system can be switched between the primary system and the secondary system without taking over data by the mode in which only the independent operation management function is operated, the system switchback at the end of the maintenance becomes easy.

実施の形態2の運用管理システム1000は、制御端末120が、運用管理サーバの動作モード記憶部のテーブル2を停止モードに書き換えることができるので、運用管理サービスの提供を継続したまま、システム停止を伴う保守に容易に対応することができる。   In the operation management system 1000 according to the second embodiment, since the control terminal 120 can rewrite the table 2 of the operation mode storage unit of the operation management server to the stop mode, the system stop can be performed while continuing to provide the operation management service. It is possible to easily cope with the accompanying maintenance.

実施の形態3.
図8、図9を用いて実施の形態3を説明する。実施の形態3は、実施の形態1の運用管理サーバを運用管理方法及び運用管理プログラムとして把握した実施形態である。
Embodiment 3 FIG.
The third embodiment will be described with reference to FIGS. The third embodiment is an embodiment in which the operation management server of the first embodiment is grasped as an operation management method and an operation management program.

実施の形態1で示した運用管理サーバの運用管理制御部の動作と動作モード記憶部の動作とは互いに関連しており、これらの動作をステップに置き換えることで運用管理方法の発明として把握することができる。図8は、運用管理方法を示すフローチャートである。
(1)S401は、動作モード記憶部が、運用管理の制御を受ける第1エージェント部と第2エージェント部とを備えた管理対象ノードの前記第1エージェント部と前記第2エージェント部とのうち予め定められた一方を運用管理する運用管理機能の動作モードを記憶するステップである。
(2)S402は、運用管理制御部が、前記予め定められた一方に対する運用管理機能を実行しようとするときに前記動作モード記憶部に記憶された動作モードを参照することにより、実行しようとする運用管理機能の動作が動作モードに合致するかどうかを確認し、確認の結果、合致する場合に前記予め定められた一方に対する運用管理機能を実行するステップである。
The operation of the operation management control unit of the operation management server shown in the first embodiment and the operation of the operation mode storage unit are related to each other, and grasped as an invention of the operation management method by replacing these operations with steps. Can do. FIG. 8 is a flowchart showing the operation management method.
(1) In step S401, the operation mode storage unit includes, in advance, the first agent unit and the second agent unit of a management target node including a first agent unit and a second agent unit that are controlled by operation management. This is a step of storing an operation mode of an operation management function for operating and managing one determined.
(2) S402 is executed by referring to the operation mode stored in the operation mode storage unit when the operation management control unit attempts to execute the operation management function for the predetermined one. It is a step of confirming whether or not the operation of the operation management function matches the operation mode, and executing the operation management function for the predetermined one if the result of the confirmation matches.

また、また方法の発明において、ステップを処理に置き換えることにより、コンピュータである運用管理サーバに実行させる運用管理プログラムとすることができる。図9は、運用管理プログラムを示すフローチャートである。
(1)S501は、運用管理の制御を受ける第1エージェント部と第2エージェント部とを備えた管理対象ノードの前記第1エージェント部と前記第2エージェント部とのうち予め定められた一方を運用管理する運用管理機能の動作モードを動作モード記憶部に記憶する処理である。
(2)S502は、前記予め定められた一方に対する運用管理機能を実行しようとするときに前記動作モード記憶部に記憶された動作モードを参照することにより、実行しようとする運用管理機能の動作が動作モードに合致するかどうかを確認し、確認の結果、合致する場合に前記予め定められた一方に対する運用管理機能を実行する処理である。
In the method invention, the operation management program to be executed by the operation management server, which is a computer, can be obtained by replacing the steps with processes. FIG. 9 is a flowchart showing the operation management program.
(1) S501 operates a predetermined one of the first agent unit and the second agent unit of a managed node including a first agent unit and a second agent unit that are controlled by operation management. This is processing for storing the operation mode of the operation management function to be managed in the operation mode storage unit.
(2) In S502, the operation of the operation management function to be executed is determined by referring to the operation mode stored in the operation mode storage unit when an operation management function for the predetermined one is to be executed. This is a process of confirming whether or not the operation mode is met, and executing the operation management function for the predetermined one if the result of the confirmation is a match.

実施の形態3の運用管理方法により、運用管理サービスの提供を継続したまま、保守・更新を実施することができる。   According to the operation management method of the third embodiment, it is possible to perform maintenance / update while continuing to provide the operation management service.

実施の形態3の運用管理プログラムにより、運用管理サービスの提供を継続したまま、保守・更新を実施することができる。   With the operation management program according to the third embodiment, maintenance / update can be performed while continuing to provide the operation management service.

以上の実施の形態では、以下を備えたサーバ・クライアント型の運用管理システム(情報システムの運用管理を行うためのシステム)を説明した。
(a)管理対象ノードに独立して導入する2つの運用管理エージェント
(b)(a)に対応する独立した2つのマネージャを持つ運用管理サーバ
(c)運用管理機能の現在の動作モードを記憶する手段
(d)運用管理機能の現在の動作モードを制御する手段
(c)、(d)を持つことによって、システム運用管理として必要最低限のサービス提供を継続したまま運用管理システムの更新を可能とすることを特徴とした運用管理システム。
In the above embodiment, a server / client type operation management system (a system for performing operation management of an information system) including the following has been described.
(A) Operation management server having two independent managers corresponding to two operation management agents (b) and (a) introduced independently to the managed node (c) Stores the current operation mode of the operation management function Means (d) By having means (c) and (d) for controlling the current operation mode of the operation management function, it is possible to update the operation management system while continuing to provide the minimum service necessary for system operation management. An operation management system characterized by

以上の実施の形態では、片側の運用管理サーバを独立動作可能な運用管理機能のみ提供するモードで動作させることによって、必要最低限の運用管理サービスを提供したままもう片側の運用管理サーバのH/W保守を可能とすることを特徴とした運用管理システムを説明した。   In the above embodiment, by operating the operation management server on one side in a mode that provides only an operation management function that can operate independently, the H / W of the other operation management server is provided while providing the minimum necessary operation management service. An operation management system characterized by enabling W maintenance has been described.

以上の実施の形態では、片側の運用管理サーバを独立動作可能な運用管理機能のみ提供するモードで動作させることによって、必要最低限の運用管理サービスを提供したままもう片側の運用管理サーバを停止したシステムバックアップを可能とすることを特徴とした運用管理システムを説明した。   In the above embodiment, by operating the operation management server on one side in a mode that only provides an operation management function that can operate independently, the operation management server on the other side is stopped while providing the minimum operation management service. An operation management system characterized by enabling system backup was explained.

以上の実施の形態では、運用管理機能の現在の動作モードを記憶する手段と、運用管理機能の現在の動作モードを制御する手段とを実現させるためのプログラムを説明した。   In the above embodiment, the program for realizing the means for storing the current operation mode of the operation management function and the means for controlling the current operation mode of the operation management function has been described.

実施の形態1における運用管理システム1000の構成図。1 is a configuration diagram of an operation management system 1000 according to Embodiment 1. FIG. 実施の形態1における運用管理サーバ100pの外観を示す図。The figure which shows the external appearance of the operation management server 100p in Embodiment 1. FIG. 実施の形態1における運用管理サーバ100pのハードウェア資源を示す図。The figure which shows the hardware resource of the operation management server 100p in Embodiment 1. FIG. 実施の形態1における動作モード記憶部に記憶される動作モードを示す図。FIG. 3 shows an operation mode stored in an operation mode storage unit in the first embodiment. 実施の形態1における運用管理マネージャ、運用管理エージェントの動作を示すフローチャート。5 is a flowchart showing operations of an operation management manager and an operation management agent in the first embodiment. 実施の形態1におけるソフトウェア更新を示すフローチャート。5 is a flowchart showing software update in the first embodiment. 実施の形態2におけるシステム停止を伴う保守のフローチャート。10 is a flowchart of maintenance accompanied by a system stop in the second embodiment. 実施の形態3における運用管理方法を示すフローチャート。10 is a flowchart illustrating an operation management method according to the third embodiment. 実施の形態3における運用管理プログラムを示すフローチャート。10 is a flowchart illustrating an operation management program according to the third embodiment.

符号の説明Explanation of symbols

100p,100s 運用管理サーバ、101p,101s 運用管理マネージャ、102p 第1動作モード記憶部、102s 第2動作モード記憶部、103p,103s 動作モード制御部、110p 第1運用管理制御部、110s 第2運用管理制御部、120 制御端末、130 WAN、140,150,160 管理対象ノード、141p,141s,151p,151s,161p,161s 運用管理エージェント、1000 運用管理システム。   100p, 100s operation management server, 101p, 101s operation management manager, 102p first operation mode storage unit, 102s second operation mode storage unit, 103p, 103s operation mode control unit, 110p first operation management control unit, 110s second operation Management control unit, 120 control terminal, 130 WAN, 140, 150, 160 managed node, 141p, 141s, 151p, 151s, 161p, 161s operation management agent, 1000 operation management system.

Claims (8)

ネットワークに分散して設置された1以上の管理対象ノードと、
前記1以上の管理対象ノードを運用管理する第1運用管理サーバ装置と、
前記1以上の管理対象ノードを運用管理する第2運用管理サーバ装置と
を備えた運用管理システムにおいて、
前記管理対象ノードは、
前記第1運用管理サーバ装置と通信して運用管理の制御を受ける第1エージェント部と、
前記第2運用管理サーバ装置と通信して運用管理の制御を受ける第2エージェント部と
を備え、
前記第1運用管理サーバ装置は、
前記第1エージェント部を運用管理する運用管理機能の動作モードを記憶する第1動作モード記憶部と、
前記第1エージェント部に対する運用管理機能を実行しようとするときに前記第1動作モード記憶部に記憶された動作モードを参照し、参照結果に基づいて前記第1エージェント部に対する運用管理機能を実行するかどうかを決定する第1運用管理制御部と
を備え、
前記第2運用管理サーバ装置は、
前記第2エージェント部を運用管理する運用管理機能の動作モードを記憶する第2動作モード記憶部と、
前記第2エージェント部に対する運用管理機能を実行しようとするときに前記第2動作モード記憶部に記憶された動作モードを参照し、参照結果に基づいて前記第2エージェント部に対する運用管理機能を実行するかどうかを決定する第2運用管理制御部と
を備えたことを特徴とする運用管理システム。
One or more managed nodes distributed across the network;
A first operation management server device that operates and manages the one or more managed nodes;
An operation management system comprising a second operation management server device that operates and manages the one or more managed nodes,
The managed node is
A first agent unit that communicates with the first operation management server device and receives operation control;
A second agent unit that communicates with the second operation management server device and receives operation control;
The first operation management server device includes:
A first operation mode storage unit for storing an operation mode of an operation management function for operation management of the first agent unit;
When an operation management function for the first agent unit is to be executed, the operation mode stored in the first operation mode storage unit is referred to, and the operation management function for the first agent unit is executed based on the reference result. A first operation management control unit that determines whether or not
The second operation management server device
A second operation mode storage unit for storing an operation mode of an operation management function for operating and managing the second agent unit;
When an operation management function for the second agent unit is to be executed, the operation mode stored in the second operation mode storage unit is referred to, and the operation management function for the second agent unit is executed based on the reference result. An operation management system comprising a second operation management control unit that determines whether or not.
前記第1運用管理制御部は、
前記第2運用管理制御部が前記第2エージェント部に対して実行可能な運用管理機能と独立して動作するとともに前記第2運用管理制御部との間でデータの引継ぎが発生しない運用管理機能を前記第1エージェント部に対して実行可能であり、
前記第2運用管理制御部は、
前記第1運用管理制御部が前記第1エージェント部に対して実行可能な運用管理機能と独立して動作するとともに前記第1運用管理制御部との間でデータの引継ぎが発生しない運用管理機能を前記第2エージェント部に対して実行可能であることを特徴とする請求項1記載の運用管理システム。
The first operation management control unit includes:
An operation management function in which the second operation management control unit operates independently of an operation management function executable for the second agent unit and does not cause data transfer with the second operation management control unit; Executable on the first agent part;
The second operation management controller is
An operation management function in which the first operation management control unit operates independently of an operation management function executable for the first agent unit, and data transfer between the first operation management control unit and the first operation management control unit does not occur; The operation management system according to claim 1, wherein the operation management system is executable on the second agent unit.
前記運用管理システムは、さらに、
前記第1動作モード記憶部に記憶された動作モードを書き換え可能であるとともに、前記第2動作モード記憶部に記憶された動作モードを書き換え可能である制御端末装置を備えたことを特徴とする請求項1または2いずれかに記載の運用管理システム。
The operation management system further includes:
A control terminal device is provided that can rewrite the operation mode stored in the first operation mode storage unit and can rewrite the operation mode stored in the second operation mode storage unit. Item 3. The operation management system according to any one of Items 1 and 2.
前記制御端末装置は、
前記第1動作モード記憶部に記憶された動作モードを運用管理機能の停止を示す停止モードに書き換え可能であるとともに、前記第2動作モード記憶部に記憶された動作モードを停止モードに書き換え可能であり、
前記第1運用管理制御部は、
前記制御端末装置によって前記第1動作モード記憶部に記憶された動作モードが停止モードに書き換えられた場合には、前記第1エージェント部に対する運用管理機能の実行を停止し、
前記第2運用管理制御部は、
前記制御端末装置によって前記第2動作モード記憶部に記憶された動作モードが停止モードに書き換えられた場合には、前記第2エージェント部に対する運用管理機能の実行を停止することを特徴とする請求項3記載の運用管理システム。
The control terminal device
The operation mode stored in the first operation mode storage unit can be rewritten to a stop mode indicating the stop of the operation management function, and the operation mode stored in the second operation mode storage unit can be rewritten to the stop mode. Yes,
The first operation management control unit includes:
When the operation mode stored in the first operation mode storage unit is rewritten to the stop mode by the control terminal device, the execution of the operation management function for the first agent unit is stopped,
The second operation management controller is
The operation management function for the second agent unit is stopped when the operation mode stored in the second operation mode storage unit is rewritten to a stop mode by the control terminal device. 3. The operation management system according to 3.
運用管理の制御を受ける第1エージェント部と第2エージェント部とを備えた管理対象ノードの前記第1エージェント部と前記第2エージェント部とのうち予め定められた一方を運用管理する運用管理機能の動作モードを記憶する動作モード記憶部と、
前記予め定められた一方に対する運用管理機能を実行しようとするときに前記動作モード記憶部に記憶された動作モードを参照し、参照結果に基づいて前記予め定められた一方に対する運用管理機能を実行するかどうかを決定する運用管理制御部と
を備えたことを特徴とする運用管理サーバ装置。
An operation management function for operating and managing a predetermined one of the first agent unit and the second agent unit of a managed node having a first agent unit and a second agent unit that are controlled by operation management. An operation mode storage unit for storing the operation mode;
When an operation management function for the predetermined one is to be executed, the operation mode stored in the operation mode storage unit is referred to, and the operation management function for the predetermined one is executed based on a reference result An operation management server device comprising an operation management control unit for determining whether or not.
コンピュータである運用管理サーバ装置が行なう運用管理方法において、
動作モード記憶部が、運用管理の制御を受ける第1エージェント部と第2エージェント部とを備えた管理対象ノードの前記第1エージェント部と前記第2エージェント部とのうち予め定められた一方を運用管理する運用管理機能の動作モードを記憶し、
運用管理制御部が、前記予め定められた一方に対する運用管理機能を実行しようとするときに前記動作モード記憶部に記憶された動作モードを参照し、参照結果に基づいて前記予め定められた一方に対する運用管理機能を実行するかどうかを決定することを特徴とする運用管理方法。
In the operation management method performed by the operation management server device which is a computer,
The operation mode storage unit operates a predetermined one of the first agent unit and the second agent unit of a managed node including a first agent unit and a second agent unit that are controlled by operation management. Stores the operation mode of the operation management function to be managed,
The operation management control unit refers to the operation mode stored in the operation mode storage unit when trying to execute the operation management function for the predetermined one, and to the predetermined one based on the reference result An operation management method characterized by determining whether to execute an operation management function.
動作モード記憶部を備えるコンピュータである運用管理サーバ装置に以下の処理を実行させる運用管理プログラム
(1)運用管理の制御を受ける第1エージェント部と第2エージェント部とを備えた管理対象ノードの前記第1エージェント部と前記第2エージェント部とのうち予め定められた一方を運用管理する運用管理機能の動作モードを前記動作モード記憶部に記憶する処理
(2)前記予め定められた一方に対する運用管理機能を実行しようとするときに前記動作モード記憶部に記憶された動作モードを参照し、参照結果に基づいて前記予め定められた一方に対する運用管理機能を実行するかどうかを決定する処理
An operation management program for causing an operation management server device, which is a computer having an operation mode storage unit, to execute the following processing: (1) The management target node including a first agent unit and a second agent unit that are controlled by operation management; A process of storing in the operation mode storage unit an operation mode of an operation management function for operating and managing one of the first agent unit and the second agent unit. (2) Operation management for the predetermined one A process of referring to an operation mode stored in the operation mode storage unit when trying to execute a function and determining whether to execute an operation management function for the predetermined one based on a reference result
第1運用管理サーバ装置と通信して運用管理の制御を受ける第1エージェント部と、
第2運用管理サーバ装置と通信して運用管理の制御を受ける第2エージェント部と
を備え、
前記第1運用管理サーバ装置は、
請求項5に記載の運用管理サーバ装置であるとともに、前記予め定められた一方として、前記第1エージェント部を運用管理する運用管理機能の動作モードを前記動作モード記憶部に記憶し、
前記第2運用管理サーバ装置は、
請求項5に記載の運用管理サーバ装置であるとともに、前記予め定められた一方として、前記第2エージェント部を運用管理する運用管理機能の動作モードを前記動作モード記憶部に記憶することを特徴とする管理対象ノード。
A first agent unit that communicates with the first operation management server device and receives operation control;
A second agent unit that communicates with the second operation management server device and receives operation control;
The first operation management server device includes:
The operation management server device according to claim 5, wherein the operation mode storage unit stores an operation mode of an operation management function for operating and managing the first agent unit as the predetermined one,
The second operation management server device
6. The operation management server device according to claim 5, wherein as the predetermined one, an operation mode of an operation management function for operating and managing the second agent unit is stored in the operation mode storage unit. Managed node to be
JP2006195664A 2006-07-18 2006-07-18 Operation management system, operation management server device, operation management method, operation management program, and management object node Pending JP2008026954A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006195664A JP2008026954A (en) 2006-07-18 2006-07-18 Operation management system, operation management server device, operation management method, operation management program, and management object node

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006195664A JP2008026954A (en) 2006-07-18 2006-07-18 Operation management system, operation management server device, operation management method, operation management program, and management object node

Publications (1)

Publication Number Publication Date
JP2008026954A true JP2008026954A (en) 2008-02-07

Family

ID=39117555

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006195664A Pending JP2008026954A (en) 2006-07-18 2006-07-18 Operation management system, operation management server device, operation management method, operation management program, and management object node

Country Status (1)

Country Link
JP (1) JP2008026954A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010106649A1 (en) * 2009-03-18 2010-09-23 富士通株式会社 Update program, information processing method, and update method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62296264A (en) * 1986-06-16 1987-12-23 Nec Corp Control system for structure of data processing system
JPH05197699A (en) * 1992-01-21 1993-08-06 Hitachi Ltd Computer system and construction control method for computer system
JPH0644200A (en) * 1992-07-24 1994-02-18 Fujitsu Ltd System for controlling distribution processing
JP2005332057A (en) * 2004-05-18 2005-12-02 Hitachi Ltd Process control method for distributed computer system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62296264A (en) * 1986-06-16 1987-12-23 Nec Corp Control system for structure of data processing system
JPH05197699A (en) * 1992-01-21 1993-08-06 Hitachi Ltd Computer system and construction control method for computer system
JPH0644200A (en) * 1992-07-24 1994-02-18 Fujitsu Ltd System for controlling distribution processing
JP2005332057A (en) * 2004-05-18 2005-12-02 Hitachi Ltd Process control method for distributed computer system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010106649A1 (en) * 2009-03-18 2010-09-23 富士通株式会社 Update program, information processing method, and update method
JP5206864B2 (en) * 2009-03-18 2013-06-12 富士通株式会社 Update program, information processing apparatus, and update method

Similar Documents

Publication Publication Date Title
CN100485676C (en) Apparatus, system, and method for file system serialization reinitialization
JP4387116B2 (en) Storage system control method and storage system
US9026996B2 (en) Providing assistance in making change decisions in a configurable managed environment
JP5328177B2 (en) Information processing apparatus, data processing method for information processing apparatus, storage medium, and program
US7373469B2 (en) Data migration method
US8589642B2 (en) Computer system duplicating writes by synchronous remote copy with multiple host computers using heterogeneous operating systems
CN108369544B (en) Deferred server recovery in a computing system
US20080281959A1 (en) Managing addition and removal of nodes in a network
JP2009288836A (en) System failure recovery method of virtual server, and its system
US8112518B2 (en) Redundant systems management frameworks for network environments
JP4159750B2 (en) Distributed computer system and maintenance data application method
US8819481B2 (en) Managing storage providers in a clustered appliance environment
CN111031126B (en) Cluster cache sharing method, system, equipment and storage medium
JP4697001B2 (en) Program automatic update system
JP2008026954A (en) Operation management system, operation management server device, operation management method, operation management program, and management object node
JP4806382B2 (en) Redundant system
JP5200658B2 (en) Server system
CN114731326B (en) Block chain system, program and network connection device
CN113138722B (en) Replication snapshot method, system and medium for distributed block storage system
JP7315214B2 (en) loosely coupled system
CN111209096B (en) Information processing apparatus and information processing method
JP4910274B2 (en) Program and server device
JP2021086489A (en) Loosely-coupled system
US8738726B2 (en) Data processor, data processing system, data processing method, and computer product, with error message display
JP2006202220A (en) Program for causing computer to execute processing of confirming consistency of handover information, and method thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090511

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110602

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120306