JP2004021549A - Network monitoring system and program - Google Patents

Network monitoring system and program Download PDF

Info

Publication number
JP2004021549A
JP2004021549A JP2002174833A JP2002174833A JP2004021549A JP 2004021549 A JP2004021549 A JP 2004021549A JP 2002174833 A JP2002174833 A JP 2002174833A JP 2002174833 A JP2002174833 A JP 2002174833A JP 2004021549 A JP2004021549 A JP 2004021549A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
monitoring
information
device
network
means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002174833A
Other languages
Japanese (ja)
Inventor
Kenzo Horie
Junichi Hosokawa
Yosuke Itasaka
Shinichi Okamoto
Shinji Shinno
Sohei Yoshino
堀江 健三
岡本 真一
新野 真司
板坂 洋介
細川 淳一
芳野 壮平
Original Assignee
Hitachi Information Systems Ltd
Hitachi Ltd
株式会社日立情報システムズ
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a system which can reduce the burden on an operating manager and the amount of TCO of a distributed computer network under large-scale multi vendor environment. <P>SOLUTION: Information collection agents 44 and 54 are installed in devices to be monitored 4 and 5, and a network monitoring manager 1 is installed in a monitoring device. In the device to be monitored 5, an information collection agent 5A installed in a monitoring device 2 in a different system coexists by the information collection agent 54. By sharing information between a plurality of the monitoring devices, overall monitoring support in a distributed computer network system under multi vendor environment is conducted. Here, between the monitoring device (network monitoring manager 1) and the devices to be monitored 4 and 5, authentication functions (11a, 44a, and 54a) which use a one-time password are provided, to prevent illegal access by impersonation as a monitoring device to the devices to be monitored on the user side. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】 [0001]
【発明の属する技術分野】 BACKGROUND OF THE INVENTION
本発明は、ネットワークの監視・管理技術に係わり、特に、大規模なネットワーク上に分散したサーバ装置やデータ伝送装置等を対象とした障害監視および性能監視を効率的に行い、ネットワークの運用管理者の負担を軽減するのに好適なネットワーク監視技術に関するものである。 The present invention relates to network monitoring and management techniques, in particular, large-scale distributed on the network to a server apparatus and a data transmission device such as a failure monitor intended for and performance monitoring efficiently performed, the operation manager of the network those of the preferred network monitoring technique to reduce the burden on.
【0002】 [0002]
【従来の技術】 BACKGROUND OF THE INVENTION
コンピュータシステムにおけるクライアント・サーバ環境の進歩によりコンピュータネットワーク上でのリソースの分散化が進み、分散したオフィス先のコンピュータ装置に対する監視・管理も必要となっている。 Distributed resources over a computer network proceeds Advances in client-server environment in a computer system, which is also required monitoring and management of distributed office destination computer system.
【0003】 [0003]
このような分散ネットワークでの監視では、監視装置一台でネットワークを挟んだ分散オフィスや同一LAN(Local Area Network)上にあるデータ伝送装置やサーバ装置のリソースを監視することが望まれるが、ネットワークを挟んだ監視ではリモート系コマンドによる制御が必要となる。 Monitoring in this distributed network, it is desirable to monitor the resources of the data transmission device and a server device located on across the network by a single monitoring device dispersed offices and the same LAN (Local Area Network), network it is necessary to control by the remote system commands monitoring across the.
【0004】 [0004]
しかし、このようなリモート系コマンドによる制御では、不正アクセスが可能となり、他人から覗かれる恐れがあり、セキュリティ上の問題がある。 However, control of these remote-commands enables unauthorized access, there is a risk of being peeped by others, there is a security problem. そのため、現状では、分散オフィス毎、例えば、同じLANに監視装置を設置し、当該LAN内の監視対象装置のみを監視している。 Therefore, at present, each dispersion office, for example, the same LAN to set up a monitoring device monitors only monitored devices within the LAN.
【0005】 [0005]
さらに、リモートでの監視はネットワーク上のトラヒックが増加するので、このような問題に対処するために、監視対象装置(サーバ装置など)にエージェント(問題発覚時のみトラップを行う)を組み込み、このエージェントで収集した監視情報や管理情報を、監視装置は、監視の基本であるSNMP(Simple NetworkManagement Protocol)により採取する技術が用いられている。 Further, since the monitoring of remotely traffic on the network increases, in order to cope with this problem, incorporation monitored device agent (such as a server device) (at discovered problem only perform trap), this agent in the collected monitoring information and management information, the monitoring device, a technique for collecting is used by SNMP is the basis of monitoring (Simple NetworkManagement Protocol).
【0006】 [0006]
しかし、これらエージェントで収集した監視情報や管理情報には、問題発覚時に障害としてトラップせずに異常状態のメッセージをログ情報として出力するものや、独自プロトコルを持った管理情報もあり、これらの情報に関しては、SNMPによる情報収集ができない。 However, the collected monitoring information and management information in these agents, and to output a message of abnormal state without trap as a failure at the time discovered a problem as the log information, there is also a management information with its own protocol, these information With regard to, it can not be information collection by SNMP. このようなSNMPによる情報収集ができない監視対象装置や管理情報が増える傾向にある。 It tends to monitored devices and the management information such can not collect information via SNMP increases. 例えば、グループウェーア系Mail、ファイヤーウォールやディレクトリ(Lightweight Directory Access Protocol、以下「LDAP」と省略)などの共通アプリケーションソフトがある。 For example, the group-way A-based Mail, firewall or directory (Lightweight Directory Access Protocol, the following abbreviated as "LDAP") there is a common application software such as.
【0007】 [0007]
また、大規模な分散ネットワークでは、マルチベンダ環境が一般的である。 In addition, in a large-scale distributed network, multi-vendor environment is common. すなわち、大規模なコンピュータネットワークシステムにおいては、ネットワーク構築に当たり一社だけでは満足のいくシステム体系にはならない為、他社製品と連携できることが重要なファクターでもある。 That is, in the large-scale computer network system, when the network build only one company because that should not be in the system scheme satisfactory, there is also an important factor to be able to work with third-party products.
【0008】 [0008]
同一LANにおいて、障害検知から復旧、そして通報までのプロセスを一元管理した従来技術はあるが、マルチベンダ環境下や複数の監視装置を統合した環境での監視制御はできない。 In the same LAN, the recovery from the failure detection, and there is the prior art that centralizes process up notification can not monitor control in an environment that integrates multi-vendor environment and a plurality of monitoring devices. そのため、現状では、各社シリーズ製品内での連携が大半である。 Therefore, at present, it is a collaboration majority in the company series products.
【0009】 [0009]
また、TCO(Total Cost of Ownership、トータル運用コスト)削減を目的に、障害発生の通報を効率化する従来技術がある。 Moreover, TCO (Total Cost of Ownership, total operational costs) in order to reduce, there is prior art to improve the efficiency of the notification of the failure. すなわち、障害発生と同時にユーザへ、障害通知のための電子メールを自動送信するものであり、この技術では、電子メール宛先を監視担当者として通知したり、同報でメーリングリスト対象ユーザ全員に通知する。 That is, the same time the user that a fault has occurred, and the e-mail for the failure notification intended to automatically transmit, in this technique, and notifies the e-mail address as a monitoring personnel, notifies the mailing object all users in the broadcast .
【0010】 [0010]
しかし、実際の通報の流れはもう少し複雑である。 However, the actual notification of the flow is a little more complicated. すなわち、監視センタからネットワーク管理者へ通報し、ネットワーク管理者は関係するサーバ担当者を探し、電話やメールで連絡、または担当者の席まで呼びに行くのが実態である。 In other words, the call from the monitoring center to the network administrator, network administrator looking for a server personnel involved, is a reality to go to call until the seat of contact, or the person in charge by phone or e-mail. このように、サイト先の顕在する問題を考慮しないと、実際のTCO削減が図れない。 In this way, if you do not take into account the problems of the site destination manifestation, it can not be achieved the actual TCO reduction.
【0011】 [0011]
また、ネットワーク監視者は、監視装置で提供する画面の状態確認が必要だがマルチベンダ環境下で複数の監視装置が分散されている為、業務は煩雑となり対応が遅れる。 In addition, network monitoring person, since a plurality of monitoring devices in the state confirmed that it is necessary, but under a multi-vendor environment of the screen provided by the monitoring devices have been distributed, business correspondence is delayed becomes complicated. 例えば、従来のマルチベンダ環境下での各監視装置の連携技術では、マスタ監視装置の画面に、その監視下になる各監視装置のアイコンを表示し、各アイコン間にリンクを張るだけである。 For example, in cooperation technique of each monitoring device under conventional multi-vendor environment, the screen of the master monitor, and displays an icon for each monitored device made under its surveillance, only a link between each icon. そのため、監視情報画面や性能監視情報やログ情報は、各監視装置固有の画面表示のままであり、統合されていない。 Therefore, monitoring information screen and performance monitoring information and the log information remains in the monitoring device specific screen, not integrated.
【0012】 [0012]
また、電子メールのような共通アプリケーションの異常発生を監視する場合には、UNIX(登録商標)/OSや、それ以外のOS等が備えているメッセージ(リソース状況)と、アプリケーションが出力するメッセージログ情報とを連携し、どこまでリカバリ処理が必要か検知する。 Also, when monitoring abnormality of common applications, such as e-mail, UNIX (registered trademark) / OS and a message (resource availability) other than the OS or the like which comprises, message log that the application outputs cooperation and information, to detect how far the recovery process is necessary. これを自動的に実行して障害を復旧させたり、システム担当者に警告を出すことが要求される。 Or to recover the failure to do this automatically, it is required to issue a warning to the system personnel. しかし、サーバ別や障害別にその対応が異なる点を考慮した監視システムは無く、ユーザ自身で開発しなければならない。 However, server-specific or failure Apart from monitoring system and its corresponding is considering different points is not, must be developed yourself.
【0013】 [0013]
例えば、UNIX(登録商標)/OS系でもFreeBSD(登録商標)、Linux(登録商標)や商用UNIX(登録商標)およびそれ以外のOSと多種にわたる。 For example, UNIX (registered trademark) / OS system FreeBSD in (registered trademark), over the Linux (registered trademark), a commercial UNIX (registered trademark) and other OS and various. そして、監視対象の電子メールでも、SMTPメールやグループウェーア系Mailなどがあり、その代表的な監視技術にメッセージ滞留キューチェックがあるが、グループウェーア系Mailの状態監視では、「x.400」、「smtpgw」、「smtp(Sendmail)」それぞれの情報を収集し、グループウェーア系Mailサーバ内に滞留しているメールキュー数を予め設定したしきい値と比較し、障害を判定する必要がある。 And, also by e-mail to be monitored, there is such as SMTP mail and group-way A-based Mail, in there is a message residence queue check to the representative monitoring technology, group-way A-based Mail of state surveillance, "x.400 "," smtpgw ", compared to" smtp (Sendmail) "each information collected, a preset number of mail queue remaining in the group-way a system in mail server threshold necessary to determine the fault there is.
【0014】 [0014]
以上のように、従来のネットワーク監視ソフト製品は同一LAN(そのビルにクローズした利用)上での監視を前提にした仕様が大半であるが、クライアント/サーバ技術の進歩によりリソースの分散化が進んでおり、このような分散したオフィスの監視管理(ネットワークや広域LANを挟んだ監視)や、アプリケーション層までを含めた”End to End”の観点に立った監視、そしてその一元化によるネットワークシステム全体の信頼性確保が必要とされている。 As described above, the conventional network monitoring software products but specification assumes the monitoring on the same LAN (available and closed the building) is mostly, increasingly distributed resources Advances in client / server technology de and such distributed office monitoring management of (monitored across the network or a wide area LAN) and, including up to the application layer "End to End" monitoring stood aspect, and the entire network system according to the centralized ensure reliability are needed.
【0015】 [0015]
しかし、従来の分散オフィス間の監視はセキュア通信が不十分であり、また分散先毎の情報セキュリテイ確保が困難であることから、分散オフィス毎に監視システムを構築・運用するのが現状である。 However, the monitoring between conventional distributed office is insufficient secure communication, and because the information security ensured distribution destination each is difficult, at present, to construct and operate the monitoring system for each distributed office.
【0016】 [0016]
このように、近年のコンピュータネットワークの普及に伴い(1)ネットワークの広域化、(2)ネットワークの分散化、(3)マルチベンダ環境、(4)管理の効率化とTCO削減の要求があり、さらにはユーザ側からも監視状況が把握できる機能とサーバ装置のリブートをリモートで操作して復旧させることも要求される。 Thus, with the recent spread of computer network (1) wide-area network, (2) dispersion of the network, (3) multi-vendor environment, (4) there are administrative requests efficiency and reduce TCO, further also required to be restored by operating a reboot function and the server apparatus can monitor status can be grasped from the user side remotely. また、各システム管理部門でもイントラネットや電子メール等の急激な利用増加により、サーバ装置の常時監視と障害の早期復旧が重要な課題となっている。 In addition, the rapid increasing use such as intranet and e-mail in each system management department, early recovery of constant monitoring and fault of the server device has become an important issue. しかし、どこにボトルネックが生じているのか予測し難いという現状である。 However, where at present that's how difficult prediction bottleneck has occurred.
【0017】 [0017]
その対応として、複数の市販監視製品を導入し、良い所を集めたマルチベンダ監視システム環境の導入が図られているが、業務アプリケーション毎に特化した「障害情報表示と連携した連絡、異常処理のリモート復旧」等の連携運用機能面が不十分であった。 As a response, introducing a plurality of commercially available monitoring products, contact although the introduction of multi-vendor monitoring system environment is achieved a collection of good place, in cooperation with specialized for each business application "fault information display, abnormality processing cooperation operational function surface such as a remote recovery "was insufficient. この結果、監視・運用管理に要する費用(TCO)の増大を招くと共にネットワーク監視の一元化に反し全体ネットワークシステムの信頼性維持が困難となっている。 As a result, maintaining reliability of the entire network system against the centralized network monitoring with results in an increase in costs for monitoring and management (TCO) is difficult.
【0018】 [0018]
【発明が解決しようとする課題】 [Problems that the Invention is to Solve
解決しようとする問題点は、従来のマルチベンダ環境の大規模な分散ネットワークの監視技術では、別系統の監視装置専用に組み込まれた情報収集エージェントと共存させる配慮がなく、一つの監視システムだけではサポートが不可能であり、また、リモート監視により監視装置になりすましてユーザのサーバ装置等へ不正侵入することを防止することができず、また、従来は障害の発生をネットワーク管理者に電子メール等で通知するだけであり、通知を確認したネットワーク管理者が障害サーバ装置等の担当者を特定して連絡するまでに時間と手間がかかってしまい、また、従来は監視対象サーバが増えた場合に監視性能確保のために監視装置を分散させると全体の監視情報を一元管理できずTCO削減ができず、また、一台の監視装置 A problem to be solved is, in the monitoring techniques for large distributed networks of a conventional multi-vendor environment, there is no consideration to coexist with the information collection agent incorporated in the monitoring device only of another system, just one monitoring system support is is impossible, also can not be prevented from intrusion into the user of the server device or the like pretending to monitor the remote monitoring, also, the conventional electronic mail or the like the occurrence of a failure in the network administrator in is only to inform, it takes time and effort until the network administrator to confirm the notification to contact to identify the person in charge such as the failed server apparatus, also, in the case the past that it has increased the monitored server monitoring information across distributing monitoring apparatus for monitoring performance ensured unable TCO reduction can not be centrally managed, also single monitoring device 全ての監視情報を集約して管理すると当該管理装置への負荷が増大してしまい、また、従来の監視システムではPINGコマンドでの動作状態監視やSNMPによる性能監視の抱き合わせ機能までであり、障害検知から通報そして復旧までの障害監視運用過程を自動化することができず、また、従来は複数の監視装置で分散して監視しているので、例えば、それぞれの監視装置を連携しマスタ監視装置の画面にその監視下になる監視装置アイコンを表示し、リンクを張るだけであり、監視情報画面や性能監視情報、ログ情報などは、各監視装置に固有の画面表示のままで統合されておらず、また、従来は監視装置で提供する画面の状態確認が監視装置に分散され業務は煩雑となり対応が遅れてしまい、さらに、従来の稼働統計は計画停止時 When managed by aggregating all monitoring information load on the management device ends up increasing, also it is up to conventional tying function of the performance monitoring by the operating state monitoring and SNMP in the PING command in the monitoring system, failure detection can not be automated fault monitoring operation process until Problem and recovery from, also, screen since conventional monitors distributed by a plurality of monitoring devices, for example, in conjunction with each of the monitoring device master monitoring device to view the monitoring device icon that made under surveillance, only a link, monitoring information screen and performance monitoring information, such as log information, not integrated remains unique screen displayed on the monitor, further, conventionally application status confirmation screen provided by the monitoring device is distributed to the monitoring device will be delayed correspondence becomes complicated, further, conventional operating statistics during planned outages などの情報がなくこの時間を除いた稼働率が提供されていたため、大規模なマルチベンダ環境の分散コンピュータネットワークシステムにおける監視を効率良くかつ安全にサポートすることができない点である。 Since the utilization rate information without excluding this time such as has been provided, is the inability to efficiently and safely support the monitor in a distributed computer network system of large, multi-vendor environment.
【0019】 [0019]
本発明の目的は、これら従来技術の課題を解決し、大規模なマルチベンダ環境の分散コンピュータネットワークの運用管理者の負担の軽減とTCOの削減を可能とすることである。 An object of the present invention is to solve the problems of these prior art allows to reduce the large multi-vendor reduction and TCO burden of operation manager of the distributed computer network environment.
【0020】 [0020]
【課題を解決するための手段】 In order to solve the problems]
上記目的を達成するため、本発明では、マルチベンダ環境のコンピュータネットワークシステムにおける各監視対象装置のリモート監視を行うシステムとして、各監視対象装置(データ伝送装置やサーバ装置)に情報収集エージェント(プログラム)を、また、監視装置にネットワーク監視マネージャ(プログラム)を組み込み、監視対象装置において、情報収集エージェントにより、別系統の監視装置専用に組込まれた情報収集エージェントと共存させ、複数台の監視装置と情報共用を実現することにより、マルチベンダ環境のコンピュータネットワークシステムにおける各監視サポートを統合的して行う。 To achieve the above object, the present invention, a system for remote monitoring of the monitored devices in a computer network system of multi-vendor environment, each monitored device (data transmission device and a server device) to the information collection agent (program) and also incorporates a network monitoring manager (program) to the monitoring device, the monitoring target device, the information collection agent, coexist with the information collection agent incorporated in the monitoring device only of another system, monitoring device and information plurality by implementing a shared, performing the monitoring support in a computer network system of multi-vendor environment integrated manner. また、監視装置と監視対象装置間にワンタイムパスワードによる認証を行う機能を設けることで、監視装置になりすましてのユーザ側の監視対象装置への不正侵入を防止する。 Further, by providing the function of performing authentication by one time password between the monitoring device and the monitoring target device, to prevent unauthorized entry to the user side of the monitored device pretending to monitor. また、障害単位で担当者リスト、電話連絡の有無、重要度を示すメッセージを表示する機能を設けることで、障害を誰に伝えればよいかの検索を容易とする。 In addition, the person in charge list in failure unit, the presence or absence of a phone call, by providing the ability to display a message indicating the importance, to facilitate the search of or should I tell to whom the failure. また、NFS(Network File System)技術を利用して、監視情報が保存されるそれぞれの監視装置間をネットワーク結合する機能を設けることにより、サーバ負荷軽減を図り、かつ、複数の監視装置間の監視情報を同期させ、一元管理する。 Furthermore, by utilizing an NFS (Network File System) technology, by between each monitoring device monitoring information is stored providing the ability to network coupling, aims to server load reduction, and monitoring between multiple monitoring devices information to synchronize, centrally managed. また、情報収集エージェントにおいて、ログ情報に用いられるアドレスや識別子、文字の配列などを登録し、ログ情報を検索して、同じパターンを検出した場合、予め登録したアクション動作をさせるパタンマッチ処理機能を設けることにより、SNMPなどのように障害情報をログ上に出力するだけでは不可能な監視も可能とし、さらに、障害検知から通報そして復旧までの障害監視運用過程の自動実行を可能とする。 In the information collection agent, the address and the identifier used in the log information, to register and sequences of characters, and search log information, when detecting the same pattern, the pattern matching processing functions for the action operation registered in advance by providing also a possible only outputs the failure information on the log impossible monitor, such as SNMP, further allows automatic execution of failure monitoring operation process until Problem and recovered from the failure detection. また、ユーザ側に提供する監視情報は、監視状態を一元的に把握できる構成でWeb画面で提供し、かつ、階層が深くなるほど詳細情報を提供する表示構成とすることにより、ユーザと監視センタの双方向での遠隔監視を実現し、迅速な障害体制の確立を可能とする。 Also, the monitoring information to be provided to the user side, and provides the Web screen monitor state unitarily grasp can be configured, and, by a display configured to provide more detailed information hierarchy becomes deeper, the user and the monitoring center to achieve remote monitoring in both directions, to allow the establishment of rapid fault system. また、ネットワーク監視マネージャにおいて、監視情報結果から監視対象装置ごとの計画停止時間を含めた月間サービス稼動率とリソース使用率を算出し、サービス稼働率表(稼働率、稼働時間、停止回数、停止時間、警告回数、計画停止回数と時間)と重要障害発生頻度管理(レベルを4区分して色分けして警告)およびリソース使用率推移グラフ(閾値との比較表示、週単位比較表示)の稼動月次レポートを自動作成してWeb画面で提供する機能を設けることにより、データ伝送装置やサーバ装置等の監視対象装置のシステム障害を事前に予測する情報を提供する。 Further, the network monitoring manager calculates the monitored monthly service utilizations, including the planned downtime each target device and resource utilization from the monitoring information results, service uptime table (operation rate, operation time, number of stops, stop time , warning number, operation monthly plan number of stops and time) is important fault frequency management (level 4 partition to color-coded warning) and resource utilization transition graph (comparison display of a threshold, weekly comparison display) by providing a function of providing a Web screen to automatically create reports, to provide information for predicting the system failure monitored apparatus such as a data transmission device and a server device in advance.
【0021】 [0021]
【発明の実施の形態】 DETAILED DESCRIPTION OF THE INVENTION
以下、本発明の実施の形態を、図面により詳細に説明する。 Hereinafter, the embodiments of the present invention will be described in detail with reference to the accompanying drawings.
【0022】 [0022]
図1は、本発明に係わるネットワーク監視システムの構成例を示すブロック図であり、図2は、図1におけるネットワーク監視システムの第1の動作例を示す説明図、図3は、図1におけるネットワーク監視システムの第2の動作例を示す説明図、図4は、図1におけるネットワーク監視システムの詳細構成例を示すブロック図である。 Figure 1 is a block diagram showing a configuration example of a network monitoring system according to the present invention, FIG. 2 is an explanatory diagram showing a first operation example of the network monitoring system in FIG. 1, FIG. 3, the network in Figure 1 explanatory view showing a second operation example of the monitoring system, Figure 4 is a block diagram illustrating a detailed configuration example of a network monitoring system in FIG.
【0023】 [0023]
図1において、1は監視装置に読み込まれたネットワーク監視マネージャ(図中「ネットワーク監視マネージャプログラム」と記載)、2は別系統の監視装置、3〜5はデータ伝送装置やサーバ装置等の監視対象装置であり、6〜9は広域LAN等のネットワークの通信回線である。 In Figure 1, 1 is a network monitoring manager loaded in the monitoring device (in the figure as "network monitoring manager program"), 2 different system monitoring devices, 3-5 monitored such as data transmission device and a server device a device, 6-9 is a network communication line such as a wide area LAN.
【0024】 [0024]
各装置1〜5は、CPU(Central Processing Unit)や主メモリ、表示装置、入力装置、外部記憶装置等を具備したコンピュータ構成からなり、光ディスク駆動装置等を介してCD−ROM等の記憶媒体に記録されたプログラムやデータを外部記憶装置内にインストールした後、この外部記憶装置から主メモリに読み込みCPUで処理することにより各機能を実現する。 Each device 1-5, CPU (Central Processing Unit) and a main memory, a display device, an input device, consists computer configuration provided with the external storage device or the like, in a storage medium such as a CD-ROM via the optical disk drive, etc. after installing the recorded programs and data in the external storage device, to realize the respective functions by treatment with read CPU to the main memory from the external storage device.
【0025】 [0025]
監視対象装置3は、TCP(Transmission Control Protocol)処理を行うTCP処理部(図中「TCPポート」と記載)31と、装置保有リソース情報や稼働情報を格納する情報記憶部(図中「装置保有リソース情報や稼働情報」と記載)32、および、例えばSMTP(Simple Mail Transfer Protocol)やWWW(World Wide Web)等のアプリケーションプログラムに基づく処理を行うアプリケーション処理部(図中「アプリケーションプログラム」と記載)33を有する。 Monitoring target apparatus 3, TCP TCP processing unit that performs a (Transmission Control Protocol) processing (in the figure as "TCP port") 31, device possesses information storage unit for storing resource information and operating information (in the figure "device owned resource information and operating information "as described) 32 and, for example, SMTP (Simple Mail Transfer Protocol) and WWW (World Wide Web) application processing unit that performs processing based on the application program, such as (in the figure as" application program ") with a 33.
【0026】 [0026]
また、監視対象装置4は、同TCP処理部41、情報記憶部42、アプリケーション処理部43と共に、ワンタイムパスワード認証プログラム44a、性能監視用エージェントプログラム44b、リモート復旧プログラム44cをサブプログラムとして持ち本発明に係わる情報収集処理を行う情報収集エージェント(図中「情報収集エージェントプログラム」と記載)44を有する。 The monitoring target device 4, the TCP processing unit 41, information storage unit 42, the application processing unit 43, the present invention has a one-time password authentication program 44a, the performance monitoring agent program 44b, the remote recovery program 44c as a sub-program has information gathering process information collection agent performing (described in the drawing as "information collection agent program") 44 according to the.
【0027】 [0027]
さらに、監視対象装置5は、同TCP処理部51、情報記憶部52、アプリケーション処理部53、および、ワンタイムパスワード認証プログラム54a、性能監視用エージェントプログラム54b、リモート復旧プログラム54cをサブプログラムとして持ち情報収集処理を行う情報収集エージェント54と共に、別系統の監視装置用の専用情報収集エージェントに基づく処理を行う別系統情報収集エージェント(図中「別系統の監視装置用の専用情報収集エージェントプログラム」と記載)5Aを有する。 Further, the monitored device 5, information has the TCP processing unit 51, information storage unit 52, the application processing unit 53 and one-time password authentication program 54a, the performance monitoring agent program 54b, the remote recovery program 54c as a sub-program with collection processing information collection agent 54 for, according to another system information collection agent for performing processing based on only information collection agent for the monitoring device of another system ( "dedicated information collection agent program for monitoring device of another system" in the figure ) with a 5A.
【0028】 [0028]
監視装置に組み込まれるネットワーク監視マネージャ1は、プロセス/性能監視プログラム11、中継サーバプログラム12、稼働月次レポート自動作成プログラム13からなり、さらに、プロセス/性能監視プログラム11は、ワンタイムパスワード発生プログラム11a、TCPポート番号設定変更プログラム11b、プロセス/ステータス確認プログラム11c、監視タイミング時間調整変更プログラム11d、監視一時休止状態表示プログラム11e、障害管理用Webプログラム11f、リモート復旧判断プログラム11gからなり、中継サーバプログラム12は、統合監視情報管理プログラム12a、HTML生成プログラム(図中「HTML生成」と記載)12b、ソケットプログラム12c、別系統の監視装置の専用情報収 Network monitoring manager 1 incorporated in the monitoring device, process / performance monitoring program 11, the relay server program 12 consists runs monthly report automatic creation program 13, further process / performance monitoring program 11, the one-time password generating program 11a , TCP port number setting change program 11b, the process / status confirmation program 11c, monitor timing time adjustment changing program 11d, monitoring temporary dormant state display program 11e, fault management for Web program 11f, consists remote recovery determining program 11g, the relay server program 12, the integrated monitoring information management program 12a, HTML generation program (in the figure as "HTML generation") 12b, the socket program 12c, only information yield of another system of the monitoring device エージェントプログラム12Aからなり、稼働月次レポート自動作成プログラム13は、状態履歴情報Webコンテンツ生成プログラム(図中「状態履歴情報Webコンテンツ生成」と記載)13aからなる。 It consists agent program 12A, running monthly report automatic creation program 13 is comprised of a state history information Web content generation program (in the figure as "state history information Web content generation") 13a.
【0029】 [0029]
別系統の監視装置2は、障害復旧テンプレート21aとソケットプログラム21aを有し、仮想通信経路10を介して、ネットワーク監視マネージャ1内に取り込まれた別系統の監視装置の専用情報収集エージェントプログラム12Aと接続される。 Monitoring device 2 of another system has a disaster recovery template 21a and the socket program 21a, via the virtual communication path 10, and the only information collection agent program 12A of the network monitoring manager 1 in the captured another system monitoring device It is connected.
【0030】 [0030]
各監視対象装置3〜5はそれぞれ異なるベンダから提供されたものとし、本例のネットワーク監視システムでは、このようなマルチベンダ環境において、各監視対象装置3〜5に対するリモート監視を行う。 Each monitored device 3-5 is assumed to have been provided by different vendors, respectively, in the network monitoring system of the present embodiment, in such a multi-vendor environment, for remote monitoring of the monitoring target device 3-5.
【0031】 [0031]
大規模なネットワークを構成するにはこのようなマルチベンダ環境となるのが一般的であり、このような大規模なネットワークを運用するにあたり、ネットワーク監視の自動化と標準化が要求される。 The To create larger networks comprising such a multi-vendor environment is common, when operating such a large network, the automation of network monitoring and standardization are required. また、ネットワーク機器やトラヒック管理のみでは万全ではなく、さらにはアプリケーションをも連携した監視も含め、迅速な復旧処理をする必要がある。 Further, only the network equipment and traffic management are not foolproof, and further including monitoring in cooperation also applications, it is necessary to rapid recovery process.
【0032】 [0032]
これらの要件を考慮したネットワーク監視を行うためには、次に例示するようなポイントが重要である。 In order to perform the network monitoring Considering these requirements, points such as illustrated below are important.
【0033】 [0033]
ポイント(1):監視オペレータの仕事は常時緊張を強いられる。 Point (1): the work of the monitoring operator is forced to constantly tension. すなわち、オペレータは、監視画面を常時チェックし、障害が発生するとユーザに連絡しなければならない。 In other words, the operator, to check the monitor screen at all times, you must contact the user when a fault occurs. その際、連絡先担当者を調べて連絡・操作指示を待つ。 In that case, wait for the connection and operation instructions examine the contact person. 役割分担の通りに障害に対応するには迅速な連絡を実現する必要があり、そのためには、オペレータが障害を誰に伝えればよいかを容易に検索できるようにすることが重要なポイントとなる。 To correspond to the failure as roles need to realize rapid contact. To this end, an important point is to ensure that the operator can easily find the whom should tell failures .
【0034】 [0034]
そのために、本例では、ネットワーク監視マネージャ1(のプロセス/性能監視プログラム11)に障害管理用Webプログラム11fを設け、見やすいWeb画面構成で、ユーザ側および監視センタ側の双方に同時に、障害単位で担当者リスト、電話連絡の有無、重要度を示すメッセージを表示する。 Therefore, in this example, the network monitoring manager 1 (process / performance monitor program 11) to the fault management Web program 11f provided in legible Web screen configuration, at the same time on both the user side and the monitor center side, the fault unit personnel list, the presence or absence of a phone call, to display a message indicating the importance.
【0035】 [0035]
ポイント(2):業務アプリケーションの異常発生を監視する場合、OS(オペレーションシステム)が備えているメッセージ(リソース状況)とアプリケーションが出力するメッセージログを連携し、どこまでリカバリ処理が必要かを検知し、さらに、障害から自動復旧させたり、システム担当者に警告を出すことが要求される。 Point (2): When monitoring abnormality of business applications, collaboration message log application with the message (resource availability) to OS (operating system) is provided with outputs to detect how far the recovery process is required, in addition, or by automatic recovery from a failure, it is required to issue a warning to the system personnel. 本例では、プロセス/性能監視プログラム11を設け、このような処理を行う。 In this example, the process / performance monitor program 11 is provided, performing such processing.
【0036】 [0036]
ポイント(3):リモートでの監視ソフトウエアはネットワーク上のトラヒックが増加する為、監視対象サーバ等にエージェントを組み込み、問題発覚時のみトラップすることで情報採取する技術があるが、監視の基本であるSNMPだけでは管理できない機器や管理情報が増える傾向にある。 Point (3): for traffic on the monitoring software on the remote network increases, incorporating the agent on the monitored servers and the like, but there is a technique to information collected by trapping only at the time discovered the problem, the basic monitoring only is SNMP tends to increase can be no equipment and management information management. 本例では、このような問題に対処するために、情報収集エージェント44に性能監視用エージェントプログラム44bを設ける。 In this example, in order to cope with this problem, providing a performance monitoring agent program 44b on the information collection agent 44.
【0037】 [0037]
ポイント(4):大規模なコンピュータネットワークシステムの運用管理をする際、アプリケーション管理機能やソフトウエア配布/イベントリ管理機能等の個々の運用管理機能同士を連携させることが要求されるが、構築に当たり一社だけでは満足のいく製品体系にはならない。 Point (4): When the operation management of large-scale computer network system, it to link individual manageability each other such applications management and software distribution / Event Management Facility is required, per the construction only one company is not a product system satisfactory. 本例では、ネットワーク監視マネージャ1に中継サーバプログラム12を設けて他社製品との連携を行う。 In this example, performs cooperation with other products to the network monitoring manager 1 is provided relay server program 12. これにより、分散先毎に監視マネージャを設置する必要がなくなり、設備面、運用人員面でのコスト削減を図ることができる。 This eliminates the need to install the monitoring manager for each distribution destination, facility faces, cost reduction can be achieved in a production personnel surface.
【0038】 [0038]
ポイント(5):分散したオフィス先の各リソース管理をWAN等を挟んでリモート系コマンドによる監視制御を行う場合、不正アクセスが可能であるとの問題に対処するため、本例では、ネットワーク監視マネージャ1側にワンタイムパスワード発生プログラム11aを、情報収集エージェント44側にワンタイムパスワード認証プログラム44aを設け、監視装置と監視対象装置4,5間のセキュア通信をサポートする。 Point (5): For the monitoring control by the remote system commands distributed office destination each resource management across the WAN or the like, to address the problem of the possible unauthorized access, in this example, network monitoring manager the one-time password generating program 11a in 1 side, the one-time password authentication program 44a provided in the information collection agent 44 side, to support secure communication between the monitoring device and the monitoring target device 4,5.
【0039】 [0039]
従来は、監視サーバ(監視マネージャとも呼ばれている)1台でWANを挟んだ分散オフィスや同一LAN上にあるサーバのリソースを監視する場合、他人から覗かれる恐れがあるので、分散毎に監視サーバを設置し監視している。 Conventionally, when monitoring the monitoring server (also known as monitoring manager) resources of a server on a distributed office or the same LAN sandwiching the WAN in one, there is a possibility that peeped from others, monitored every dispersion monitors set up a server.
【0040】 [0040]
その他、例えば、動作状態を監視するのに、「Ping」コマンドが用いられるが、従来は、このコマンド(Ping)の発行間隔時間を監視状態に応じて変更できない。 Other, for example, for monitoring the operating state, "Ping" command is used, but conventionally can not be changed according to the monitoring state issuing interval of the command (Ping). その結果、実際には障害復旧しているが、監視間隔時間ズレにより監視マネージャの監視状態は異常表示となったままの状態が発生する。 As a result, although actually have disaster recovery, monitoring status of the monitoring manager by the monitoring interval time shift remains becomes abnormal display occurs. このような問題に対処するために、本例では、ネットワーク監視マネージャ1におけるプロセス/性能監視プログラム11に監視タイミング時間調整変更プログラム11dを設けている。 To address this problem, in this embodiment, the process / performance monitor program 11 in the network monitoring manager 1 is provided with a monitoring timing time adjustment changing program 11d.
【0041】 [0041]
また、従来技術では、工事等で停止している状態も、障害として検知されるので、障害情報の精度が劣化する。 Further, in the prior art, also the state stopped in the construction or the like, since it is detected as a failure, the accuracy of the fault information is deteriorated. このような問題に対処するために、本例では、監視一時休止状態表示プログラム11eを設け、工事管理情報データベース14に基づき、工事等での停止状態を障害状態と区別して管理する。 To address this problem, in this embodiment, the monitoring temporary dormant display program 11e is provided on the basis of the construction management information database 14 and manages distinguished from fault conditions in the stopped state in construction work.
【0042】 [0042]
このように、本例では、監視対象装置4,5に情報収集エージェント44,54を、また、監視装置にネットワーク監視マネージャ1を組み込み、監視対象装置4,5では、情報収集エージェント44,54により、当該監視対象装置4,5の稼働情報や性能情報および保有するリソースの状態等の情報を収集し、情報記憶部42,52に格納して管理する。 Thus, in this example, the information collection agent 44, 54 to the monitoring target devices 4 and 5, also incorporates a network monitoring manager 1 to the monitoring device, the monitoring target devices 4, the information collection agent 44, 54 collects information such as the state of the resource operation information, performance information, and held by the monitoring target device 4, 5, and manages the stored in the information storage unit 42, 52.
【0043】 [0043]
監視対象装置4,5の情報収集エージェント44,54は、ログ情報に用いられるアドレスや識別子、文字の配列などを登録し、ログ情報を検索して、同じパターンを検出した場合、予め登録したアクション動作をさせるパタンマッチ処理機能を有し、SNMPなどのように障害情報をログ上に出力するだけでは不可能な監視も行い、さらに、障害検知から通報そして復旧までの障害監視運用過程を自動的に実行する。 Information collection agent 44, 54 of the monitored devices 4 registers addresses and identifiers used in the log information, and sequence of characters, and search the log information if the detected the same pattern, the action registered in advance has a pattern matching process function of the operation, also performs monitoring impossible only outputs the failure information on the log, such as SNMP, further failure monitoring operation process until Problem and recovery from failure detection automatically to run.
【0044】 [0044]
ネットワーク監視マネージャ1は、通信回線7,8を介して、監視対象装置4,5の情報収集エージェント44,54に定期的にアクセスして、情報記憶部42,52に格納した各種情報を取得し、障害発生の検知、および、障害復旧の検知等を行い、検知した障害情報および復旧情報を一元的に管理して、監視センタ側と共にユーザ装置側にもWebブラウザを介して通知する。 Network monitoring manager 1 via the communication line 7 and 8, by periodically accessing the information collection agent 44, 54 of the monitored devices 4, acquires various information stored in the information storage section 42 and 52 , the detection of the failure, and performs a detection such as disaster recovery, the detected failure information and recovery information to centralized management, is also notified via the Web browser on the user device side together with the monitoring center side. これにより、リアルタイムで遠隔性と同時可視化に優れたネットワーク管理を行うことができる。 Thus, it is possible to perform good network management to remote simultaneously visualized in real time.
【0045】 [0045]
また、情報収集エージェント44,54とネットワーク監視マネージャ1間では、ワンタイムパスワード発生プログラム11aとワンタイムパスワード認証プログラム44a,54aにより、ワンタイムパスワードによる情報収集単位毎の認証を行うことにより、リモート不正アクセスを可否でき安全性を確保できる。 Further, between the information collection agent 44, 54 and the network monitoring manager 1, the one-time password generation program 11a and the one-time password authentication program 44a, by 54a, by performing the authentication of the information collection unit each by one-time password, the remote unauthorized We can ensure the safety can be whether or not the access.
【0046】 [0046]
また、ネットワーク監視マネージャ1は、監視対象装置4,5での障害情報を取得すると、監視タイミング時間調整変更プログラム11dにより、当該障害に対する復旧情報を取得するまで、情報収集時間間隔を短くして、復旧情報を取得するタイミングを早め、監視精度を向上させる。 The network monitoring manager 1 obtains the failure information on the monitored devices 4 and 5, by monitoring the timing time adjustment changing program 11d, until obtaining recovery information for the failure, by shortening the information collection time interval, advancing the timing of acquiring the recovery information, to improve the monitoring accuracy.
【0047】 [0047]
また、ネットワーク監視マネージャ1は、中継サーバプログラム12により、別系統の監視装置の制御下で収集・管理している監視情報を、NFS(Network File System)技術により統合管理し、さらに、統合管理した情報に基づき障害発生を検知し、検知した障害に対応する復旧処理を別系統の監視装置に指示し、この別系統の監視装置にアドオンしたプログラムからリモートコマンドを発行し、当該監視対象装置の情報収集エージェントに自動復旧させる。 The network monitoring manager 1, the relay server program 12, the monitoring information collected and managed under the control of another system of the monitoring device, and integrated management as NFS (Network File System) technology was further integrated management detects the failure occurrence on the basis of the information, and instructs the recovery processing corresponding to the detected failure to the monitoring device of another system, to issue a remote command from the program add-on to the monitoring apparatus of the different system, the information of the monitoring target device It is automatically restored to the collection agent. これにより、既存の監視マネージャをそのまま導入しただけで、例えばイントラネット環境下でのベンダ毎の監視や管理ツールを共存させることができる。 Accordingly, existing in the monitoring manager only by introducing it, it can coexist example for each vendor under intranet environment monitoring and management tools.
【0048】 [0048]
以下、図1におけるシステムの動作説明を行う。 Hereinafter, the description of the operation of the system in FIG.
【0049】 [0049]
図1においては、データ伝送装置やサーバ装置などからなる複数の監視対象装置3〜5の情報収集エージェント44,54は、予め監視センタからリモート処理で組み込まれる。 In Figure 1, the information collection agent 44, 54 of a plurality of monitored devices 3-5 made of the data transmission device and the server device is incorporated in advance from the monitoring center remoting.
【0050】 [0050]
この情報収集エージェント44,54が収集して情報記憶部32,42,52に格納した各種情報(障害情報や装置保有リソース情報、稼動情報等の性能情報など)、および、アプリケーションプログラム33,43,53の動作状況などが、ネットワークを介してネットワーク監視マネージャ1において、監視情報(システムログ情報)として収集される。 Various types of information the information collection agent 44, 54 has stored to the information storage unit 32, 42, 52 collect (failure information and device owned resource information, such as performance information such as operation information), and an application program 33, 43, such as 53 operating status of, in the network monitoring manager 1 via the network, it is collected as the monitoring information (system log information). この際、ネットワーク監視マネージャ1が監視対象装置であるか否かをワンタイムパスワード認証により認証し、正当性を確認する。 In this case, to authenticate whether the network monitoring manager 1 is a monitoring target device by one-time password authentication, to verify the validity.
【0051】 [0051]
ネットワーク監視マネージャ1は、障害管理用Webプログラム11fにより、監視情報と同時に収集している性能情報を基に、図2に示す手順で、監視センタとユーザの双方に、同時に、障害検知や、監視情報および性能情報の分析結果などを自動通知する。 Network monitoring manager 1, the fault management for Web program 11f, based on the performance information that is collected monitoring information at the same time, the procedure shown in FIG. 2, both the monitoring center and the user, at the same time, and failure detection, monitoring automatically notifies such analysis information and performance information.
【0052】 [0052]
すなわち、図2に示すように、従来は、監視対象装置における障害発生を検知した監視装置が、まず、監視センタに通知し、監視センタにおいて、情報収集、分析/調査を行い、ユーザ側に警告/通知を障害当該ユーザに行っており、ユーザ側と監視センタにおいて通知を受けるまでに大きな時間差が発生していたが、本例では、ネットワーク監視マネージャ1が、障害発生を検知すると、監視センタとユーザの双方に、同時に、通知するので、監視センタとユーザとの通知時間差がほとんどゼロになる。 That is, as shown in FIG. 2, the conventional monitoring apparatus which detects the failure occurrence in the monitored device is first notifies the monitoring center, the monitoring center, performs information collection, analysis / investigation, warning to the user / notification is performed to the failure the user, a large time lag until notified the user side with the monitoring center has occurred, in this example, the network monitoring manager 1, when detecting the failure, the monitoring center to both users, at the same time, since the notification, it notifies the time difference between the monitoring center and the user is almost zero.
【0053】 [0053]
また、本例では、ネットワーク監視マネージャ1と情報収集エージェント44,54において、障害情報の自動収集と、分析、調査、および、リモート復旧処理を行うことにより、監視センタおよびユーザ側では、直接の情報収集が不要となり、重度障害のみの分析/調査のみを行うだけでよくなる。 Further, in this embodiment, the network monitoring manager 1 and the information collection agent 44, 54, and automatic collection of the fault information, analysis, surveys, and, by performing the remote recovery process, at the monitoring center and the user side, direct information collection is not required, and it is only necessary to carry out the only analysis / investigation of severely disabled only.
【0054】 [0054]
さらに、ネットワーク監視マネージャ1から監視センタおよびユーザ側への障害発生などの通知は、障害管理用Webプログラム11fによりWeb技術を利用して、瞬時に異常を見つけ易いように監視項目や性能項目を任意の観測時間で、数値や○×で、視覚的に表示かつ具体的変化を数値で判断しやすいチックシート形式でWeb画面に表示する。 Further, notification of such failure from the network monitoring manager 1 to the monitoring center and the user side by using a Web technology by fault management for Web program 11f, any monitoring items and performance items to facilitate finding an abnormality in an instant in the observation time, a numerical value or ○ ×, displayed on the Web screen in a visually displayed and determine easily tic sheet format specific change numerically.
【0055】 [0055]
例えば、この障害管理用Webプログラム11fによるWeb画面表示において、各監視対象装置3〜5がイントラネット系のサーバ装置であれば、障害が発生した装置の担当者および連絡先と条件等が記載されたポップアップメモが自動的に現れ、同時に、障害管理用Webプログラム11fは、担当者へ電子メールを自動発信する。 For example, the Web screen display by the fault management for Web program 11f, each monitored device 3-5 is if server intranet system, personnel and contacts and conditions of the device where the failure has occurred is described pop-up notes automatically appear, at the same time, for fault management Web program 11f, the automatic transmission an e-mail to the person in charge.
【0056】 [0056]
監視センタ側に対するWeb画面では、障害サーバ名や時刻等の情報メッセージをポップアップ表示して警告する。 In the Web screen for the monitoring center side, to warn the failed server name and the time and the like of the information message to display pop-up. 障害が復旧すると自動的に裏画面の障害履歴画面に内容が移動される仕組みとする。 Failure is the mechanism by which content is automatically moved to the fault history screen of the back screen and to recover.
【0057】 [0057]
監視対象が電子メールサーバであれば、監視画面に障害サーバを表示してブザーを鳴らし、オペレータが、該当する障害サーバ表示部分をクリックすると連絡先情報がポップアップする仕組みとする。 If the monitored e-mail server, and a buzzer sounds to display the failed server to the monitoring screen, the operator, contact information and click on the failed server display portion corresponding to the mechanism to pop-up.
【0058】 [0058]
ユーザ側に対するWeb画面では、階層画面構成とし、最初の階層画面では、事業所毎にサービス別ノードをアイコンで稼動状況をリアルタイム表示する。 In the Web screen for the user side, the hierarchy screen configuration, in the first of the hierarchy screen, real-time view of the operational situation of the service-specific node with an icon for each office. この際、正常/注意/異常の3段階評価で色分けして表示する。 At this time, it displayed in different colors in a three-step evaluation of the normal / attention / abnormal. さらに次の階層画面では、パスワード入力を必要とし、障害発生ログによる詳細状態を把握可能な内容を表示し、この画面で警告音を出す仕組みとする。 Furthermore, in the following hierarchy screen, it requires a password input, and display the available grasp contents of the detailed state by the failure log, and a mechanism to issue a warning sound on this screen.
【0059】 [0059]
また、監視対象装置3〜5がイントラネットやインターネット系のサーバであれば、そのプロセス・性能の監視に関してのWeb画面では、最初の画面においては、各監視対象装置3〜5の状態をアイコンで、正常/警告/異常の3階段評価で表示する。 Further, if the monitored device 3-5 is a server intranet and Internet-based, Web screen regarding monitoring of its process performance, in the first screen, in the state of each monitored device 3-5 icon, to display in 3 stairs evaluation of normal / warning / abnormal. 次の階層画面ではチェックシート方式による性能情報を提供し、次の階層画面で、詳細性能情報をテキストベースで提供する仕組みとする。 In the next hierarchy screen to provide performance information by the check sheet method, in the next hierarchy screen, and a mechanism to provide detailed performance information in text-based.
【0060】 [0060]
電子メールサーバの障害に関しては、監視画面に障害箇所を表示してブザーを鳴らし、オペレータが該当する障害箇所をクリックすると、稼動状況一覧画面にリンクし、リンク先では各障害箇所での滞留メッセージ数やSMTPのレスポンス状態等の情報をユーザが瞬時に異常判断できる最小項目をビジュアルにサーバ毎にブロック表示する。 With respect to the failure of the e-mail server, and a buzzer sounds to display the fault location on the monitoring screen, click on the fault location for the operator to appropriate, linked to the operating status list screen, the number of residence messages in each failure point in the link destination and SMTP for information such as the response state user blocks displayed for each server the minimum items that can abnormality determination instantaneously visually.
【0061】 [0061]
尚、小規模な事業所側では、夜間バッチ処理によるサーバ停止が毎晩発生することがある。 It should be noted that in the small office side, there is the server stop by overnight batch processing occurs every night. このような場合に対処するため、本例では、監視一時休止状態表示プログラム11eにより、監視対象から任意な時間帯に解除する。 To deal with such a case, in this embodiment, the monitoring temporary dormant display program 11e, to release any time zone from monitoring.
【0062】 [0062]
さらに、本例では、障害の発生から復旧、稼動月次統計報告作成に至る障害監視運用全過程を、途中、人的操作を介入せず、Web管理画面のみで総合的に一括管理することができる。 In addition, in the present example, recovery from the occurrence of the fault, the fault monitoring operation entire process leading to the operation monthly statistics report created, the way, without the intervention of human manipulation, is possible to comprehensively collectively managed only in the Web management screen it can.
【0063】 [0063]
以下、図1におけるネットワーク監視システムの動作について説明する。 Hereinafter, the operation of the network monitoring system in FIG. 図1において、監視対象装置3は、情報収集エージェントが組み込まれておらず、TCPポートのみで監視される装置である。 In Figure 1, the monitoring target apparatus 3, the collection agent is not incorporated information, is a device to be monitored only in TCP port. TCPポートでの監視としては、例えばサーバ装置の各サービスプロセスの生死状態確認がある。 The monitoring TCP port, for example, a life-or-death state confirmation of each service process of the server apparatus.
【0064】 [0064]
また、監視対象装置4は、TCPポートでの監視を含み、さらに、ワンタイムパスワード認証プログラム44aと、性能監視用エージェントプログラム44b、リモート復旧プログラム44cからなる情報収集エージェント44が組み込まれ、これらのプログラムに基づく監視が行われる。 The monitoring target device 4 comprises a monitor on TCP port, further, the one-time password authentication program 44a, the performance monitoring agent program 44b, the information collection agent 44 consisting of a remote recovery program 44c incorporated, these programs in based monitoring is performed.
【0065】 [0065]
そして、監視対象装置5は、監視対象装置4の構成に、さらに、既に別系統の監視装置2の監視下にある専用情報収集エージェント5Aが組み込まれており、情報収集エージェント44と専用情報収集エージェント5Aとが共存し、両監視が行われる。 The monitored device 5, the configuration of the monitoring target device 4, furthermore, already dedicated information collection agent 5A under surveillance monitoring device 2 of another system is built, only information collection agent information collection agent 44 5A and coexist, both the monitoring is performed.
【0066】 [0066]
これらの監視対象装置3〜5は、ネットワークや広域LANを介して監視装置(ネットワーク監視マネージャ1)に接続され、監視装置において、各監視対象装置3〜5の監視情報が収集され管理される。 These monitored device 3-5 is connected to the monitoring device via a network or a wide area LAN (network monitoring manager 1), in the monitoring device, the monitoring information of each monitored device 3-5 is collected and managed.
【0067】 [0067]
まず、監視対象装置3に対する監視動作について説明する。 It will be described first monitoring operation for monitoring target apparatus 3.
【0068】 [0068]
監視対象装置3の監視は、ネットワーク監視マネージャ1のプロセス/ステータス確認プログラム11cから、状態確認コマンド(PING)を、TCPポート番号設定変更プログラム11b経由(予め該当のTCPポート番号変更指示設定がない場合はデフォルト)で、通信回線6に接続した監視対象装置3のTCP処理部31を介して各TCPポートに接続し、監視対象のTCPポートのプロセス状態を5分間隔(任意設定可)で監視する。 Monitoring of the monitoring target apparatus 3, from the process / status confirmation program 11c network monitoring manager 1, the state confirmation command (PING), if there is no over TCP port number setting change program 11b (previously applicable TCP port number change instruction set by default), via the TCP processing unit 31 of the monitoring target apparatus 3 connected to the communication line 6 is connected to each TCP port to monitor the process state of the TCP port monitored at 5 minute intervals (optional configurable) .
【0069】 [0069]
状態確認コマンド(PING)の無応答を検知すると、「正常/警告/異常」の3区分のうち「警告」に設定する。 Upon detection of a non-response of the state confirmation command (PING), it is set to "warning" of the three categories of "normal / warning / abnormal".
【0070】 [0070]
このように、「警告」を設定すると、図3で示すように、監視タイミング時間変更プログラム11bにより、PINGの発行タイミング時間を、5分間隔から1分間隔(任意設定可)に自動的に短縮し、以降、約10分間、1分間隔で、そのTCPポートに対してTCPセッション確立を試みる。 Thus, when "warning" is set, as shown in Figure 3, by monitoring the timing time changing program 11b, automatically reduce the issuance timing time of PING, to 1-minute intervals every five minutes (optional configurable) and, after about 10 minutes, at 1 minute intervals, attempt TCP session established to the TCP port.
【0071】 [0071]
そこで、確立できない場合のみエラーのメッセージ(Connection refused)を返す。 Therefore, only when it is not possible to establish returns an error message (Connection refused). そのメッセージの存在有無により、プロセス/ステータス確認プログラム11cは、障害を検知し、「異常」区分とする。 By the presence or absence of the message, process / status confirmation program 11c is, detects a failure, and "abnormal" division.
【0072】 [0072]
尚、PINGのレスポンスがあると、プロセス/ステータス確認プログラム11cは、自動的にデフォルトに戻し「正常」区分となる。 It should be noted that, if there is a PING response, process / status confirmation program 11c is made automatically return to the default "normal" category.
【0073】 [0073]
このように、ネットワーク監視マネージャ1では、「警告」を設定すると、PING発行タイミング時間を、5分間隔から1分間隔に自動的に短縮して、そのTCPポートに対するTCPセッション確立を試みることにより、復旧検知時間を早くでき、監視精度向上を図ることが可能である。 Thus, the network monitoring manager 1, the "warning" is set, the PING issuance timing time, automatically shortened from 5 minutes to 1 minute intervals, by attempting a TCP session establishment for the TCP port, can quickly recover detection time, it is possible to achieve monitoring accuracy.
【0074】 [0074]
また、監視タイミング時間変更プログラム11bは、監視対象装置3が固有に持っているシステムログ情報で管理している復旧時刻と、ネットワーク監視マネージャ1の復旧時刻にズレが発生した場合、ネットワーク監視マネージャ1が障害通知のため自動発行する通知メール上に記載される障害発生時刻や復旧時刻およびWeb表示の警告時刻などに時刻差が生じるので、ネットワーク監視マネージャ1が参照する時刻を、監視対象装置3がシステムログ情報の管理に用いている時刻に補正する。 The monitoring timing time changing program 11b includes a recovery time that is monitored devices 3 are managed by the system log information that has unique, if deviation in the recovery time of the network monitoring manager 1 has occurred, the network monitoring manager 1 There because time difference such as the failure time and recovery time and Web display warning time described on the notification mail to be automatically issued for the failure notification occurs, the time at which the network monitoring manager 1 refers, the monitoring target apparatus 3 It is corrected to time that are used to manage the system log information. 複数の監視装置間にまたがった監視情報や性能管理情報の収集時刻などが同期されるので、障害分析を複数のログ情報を突き合わせる原因追跡(時間経緯)では有効となる。 Since such collection time monitoring information and performance management information across between a plurality of monitoring devices are synchronized, the effective CAUSE track to match a plurality of log information failure analysis (time history).
【0075】 [0075]
尚、障害管理Webプログラム11fでは、TCPポートに応答がない場合(「Connection」が「refused」される場合)は「警告」とし、ユーザ側装置や監視センタ装置に提供するWeb画面で表示するアイコンを緑色(正常)から黄色(警告)に変える。 In the failure management Web program 11f, if there is no response to a TCP port (when "Connection" is "refused") is displayed on the Web screen provided with, and the user device and the monitoring center device "warning" icon the change from green (normal) to yellow (warning). そして、監視間隔が1分間隔に切り替わり、さらに、10回連続で応答がない場合(約10分間)に障害として判断し、アイコンを黄色から赤色(異常)に変えアラームを鳴動する。 Then, the monitoring interval is switched to the one-minute intervals, further determines a failure if there is no response (about 10 minutes) at 10 consecutive, icons sounding an alarm changed to red (abnormal) yellow.
【0076】 [0076]
また、監視対象装置の「障害」、「復旧」を検知した場合は、監視条件メッセージ管理データベース15において予め指定されたサーバ管理者に、電子メールを自動発送して通報する。 In addition, the "disorder" of the monitoring target device, if you detect a "recovery", in advance to the specified server administrator in monitoring conditions message management database 15, to report the e-mail is automatically sent out. この監視条件メッセージ管理データベース15におけるユーザ別・サーバ別の通知先や、時間他の指定や担当者のエスカレーション等は任意に設定が可能である。 And another notification destination user-specific server in the monitoring condition message management database 15, escalation such time other designated or personnel can be arbitrarily set.
【0077】 [0077]
自動発送する通知メールの例を下記に示す。 It shows an example of a notification mail to be automatically shipped to below.
【0078】 [0078]
また、監視結果は下記のようにWeb画面上にロギングされる。 The monitoring results are logged in the Web screen as follows. これらログは、常時、過去5日間のログを表示する。 These logs are, at all times, to display a log of the past five days. また、サーバの稼動状態が良好の場合は何も表示されない。 In addition, if the server of the operating state of the good do not see anything.
【0079】 [0079]
【0080】 [0080]
ここで、「Apr/24/2001 02:13:10 nmapp1 disk ok」は、「正常」であり、色識別区分は「緑色」で、緑色に表示され、また「Apr/23/2001 00:13:10 nmapp1 disk warning over 90%」は、「警告」であり、色識別区分は「黄色」で黄色に表示され、そして、「Apr/22/2001 10:06:39 nmapp2 dns (port 53) error」は「異常」であり、色識別区分は「赤色」で、赤色に表示される。 Here, "Apr / 24/2001 02:13:10 nmapp1 disk ok" is a "normal", color identification division in the "green", are displayed in green, also "Apr / 23/2001 00:13 : 10 nmapp1 disk warning over 90% "is" warning ", color identification segment is displayed in yellow" yellow ", and" Apr / 22/2001 10:06:39 nmapp2 dns (port 53) error "is" abnormal ", color identification division in the" red ", is displayed in red.
【0081】 [0081]
障害管理用Webプログラム11fでは、監視対象のTCPポートに応答がない場合、監視一時休止表示プログラム11eからの情報を参照する。 In fault management for Web program 11f, if there is no response to the TCP port monitored, referring to the information from the monitoring temporary pause display program 11e. すなわち、監視一時休止表示プログラム11eは、工事管理情報データベース14を参照し、監視対象装置3の工事停止情報を検索し、障害か工事による停止かを判断し、その結果を障害管理用Webプログラム11fに指示する。 That is, the monitoring temporary pause display program 11e refers to the construction management information database 14, retrieves the work stop information of the monitored device 3, disorder or work by determining whether or stop, resulting fault management for Web program 11f to tell.
【0082】 [0082]
障害外、例えば工事による停止であれば、障害管理用Webプログラム11fは、その時間帯を監視対象外扱いとする。 Outside the failure, if it is stopped, for example by the construction work, Web program 11f for disaster management, to be monitored outside the treats that time period. このように、監視対象外時の場合は、Web画面上に青色のアイコンを表示する。 Thus, when the time unmonitored, displays a blue icon Web screen. このアイコンは通常は使用しないが、計画的停止などによる監視の一時停止時などに表示する。 This icon is usually not used, and displays, such as during a temporary stop of the monitoring by such as planned outages.
【0083】 [0083]
また、この停止時間情報は、稼動月次レポート自動作成プログラム13に蓄積される。 Further, the stop time information is stored in the operation monthly report automatic creation program 13. 稼動月次レポート自動作成プログラム13は、蓄積した情報結果から監視対象装置(サーバ装置等)ごとの月間サービス稼動率とリソース使用率を算出し、サービス稼働率表(稼働率、稼働時間、停止回数、停止時間、警告回数、計画停止回数と時間)と重要障害発生頻度管理(レベル4で区分して色で警告)、および、リソース使用率推移グラフ(閾値との比較表示、週単位比較表示)等からなる稼動月次レポートを自動作成し、状態履歴情報Webコンテンツ生成13aでデータ伝送装置やサーバ装置のシステム障害を事前に予測する情報に加工する。 Operation monthly report automatic creation program 13 calculates a monthly service utilizations and resource usage for each monitored device (server, etc.) from the stored information a result, service uptime table (operation rate, operation time, number of stops , downtime, warning number, planned number of stops and time) is important fault frequency management (warning color classified in level 4), and, comparison display of resource usage trend graph (threshold, weekly comparison display) automatically creates operational monthly report consisting etc., processed into information to predict system failure of the data transmission apparatus and the server apparatus in advance in the state history information Web content generation 13a.
【0084】 [0084]
次に、監視対象装置4に対する監視動作を説明するが、監視対象装置4の「状態監視」に関しては、ネットワーク監視マネージャ1のプロセス/ステータス確認プログラム11cから状態確認コマンド(PING)をTCPポート番号設定変更プログラム11b経由(予め該当のTCPポート番号変更指示設定がない場合はデフォルト)で通信回線7に接続した監視対象装置4のTCP処理部41を介して各TCPポートに接続するもので、監視対象装置3と同様の監視過程であり、以下「性能監視」のみをポイントに説明する。 Next is a description of monitoring operation for monitoring target device 4, the monitoring target device 4 with respect to the "status monitoring" is, TCP port number setting from the process / status confirmation program 11c status confirmation command (PING) network monitoring manager 1 via changing program 11b (if there is no pre-relevant TCP port number change instruction set default) intended to be connected to each TCP port via TCP processing unit 41 of the monitoring target device 4 connected to the communication line 7, the monitored a similar monitoring process and device 3, the following describes only "performance monitoring" point.
【0085】 [0085]
監視対象装置4において、性能監視用エージェントプログラム44bは、情報収集エージェント44に組み込んだサブプログラムであるが、性能監視用エージェントプログラム44b単体でも機能するものであり、CPU負荷情報の収集、ディスク使用率情報の収集、メモリ使用率情報の採取、メールキュー情報の採取、プロセス数の収集等を行う。 In the monitoring target device 4, performance monitoring agent program 44b is a subprogram that incorporates the information collection agent 44, which functions in the performance monitoring agent program 44b alone, collect CPU load information, disk usage collection of information, collection of memory usage information, collection of mail queue information, the number of processes of collection, etc. do.
【0086】 [0086]
また、情報収集エージェント44は、ログ情報とのパターンマッチによるアクション動作機能の他に、ネットワーク監視マネージャ1との監視専用TCPポート(例えばポート番号「8888」)での通信機能、ならびに、別系統の監視装置専用に組み込まれた情報収集エージェントと共存を可能とする機能を有し、さらに、ワンタイムパスワード認証プログラム44a、性能監視用エージェントプログラム44b、リモート復旧プログラム44cのそれぞれを連携する機能を有する。 The information collection agent 44, in addition to the action operation function by pattern matching with the log information, the communication function of the monitoring dedicated TCP port of the network monitoring manager 1 (e.g. port number "8888"), and, of another system It has the function to enable coexistence information collection agent incorporated in the monitoring device only, further comprising one-time password authentication program 44a, the performance monitoring agent program 44b, the function of linking the respective remote recovery program 44c.
【0087】 [0087]
ネットワーク監視マネージャ1は、プロセス/ステータス確認プログラム11cからTCPポート番号設定変更プログラム11b経由(予め該当のTCPポート番号変更指示設定がない場合はデフォルト)で、監視対象装置4の情報収集エージェント44の性能監視用エージェントプログラム44bを起動させる為のリモートコマンドを、通信回線7に接続した監視対象装置4のTCP処理部41が情報収集エージェント44に専用に割当てたTCPポート(「8888」)を介して発行し、性能監視用エージェントプログラム44bにおいて予め登録されている各種スクリプト(CPU負荷情報収集用、ディスク使用率情報収集用、メモリ使用率情報採取用、メールキュー情報採取用、プロセス数収集用など)を起動させる。 Network monitoring manager 1 is the process / status via TCP port number setting change program 11b from the confirmation program 11c (advance if there is no corresponding TCP port number change instruction set by default), the performance information collection agent 44 of the monitoring target device 4 issued through the TCP port remote commands for activating the monitoring agent program 44b, TCP processing unit 41 of the monitoring target device 4 connected to the communication line 7 is assigned to the dedicated information collection agent 44 ( "8888") and, pre-registered in that various scripts in the performance monitoring agent program 44b (for CPU load information collecting, disk usage information for collection, memory usage information for collection, mail queue information for collection, for example, for the number of processes collect) the the activated cells.
【0088】 [0088]
尚、この際、リモートコマンドには、ワンタイムパスワード発生プログラム11aで生成した、監視対象装置4の情報収集エージェント44の性能監視用エージェントプログラム44bを起動させる為のワンタイムパスワードを付与し、ワンタイムパスワード認証プログラム44aにおいてワンタイムパスワードに基づく認証を行った後に、性能監視用エージェントプログラム44bに発行し起動させる。 At this time, the remote command generated by one-time password generation program 11a, to grant one-time password for starting the performance monitoring agent program 44b for information collection agent 44 of the monitoring target device 4, the one-time after the authentication based on the one-time password in the password authentication program 44a, to start issuing the performance monitoring agent program 44b.
【0089】 [0089]
このように、ワンタイムパスワード認証後に、性能監視用エージェントプログラム44bは、リモートコマンドに対応する性能数値をチェックシート形式で性能監視情報として編集し、プロセス/性能監視プログラム11に送信する。 Thus, after the one-time password authentication, the performance monitoring agent program 44b, edit the performance value corresponding to the remote command as performance monitoring information in the check sheet form, it is sent to the process / performance monitor program 11.
【0090】 [0090]
プロセス/性能監視プログラム11では、障害管理用Webプログラム11fにより、性能監視用エージェントプログラム44bから送られてきた性能数値を予め設定した「しきい値」と比較し、しきい値を超えた(下回った)場合には障害として検知し通報対象とする。 Process / performance monitoring program 11, the fault management for Web program 11f, compared with preset performance numbers sent from the performance monitoring agent program 44b 'threshold', exceeds the threshold (below was) a message object is detected as a failure in the case. 尚、性能監視用エージェントプログラム44bでは、性能監視情報は貯めず、アクセスログ情報のみを残す。 It should be noted that, in the performance monitoring agent program 44b, performance monitoring information is not accumulated, leaving only the access log information.
【0091】 [0091]
性能評価における「ロードアベレージの監視(CPU負荷情報収集)」は、基本的に「uptime」コマンド の結果をもとにCPUの負荷状況を把握し、過去1分平均の値をもとに監視を行う。 "Load average of monitoring (CPU load information collection)" in the performance evaluation, the basic grasp the load status of the CPU on the basis of the result of "uptime" command, monitoring on the basis of the value of the average past 1 minute do. 例えば、FreeBSD(登録商標)の場合、「uptime」 の実行結果は以下のように示される。 For example, in the case of FreeBSD (registered trademark), the execution result of the "uptime" is shown as follows.
【0092】 [0092]
【0093】 [0093]
上記「load average」以下の項目(0.10, 0.09, 0.08)を取得し、しきい値と比較させ、それを上回った場合に警告とする。 The "load average" the following items (0.10, 0.09, 0.08) acquires, is compared with a threshold value, and warning if exceeded it. この状態がしばらく続くと障害として検知する。 This state is detected as continue for some time when a failure.
【0094】 [0094]
このように、しきい値を超えた時すぐに障害を検知するのではなく、しきい値を超えた状態が続くようなら障害と認識する。 Recognized in this way, rather than a failure is detected immediately when the threshold is exceeded, a failure so if the state that exceeds the threshold is followed. 尚、警告期間は任意に設定可能である。 Note that warning period can be arbitrarily set.
【0095】 [0095]
また、性能評価における「ディスク使用率の監視」は「df」コマンド の結果をもとにディスクの使用状況を把握し、ファイルシステム単位での監視を行う。 In addition, "Monitoring disk usage" in the performance evaluation is to understand the usage of the disk on the basis of the results of the "df" command, carry out the monitoring of the file system unit. 例えばFreeBSD(登録商標)の場合、「df」の実行結果は以下のようになる。 For example, in the case of FreeBSD (registered trademark), the execution result of the "df" is as follows.
【0096】 [0096]
【0097】 [0097]
ファイルシステム(「Filesystem」)に対応する「Capacity」の値(52%、48%、0%)を取得し、しきい値と比較し、それを超えた場合に障害として検知する。 Corresponding to the file system ( "Filesystem") the value of the "Capacity" (52%, 48%, 0%) to get the, compared to the threshold value, to detect a fault if it exceeds it. ファイルシステムは同時に複数監視可能であるが、しきい値は同一のものとする。 While the file system can more simultaneously monitor, the threshold is the same. 尚、しきい値の指定は2つまで可能とする。 Incidentally, the specified threshold allows up to two.
【0098】 [0098]
また、性能評価における「メモリ使用率の監視」は、基本的に「top」コマンド の結果をもとにメモリの使用状況を把握し、フリーメモリの値をもとに監視を行う。 In addition, "Monitoring Memory Usage" in the performance evaluation is, basically understand the usage of memory on the basis of the results of the "top" command, carry out the monitoring on the basis of the value of free memory. 例えば、FreeBSD(登録商標)の場合、「top」の実行結果は以下に示すようになる。 For example, in the case of FreeBSD (registered trademark), the execution result of the "top" is as shown below.
【0099】 [0099]
【0100】 [0100]
このうち、「Memory:」の行(「Memory: Real: 3628K/22M Virt: 8752K/199M Free: 29M」)のみを選定する。 Among them, the "Memory:" line ( "Memory: Real: 3628K / 22M Virt: 8752K / 199M Free: 29M") to select only. さらに、「Memory:」に関する「Free:」の項目(「29M」)を取得し、しきい値と比較させ、それを下回った場合に障害として検知する。 Furthermore, "Memory:" on "Free:" Get the item ( "29M"), and is compared with a threshold value, to detect a failure when it falls below it. 但し、「top」コマンドが標準でインストールされていない場合があるので、その場合は別途インストールするか、監視できないということになる。 However, the "top" command because there is a case that has not been installed by default, if the case is installed separately, it comes to not be monitored.
【0101】 [0101]
例えば、オペレーティングシステムがLinux(登録商標)の場合、Linux(登録商標)にはメモリ使用状況を表示する専用の「free」コマンドなるものが存在するので、Linux(登録商標)の場合はこの「free」コマンドを使用する。 For example, if the operating system is Linux (registered trademark), since there is made only "free" command to display the memory usage in Linux (registered trademark), in the case of Linux (registered trademark) this "free using the "command. この「free」コマンドの実行例を下記に示す。 It shows an execution example of this "free" command below.
【0102】 [0102]
【0103】 [0103]
この時は、「Mem:」行に対する「free」の値(「23348」)を取得する。 At this time, "Mem:" to get the value of the "free" ( "23348") for the line.
【0104】 [0104]
次に、性能評価における「メールキュー監視」について「Sendmail」を例に説明する。 Next, it will be described as an example the "Sendmail" for "mail queue monitoring" in the performance evaluation.
【0105】 [0105]
「Sendmail」のメールキュー監視は、「mailq」コマンド の結果をもとにメールの滞留状況を把握し、この滞留数をもとに監視を行う。 E-mail queue monitoring of "Sendmail", it is important to know the results based on the residence status of the mail of "mailq" command, to monitor the residence number in the original. 例えば、「Sendmail」の場合の「mailq」の実行結果は以下のようになる。 For example, the execution result of the "mailq" in case of "Sendmail" is as follows.
【0106】 [0106]
【0107】 [0107]
このような実行結果から、メールの滞留数を取得し、しきい値と比較させ、それを超えた場合に障害として検知する。 From such execution results to obtain a staying number of mail, it is compared with a threshold value, to detect a fault if it exceeds it. 尚、メールキューがない場合はメッセージとして「empty」を返すので、これを「0(数値)」として扱う。 It should be noted that, if there is no e-mail queue because it returns the "empty" as a message, treat this as "0 (number)".
【0108】 [0108]
また、他の事例として、グループウェーア系Mailについて説明する。 In addition, as other cases, a description will be given of group-way A-based Mail. このグループウェーア系Mailのメールキュー監視は、上記「Sendmail」のメールキュー監視に加え、グループウェーア系Mailのローカルで使われている「x.400」及び、この「x.400」とSMTPとの掛け橋となる「SMTP Gateway」の持つそれぞれのファイル数をカウントし、それを滞留数として扱うようにする。 E-mail queue monitoring of this group-way A-based Mail, in addition to the e-mail queue monitoring of the above-mentioned "Sendmail", are used in group-way A-based Mail of local "x.400" and, this "x.400" SMTP counting the respective number of files with the the bridge "SMTP Gateway" and, to treat it as a staying number. 尚、「SMTP Gateway」は「x.400」向けと「Sendmail」向けの2つをカウントする。 It should be noted that, "SMTP Gateway" counts the two and for "x.400" for "Sendmail".
【0109】 [0109]
グループウェーア系Mail特有のメール滞留数は、ある特定のディレクトリ上のファイル数をカウントすることで求めることができるので、ファイルをカウントするスクリプトを準備しておき、これを実行することで各々滞留数を取得することができる。 Group Kwai A system Mail specific mail staying number are each retained by some because they can be determined by counting the number of files on a particular directory, leave prepared scripts to count files, do this it is possible to get the number. このようにして取得した滞留数としきい値を比較させ、それを超えた場合に障害として検知する。 In this way, by comparing the obtained number of remaining with the threshold value, it detects a fault if it exceeds it. 尚、監視は「Mail queue」、「x400 queue」、「smtp to x400 queue」、「smtp to Sendmail queue」の4項目それぞれについて可能である。 In addition, monitoring is "Mail queue", "x400 queue", "smtp to x400 queue", it is possible for each of the four items of the "smtp to Sendmail queue".
【0110】 [0110]
さらに、他の事例として、ウイルスチェックサーバの監視は、搭載されたウイルスチェックソフト製品を用いてのメールウィルスチェック専用のメールキューを監視する。 In addition, as other cases, monitoring of the virus check server monitors the e-mail virus check dedicated e-mail queue of using the anti-virus software product that is installed. このメール滞留数もグループウェーア系Mailと同様に、特定のディレクトリ上のファイル数をカウントすることで求めることができる。 The mail staying number is similarly and groups Kwai A system Mail, can be determined by counting the number of files on a specific directory.
【0111】 [0111]
次に、性能評価における「プロセス数監視」は、特定のプロセス数をカウントして、そのカウント数を元に監視するものである。 Next, "the process number monitoring" in the performance evaluation counts a specific number of processes, it is to monitor based on the count number. 代表的なもので言えば、「SendMail」、「Delegate」、「Squid」等である。 In terms of the typical ones, "SendMail", "Delegate", is like "Squid". 対象プロセスを限定するものではないので、カウント可能ものであれば種別は問題ではない。 Because it is not intended to limit the subject process, the type is not a problem as long countable ones.
【0112】 [0112]
例として、「SendMail」のプロセス数を監視する際、以下に示すように、「ps」コマンド にてプロセス一覧を表示させ、その中で 「sendmail」 の文字列を有するものを抜き出す。 As an example, when monitoring the number of processes of "SendMail", as shown below, to display the process list at "ps" command, extracting those with a character string of "sendmail" therein. その抜き出した行数をカウントすることでプロセス数を取得する。 Obtaining the number of processes by counting the extracted and the number of rows.
【0113】 [0113]
【0114】 [0114]
特定プロセス数は、上記のようなプロセス数をカウントするためのスクリプトを準備しておき、これを実行することでプロセス数を取得することができる。 Specific number process in advance to prepare the script for counting the number of processes as described above, it is possible to obtain a number of processes in doing this. 取得したプロセス数としきい値を比較し、それを超えた場合に障害として検知する。 Comparing the acquired number of processes and a threshold, and detects a fault if it exceeds it.
【0115】 [0115]
次に、監視対象装置4に対するリモート復旧動作を説明する。 Next, the remote recovery operation for the monitoring target device 4.
【0116】 [0116]
まず、監視対象装置4上で生じるイベント(HTTP:Hyper Text Transfer Protocol、SMTP:Simple Mail Transfer Protocolの異常終了など)をトリガとして、リモート復旧プログラム44cに予め組み込んだ障害に応じた復旧オペレーションを実行するプログラムやシェルスクリプトを登録しておく。 First, an event that occurs on the monitored device 4 as a trigger (HTTP:: Hyper Text Transfer Protocol, SMTP abnormal termination such as Simple Mail Transfer Protocol), to perform a recovery operation in accordance with the previously incorporated fault to the remote recovery program 44c registering a program or shell script.
【0117】 [0117]
監視対象装置4では、情報収集エージェント44の性能監視用エージェントプログラム44bが、情報記憶部42に格納した装置保有リソースや稼動情報(各種ログファイル含む)を参照し、各種ログファイルでのパタンマッチやコマンド実行結果での監視を行う。 The monitoring target device 4, performance monitoring agent program 44b for information collection agent 44 refers to the device owned resources and operational information stored in the information storage unit 42 (including various log files), the pattern match Ya in various log files carry out the monitoring of the command execution result.
【0118】 [0118]
情報収集エージェント44は、この性能監視用エージェントプログラム44bによる監視結果を、監視装置に組み込まれたネットワーク監視マネージャ1のプロセス/性能監視プログラム11に、障害検知としてトラップを上げる。 Information collection agent 44, the result of monitoring by the performance monitoring agent program 44b, a process / performance monitoring program 11 of the network monitoring manager 1, associated with the monitoring device, raise the trap as fault detection.
【0119】 [0119]
監視装置に組み込まれたネットワーク監視マネージャ1のプロセス/性能監視プログラム11は、この情報を基に、リモート復旧判断プログラム11gから、TCPポート番号設定変更プログラム11bとワンタイムパスワード発生プログラム11a経由で(予め該当のTCPポート番号変更指示設定がない場合はデフォルト)、監視対象装置4の情報収集エージェント44のリモート復旧プログラム44cを起動させる為のワンタイムパスワード付きのリモートコマンドを、通信回線7を介して監視対象装置4に送る。 Process / performance monitoring program 11 of the network monitoring manager 1, associated with the monitoring device, on the basis of this information, the remote recovery determining program 11g, TCP port number setting change program 11b and the one-time password generating program 11a via at (previously If you do not have TCP port number change instruction set of the applicable default), the remote command with a one-time password for activating the remote recovery program 44c of the information collection agent 44 of the monitoring target device 4, monitored via the communication line 7 and it sends it to the target device 4.
【0120】 [0120]
監視対象装置4は、TCP処理部41を介して情報収集エージェント44に専用に割当てたTCPポート番号で、プロセス/性能監視プログラム11と情報収集エージェント44を接続する。 Monitoring target device 4 is a TCP port number allocated to the dedicated information collection agent 44 via the TCP processing unit 41, connects the process / performance monitor program 11 and the information collection agent 44.
【0121】 [0121]
情報収集エージェント44は、プロセス/性能監視プログラム11からのリモートコマンドに付与されたワンタイムパスワードを、ワンタイムパスワード認証プログラム44aで認証させた後に、リモートコマンドに対応して、リモート復旧プログラム44cに対して、予め登録されている障害に応じた復旧オペレーションを実行するプログラムやシェルスクリプトを起動する。 Information collection agent 44, the process / performance monitoring program one-time password that is given to the remote command from the 11, after which was authenticated by the one-time password authentication program 44a, in response to remote commands, to a remote recovery program 44c Te, to start a program or shell script to perform the recovery operation in accordance with the disorders that are registered in advance.
【0122】 [0122]
次に、第3の例として、監視対象装置5に対する監視動作について説明する。 Next, a third example will be described monitoring operation for monitoring target device 5.
【0123】 [0123]
この監視対象装置5は、ネットワーク監視マネージャ1を設けた監視装置と、この監視装置とは別系統の監視装置2から同時に監視されるものであり、それぞれ(監視装置)に監視用通信回線8と監視用通信回線9で接続されている。 The monitored device 5, a monitoring device in which a network monitoring manager 1, and the monitoring device is intended to be simultaneously monitored from a monitoring device 2 of another system, and monitoring the communication line 8, respectively (monitor) It is connected by monitoring communications line 9.
【0124】 [0124]
そして、監視対象装置5には、別系統の監視装置2用の情報収集のための別系統の監視装置用の専用情報収集エージェント5Aが設けられ、また、ネットワーク監視マネージャ1側には、中継サーバプログラム12のサブシステムとして、別系統の監視装置の専用情報収集エージェントプログラム12Aが設けられている。 Then, the monitored device 5, only the information collection agent 5A for another system of the monitoring device for the collection of information for monitoring apparatus 2 of another system is provided, also, to the network monitoring manager 1 side, the relay server as a subsystem programs 12, only information collection agent program 12A of another system of the monitoring device is provided. 尚、別系統の監視装置用の専用情報収集エージェント5Aと別系統の監視装置の専用情報収集エージェントプログラム12Aとは同じ機能を有する。 Note that the only information collection agent program 12A of dedicated information collection agent 5A and another system monitoring device for monitoring device of another system having the same function.
【0125】 [0125]
中継サーバプログラム12の統合監視情報管理プログラム12aにより、ネットワーク監視マネージャ1の持つ監視情報と、別系統の監視装置2が持つ監視情報を仮想的に一体化させ、これにより、ネットワーク監視マネージャ1と別系統の監視装置2の監視機能を連携させる。 The integrated monitoring information management program 12a in the relay server program 12, and the monitoring information with the network monitoring manager 1, the monitoring information monitoring device 2 of another system has virtually be integrated, thereby, the network monitoring manager 1 and another linking the monitoring function of the monitoring apparatus 2 of the system.
【0126】 [0126]
以下、例として、別系統の監視装置2には、商用UNIX(登録商標)系のリモート復旧機能があるが、PC−UNIX(UNIX:登録商標)系(FreeBSD(登録商標)、Linux(登録商標)など)に対しては監視機能が無くリモート復旧対象外であるとし、また、ネットワーク監視マネージャ1には、PC−UNIX(UNIX:登録商標)のプロセス監視と性能監視および復旧機能を有するがリモートでの復旧機能が無いものと想定し、このような環境において、監視対象装置5でHTTPの障害が発生する際の動作処理を、図4を用いて説明する。 Hereinafter, as an example, the monitoring device 2 of another system, there is a remote recovery capability of commercial UNIX (registered trademark) system, PC-UNIX (UNIX: registered trademark) (FreeBSD (registered trademark), Linux (registered trademark ) and a remote recovery exempt no monitoring for such), also to the network monitoring manager 1, PC-UNIX (UNIX: has a process monitoring and performance monitoring and recovery capabilities of the registered trademark) remote assume recovery function is not in, in such an environment, the operation processing when the HTTP fault on a monitored device 5 is generated will be described with reference to FIG.
【0127】 [0127]
このような監視対象装置5でHTTPの障害が発生すると(▲1▼)、監視対象装置5に設けた情報収集エージェント54におけるサブプログラムの性能監視用エージェントプログラム54bで検出し、ログ情報に記録する(▲2▼)。 When such monitored devices 5 in the HTTP failure (▲ 1 ▼), detected by the performance monitoring agent program 54b subprograms in the monitoring target apparatus 5 to the information collection agent 54 provided to record the log information (▲ 2 ▼).
【0128】 [0128]
ネットワーク監視マネージャ1は、プロセス/ステータス確認プログラム11cにより、所定の時間間隔でサブプログラムの性能監視用エージェントプログラム54bからログ情報を取得し、監視対象装置5でのHTTP障害を検知する(▲3▼)。 Network monitoring manager 1, the process / status confirmation program 11c, to retrieve the log information from the performance monitoring agent program 54b subprogram at predetermined time intervals and detects the HTTP failure on the monitored device 5 (▲ 3 ▼ ).
【0129】 [0129]
このように、監視対象装置5でのHTTP障害を検知すると、監視タイミング時間調整変更プログラム11dにより、プロセス/ステータス確認プログラム11cによる性能監視用エージェントプログラム54bからのログ情報の取得時間間隔を短く、例えば、5分間隔から1分間隔にする。 Thus, when detecting the HTTP failure on the monitored device 5, by monitoring the timing time adjustment changing program 11d, shorten the acquisition time interval of the log information from the performance monitoring agent program 54b due to process / status confirmation program 11c, e.g. , to 1 minute intervals from 5-minute intervals.
【0130】 [0130]
また、この際の障害状況により、障害管理用Webプログラム11fにおいて、警告、障害、アラーム鳴動等、段階的にレベル分けしたWeb通報情報を生成し、ユーザ側および監視センタに送出する。 Further, the fault conditions during this, the Web program 11f for fault management, warning, fault, alarm sounding, etc., and generates a Web report information stepwise Placement and sends it to the user side and the monitoring center.
【0131】 [0131]
また、プロセス/ステータス確認プログラム11cで監視対象装置5のHTTP障害を検知すると、リモート復旧判断プログラム11gが、当該障害に対するリモートでの復旧機能の有無を判別する。 Further, when detecting the HTTP failure monitored device 5 in the process / status confirmation program 11c, remote recovery determination program 11g is, to determine the presence or absence of recovery functions remotely with respect to the disorder. ここでは、当該障害に対する復旧機能は有するがリモートでの復旧機能は無いとの判別結果となり、リモート復旧判断プログラム11gから障害管理用Webプログラム11fに復旧指示が出力される。 Here, you have the recovery function for the failure, but will result of judgment that there is no recovery capabilities for remote recovery instruction from the remote recovery determining program 11g fault management Web program 11f is output.
【0132】 [0132]
このリモート復旧判断プログラム11gから出力される復旧指示およびプロセス/ステータス確認プログラム11cで取得した性能監視ログ情報を、障害管理用Webプログラム11fは、障害復旧情報リスト生成機能11f により、チェックシート情報11f に編集する。 The obtained performance monitoring log information in the recovery instruction and process / status confirmation program 11c is outputted from the remote recovery determining program 11g, Web program 11f for fault management, the failure recovery information list generation function 11f 1, check sheet information 11f edit to 2. このチェックシート情報11f は、別系統の監視装置2との共通化を図るようチェックシート形式となっている。 The check sheet information 11f 2 has a check sheet form so as to achieve the commonality of the monitoring device 2 of another system.
【0133】 [0133]
この編集結果情報は、監視情報同期プログラム(NFS)11f により、NFSを利用して、中継サーバプログラム12の監視情報同期プログラム(NFS)12dに渡され、統合監視情報プログラム12aに伝達される(▲4▼、▲5▼)。 This edit information, the monitoring information synchronization program (NFS) 11f 3, using the NFS, is passed to the monitoring information synchronization program (NFS) 12d of the relay server program 12, is transmitted to the integrated monitoring information program 12a ( ▲ 4 ▼, ▲ 5 ▼).
【0134】 [0134]
このように、統合監視情報プログラム12aにおいては、別系統の監視装置2で登録されている障害ステータス情報をチェックシート(監視対象名称、障害ステータス情報、性能監視ログ情報、障害と同じ扱いで警報する情報)形式で登録し、このチェックシート情報12a に基づき、別系統の監視装置用の専用情報収集エージェントプログラム12Aが、監視対象装置5のHTTP障害を検知する。 Thus, in the integrated monitoring information program 12a, to alert the fault status information registered in the monitoring unit 2 of another system check sheet (monitored name, fault status information, performance monitoring log information, the same treatment as failures registered in the information) format, based on the check sheet information 12a 1, only information collection agent program 12A for monitoring device of another system senses an HTTP failure of the monitored device 5.
【0135】 [0135]
別系統の監視装置用の専用情報収集エージェントプログラム12Aによる監視対象装置5のHTTP障害の検知動作に基づき、統合監視情報プログラム12aは、チェックシート情報12a における「HTTP復旧指示」を読み出し、ソケットプログラム12cを介して別系統の監視装置2に伝送し、別系統の監視装置2に対してリモート復旧指示のトラップをあげる(▲6▼)。 Based on the detection operation of the HTTP failure monitored device 5 with dedicated information collection agent program 12A for monitoring device of another system, the integrated monitoring information program 12a reads the "HTTP restoration instruction" in the check sheet information 12a 1, socket program 12c is transmitted to the monitoring apparatus 2 of another system through, raise the trap of remote recovery instruction to the monitoring apparatus 2 of another system (▲ 6 ▼).
【0136】 [0136]
この別系統の監視装置2は、通常は、障害検知機能23により障害を検知すると、障害復旧用テンプレート21に従いリモート復旧処理を行うが、ここでは、PC−UNIX(UNIX:登録商標)対応の復旧オペレーションを実行するプログラムやシェルスクリプトが無いので、監視対象装置5の情報収集エージェント54の当該リモート復旧プログラム54cを起動するために、ソケットプログラム21aを、予めリモート復旧機能22のアドオンソフトとして、障害復旧用テンプレート21に登録しておく。 Monitoring device 2 of the system different, usually when a failure is detected by the failure detection function 23, performs the remote recovery process in accordance with disaster recovery template 21, here, PC-UNIX (UNIX: registered trademark) corresponding recovery the program or shell scripts to perform operations is not, in order to start the remote recovery program 54c of the information collection agent 54 of the monitored device 5, a socket program 21a, as previously add-on software for the remote recovery function 22, failure recovery It is registered to use the template 21.
【0137】 [0137]
これにより、別系統の監視装置2は、ソケットプログラム21bを介して接続された監視対象装置5に、情報収集エージェント54のリモート復旧プログラム54cの復旧オペレーションを実行するプログラムやシェルスクリプトをリモートコマンド発行し(▲7▼)、監視対象装置5においてHTTP復旧オペレーションプログラム54c により復旧処理を行う(▲8▼)。 Thus, the monitoring device 2 of another system is a monitoring target device 5 connected via the socket program 21b, a program or shell script that performs the recovery operation of the remote recovery program 54c of the information collection agent 54 issues a remote command (▲ 7 ▼), the monitored devices 5 performs recovery processing by HTTP recovery operation program 54c 1 (▲ 8 ▼).
【0138】 [0138]
尚、監視対象装置5において、別系統の監視装置2の配下用に組み込まれている別系統監視装置用専用の情報収集エージェント5Aと、ネットワーク監視マネージャ1配下の情報収集エージェント54とは、情報記憶部52に格納されている装置保有リソース情報や稼動情報から共通に情報を収集するので、情報の同期ズレなどは発生しない。 Note that in the monitored device 5, is a system different monitoring device for dedicated information collection agent 5A incorporated in a subordinate of another system of the monitoring device 2, the network monitoring manager 1 subordinate to the information collection agent 54, the information storage since common to collect information from a device owned resource information and operation information stored in section 52, such as the synchronization deviation information does not occur.
【0139】 [0139]
このように、監視対象装置5の監視機能を連携して利用することにより、このマルチベンダ環境下での複数の監視装置の監視運用の統合化が実現できる。 Thus, by utilizing in conjunction with monitoring of the monitoring target device 5, integration of monitoring operation of a plurality of monitoring devices in the multi-vendor environment can be realized.
【0140】 [0140]
次に、このようなマルチベンダ環境下での複数監視装置の監視機能の連携(トレース)動作に関して、監視対象装置5におけるディスク使用率やログ情報などの性能を監視する動作を例に説明する。 Next, with respect to linkage (trace) operation of the monitoring function of a plurality monitoring device in such a multi-vendor environment, the operation of monitoring the performance of such a disk usage and log information in the monitoring target device 5 as an example.
【0141】 [0141]
ネットワーク監視マネージャ1から監視対象装置5に組込みこまれた情報収集エージェント54の性能監視用エージェントプログラム54bに性能監視情報を収集するためにポーリングを実施する。 Implementing polling to collect performance monitoring information to the performance monitoring agent program 54b for network monitoring manager 1 from the monitored device 5 for incorporation crowded information collection agent 54.
【0142】 [0142]
情報収集する内容は、例えば、「Load average 0.13」、「Free Memory 175M」、「file system (/) 29%」、「file system (/usr) 62%」、「file system (/var) 100%」、「file system (/var/mail) 0%」、「file system (/var/spool/mqueue) 0%」、「inetd o」、「syslogd update o」、「named o」、「sendmail process 1」、「Mail queue 0」、「delegate process 1」、「messages Apr 20 05:36:03 監視対象装置5 kernel: /var: optimization changed f The contents of information collected, for example, "Load average 0.13", "Free Memory 175M", "file system (/) 29%", "file system (/ usr) 62%", "file system (/ var) 100% "," file system (/ var / mail) 0% "," file system (/ var / spool / mqueue) 0% "," inetd o "," syslogd update o "," named o "," sendmail process 1 "," Mail queue 0 "," delegate process 1 "," messages Apr 20 05:36:03 monitored devices 5 kernel: / var: optimization changed f om SPACE to TIME Apr 22 03:10:04 監視対象装置5 kernel: /var: optimization changed from TIME to SPACE」等となる。 om SPACE to TIME Apr 22 03:10:04 monitored devices 5 kernel: / var: the optimization changed from TIME to SPACE ", and the like.
【0143】 [0143]
ネットワーク監視マネージャ1は、上記データをテンポラリファイルとして保存し、予め監視設定ファイルに設定されたしきい値と比較し、監視対象装置5の障害発生の判定を行う。 Network monitoring manager 1 stores the data as a temporary file, compared with the set threshold in advance monitoring configuration file, it is determined failure monitored device 5. 比較終了後、このテンポラリファイルは削除される。 After the end of comparison, this temporary file is deleted.
【0144】 [0144]
例えば、ディスク使用率がしきい値を越えて障害状態となった場合、障害管理用Webプログラム11fにおいて、チェックシート情報11f を生成して、このチェックシート情報11f をNFSでファイルシェアをしている中継サーバプログラム12から、別系統の監視装置用の専用情報収集エージェントプログラム12Aを経由し、別系統の監視装置2に、この障害情報を通知する。 For example, if the disk usage becomes fault condition exceeds the threshold value, the Web program 11f for fault management, and generates a check sheet information 11f 1, and the file sharing the check sheet information 11f 1 in NFS after that the relay server program 12, via a dedicated information collection agent program 12A for monitoring device of another system, the monitoring device 2 of another system, and notifies the failure information.
【0145】 [0145]
障害管理用Webプログラム11fでは、別系統の監視装置の監視下の障害を検知したことをオペレータコンソール画面などに警告等する。 In fault management for Web program 11f, a warning such as the detection of the failure of the monitored of another system of the monitoring device, such as an operator console screen. また、リモート復旧判断プログラム11gにおいて、別系統の監視装置2内のリモート復旧機能22の復旧対象か否か判定する。 Further, in the remote recovery determining program 11g, determines whether recovery target or not the remote recovery function 22 of another system of the monitoring device 2.
【0146】 [0146]
復旧対象の場合、ソケットプログラム12cにより、別系統の監視装置2にアドオンソフトとして組み込まれたソケットプログラム21aを介して、リモート復旧機能22にある障害復旧用テンプレート21(ディスク障害復旧手順)を動作させ、監視対象装置5に組み込んだネットワーク監視マネージャ1の監視下にある情報収集エージェント54のリモート復旧プログラム54c内のディスク障害復旧プログラムに起動をかける。 If the recovery target, the socket program 12c, via a socket program 21a incorporated in the monitoring device 2 of another system as add-on software to operate the disaster recovery template 21 in the remote recovery function 22 (disk failure recovery procedure) applies a boot disk failure recovery program in the remote recovery program 54c of the information collection agent 54 under surveillance of the monitored device network monitoring manager 1 incorporating the 5.
【0147】 [0147]
このようにして、別系統の監視装置2からの上記アクセスを受け付けた監視対象装置5はネットワーク監視マネージャ1の監視下にある情報収集エージェント54の専用ディレクトリ下のbinディレクトリ下に予め用意された復旧オペレーションプログラム(「disk_recover.sh」)を実行する。 In this way, the recovery monitored device 5 which has received the access from the monitoring device 2 of another system prepared in advance under the bin directory under only directory of the network monitoring manager 1 under surveillance information collection agent 54 to perform an operation program ( "disk_recover.sh").
【0148】 [0148]
次に、図1における監視装置に組み込まれたネットワーク監視マネージャ1の稼働月次レポート自動作成プログラム13の動作を説明する。 Next, the operation of the operation monthly report automatic creation program 13 of the network monitoring manager 1, associated with the monitoring apparatus in FIG.
【0149】 [0149]
稼動月次レポート自動作成プログラム13は、図4で示す統合監視情報管理プログラム12aのチェックシート情報12a から,監視対象装置の月間のサービス稼働率とリソース使用率を算出し、「サービス稼働率表」と「リソース使用率推移グラフ」の月次レポートを作成する機能である。 Operation monthly report automatic creation program 13, a check sheet information 12a 1 of the integrated monitoring information management program 12a shown in Figure 4, calculates a service availability and resource utilization monthly monitored device, "service uptime Table "to be the ability to create a monthly report of" resource utilization transition graph ". 作成するレポートの詳細と画面を、図5および図6に示す。 The details and the screen of the report to create, shown in FIGS.
【0150】 [0150]
図5は、図1における稼動月次レポート自動作成プログラムで作成されるサービス稼働率表の構成項目内容例を示す説明図であり、図6は、図1における稼動月次レポート自動作成プログラムで作成されるリソース使用率推移グラフの構成項目内容例を示す説明図である。 Figure 5 is an explanatory diagram showing a configuration item content example of the service uptime table created by operation monthly report automatic creation program in FIG. 1, FIG. 6 is created in operation monthly report automatic creation program in FIG. 1 it is an explanatory diagram showing a configuration item content example of resource utilization transition graph to be.
【0151】 [0151]
図5に示すように、月間の「サービス稼働率」は、「項目」と「単位」および「説明」欄からなり、例えば、「稼働率」は、「%」を単位とした、計画停止時間を除いた、稼働時間の割合であり、「(稼働率)=(稼働時間)/((全対象時間)−(計画停止時間))」の式で求められ。 As shown in FIG. 5, "Service uptime" monthly consists "unit" and "description" column and "item", for example, "uptime" is in units of "%", planned downtime excluding a ratio of operating time, "(operating rate) = (operating time) / ((total target time) - (planned downtime))" obtained by the equation.
【0152】 [0152]
また、「稼働時間」は、「分」を単位としたサービス稼動時間であり、「(稼働時間) = (全対象時間)−(計画停止時間)−(停止時間)」の式で求められ、「停止回数」は「回」を単位に、サービスが停止した回数で計画停止は除いた値となり、「停止時間」は「分」を単位に、サービスが停止した時間で計画停止は除いた値となり、「警告(応答遅延)回数」は「回」を単位に、サービス停止までには至らないが,応答遅延を検出した回数が記録され、「計画停止回数」は「回」を単位に、計画停止した回数が記録され、「計画停止時間」は「分」を単位に、計画停止した時間が記録される。 In addition, "uptime" is a service running time in units of "minute", prompted by the formula "(running time) = (total target time) - - (planned downtime) (stop time)", to "stop count" is the unit the "times", the service becomes a value planned stop that except in the number of times you stop, in units of "stop time" is "minute", value service, excluding the planned shutdown in the time that has stopped next, "warning (response delay) the number of times" is in units of "times", but does not reach the point service stop, the number of times that detects a response delay is recorded, "planning the number of stops" is in units of "times", number of planned stops are recorded, "planned downtime" is in units of "minute", the time you have planned stop is recorded.
【0153】 [0153]
そして、「停止時間レベル別停止回数」は「回」を単位に、サービスが停止した時間の長さ別の停止回数で計画停止は除く値が記録される。 Then, the "specific number of stops stopping time level" units "times", the service is a value except for planned outages length different number of stops of time stopped is recorded. また、この「停止時間レベル別停止回数」においては、デフォルトの停止レベルは,「レベルA:2時間以上」、「レベルB:1時間以上2時間未満」、「レベルC:30分以上1時間未満」、「レベルD:30分未満」で、停止レベルを規定する停止時間は,設定変更可能である。 Also, in this "per number of stops downtime level" default shutdown level, "Level A: 2 hours or more", "Level B: less than 1 hour or more 2 hours", "Level C: 30 minutes or more 1 hour less than "," level D: less than 30 minutes ", stop time defining the stop level is configurable.
【0154】 [0154]
尚、月をまたがる停止/警告/計画停止は,前後の月でそれぞれ停止/警告/計画停止回数にカウントする。 Incidentally, stop / warning / planned stop across the month counts each stop / warning / planned number of stops before and after month. また,停止時間レベルも,前後の月でそれぞれの停止時間により計算する。 Also, the stop time level is calculated by the respective stopping time before and after a month. また、停止/警告時間に引き続いて計画停止に入った場合,計画停止前で,1回の停止/警告とカウントする。 Also, if you went into the planned shutdown following the stop / warning time, in front of planned outages, to count one of a stop / warning. さらに、ping監視で停止/警告と判定された時間は,全てのサービスも停止/警告と判定された時間とする。 Furthermore, the time it is determined that the stop / warning ping monitoring also the time it is determined that the stop / warning all services.
【0155】 [0155]
「リソース使用率推移グラフ」は、ディスクやメモリなどのサーバリソースについて,対象月間中の使用率の推移を示すグラフであり、その構成項目内容は、図6に示すように、「項目」と「単位」および「説明」欄からなる。 "Resource Utilization transition graph", for server resources such as disks and memory, and a graph showing changes in the utilization in the subject month, its configuration field contents, as shown in FIG. 6, the "items", " unit "and consists of a" description "column.
【0156】 [0156]
例えば、「ディスク使用量」は、「%」を単位として、各パーティションの日毎の最大使用率をプロットした推移グラフとなり、「空メモリ量」は、「Mbyte」を単位に、空メモリ量の日毎の最小量をプロットした推移グラフとなり、「CPU負荷平均」は、CPU負荷平均の日毎の最大値と平均値をプロットした推移グラフとなる。 For example, "Disk Usage" is in units of "%", it is transition graph plotting the maximum utilization of the daily each partition, "Check Memory amount", in units of "Mbyte", daily empty memory capacity the minimum amount will trend graph plotting the "CPU load average" is a transition graph plotting the maximum and average daily CPU load average.
【0157】 [0157]
以上、図1〜図6を用いて説明したように、本例では、マルチベンダ環境の分散コンピュータネットワークシステムにおける各監視対象装置のリモート監視を行うシステムとして、各監視対象装置(データ伝送装置やサーバ装置)に情報収集エージェントを、また、監視装置にネットワーク監視マネージャを組み込み、監視対象装置において、情報収集エージェントにより、別系統の監視装置専用に組込まれた情報収集エージェントと共存させ、複数台の監視装置と情報共用を実現することにより、マルチベンダ環境のコンピュータネットワークシステムにおける各監視サポートを統合して行う。 As described above with reference to FIGS. 1 to 6, in the present embodiment, as a system for remote monitoring of the monitored devices in a distributed computer network system of multi-vendor environment, each monitored device (data transmission device and a server the information collection agent to the apparatus), also incorporate network monitoring manager monitoring device, the monitoring target device, the information collection agent, coexist with the information collection agent incorporated in the monitoring device only of another system, the plurality of monitoring by implementing an apparatus and information sharing is performed by integrating the monitoring support in a computer network system of multi-vendor environment.
【0158】 [0158]
また、監視装置と監視対象装置間にワンタイムパスワードによる認証を行う機能を設けることで、監視装置になりすましてのユーザ側の監視対象装置への不正侵入を防止することが可能となる。 Further, by providing the function of performing authentication by one time password between the monitoring device and the monitoring target device, it is possible to prevent unauthorized entry into the user side of the monitored device pretending to monitor.
【0159】 [0159]
また、障害単位で担当者リスト、電話連絡の有無、重要度を示すメッセージを監視センタ装置やユーザ装置に表示する機能を設けることで、センタおよびユーザ側において、障害を誰に伝えればよいかの検索が容易となり、迅速な通報等が可能となる。 Further, representative list disorder units, whether telephone contact, by providing the ability to display to the monitoring center device and the user device a message indicating the importance of, the center and the user side, of whom may tell failures search becomes easy, quick report, etc. is possible.
【0160】 [0160]
また、NFS技術を利用して、監視情報が保存されるそれぞれの監視装置間をネットワーク結合する機能を設けることにより、サーバ負荷軽減を図り、かつ、複数の監視装置間の監視情報を同期させ、一元管理することができ、TCOの削減が可能となる。 Further, by using the NFS technology, between each monitoring device monitoring information is stored by providing the ability to network coupling, it aims to server load reduction, and synchronizes the monitoring information between a plurality of monitoring devices, can be centrally managed, it is possible to reduce the TCO.
【0161】 [0161]
また、ログ情報に用いられるアドレスや識別子、文字の配列などを登録し、ログ情報を検索して、同じパターンを検出した場合、予め登録したアクション動作をさせるパタンマッチ処理機能を設けることにより、SNMPなどのように障害情報をログ上に出力するだけでは不可能な監視も可能となり、さらに、障害検知から通報そして復旧までの障害監視運用過程を自動的に実行することができる。 Also, registered address or identifier used to log information, and sequence of characters, and search log information, when detecting the same pattern, by providing the pattern matching processing functions for the action operation registered in advance, SNMP failure information such as only output on the log also becomes possible not possible monitoring further can automatically perform the failure monitoring operation process until Problem and recovered from the failure detection.
【0162】 [0162]
また、ユーザ側に提供する監視情報は、監視状態を一元的に把握できる構成でWeb画面で提供し、かつ、階層が深くなるほど詳細情報を提供する表示構成とすることにより、ユーザと監視センタの双方向での遠隔監視を実現し、迅速な障害体制の確立が可能となる。 Also, the monitoring information to be provided to the user side, and provides the Web screen monitor state unitarily grasp can be configured, and, by a display configured to provide more detailed information hierarchy becomes deeper, the user and the monitoring center to achieve remote monitoring in both directions, it is possible to establish a rapid fault system.
【0163】 [0163]
また、監視情報結果から監視対象装置ごとの計画停止時間を含めた月間サービス稼動率とリソース使用率を算出し、サービス稼働率表(稼働率、稼働時間、停止回数、停止時間、警告回数、計画停止回数と時間)と重要障害発生頻度管理(レベル4区分し色で警告)およびリソース使用率推移グラフ(閾値との比較表示、週単位比較表示)の稼動月次レポートを自動作成してWeb画面で提供する機能を設けることにより、データ伝送装置やサーバ装置等の監視対象装置のシステム障害を事前に予測する情報を提供することが可能となる。 Moreover, to calculate the planned monthly service utilizations including downtime and resource usage for each monitored device from the monitoring information results, service uptime table (operation rate, operation time, number of stops, stop time, a warning number, plan number of stops and time) is important fault frequency management (level 4 partition compared displaying and warning) and resource utilization transition graph (threshold color, Web screen automatically creates the operation monthly reports weekly comparison display) by providing the ability to provide in, it is possible to provide information to predict system failure monitored apparatus such as a data transmission device and a server device in advance.
【0164】 [0164]
このように、本例では、マルチベンダ環境下での物理的ネットワークからアプリケーション層までを対象とした「監視から復旧及び運用管理」のシームレス化を実現させた。 Thus, in this example, it was seamless of the physical network under multi-vendor environment and targets to the application layer "restoration from the monitoring and management." そして、新しい監視技術とWeb技術を活用し、監視センタで障害発生を検知したと同時にユーザ側にもWeb画面で通知する双方向監視による迅速な対応(情報収集/分析から障害検知及びリモート復旧)を可能とした。 Then, utilizing the new monitoring technology and Web technology, rapid response by the bi-directional monitoring to notify the Web screen to simultaneously user side that detects a failure in the monitoring center (fault detection and remote recovery from the information collection / analysis) It made it possible to. また、CS(クライアント・サーバ)技術思想を十分に考慮した運用管理の効率化と省力化を図り、TCO(トータル運用コスト)の削減・信頼性面からの先手管理(データ伝送装置やサーバ装置のシステム障害を事前に予測する)を可能とした。 Further, CS improve efficiency and labor saving (client-server) technical idea sufficiently consider the operation management, TCO forestalling management from reduction and reliability plane of (total operating costs) (data transmission device and a server device It made it possible to predict in advance) a system failure.
【0165】 [0165]
このことにより、監視センタは、いつ障害が発生するか、また発生したら障害内容に応じてその担当者の連絡先を調べて連絡と、その対応指示を待つと言った行為の連続で監視装置画面をたえずチェックするなど常時緊張を強いられていたことから開放される。 Thus, the monitoring center, when a failure occurs or also occur Once you and the contact Check the contact of the person in charge in response to a failure content, continuous monitoring devices screen of the activities said that waiting for the corresponding indication constantly it is released from the fact that had been forced to constantly tension such as to check.
【0166】 [0166]
また、ユーザ側においては、マルチベンダ環境下の監視制限により個別に監視しなければならなかったグループウェーア系Mail、ファイヤーウォールやディレクトリ(LDAP)などの共通アプリケーションソフト監視とその対象OS(FreeBSD(登録商標)、Linux(登録商標)等のPC−UNIX(UNIX:登録商標)系、商用UNIX(登録商標)系やそれ以外のOSなど多岐にわたる)での監視運用と月次稼動報告業務の煩雑さから開放される。 In addition, in the user side, a common application software and monitoring the target OS (FreeBSD, such as a multi-vendor environment group-way A system had to be individually monitored by the monitoring limit of under Mail, firewall or directory (LDAP) ( registered trademark), Linux (registered trademark), and the like of the PC-UNIX (UNIX: registered trademark) system, complexity of monitoring operations and monthly operating report business of commercial UNIX (wide variety, such as registered trademark) system or any other OS) It is released from the.
【0167】 [0167]
この結果、リモート型運用監視・管理サービスへのノウハウ適用範囲が広がった。 As a result, they spread know-how the scope of application of the remote type operation monitoring and management services. 例えば、他社製品と連携する中継サーバ機能により、監視装置のマルチベンダ化による監視業務分散等の問題を解決でき、また、監視システムからサーバ管理担当者毎に障害・復旧状況を自動的に通知する機能により、監視業務の工数を低減でき、また、従来の監視技術では未サポートであるPC−UNIX(UNIX:登録商標)のリモート自動復旧プログラム開発で専門分野の人材確保対応など運用の実務にとっての効果が得られる。 For example, by the relay server function that works with third-party products, can solve the problem of monitoring business dispersion, such as by the multi-vendor of the monitoring device, also, automatically notifies the failure-recovery situation for each server management personnel from the monitoring system by function, it is possible to reduce the man-hours of surveillance work, also, in the conventional monitoring techniques PC-UNIX is not supported: for the practice of the operation, such as securing human resources corresponding areas of expertise at the remote automatic recovery program development of the (UNIX registered trademark) effect can be obtained.
【0168】 [0168]
従って、本例のネットワーク監視システムは、インターネット時代には必須なネットワーク監視技術となる。 Thus, the network monitoring system of the present example, is essential network monitoring technology in the Internet age. 本例の技術を用いないでネットワークを挟んだ分散オフィス先の運用監視をした場合、セキュリティが問題となるので、分散先に監視装置を設置した分散監視運用の体制となり、設備面・運用人員等のコスト面で増大する。 If you have the operation monitoring of distributed across the network office destination without using the techniques of the present example, since security is a problem, become a system of distributed monitoring operation that was installed monitoring equipment to the distribution destination, equipment and operational personnel, etc. an increase in the cost of.
【0169】 [0169]
尚、本発明は、図1〜図6を用いて説明した例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。 The present invention is not limited to the example described with reference to FIGS, various modifications are possible within a scope not departing from the gist thereof. 例えば、図2の説明において、本例では、監視センタとは別の箇所に設置された監視装置が、ネットワーク監視マネージャ1内の障害管理用Webプログラム11fと連動して、ユーザと監視センタへの同時通知を行うものとしているが、情報収集エージェント単体で、ユーザと監視センタへの自動同時通知を行うことでも良い。 For example, in the description of FIG. 2, in this example, the monitoring device installed elsewhere than the monitoring center, in conjunction with the fault management for Web program 11f in the network monitoring manager 1, to the user with the monitoring center Although it is assumed that simultaneous notification, the information collection agent alone, may be by performing an automatic simultaneous notification to the user with the monitoring center. 本例では、複数ユーザへの通知や、障害区分に応じた通知、性能情報やしきい値管理および障害復旧指示などのためのデータベースが必要となるので、エージェントの負荷軽減させるために障害管理用Webプログラム11fと連動させ、この部分の情報を付加しユーザと監視センタへの同時通知をする仕組みとしている。 In this example, the notification and to multiple users, the notification in accordance with the fault classification, since it is necessary database for such performance information and the threshold management and error recovery instruction, a fault management in order to reduce the load Agents in conjunction with the Web program 11f, and a mechanism for the simultaneous notification to the monitoring center user adds information for this part.
【0170】 [0170]
また、図4での説明として本例では、ネットワーク監視マネージャ1に、PC−UNIX(UNIX:登録商標)のリモートでの復旧機能が無いものとしたが、ネットワーク監視マネージャ1に、PC−UNIX(UNIX:登録商標)のリモート復旧機能も持たせることでも良い。 Further, in the present embodiment as described in FIG. 4, the network monitoring manager 1, PC-UNIX: it is assumed there is no recovery function in the remote (UNIX ®), the network monitoring manager 1, PC-UNIX ( UNIX: may also be also have a remote recovery capabilities of the registered trademark). この場合、監視対象装置5におけるHTTP障害の復旧は、別系統の監視装置2を介することなく、ネットワーク監視マネージャ1を設けた監視装置から直接、リモート復旧させることができる。 In this case, the recovery of HTTP disorder in the monitored device 5 without passing through the monitor apparatus 2 of another system, directly from the monitoring device in which a network monitoring manager 1 can be remotely restored.
【0171】 [0171]
また、図4に示す例では、ネットワーク監視マネージャ1が、プロセス/ステータス確認プログラム11cにより監視対象装置5における情報収集エージェント54における性能監視用エージェントプログラム54bのログ情報を読みとることで、監視対象装置5におけるHTTPプログラム53aの障害を検出しているが、ネットワーク監視マネージャ1(プロセス/性能監視プログラム11)から監視対象装置5に対してHTTP監視ポーリングを行い、HTTP監視ポーリングの無応答を検知することで、監視対象装置5におけるHTTPプログラム53aの障害を検出することでも良い。 Further, in the example shown in FIG. 4, the network monitor manager 1, that the process / status confirmation program 11c reads the log information of the performance monitoring for the agent program 54b in the information collection agent 54 in the monitoring target device 5, the monitoring target apparatus 5 by but it detects the failure of the HTTP program 53a, which performs HTTP monitor polls the monitored device 5 from the network monitoring manager 1 (process / performance monitor program 11) detects no response HTTP monitor polling in it may be to detect a failure of the HTTP program 53a in the monitoring target device 5.
【0172】 [0172]
また、本例では、OS(オペレーティングシステム)としてUNIX(登録商標)/OSを用いた構成で説明しているが、他のOSであっても良い。 Further, in this embodiment, OS has been described with a configuration using a UNIX (registered trademark) / OS as (operating system), but may be another of the OS. また、NFSを別系統の監視装置との連携に用いているが、他のネットワークファイルプロトコルを用いることでも良い。 Furthermore, although using the NFS in cooperation with another system of the monitoring device may also be used other network file protocol.
【0173】 [0173]
また、本例のコンピュータ構成例として、光ディスクをプログラムやデータの記録媒体として用いているが、FD(Flexible Disk)等を記録媒体として用いることでも良い。 As examples computer structure of this example, although using an optical disk as a recording medium for a program and data, it may also be used as a recording medium FD (Flexible Disk) or the like. また、プログラムのインストールに関しても、通信装置を介してネットワーク経由でプログラムをダウンロードしてインストールすることでも良い。 Further, with regard install the program may be to download and install the program via a network through a communication device.
【0174】 [0174]
【発明の効果】 【Effect of the invention】
本発明によれば、ネットワーク監視マネージャからネットワークを介した監視対象装置の情報収集エージェント(シェルスクリプト)へ起動をかけるとき、不正利用者から監視対象サーバのシェルスクリプトを実行をできないようにネットワーク監視マネージャと監視対象装置(サーバ装置)間の通信に認証機能を設けたので、ネットワークを利用してもセキュア通信を確保した安全な監視が可能である。 According to the present invention, the network monitoring manager from when applying the boot to the information collection agents for the monitored device via a network (shell script), the monitored server network monitoring manager so that you can not to run shell script from fraudster monitored device is provided with the authentication function for communication between (server apparatus) and, even using a network are possible safe monitoring to ensure secure communications. また、障害発生を検知したと同時にユーザ側もWeb画面で障害を認識できる双方向監視を行うことにより、迅速な対応(情報収集/分析から障害検知及びリモート復旧)が可能である。 Further, by performing the same time the user side bidirectional monitoring can recognize failure Web screen and detects a failure, rapid response (failure detection from the information collection / analysis and remote recovery) is possible. さらには、中継サーバプログラムにより他社製品との連携が可能となり、監視装置のマルチベンダ化による監視業務分散等の問題を解決することができ、例えば、従来の監視技術では未サポートであるPC−UNIX(UNIX:登録商標)等のリモート自動復旧が可能となり、専門分野の人材確保対応など運用の実務にとって効果的である。 Furthermore, the relay enables integration with other products by the server program, it is possible to solve the problem of monitoring operations dispersion due multivendor monitoring device, for example, by conventional monitoring techniques PC-UNIX is unsupported it is possible to: (UNIX registered trademark) remote automatic recovery of such, is effective for the practice of the operation, such as securing human resources corresponding area of ​​expertise. また、各システム管理部門のネットワーク運用者が最も頭を悩ます稼動統計月報作成を高信頼に自動的に作成でき、システム障害の事前予測を高精度に行う情報を提供でき、ユーザと監視センタの双方の運用実務を効率化できる。 Also, be reliable and automatically create a production statistics monthly report created by the network operator is annoy the most head of each system management department, can provide information to pre-prediction of system failure with high accuracy, both the user and the monitoring center operational practices can be efficient.
【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS
【図1】本発明に係わるネットワーク監視システムの構成例を示すブロック図である。 1 is a block diagram showing a configuration example of a network monitoring system according to the present invention.
【図2】図1におけるネットワーク監視システムの第1の動作例を示す説明図である。 FIG. 2 is an explanatory diagram showing a first operation example of the network monitoring system in FIG.
【図3】図1におけるネットワーク監視システムの第2の動作例を示す説明図である。 3 is an explanatory diagram showing a second operation example of the network monitoring system in FIG.
【図4】図1におけるネットワーク監視システムの詳細構成例を示すブロック図である。 4 is a block diagram illustrating a detailed configuration example of a network monitoring system in FIG.
【図5】図1における稼動月次レポート自動作成プログラムで作成されるサービス稼働率表の構成項目内容例を示す説明図である。 5 is an explanatory diagram showing a configuration item content example of the service uptime table created by operation monthly report automatic creation program in FIG.
【図6】図1における稼動月次レポート自動作成プログラムで作成されるリソース使用率推移グラフの構成項目内容例を示す説明図である。 6 is an explanatory diagram showing a configuration item content example of resource utilization transition graph created in operation monthly report automatic creation program in FIG.
【符号の説明】 DESCRIPTION OF SYMBOLS
1:ネットワーク監視マネージャ、1a:ソケットプログラム、2:別系統の監視装置、3〜5:監視対象装置、5A:別系統の監視装置用の専用情報収集エージェント、6〜8:通信回線、9:別系統の監視装置用の通信回線、10:仮想通信経路、11:プロセス/性能監視プログラム、11a:ワンタイムパスワード発生プログラム、11b:TCPポート番号設定変更プログラム、11c:プロセス/ステータス確認プログラム、11d:監視タイミング時間調整変更プログラム、11e:監視一時休止状態表示プログラム、11f:障害管理用Webプログラム、11f :障害復旧情報リスト作成機能、11f :チェックシート情報、11f :監視情報同期プログラム(NFS)、11g:リモート復旧判断プログラム 1: network monitoring manager, 1a: socket program 2: another system of the monitoring device, 3-5: monitoring target device, 5A: private information collection agent for another system of the monitoring device, 6-8: communication line, 9: another system communication line for the monitoring device, 10: virtual communication path, 11: process / performance monitor program, 11a: one-time password generation program, 11b: TCP port number setting change program, 11c: process / status check program, 11d : monitor timing time adjustment change program, 11e: monitoring temporary pause state display program, 11f: fault management for the Web program, 11f 1: Disaster recovery information list creation function, 11f 2: check sheet information, 11f 3: monitoring information synchronization program ( NFS), 11g: the remote recovery determining program 12:中継サーバプログラム、12a:統合監視情報管理プログラム、12a :チェックシート情報、12b:HTML生成プログラム(「HTML生成」)、12c:ソケットプログラム、12d:監視情報同期プログラム(NFS)、12A:別系統の監視装置の専用情報収集エージェント、13:稼働月次レポート自動作成プログラム、13a:状態履歴情報Webコンテンツ生成プログラム(「状態履歴情報Webコンテンツ生成」)、14:工事管理情報データベース、15:監視条件メッセージ管理データベース、21:障害復旧テンプレート、21a,21b:ソケットプログラム、22:リモート復旧機能、23:障害検知機能、31,41,51:TCP処理部(「TCPポート」)、32,42,52:情報記憶部 12: relay server program, 12a: integrated monitoring information management program, 12a 1: check sheet information, 12b: HTML generation program ( "HTML generation"), 12c: socket program, 12d: monitoring information synchronization program (NFS), 12A: only information collection agent of another system of the monitoring device, 13: running monthly reports automatically created program, 13a: state history information Web content generation program ( "state history information Web content generation"), 14: construction management information database, 15: monitoring condition message management database, 21: disaster recovery template, 21a, 21b: socket program, 22: remote recovery capabilities, 23: fault detection function, 31, 41, 51: TCP processing unit ( "TCP port"), 32 and 42 , 52: information storage unit (「装置保有リソース情報や稼働情報」)、33,43,53:アプリケーション処理部(「アプリケーションプログラム」)、44,54:情報収集エージェント、44a,54a:ワンタイムパスワード認証プログラム、44b,54b:性能監視用エージェントプログラム、44c,54c:リモート復旧プログラム、53:アプリケーションプログラム、53a:HTTP、54c :HTTP復旧オペレーションプログラム、54d:ソケットプログラム。 ( "Equipment owned resource information and operating information"), 33, 43, 53: application processing unit ( "application program"), 44, 54: information collection agent, 44a, 54a: one-time password authentication program, 44b, 54b: performance monitoring for the agent program, 44c, 54c: remote recovery program, 53: application program, 53a: HTTP, 54c 1: HTTP recovery operation program, 54d: socket program.

Claims (20)

  1. 監視対象装置に対する監視をネットワークを挟んで監視装置で行うネットワーク監視システムであって、 Monitoring for the monitored device a network monitoring system for monitoring devices across the network,
    上記監視対象装置に設けられ当該監視対象装置の少なくとも性能情報を含む監視情報を収集する情報収集エージェント手段と、 An information collection agent means for collecting monitoring information including at least the performance information of the provided monitoring target apparatus the monitoring target device,
    上記監視装置に設けられ上記情報収集エージェント手段で収集した稼動情報を取得し、該稼動情報に基づき当該監視対象装置における障害の発生を検知する監視マネージャ手段と、 Acquires the operation information collected by said information collection agent unit provided in the monitoring device, the monitoring manager means for detecting the occurrence of a fault in the monitoring target device based on the operation information,
    該監視マネージャ手段が上記情報収集エージェント手段における上記稼動情報を収集する際に、当該監視装置の正当性の認証を行う認証手段とを有することを特徴とするネットワーク監視システム。 Network monitoring system the monitoring manager means when collecting the operational information in the information collection agent means, and having an authentication unit for authenticating the validity of the monitoring device.
  2. 監視対象装置に対する監視をネットワークを挟んで監視装置で行うネットワーク監視システムであって、 Monitoring for the monitored device a network monitoring system for monitoring devices across the network,
    上記監視対象装置に設けられ当該監視対象装置の少なくとも性能情報を含む監視情報を収集する情報収集エージェント手段と、 An information collection agent means for collecting monitoring information including at least the performance information of the provided monitoring target apparatus the monitoring target device,
    上記監視装置に設けられ上記情報収集エージェント手段で収集した監視情報を取得し、該監視情報に基づき当該監視対象装置における障害の発生を検知する監視マネージャ手段と、 Acquires monitoring information collected by the information collection agent means provided in the monitoring device, the monitoring manager means for detecting the occurrence of a fault in the monitoring target device based on the monitoring information,
    該監視マネージャ手段が上記情報収集エージェント手段における上記監視情報を収集する際に、当該監視装置の正当性の認証をワンタイムパスワードによる行う認証手段とを有することを特徴とするネットワーク監視システム。 Network monitoring system the monitoring manager means when collecting the monitoring information in the information collection agent means, and having an authentication unit for authenticating the validity of the monitoring device according to one-time password.
  3. 請求項1、もしくは、請求項2のいずれかに記載のネットワーク監視システムであって、 Claim 1, or a network monitoring system according to claim 2,
    上記情報収集エージェント手段は、収集した監視情報に対して予め記憶装置に記憶された処理を判別して実行するオペレーション手段を有し、少なくとも、発生した障害に対する原因分析処理および復旧処理のいずれか一つを行うことを特徴とするネットワーク監視システム。 The information collection agent means includes operation means for executing prestored device to determine the stored process on the collected monitoring information, at least, one of the cause analysis processing and recovery processing for the failure that has occurred one network monitoring system and performs One.
  4. 請求項1から請求項3のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any one of claims 3,
    上記監視マネージャ手段は、 The monitoring manager means,
    上記情報収集エージェント手段で収集した監視情報を取得する時間間隔を設定する監視タイミング時間調整変更手段を有し、 A supervision timing time adjusting changing means for setting a time interval for acquiring the monitoring information collected by the information collection agent means,
    該監視タイミング時間調整変更手段は、上記監視対象装置での異常発生検知に伴い上記時間間隔を短く変更し、正常状態検知に伴い元に戻すことを特徴とするネットワーク監視システム。 The monitoring timing interval adjusting changing means, a network monitoring system, characterized in that the time interval with the abnormality detection in the monitored device short change, back to the source with the normal state detection.
  5. 請求項1から請求項4のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any of claims 4,
    上記監視マネージャ手段は、 The monitoring manager means,
    上記監視対象装置で動作するアプリケーションプログラムを認識するTCPポートの番号を設定変更するTCPポート番号設定変更手段を有し、 Has a TCP port number setting changing means for setting change the number of recognizing TCP port an application program running on the monitored device,
    該TCPポート番号設定変更手段で設定した番号のTCPポートに対するTCPセッション確立を試みることで、当該アプリケーションプログラムの異常を検知することを特徴とするネットワーク監視システム。 By attempting a TCP session establishment for TCP port numbers set in the TCP port number setting change unit, a network monitoring system and detecting an abnormality of the application program.
  6. 請求項5に記載のネットワーク監視システムであって、 A network monitoring system according to claim 5,
    上記監視マネージャ手段は、 The monitoring manager means,
    上記TCPセッション確立を試みる時間間隔を設定する監視タイミング時間調整変更手段を有し、 A supervision timing time adjusting changing means for setting the time interval to attempt the TCP session establishment,
    該監視タイミング時間調整変更手段は、上記アプリケーションプログラムの異常検知に伴い上記時間間隔を短く変更し、正常状態検知に伴い元に戻すことを特徴とするネットワーク監視システム。 The monitoring timing interval adjusting changing means, a network monitoring system, characterized in that the time interval with the abnormality detection of the application program short change, back to the source with the normal state detection.
  7. 請求項5、もしくは、請求項6のいずれかに記載のネットワーク監視システムであって、 Claim 5, or a network monitoring system according to claim 6,
    上記監視マネージャ手段で参照する時刻を、上記監視対象装置の時刻に合わせて補正する手段を有することを特徴とするネットワーク監視システム。 Network monitoring system characterized by having a means for correcting the time reference in the monitoring manager means, in accordance with the time of the monitored device.
  8. 請求項1から請求項7のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any one of claims 7,
    上記監視マネージャ手段は、 The monitoring manager means,
    上記監視対象装置に対する監視結果情報をWeb画面表示するWeb手段を有することを特徴とするネットワーク監視システム。 Network monitoring system characterized by having a Web means for monitoring result information a Web screen display for the monitored devices.
  9. 請求項8に記載のネットワーク監視システムであって、 A network monitoring system according to claim 8,
    上記監視マネージャ手段は、 The monitoring manager means,
    上記監視結果情報のWeb画面を、当該監視対象装置を利用するユーザの端末装置および予め定められた監視センタ装置に送信して表示する手段を有することを特徴とするネットワーク監視システム。 Network monitoring system, characterized in that it comprises means for displaying the Web screen of the monitoring result information and transmitted to the terminal device and the predetermined monitoring center device of the user who uses the monitored device.
  10. 請求項8、もしくは、請求項9のいずれかに記載のネットワーク監視システムであって、 8., or a network monitoring system according to claim 9,
    上記監視結果情報のWeb画面は、多層構成され、最初の層の画面は、障害の発生を通知する情報を含み、他の層の画面は、少なくとも通報先を含む当該障害に対する対応手順を示す情報を含むことを特徴とするネットワーク監視システム。 Web screen of the monitoring result information is multi-layered structure, information on the screen the first layer, includes information for notifying the occurrence of a failure, the screen of the other layers, showing the corresponding procedure for the fault including at least report destination network monitoring system, which comprises a.
  11. 請求項10に記載のネットワーク監視システムであって、上記他の層の画面に対してパスワード保護を設けることを特徴とするネットワーク監視システム。 A network monitoring system according to claim 10, a network monitoring system and providing a password protection for the screen of the other layers.
  12. 請求項1から請求項11のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any one of claims 11,
    上記監視マネージャ手段は、予め記憶装置に記憶された監視対象装置の工事計画情報を参照して、当該監視対象装置の工事による障害を判別し、該工事による障害を通常の障害と区別可能に表示する休止状態表示手段を有することを特徴とするネットワーク監視システム。 The monitoring manager means, prestored device with reference to the construction plan information stored monitored device, and determine the failure due to construction of the monitoring target device, display failure due 該工 events to be distinguished from the normal failure network monitoring system and having a rest state display means for.
  13. 請求項1から請求項12のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any one of claims 12,
    上記監視マネージャ手段は、障害が発生した監視対象装置に対して、当該障害に対応した復旧指示情報を送出するリモート復旧指示手段を有し、 The monitoring manager means includes the monitoring target device fails, the remote recovery instructing means for sending a restoration instruction information corresponding to the failure,
    上記情報収集エージェント手段は、上記監視マネージャ手段からの復旧指示情報に基づき、当該障害に対して予め定められた復旧処理を行う復旧手段を有することを特徴とするネットワーク監視システム。 The information collection agent means, network monitoring system, characterized in that it comprises a recovery means based on the recovery instruction information from the monitoring manager means, performs predetermined restoration process to the disorder.
  14. 請求項1から請求項13のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any one of claims 13,
    上記監視対象装置に、上記情報収集エージェント手段と、別系統の監視装置用の情報収集エージェント手段とを組み込み、それぞれの情報収集エージェント手段が収集する監視情報を、共通の記憶装置に記憶し、上記監視装置および上記別系統の監視装置のそれぞれで共有して利用することを特徴とするネットワーク監視システム。 In the monitoring target device, and the information collection agent means, built and information collection agent means for monitoring device of another system, the monitoring information each information collection agent means is collected and stored in a common storage device, the network monitoring system, characterized in that use shared by each of the monitoring device and the monitoring device of the specific system.
  15. 請求項14に記載のネットワーク監視システムであって、上記監視マネージャ手段は、 A network monitoring system according to claim 14, the monitoring manager means,
    上記情報収集エージェントから収集した共通監視情報を上記別系統の監視装置と共通に取り扱えるチェックシート情報に変換する生成手段と、 A generating means for converting the common monitoring information collected from the information collection agent on the check sheet information handled in common with the monitoring device of the specific system,
    上記チェックシート情報に基づき当該監視対象装置の上記別系統の監視装置での監視対象の障害を検知する手段とを有することを特徴とするネットワーク監視システム。 Network monitoring system, characterized in that it comprises a means for sensing a failure of monitored by the monitoring device of the another system of the monitored device based on the check sheet information.
  16. 請求項15に記載のネットワーク監視システムであって、上記監視マネージャ手段は、 A network monitoring system according to claim 15, the monitoring manager means,
    検知した上記別系統の監視装置での監視対象の障害が自装置での復旧対象であるか否かを判別する判別手段と、 A determining means for fault monitored in the monitoring device of the detected said another system to determine whether a recovery target in its own device,
    復旧対象でなければ、上記別系統の監視装置に復旧依頼情報を送出する手段を有し、 If not the recovery target, and means for transmitting the recovery request information to the monitoring device of the specific system,
    上記別系統の監視装置は、上記復旧依頼情報に基づき当該監視対象装置の情報収集エージェントに当該障害を復旧するよう指示する手段を有することを特徴とするネットワーク監視システム。 Monitoring apparatus of the another system, network monitoring system, characterized in that it comprises means for instructing to recover the monitoring information collection agent on the failure of the target device based on the recovery request information.
  17. 請求項1から請求項16のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any one of claims 16,
    複数の監視装置のそれぞれで取得した監視情報を記憶する記憶装置を、NFSを含むネットワークファイルプロトコルのいずれかによりネットワーク結合する手段を有することを特徴とするネットワーク監視システム。 Network monitoring system comprising a storage device for storing the acquired monitor information in each of the plurality of monitoring apparatuses, in that it comprises means for the network bound by any network file protocol including NFS.
  18. 請求項1から請求項17のいずれかに記載のネットワーク監視システムであって、 A network monitoring system as claimed in any one of claims 17,
    上記監視マネージャ手段は、予め定められた期間の監視結果に基づき、当該監視対象装置の当該期間における稼動状況を示す情報を生成するレポート作成手段を有することを特徴とするネットワーク監視システム。 The monitoring manager means, network monitoring system, characterized in that on the basis of the monitoring result of the predetermined period has reporting means for generating information representing the operation status during the period of the monitoring target device.
  19. 請求項18に記載のネットワーク監視システムであって、上記レポート作成手段は、 A network monitoring system according to claim 18, said reporting means,
    予め記憶装置に記憶された監視対象装置の工事情報に基づき、当該監視対象装置に対する稼動状況情報を補正する手段を有することを特徴とするネットワーク監視システム。 Based on the construction information of previously stored device-stored monitored devices, network monitoring system, characterized in that it comprises means for correcting the operating status information for the monitored device.
  20. コンピュータを、請求項1から請求項19のいずれかに記載のネットワーク監視システムにおける各手段として機能させるためのプログラム。 Program for causing a computer to function as each unit in the network monitoring system as claimed in any one of claims 19.
JP2002174833A 2002-06-14 2002-06-14 Network monitoring system and program Pending JP2004021549A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002174833A JP2004021549A (en) 2002-06-14 2002-06-14 Network monitoring system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002174833A JP2004021549A (en) 2002-06-14 2002-06-14 Network monitoring system and program

Publications (1)

Publication Number Publication Date
JP2004021549A true true JP2004021549A (en) 2004-01-22

Family

ID=31173704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002174833A Pending JP2004021549A (en) 2002-06-14 2002-06-14 Network monitoring system and program

Country Status (1)

Country Link
JP (1) JP2004021549A (en)

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007005905A (en) * 2005-06-21 2007-01-11 Mitsubishi Electric Corp Monitor object terminal, and monitoring program, system and method
JP2007048266A (en) * 2005-07-11 2007-02-22 Fujitsu Ltd Apparatus, method, and program for tracing audit trail
JP2007148738A (en) * 2005-11-28 2007-06-14 Hitachi Ltd Information monitoring method, system, and program
JP2007156869A (en) * 2005-12-06 2007-06-21 Mitsubishi Electric Corp Alarm management apparatus and alarm management method
JP2008015648A (en) * 2006-07-04 2008-01-24 Yokogawa Electric Corp Application management framework
JP2008102763A (en) * 2006-10-19 2008-05-01 Hitachi Ltd Mail management method, mail system, and display method in mail system
JPWO2006046486A1 (en) * 2004-10-27 2008-05-22 日本電気株式会社 Resource management system, the resource information providing method, and a program
JP2009501386A (en) * 2005-07-12 2009-01-15 ヴィジブル メジャーズ,インク. Distributed acquisition and aggregation of usage information of dynamic applications
JP2009530979A (en) * 2006-03-20 2009-08-27 ソニー・コンピュータ・エンタテインメント・アメリカ・インク Conservation of the evaluation and the integrity of the network device
JP2009205356A (en) * 2008-02-27 2009-09-10 Nec Fielding Ltd Remote reporting system, electronic computer, and remote reporting method
JP2010521749A (en) * 2007-03-14 2010-06-24 マイクロソフト コーポレーション Share of the enterprise security assessment
JP2010232733A (en) * 2009-03-25 2010-10-14 Oki Networks Co Ltd Network monitoring device and network monitoring program
JP2010538551A (en) * 2007-09-03 2010-12-09 アルカテル−ルーセント ユーエスエー インコーポレーテッド Method and system for automatically confirming the connectivity status of ip link on Ip Network
JP2011502307A (en) * 2007-10-26 2011-01-20 ソニー コンピュータ エンタテインメント アメリカ リミテッド ライアビリテイ カンパニー Online resources monitoring
JP2011048539A (en) * 2009-08-26 2011-03-10 Nec Corp Management system, management device, network device, management method, and program
JP2011060323A (en) * 2010-12-06 2011-03-24 Hitachi Ltd Information monitoring method, system, and program
JP2011100283A (en) * 2009-11-05 2011-05-19 Ricoh Co Ltd Management device, equipment management method, equipment management program, recording medium, and equipment management system
US8032502B2 (en) 2006-03-20 2011-10-04 Sony Computer Entertainment America Llc Validation of network devices
JP2012048556A (en) * 2010-08-27 2012-03-08 Toshiba It Service Kk Remote security diagnosis system
US8230001B2 (en) 2004-05-28 2012-07-24 Hewlett-Packard Development Company, L.P. Providing information about a system using scripts
US8266117B2 (en) 2005-07-11 2012-09-11 Fujitsu Limited Method and apparatus for tracing data in audit trail, and computer product
JP2012185577A (en) * 2011-03-03 2012-09-27 Toshiba Tec Corp Application server and monitoring program for the same
JP2012198796A (en) * 2011-03-22 2012-10-18 Nec Corp Log collection system, device, method and program
CN102752167A (en) * 2012-06-05 2012-10-24 东莞市博晟电子科技有限公司 System for monitoring internet site information in real time
JP2012208646A (en) * 2011-03-29 2012-10-25 Nec Corp Monitoring system
US8327140B2 (en) 2006-07-07 2012-12-04 Nec Corporation System and method for authentication in wireless networks by means of one-time passwords
JP2013196219A (en) * 2012-03-16 2013-09-30 Fujitsu Fsas Inc Report preparation device, report preparation program and report preparation method
WO2013153767A1 (en) * 2012-04-13 2013-10-17 株式会社ソニー・コンピュータエンタテインメント Information processing system and media server
JP2014053042A (en) * 2007-11-29 2014-03-20 Barclays Capital Inc Communication enterprise server monitor
US8771061B2 (en) 2006-03-20 2014-07-08 Sony Computer Entertainment America Llc Invalidating network devices with illicit peripherals
US8955105B2 (en) 2007-03-14 2015-02-10 Microsoft Corporation Endpoint enabled for enterprise security assessment sharing
JP2015519630A (en) * 2012-03-30 2015-07-09 アンビエント・コーポレイション Discovery Optimizing Data network device for reducing the data transfer capacity
JP2015228104A (en) * 2014-05-30 2015-12-17 株式会社東芝 Medical image diagnostic device
US9636589B2 (en) 2010-11-02 2017-05-02 Sony Interactive Entertainment America Llc Detecting lag switch cheating in game
US9996372B2 (en) 2015-03-27 2018-06-12 Fujitsu Limited Information processing apparatus, information processing system and program

Cited By (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8230001B2 (en) 2004-05-28 2012-07-24 Hewlett-Packard Development Company, L.P. Providing information about a system using scripts
JPWO2006046486A1 (en) * 2004-10-27 2008-05-22 日本電気株式会社 Resource management system, the resource information providing method, and a program
JP5040311B2 (en) * 2004-10-27 2012-10-03 日本電気株式会社 Resource management system, the resource information providing method, and a program
US8484650B2 (en) 2004-10-27 2013-07-09 Nec Corporation Resource management system, resource information providing method and program for providing resource information relating to a plurality of resources
US8191068B2 (en) 2004-10-27 2012-05-29 Nec Corporation Resource management system, resource information providing method and program
JP2007005905A (en) * 2005-06-21 2007-01-11 Mitsubishi Electric Corp Monitor object terminal, and monitoring program, system and method
JP2007048266A (en) * 2005-07-11 2007-02-22 Fujitsu Ltd Apparatus, method, and program for tracing audit trail
US8266117B2 (en) 2005-07-11 2012-09-11 Fujitsu Limited Method and apparatus for tracing data in audit trail, and computer product
JP2009501386A (en) * 2005-07-12 2009-01-15 ヴィジブル メジャーズ,インク. Distributed acquisition and aggregation of usage information of dynamic applications
JP2007148738A (en) * 2005-11-28 2007-06-14 Hitachi Ltd Information monitoring method, system, and program
JP2007156869A (en) * 2005-12-06 2007-06-21 Mitsubishi Electric Corp Alarm management apparatus and alarm management method
US9526990B2 (en) 2006-03-20 2016-12-27 Sony Interactive Entertainment America Llc Managing game metrics and authorizations
US8622837B2 (en) 2006-03-20 2014-01-07 Sony Computer Entertainment America Llc Managing game metrics and authorizations
US8626710B2 (en) 2006-03-20 2014-01-07 Sony Computer Entertainment America Llc Defining new rules for validation of network devices
US8715072B2 (en) 2006-03-20 2014-05-06 Sony Computer Entertainment America Llc Generating rules for maintaining community integrity
US8972364B2 (en) 2006-03-20 2015-03-03 Sony Computer Entertainment America Llc Defining new rules for validation of network devices
JP4672797B2 (en) * 2006-03-20 2011-04-20 ソニー コンピュータ エンタテインメント アメリカ リミテッド ライアビリテイ カンパニー Conservation of the evaluation and the integrity of the network device
JP2009530979A (en) * 2006-03-20 2009-08-27 ソニー・コンピュータ・エンタテインメント・アメリカ・インク Conservation of the evaluation and the integrity of the network device
US9717992B2 (en) 2006-03-20 2017-08-01 Sony Interactive Entertainment America Llc Invalidating network devices with illicit peripherals
US8771061B2 (en) 2006-03-20 2014-07-08 Sony Computer Entertainment America Llc Invalidating network devices with illicit peripherals
US8032502B2 (en) 2006-03-20 2011-10-04 Sony Computer Entertainment America Llc Validation of network devices
JP2008015648A (en) * 2006-07-04 2008-01-24 Yokogawa Electric Corp Application management framework
US8327140B2 (en) 2006-07-07 2012-12-04 Nec Corporation System and method for authentication in wireless networks by means of one-time passwords
JP2008102763A (en) * 2006-10-19 2008-05-01 Hitachi Ltd Mail management method, mail system, and display method in mail system
US8959568B2 (en) 2007-03-14 2015-02-17 Microsoft Corporation Enterprise security assessment sharing
JP2010521749A (en) * 2007-03-14 2010-06-24 マイクロソフト コーポレーション Share of the enterprise security assessment
US8955105B2 (en) 2007-03-14 2015-02-10 Microsoft Corporation Endpoint enabled for enterprise security assessment sharing
JP2010538551A (en) * 2007-09-03 2010-12-09 アルカテル−ルーセント ユーエスエー インコーポレーテッド Method and system for automatically confirming the connectivity status of ip link on Ip Network
JP2011502307A (en) * 2007-10-26 2011-01-20 ソニー コンピュータ エンタテインメント アメリカ リミテッド ライアビリテイ カンパニー Online resources monitoring
JP2014053042A (en) * 2007-11-29 2014-03-20 Barclays Capital Inc Communication enterprise server monitor
JP2009205356A (en) * 2008-02-27 2009-09-10 Nec Fielding Ltd Remote reporting system, electronic computer, and remote reporting method
JP2010232733A (en) * 2009-03-25 2010-10-14 Oki Networks Co Ltd Network monitoring device and network monitoring program
JP2011048539A (en) * 2009-08-26 2011-03-10 Nec Corp Management system, management device, network device, management method, and program
JP2011100283A (en) * 2009-11-05 2011-05-19 Ricoh Co Ltd Management device, equipment management method, equipment management program, recording medium, and equipment management system
JP2012048556A (en) * 2010-08-27 2012-03-08 Toshiba It Service Kk Remote security diagnosis system
US10092845B2 (en) 2010-11-02 2018-10-09 Sony Interactive Entertainment America Llc Detecting lag switch cheating in game
US9636589B2 (en) 2010-11-02 2017-05-02 Sony Interactive Entertainment America Llc Detecting lag switch cheating in game
JP2011060323A (en) * 2010-12-06 2011-03-24 Hitachi Ltd Information monitoring method, system, and program
JP2012185577A (en) * 2011-03-03 2012-09-27 Toshiba Tec Corp Application server and monitoring program for the same
JP2012198796A (en) * 2011-03-22 2012-10-18 Nec Corp Log collection system, device, method and program
JP2012208646A (en) * 2011-03-29 2012-10-25 Nec Corp Monitoring system
JP2013196219A (en) * 2012-03-16 2013-09-30 Fujitsu Fsas Inc Report preparation device, report preparation program and report preparation method
JP2015519630A (en) * 2012-03-30 2015-07-09 アンビエント・コーポレイション Discovery Optimizing Data network device for reducing the data transfer capacity
WO2013153767A1 (en) * 2012-04-13 2013-10-17 株式会社ソニー・コンピュータエンタテインメント Information processing system and media server
JP2013222249A (en) * 2012-04-13 2013-10-28 Sony Computer Entertainment Inc Information processing system and media server
CN102752167A (en) * 2012-06-05 2012-10-24 东莞市博晟电子科技有限公司 System for monitoring internet site information in real time
JP2015228104A (en) * 2014-05-30 2015-12-17 株式会社東芝 Medical image diagnostic device
US9996372B2 (en) 2015-03-27 2018-06-12 Fujitsu Limited Information processing apparatus, information processing system and program

Similar Documents

Publication Publication Date Title
US7127743B1 (en) Comprehensive security structure platform for network managers
US6243105B1 (en) Drill-down method to historical data in a performance monitor using a platform independent program
US7426654B2 (en) Method and system for providing customer controlled notifications in a managed network services system
US7406517B2 (en) System and method for distributed management of shared computers
US5491791A (en) System and method for remote workstation monitoring within a distributed computing environment
US7383332B2 (en) Method for problem determination in distributed enterprise applications
US6263361B1 (en) Method for calculating capacity measurements for an internet web site
US20060161816A1 (en) System and method for managing events
US20030196148A1 (en) System and method for peer-to-peer monitoring within a network
US7558927B2 (en) System to capture, transmit and persist backup and recovery meta data
US20020095524A1 (en) Method and apparatus for applying policies
EP0952521A2 (en) Method for tracking configuration changes in networks of computer systems through historical monitoring of configuration status of devices on the network
US6754707B2 (en) Secure computer support system
US6314512B1 (en) Automatic notification of connection or system failure in asynchronous multi-tiered system by monitoring connection status using connection objects
US20020198985A1 (en) Post-deployment monitoring and analysis of server performance
US6754664B1 (en) Schema-based computer system health monitoring
US6738933B2 (en) Root cause analysis of server system performance degradations
US7007104B1 (en) Method and apparatus for integrated network management and systems management in communications networks
US20060031476A1 (en) Apparatus and method for remotely monitoring a computer network
US7231403B1 (en) System and method for transformation and analysis of messaging data
US20060233313A1 (en) Method and system for processing fault alarms and maintenance events in a managed network services system
US6529784B1 (en) Method and apparatus for monitoring computer systems and alerting users of actual or potential system errors
US7577701B1 (en) System and method for continuous monitoring and measurement of performance of computers on network
US6985944B2 (en) Distributing queries and combining query responses in a fault and performance monitoring system using distributed data gathering and storage
US7246159B2 (en) Distributed data gathering and storage for use in a fault and performance monitoring system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040324

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060725

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061117