JP2001014188A - 監視システム - Google Patents

監視システム

Info

Publication number
JP2001014188A
JP2001014188A JP11184891A JP18489199A JP2001014188A JP 2001014188 A JP2001014188 A JP 2001014188A JP 11184891 A JP11184891 A JP 11184891A JP 18489199 A JP18489199 A JP 18489199A JP 2001014188 A JP2001014188 A JP 2001014188A
Authority
JP
Japan
Prior art keywords
monitoring
log
computers
monitor
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11184891A
Other languages
English (en)
Inventor
Tatsuya Matsubara
達也 松原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Information Service Co Ltd
Original Assignee
NEC Information Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Information Service Co Ltd filed Critical NEC Information Service Co Ltd
Priority to JP11184891A priority Critical patent/JP2001014188A/ja
Publication of JP2001014188A publication Critical patent/JP2001014188A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)

Abstract

(57)【要約】 【課題】 時間及びコスト低減により、業務稼働状況の
監視適用範囲を拡大することができる監視システムを提
供する。 【解決手段】 複数のコンピュータの業務稼働状況を監
視する監視システムにおいて、各種サーバ等12とネッ
トワークで結び、各種サーバ等12の業務状態を監視し
て各種サーバ等12の出力するログを収集・蓄積・解析
する統合監視部11を有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、監視システムに
関し、特に、オープンシステムにおける業務稼働状況の
監視システムに関する。
【0002】
【従来の技術】従来、複数のコンピュータの業務稼働状
況を監視する場合、人手を介して監視対象である複数の
コンピュータの1台1台に接続し、ログを取得し解析す
ることにより対応していた。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
業務稼働状況を監視する方法では、人が常時監視するた
め、時間やコストがかかり過ぎて監視項目が限られてし
まうことから、適用業務範囲を拡大することができなか
った。
【0004】この発明の目的は、時間及びコスト低減に
より、業務稼働状況の監視適用範囲を拡大することがで
きる監視システムを提供することにある。
【0005】
【課題を解決するための手段】上記目的を達成するた
め、この発明に係る監視システムは、複数のコンピュー
タの業務稼働状況を監視する監視システムにおいて、前
記複数のコンピュータとネットワークで結び、前記複数
のコンピュータの業務状態を監視して前記複数のコンピ
ュータの出力するログを収集・蓄積・解析する統合監視
手段を有することを特徴としている。
【0006】上記構成を有することにより、複数のコン
ピュータの業務稼働状況を監視する監視システムにおい
て、複数のコンピュータとネットワークで結ばれた統合
監視手段が、複数のコンピュータの業務状態を監視して
複数のコンピュータの出力するログを収集・蓄積・解析
する。これにより、時間及びコストが低減され、業務稼
働状況の監視適用範囲を拡大することができる。
【0007】
【発明の実施の形態】以下、この発明の実施の形態につ
いて図面を参照して説明する。
【0008】図1は、この発明の実施の形態に係る監視
システムの構成を示すブロック図である。図1に示すよ
うに、MMS運用保守システム(監視システム)10
は、統合監視部11と、統合監視部11により集中監視
される複数のコンピュータ等からなるサーバ等12とを
有する。
【0009】統合監視部11は、ログ(LOG)収集イ
ンタフェース13、ログ自動監視部14、統計分析部1
5、監視データベース(DB)用記憶手段16、ログ収
集用記憶手段17、及びログ蓄積用記憶手段18を有し
ている。
【0010】サーバ等12としては、例えば、共同利用
型クレジット・オンライン・システム(credit
and finance information s
witching system:CAFIS)サーバ
19、OSSサーバ20、会員管理サーバ21、プロバ
イダ課金サーバ22、明細サーバ23、及び付加価値通
信網(value added network:VA
N)課金システム24等がある。
【0011】ログ収集インタフェース13は、各種サー
バであるコンピュータ毎に設けられており、各種サーバ
へのコマンド発行による各種サーバからの出力ログ及び
システム等からの出力ログを取得する。
【0012】ログ自動監視部14は、監視DB用記憶手
段16の監視DBに基づき、ログ収集インタフェース1
3を介してログ収集用記憶手段17に収集されたログを
チェックする。統計分析部15は、ログ蓄積用記憶手段
18に蓄積されたログデータから統計分析を行う。
【0013】監視DB用記憶手段16には、処理結果/
時間監視情報、到達経路/未到達監視情報、及び処理変
更監視情報等が記憶される。ログ収集用記憶手段17に
は、正常/異常の処理結果、リソースや処理件数の監視
結果等の個別アプリケーション(AP)ログ情報、及び
処理時間、処理結果コード或いはCPU/ELAPS等
のシステムログ情報等が記憶される。
【0014】統合監視部11において、ログ自動監視部
14は、各サーバから常時出力されるログのデータ漏れ
や重複を監視し、また、システム変更時に出力されるロ
グによる処理の論理を監視している。
【0015】このログ自動監視部14からアラーム通知
aが発せられると、オペレータPが、これを察知して、
MMS運用保守システム10の「異常」を認識する。ま
た、統計分析部15から監視DB用記憶手段16へ、統
計情報に基づく分析結果bがフィードバックされる。
【0016】図2は、図1の監視システムによる安定稼
働維持状態を概念的に示す説明図であり、図3は、図1
の監視システムによるシステム変更対応状態を概念的に
示す説明図であり、図4は、図1の監視システムによる
将来性能予測状態を概念的に示す説明図である。
【0017】図2に示すように、監視システム10は、
ログ自動監視により安定稼働を維持する。ログ収集イン
タフェース13は、HIOS−Vを利用したインタフェ
ースを適用し、各サーバに対してコマンドを発行し必要
ログ情報を得る。
【0018】ログ自動監視部14は、ログ自動監視によ
り、件数閾値、発生予定ログ、到着予定経路等の確認に
よるデータ漏れや重複を検出し、処理予定時間、予定件
数との比較によるデータ処理時間や件数妥当性チェック
を行い、処理予定結果との比較によるデータ処理結果の
妥当性チェックを行い、定期的又は処理結果によって監
視対象サーバ側に対しイベント通知やコマンド発行を行
う。
【0019】つまり、各サーバマシンの定期的なログ又
は自動コマンド投入により、自動監視を行うことがで
き、また、ログの実績とあるべき結果を比較してアラー
ム通知aを行う。この結果、障害検出の迅速化、障害発
生の未然防止、及び運用監視工数の削減が可能になる。
【0020】図3に示すように、監視システム10は、
ログ自動監視によりシステム変更に対応する。ログ自動
監視部14は、ログ自動監視により、変更予定結果との
比較によるシステム変更結果の論理チェックを行い、各
種サーバ内で行ったホワイトボックステストの結果の監
視を行い、その他定常的に発生するログの監視によって
システム変更異常の検出を行う。
【0021】つまり、各サーバマシンにおいて行う変更
に対し、統合監視部11側でも予め予想結果を登録して
おくことにより、ホワイトボックステストを実現させ
る。この結果、バグ検出の迅速化及びバグ検出による重
大障害の撲滅が可能になる。
【0022】図4に示すように、監視システム10は、
ログ自動監視によりシステム変更に対応する。統計分析
部15は、ログの蓄積データから各種統計分析を行うと
共に、分析結果bを監視DB16へフィードバックす
る。ログ自動監視部14は、ログ自動監視により、ログ
の蓄積及び監視結果の蓄積を行う。
【0023】つまり、ログ及び監視結果の蓄積データに
より、統計分析を行い、将来の性能予測を行う。この結
果、将来性の紆余即による障害の未然防止、及び分析結
果のフィードバックによる監視閾値の適正化が可能にな
る。
【0024】上述したように、監視システム10によ
り、収集ログが与えられたログ自動監視部14は、収集
ログを判断し異常値を検出するとオペレータPにアラー
ム通知aを行う。また、ログを蓄積し統計分析部15に
供給する。
【0025】即ち、他のコンピュータの状態を監視する
コンピュータを設置し、監視対象のコンピュータをネッ
トワークで結び、その出力するログを収集・蓄積・解析
することにより、システムの安定稼働・維持・システム
変更対応・将来性能予測等を可能にする。
【0026】図5は、図1の監視システムの具体的構成
を示す説明図である。図5に示すように、統合監視部1
1と各種サーバ等12は、インタネットにより接続され
ている。
【0027】CAFISサーバ19(#1〜#3)、O
SSサーバ20(#1,#2)、会員管理サーバ21
(#1,#2)、プロバイダ課金サーバ22(請求用、
月次用#1〜#3)、明細サーバ23、及びVAN課金
システム24の各コンピュータからなる各種サーバ等1
2からのログは、インタネットを介して統合監視部11
に入力する。
【0028】統合監視部11には、CAFIS/OSS
用、会員管理用、VAN課金明細用、プロダイバ課金用
等の個別監視サーバ25や統合監視サーバ26、及び複
数の端末コンピュータ(#1〜#8)等27が設けられ
ており、これらサーバ25,26やコンピュータ等27
は、統合監視部11が設けられた施設28の構内ネット
ワーク・システム(local area netwo
rk:LAN)を介して、接続されている。
【0029】このように、この発明によれば、ログ収集
インターフェース13が複数のコンピュータ等のログを
収集して蓄積し、このログの中からログ自動監視部14
が異常を検知しオペレータに通知することにより、複数
のコンピュータ等の業務状況を1台のコンピュータが集
中監視することができる。
【0030】これにより、監視をシステム化しているの
で、障害検出の迅速化及び運用工数の削減ができると共
に、ログを収集・分析しているので、将来性能予測によ
る障害の未然防止ができる。また、コンピュータに業務
稼働状況の集中監視をさせているので人が常時監視する
必要がなく、運用保守システムの適用範囲拡大に伴って
煩雑な業務が増えたとしても、現状の人員でシステムを
維持・管理することが可能になる。
【0031】
【発明の効果】以上説明したように、この発明によれ
ば、複数のコンピュータの業務稼働状況を監視する監視
システムにおいて、複数のコンピュータとネットワーク
で結ばれた統合監視手段が、複数のコンピュータの業務
状態を監視して複数のコンピュータの出力するログを収
集・蓄積・解析するので、時間及びコストが低減され、
業務稼働状況の監視適用範囲を拡大することができる。
【0032】即ち、人が常時監視する必要がなく、運用
保守システムの適用範囲拡大に伴って煩雑な業務が増え
たとしても、現状の人員でシステムを維持・管理するこ
とが可能になる。
【図面の簡単な説明】
【図1】この発明の実施の形態に係る監視システムの構
成を示すブロック図である。
【図2】図1の監視システムによる安定稼働維持状態を
概念的に示す説明図である。
【図3】図1の監視システムによるシステム変更対応状
態を概念的に示す説明図である。
【図4】図1の監視システムによる将来性能予測状態を
概念的に示す説明図である。
【図5】図1の監視システムの具体的構成を示す説明図
である。
【符号の説明】
10 MMS運用保守システム 11 統合監視部 12 サーバ等 13 ログ収集インタフェース 14 ログ自動監視部 15 統計分析部 16 監視データベース用記憶手段 17 ログ収集用記憶手段 18 ログ蓄積用記憶手段 19 共同利用型クレジット・オンライン・システムサ
ーバ 20 OSSサーバ 21 会員管理サーバ 22 プロバイダ課金サーバ 23 明細サーバ 24 付加価値通信網課金システム 25 個別監視サーバ 26 統合監視サーバ 27 端末コンピュータ等 28 施設 a アラーム通知 b 分析結果
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 15/177 678 G06F 15/177 678A

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】複数のコンピュータの業務稼働状況を監視
    する監視システムにおいて、 前記複数のコンピュータとネットワークで結び、前記複
    数のコンピュータの業務状態を監視して前記複数のコン
    ピュータの出力するログを収集・蓄積・解析する統合監
    視手段を有することを特徴とする監視システム。
  2. 【請求項2】前記統合監視手段は、システムの安定稼働
    とその維持、システム変更対応、及び将来性能予測等を
    行うことを特徴とする請求項1に記載の監視システム。
  3. 【請求項3】前記統合監視手段は、 前記複数のコンピュータのログを収集して蓄積するログ
    収集インターフェースと、 前記ログ収集インターフェースを介して前記複数のコン
    ピュータから常時出力されるログを監視すると共に、収
    集したログの中から異常を検知しオペレータに通知する
    ことにより、前記複数のコンピュータの業務状況を集中
    監視するログ自動監視部とを有することを特徴とする請
    求項1または2に記載の監視システム。
  4. 【請求項4】前記統合監視手段は、 処理結果/時間監視情報、到達経路/未到達監視情報、
    及び処理変更監視情報等が記憶される監視データベース
    用記憶手段と、 正常/異常の処理結果、リソースや処理件数の監視結果
    等の個別アプリケーションログ情報、及び処理時間、処
    理結果コード或いはCPU/ELAPS等のシステムロ
    グ情報等が記憶されるログ収集用記憶手段とを有するこ
    とを特徴とする請求項3に記載の監視システム。
  5. 【請求項5】前記統合監視手段は、 前記ログ自動監視部から出力されたログを蓄積するログ
    蓄積用記憶手段と、 前記ログ蓄積用記憶手段に蓄積されたログデータから統
    計分析を行い、分析結果を前記監視データベース用記憶
    手段へフィードバックする統計分析部とを有することを
    特徴とする請求項4に記載の監視システム。
  6. 【請求項6】前記複数のコンピュータは、共同利用型ク
    レジット・オンライン・システムサーバ、OSSサー
    バ、会員管理サーバ、プロバイダ課金サーバ、明細サー
    バ、及び付加価値通信網課金システム等であることを特
    徴とする請求項1〜5のいずれかに記載の監視システ
    ム。
JP11184891A 1999-06-30 1999-06-30 監視システム Pending JP2001014188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11184891A JP2001014188A (ja) 1999-06-30 1999-06-30 監視システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11184891A JP2001014188A (ja) 1999-06-30 1999-06-30 監視システム

Publications (1)

Publication Number Publication Date
JP2001014188A true JP2001014188A (ja) 2001-01-19

Family

ID=16161134

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11184891A Pending JP2001014188A (ja) 1999-06-30 1999-06-30 監視システム

Country Status (1)

Country Link
JP (1) JP2001014188A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330177A (ja) * 2001-03-02 2002-11-15 Seer Insight Security Inc セキュリティ管理サーバおよびこれと連携して動作するホストサーバ
KR100424418B1 (ko) * 2001-10-26 2004-03-24 주식회사 케이투씨 메인프레임 관리 시스템 및 그 방법과 그의 데이터 분석 장치
WO2006015935A2 (en) * 2004-08-10 2006-02-16 International Business Machines Corporation System and method for automatically discovering and grouping resources used by a business process
US7630955B2 (en) 2004-08-10 2009-12-08 International Business Machines Corporation Apparatus, system, and method for analyzing the association of a resource to a business process
US7661135B2 (en) 2004-08-10 2010-02-09 International Business Machines Corporation Apparatus, system, and method for gathering trace data indicative of resource activity
US8489525B2 (en) 2010-05-20 2013-07-16 International Business Machines Corporation Automatic model evolution

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330177A (ja) * 2001-03-02 2002-11-15 Seer Insight Security Inc セキュリティ管理サーバおよびこれと連携して動作するホストサーバ
KR100424418B1 (ko) * 2001-10-26 2004-03-24 주식회사 케이투씨 메인프레임 관리 시스템 및 그 방법과 그의 데이터 분석 장치
WO2006015935A2 (en) * 2004-08-10 2006-02-16 International Business Machines Corporation System and method for automatically discovering and grouping resources used by a business process
WO2006015935A3 (en) * 2004-08-10 2006-07-06 Ibm System and method for automatically discovering and grouping resources used by a business process
JP2008509494A (ja) * 2004-08-10 2008-03-27 インターナショナル・ビジネス・マシーンズ・コーポレーション ビジネス・プロセスで使用されるリソースを自動的に発見し分類するための装置、システム、および方法
US7546601B2 (en) 2004-08-10 2009-06-09 International Business Machines Corporation Apparatus, system, and method for automatically discovering and grouping resources used by a business process
US7630955B2 (en) 2004-08-10 2009-12-08 International Business Machines Corporation Apparatus, system, and method for analyzing the association of a resource to a business process
US7661135B2 (en) 2004-08-10 2010-02-09 International Business Machines Corporation Apparatus, system, and method for gathering trace data indicative of resource activity
US8489525B2 (en) 2010-05-20 2013-07-16 International Business Machines Corporation Automatic model evolution
US8577818B2 (en) 2010-05-20 2013-11-05 International Business Machines Corporation Automatic model evolution

Similar Documents

Publication Publication Date Title
US6792456B1 (en) Systems and methods for authoring and executing operational policies that use event rates
CN107992398B (zh) 一种业务系统的监控方法和监控系统
US7051244B2 (en) Method and apparatus for managing incident reports
CN110825578A (zh) 用以自动管理发生于数据中心系统的硬件错误事件的方法
CN101233491B (zh) 检测集群环境中动态工作负载调度的不平衡的系统和方法
CN111176879A (zh) 设备的故障修复方法及装置
US8543689B2 (en) Apparatus and method for analysing a computer infrastructure
CN101632093A (zh) 用于使用统计学分析来管理性能故障的系统和方法
US20070168696A1 (en) System for inventing computer systems and alerting users of faults
EP3663919B1 (en) System and method of automated fault correction in a network environment
JP4892367B2 (ja) 異常兆候検出システム
CN112527484B (zh) 工作流断点续跑方法、装置、计算机设备及可读存储介质
US8332690B1 (en) Method and apparatus for managing failures in a datacenter
US20180321719A1 (en) Thermal excursion detection in datacenter components
WO2006117833A1 (ja) 監視シミュレーション装置,方法およびそのプログラム
CN114201201A (zh) 一种对业务系统异常检测方法、装置及设备
CN112783682A (zh) 一种基于云手机服务的异常自动修复方法
CN108769170A (zh) 一种集群网络故障自检系统及方法
US20080071807A1 (en) Methods and systems for enterprise performance management
CN108809729A (zh) 一种分布式系统中ctdb服务的故障处理方法及装置
Ali et al. [Retracted] Classification and Prediction of Software Incidents Using Machine Learning Techniques
JP2001014188A (ja) 監視システム
JP2004145536A (ja) 管理システム
CN112817827A (zh) 运维方法、装置、服务器、设备、系统及介质
CN111813872A (zh) 一种故障排查模型的生成方法、装置、设备