JP5685922B2 - 管理装置、管理プログラム、および管理方法 - Google Patents
管理装置、管理プログラム、および管理方法 Download PDFInfo
- Publication number
- JP5685922B2 JP5685922B2 JP2010282212A JP2010282212A JP5685922B2 JP 5685922 B2 JP5685922 B2 JP 5685922B2 JP 2010282212 A JP2010282212 A JP 2010282212A JP 2010282212 A JP2010282212 A JP 2010282212A JP 5685922 B2 JP5685922 B2 JP 5685922B2
- Authority
- JP
- Japan
- Prior art keywords
- event
- management
- difference
- dependency
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3089—Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/86—Event-based monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/865—Monitoring of software
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Debugging And Monitoring (AREA)
Description
図1は、情報管理システム100の一例を示す説明図である。情報管理システム100は、管理対象装置101と管理対象装置101を管理する管理機能102と統合管理データベース(DB)103を備える。情報管理システム100は、1台のコンピュータでもよく、複数台のコンピュータで構成してもよい。
つぎに、上述した管理対象から発生するイベントのデータ構造について説明する。
図3は、実施の形態で用いられるコンピュータのハードウェア構成を示すブロック図である。図3において、コンピュータは、CPU301と、ROM(Read‐Only Memory)302と、RAM(Random Access Memory)303と、磁気ディスクドライブ304と、磁気ディスク305と、光ディスクドライブ306と、光ディスク307と、ディスプレイ308と、インターフェース(Interface 以下、「I/F」と略する。)309と、キーボード310と、マウス311と、スキャナ312と、プリンタ313と、を備えている。また、各構成部はバス300によってそれぞれ接続されている。
情報管理装置400の機能的構成について説明する。図4は、情報管理装置400の機能的構成を示すブロック図である。情報管理装置400は、図1に示した統合管理機能127に相当する。情報管理装置400は、取得部401と、特定部402と、抽出部403と、判定部404と、決定部405と、算出部406と、保存部407と、を備える。取得部401〜保存部407は、具体的には、たとえば、図3に示したROM302、RAM303、磁気ディスク305、光ディスク307などの記憶装置に記憶されたプログラムをCPU301に実行させることにより、または、I/F309により、その機能を実現する。
図13は、実施例1にかかる管理装置の説明図である。図13に示した管理装置10は、図1に示した統合管理機能127の一部分であり、この例ではCPU#2、VM(Virtual Machine:仮想計算機)#3,6、業務X_DB、業務Y_DBを管理しているものとする。
途中イベント抜けの推定部12の動作について具体例を挙げて説明する。図14は、途中イベント抜けの具体例の説明図(その1)であり、図15は、途中イベント抜けの具体例の説明図(その2)である。図14,図15では、CPU#2、VM#3、業務X_DBのルートをAルート、CPU#2、VM#6、業務Y_DBのルートをBルートとする。
起点イベント抜けの推定部13の動作について具体例を挙げて説明する。図16は、起点イベント抜けの具体例の説明図(その1)であり、図17は、起点イベント抜けの具体例の説明図(その2)である。図16,図17では、CPU#2、VM#3、業務X_DBのルートをAルート、CPU#2、VM#6、業務Y_DBのルートをBルートとする。
つぎに、図4に示した情報管理装置400による管理処理手順について説明する。
11 取得部
12 途中イベント抜けの推定部
13 起点イベント抜けの推定部
14,15 差分算出部
16,17 判定部
100 情報管理システム
101 管理対象装置
102 管理機能
113 業務プロセス
127 統合管理機能
400 情報管理装置
401 取得部
402 特定部
403 抽出部
404 判定部
405 決定部
406 算出部
407 保存部
500 プロセス割当テーブル
600,700,801〜806,901〜906 依存関係情報
Claims (10)
- 第1の管理対象と、前記第1の管理対象で発生した第1のイベントに依存して第2のイベントを発生する第2の管理対象と、前記第2の管理対象で発生した前記第2のイベントに依存して第3のイベントを発生する第3の管理対象とを管理する管理装置であって、
前記第1のイベントの発生時刻と前記第3のイベントの発生時刻との差分を求める差分算出部と、
前記差分算出部が算出した差分が所定時間以内である場合に前記第3のイベントが前記第1のイベントに基づいて発生したと判定する判定部と
を備えたことを特徴とする管理装置。 - 前記判定部は、算出した前記差分が所定時間以内でない場合に前記第3のイベントが前記第1のイベントに基づかずに発生したと判定することを特徴とする請求項1に記載の管理装置。
- 第1の管理対象と、前記第1の管理対象で発生した第1のイベントに依存して各々第2のイベントを発生する複数の第2の管理対象とを管理する管理装置であって、
前記複数の第2の管理対象で発生した複数の第2のイベントの発生時刻の差分を求める差分算出部と、
前記差分算出部が算出した差分が所定時間以内である場合に前記複数の第2のイベントが前記第1のイベントに基づいて発生したと判定する判定部と、
を備えたことを特徴とする管理装置。 - 前記判定部は、算出した前記差分が所定時間以内でない場合に前記複数の第2のイベントが前記第1のイベントに基づかずに発生したと判定することを特徴とする請求項3に記載の管理装置。
- 前記複数の第2の管理対象の数と、前記複数の第2の管理対象のうち前記第2のイベントを発生した前記第2の管理対象の数に基づいて信頼度を算出し、
前記判定部は、前記信頼度が所定値以上で、かつ前記差分が所定時間以内である場合に前記複数の第2のイベントが前記第1のイベントに基づいて発生したと判定することを特徴とする請求項3または4に記載の管理装置。 - 前記判定部は、前記複数の第2のイベントが前記第1のイベントに基づいて発生したと判定した場合に、前記第1のイベントの発生時刻のダミー値を作成することを特徴とする請求項3〜5のいずれか1つに記載の管理装置。
- 第1の管理対象と、前記第1の管理対象で発生した第1のイベントに依存して第2のイベントを発生する第2の管理対象と、前記第2の管理対象で発生した前記第2のイベントに依存して第3のイベントを発生する第3の管理対象とを管理する管理プログラムであって、
前記第1のイベントの発生時刻と前記第3のイベントの発生時刻との差分を求める差分算出手順と、
前記差分算出手順で算出した差分が所定時間以内である場合に前記第3のイベントが前記第1のイベントに基づいて発生したと判定する判定手順と
をコンピュータに実行させることを特徴とする管理プログラム。 - 第1の管理対象と、前記第1の管理対象で発生した第1のイベントに依存して各々第2のイベントを発生する複数の第2の管理対象とを管理する管理プログラムであって、
前記複数の第2の管理対象で発生した複数の第2のイベントの発生時刻の差分を求める差分算出手順と、
前記差分算出手順で算出した差分が所定時間以内である場合に前記複数の第2のイベントが前記第1のイベントに基づいて発生したと判定する判定手順と
をコンピュータに実行させることを特徴とする管理プログラム。 - 第1の管理対象と、前記第1の管理対象で発生した第1のイベントに依存して第2のイベントを発生する第2の管理対象と、前記第2の管理対象で発生した前記第2のイベントに依存して第3のイベントを発生する第3の管理対象とを管理する管理方法であって、
前記第1のイベントの発生時刻と前記第3のイベントの発生時刻との差分を求める差分算出ステップと、
前記差分算出ステップで算出した差分が所定時間以内である場合に前記第3のイベントが前記第1のイベントに基づいて発生したと判定する判定ステップと
を含んだことを特徴とする管理方法。 - 第1の管理対象と、前記第1の管理対象で発生した第1のイベントに依存して各々第2のイベントを発生する複数の第2の管理対象とを管理する管理方法であって、
前記複数の第2の管理対象で発生した複数の第2のイベントの発生時刻の差分を求める差分算出ステップと、
前記差分算出ステップで算出した差分が所定時間以内である場合に前記複数の第2のイベントが前記第1のイベントに基づいて発生したと判定する判定ステップと
を含んだことを特徴とする管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010282212A JP5685922B2 (ja) | 2010-12-17 | 2010-12-17 | 管理装置、管理プログラム、および管理方法 |
US13/288,136 US20120159519A1 (en) | 2010-12-17 | 2011-11-03 | Event dependency management apparatus and event dependency management method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010282212A JP5685922B2 (ja) | 2010-12-17 | 2010-12-17 | 管理装置、管理プログラム、および管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012128811A JP2012128811A (ja) | 2012-07-05 |
JP5685922B2 true JP5685922B2 (ja) | 2015-03-18 |
Family
ID=46236271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010282212A Expired - Fee Related JP5685922B2 (ja) | 2010-12-17 | 2010-12-17 | 管理装置、管理プログラム、および管理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20120159519A1 (ja) |
JP (1) | JP5685922B2 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9179358B2 (en) * | 2012-12-21 | 2015-11-03 | Qualcomm Incorporated | Techniques for reducing network congestion in a wireless communications system |
US9232178B2 (en) * | 2013-03-15 | 2016-01-05 | Intelmate Llc | Time-based multivariable secure facility alarm system |
WO2015128896A1 (ja) | 2014-02-26 | 2015-09-03 | 三菱電機株式会社 | 攻撃検知装置、攻撃検知方法、及び攻撃検知プログラム |
US10027689B1 (en) | 2014-09-29 | 2018-07-17 | Fireeye, Inc. | Interactive infection visualization for improved exploit detection and signature generation for malware and malware families |
US9773112B1 (en) * | 2014-09-29 | 2017-09-26 | Fireeye, Inc. | Exploit detection of malware and malware families |
US11947489B2 (en) | 2017-09-05 | 2024-04-02 | Robin Systems, Inc. | Creating snapshots of a storage volume in a distributed storage system |
JP7032640B2 (ja) * | 2017-12-28 | 2022-03-09 | 富士通株式会社 | 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置 |
US11748203B2 (en) | 2018-01-11 | 2023-09-05 | Robin Systems, Inc. | Multi-role application orchestration in a distributed storage system |
US11582168B2 (en) | 2018-01-11 | 2023-02-14 | Robin Systems, Inc. | Fenced clone applications |
US11392363B2 (en) | 2018-01-11 | 2022-07-19 | Robin Systems, Inc. | Implementing application entrypoints with containers of a bundled application |
US11520650B2 (en) * | 2019-09-05 | 2022-12-06 | Robin Systems, Inc. | Performing root cause analysis in a multi-role application |
US11347684B2 (en) | 2019-10-04 | 2022-05-31 | Robin Systems, Inc. | Rolling back KUBERNETES applications including custom resources |
US11099979B2 (en) | 2019-10-31 | 2021-08-24 | International Business Machines Corporation | Testing and modifying calendar and event sensitive timer series data analytics |
US11403188B2 (en) | 2019-12-04 | 2022-08-02 | Robin Systems, Inc. | Operation-level consistency points and rollback |
US11528186B2 (en) | 2020-06-16 | 2022-12-13 | Robin Systems, Inc. | Automated initialization of bare metal servers |
US11740980B2 (en) | 2020-09-22 | 2023-08-29 | Robin Systems, Inc. | Managing snapshot metadata following backup |
US11743188B2 (en) | 2020-10-01 | 2023-08-29 | Robin Systems, Inc. | Check-in monitoring for workflows |
US11271895B1 (en) | 2020-10-07 | 2022-03-08 | Robin Systems, Inc. | Implementing advanced networking capabilities using helm charts |
US11456914B2 (en) | 2020-10-07 | 2022-09-27 | Robin Systems, Inc. | Implementing affinity and anti-affinity with KUBERNETES |
US11750451B2 (en) | 2020-11-04 | 2023-09-05 | Robin Systems, Inc. | Batch manager for complex workflows |
US11556361B2 (en) | 2020-12-09 | 2023-01-17 | Robin Systems, Inc. | Monitoring and managing of complex multi-role applications |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5768501A (en) * | 1996-05-28 | 1998-06-16 | Cabletron Systems | Method and apparatus for inter-domain alarm correlation |
US5771274A (en) * | 1996-06-21 | 1998-06-23 | Mci Communications Corporation | Topology-based fault analysis in telecommunications networks |
JP2001067248A (ja) * | 1999-08-27 | 2001-03-16 | Nec Software Hokuriku Ltd | 障害ログの採取方式及びその方法 |
US20030149717A1 (en) * | 2002-02-05 | 2003-08-07 | William Heinzman | Batch processing job streams using and/or precedence logic |
US7454761B1 (en) * | 2002-12-20 | 2008-11-18 | Cisco Technology, Inc. | Method and apparatus for correlating output of distributed processes |
US7457872B2 (en) * | 2003-10-15 | 2008-11-25 | Microsoft Corporation | On-line service/application monitoring and reporting system |
US20050091356A1 (en) * | 2003-10-24 | 2005-04-28 | Matthew Izzo | Method and machine-readable medium for using matrices to automatically analyze network events and objects |
US7631222B2 (en) * | 2004-08-23 | 2009-12-08 | Cisco Technology, Inc. | Method and apparatus for correlating events in a network |
US20060111993A1 (en) * | 2004-11-23 | 2006-05-25 | International Business Machines Corporation | System, method for deploying computing infrastructure, and method for identifying an impact of a business action on a financial performance of a company |
JP4172807B2 (ja) * | 2006-09-08 | 2008-10-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 障害発生の原因箇所の発見を支援する技術 |
US7974800B2 (en) * | 2006-12-12 | 2011-07-05 | International Business Machines Corporation | Method, apparatus, and program for detecting the correlation between repeating events |
US10127129B2 (en) * | 2007-02-27 | 2018-11-13 | Red Hat, Inc. | Non-invasive time-based profiling tool |
US7895146B2 (en) * | 2007-12-03 | 2011-02-22 | Microsoft Corporation | Time modulated generative probabilistic models for automated causal discovery that monitors times of packets |
US8924794B2 (en) * | 2008-02-21 | 2014-12-30 | Hewlett-Packard Development Company, L.P. | Method and computer program product for forecasting system behavior |
JP5240709B2 (ja) * | 2008-03-31 | 2013-07-17 | インターナショナル・ビジネス・マシーンズ・コーポレーション | シンプトンを評価するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム |
US8280683B2 (en) * | 2008-07-17 | 2012-10-02 | International Business Machines Corporation | Probabilistic framework for the highly efficient correlation of call chains with hardware events |
JP5444673B2 (ja) * | 2008-09-30 | 2014-03-19 | 富士通株式会社 | ログ管理方法、ログ管理装置、ログ管理装置を備えた情報処理装置、及びプログラム |
JP5422989B2 (ja) * | 2008-12-17 | 2014-02-19 | 富士通株式会社 | トランザクションモデル生成支援プログラム、トランザクションモデル生成支援装置、およびトランザクションモデル生成支援方法 |
US8473951B2 (en) * | 2009-12-30 | 2013-06-25 | Bmc Software, Inc. | Method and system for traversing in reverse chronological order along a critical path of a plurality of jobs, and reducing time gaps between jobs until an estimated end time of the last job is less than or equal to a target end time |
-
2010
- 2010-12-17 JP JP2010282212A patent/JP5685922B2/ja not_active Expired - Fee Related
-
2011
- 2011-11-03 US US13/288,136 patent/US20120159519A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP2012128811A (ja) | 2012-07-05 |
US20120159519A1 (en) | 2012-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5685922B2 (ja) | 管理装置、管理プログラム、および管理方法 | |
JP5468837B2 (ja) | 異常検出方法、装置、及びプログラム | |
KR101797185B1 (ko) | 분산 환경에서 효율적으로 트랜젝션-분리 메트릭들을 수집하는 방법 | |
EP4086771B1 (en) | Method and system for the on-demand generation of graph-like models out of multidimensional observation data | |
CN109213747B (zh) | 一种数据管理方法及装置 | |
US8001075B2 (en) | Log file amnesia detection | |
US9027037B2 (en) | Information output device, method, and recording medium for outputting notification information corresponding to a state of a computer | |
JP6150453B2 (ja) | サーバ装置、システム、およびログ収集支援方法 | |
Sambasivan et al. | So, you want to trace your distributed system? Key design insights from years of practical experience | |
JPWO2010061735A1 (ja) | 検出イベントに応じたアクション実行を支援するシステム、検出イベントに応じたアクション実行を支援する方法、支援装置及びコンピュータプログラム | |
CN110019239B (zh) | 上报数据的存储方法、装置、电子设备和存储介质 | |
CN107710189B (zh) | 文档间的内容多模式共享 | |
CN108170832B (zh) | 一种面向工业大数据的异构数据库的监控系统及监控方法 | |
CN109460345B (zh) | 实时数据的计算方法及系统 | |
Diotalevi et al. | Collection and harmonization of system logs and prototypal Analytics services with the Elastic (ELK) suite at the INFN-CNAF computing centre | |
Park et al. | A big data analytics framework for hpc log data: Three case studies using the titan supercomputer log | |
JP5423427B2 (ja) | 情報管理プログラム、情報管理装置、および情報管理方法 | |
Cao et al. | Timon: A timestamped event database for efficient telemetry data processing and analytics | |
Peng et al. | Mining logs files for data-driven system management | |
US7287144B2 (en) | Hit ratio estimation device, hit ratio estimation method, hit ratio estimation program and recording medium | |
JP5240709B2 (ja) | シンプトンを評価するためのコンピュータ・システム、並びにその方法及びコンピュータ・プログラム | |
JP5790411B2 (ja) | 並列の分散環境において対話的クライアント‐サーバー・アプリケーションの効率的な部分的クロールを行う技法 | |
JP5454235B2 (ja) | 監視プログラム、監視装置、および監視方法 | |
JP6305258B2 (ja) | 情報処理装置及び情報処理方法及びプログラム | |
CN116431688B (zh) | 一种数据的处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130904 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140609 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5685922 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |