JP4478196B2 - 監視装置、監視プログラム、および情報処理システム - Google Patents
監視装置、監視プログラム、および情報処理システム Download PDFInfo
- Publication number
- JP4478196B2 JP4478196B2 JP2008502580A JP2008502580A JP4478196B2 JP 4478196 B2 JP4478196 B2 JP 4478196B2 JP 2008502580 A JP2008502580 A JP 2008502580A JP 2008502580 A JP2008502580 A JP 2008502580A JP 4478196 B2 JP4478196 B2 JP 4478196B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- failure
- information processing
- storage
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0781—Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0748—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
Description
"PRIMEPOWER(登録商標)とPRIMECLUSTER(登録商標)が織り成す高信頼・高可用ソリューション"、[online]、2005年1月11日、富士通株式会社、[2006年2月1日検索]、インターネット<URL:http://primerserver.fujitsu.com/primepower/news/article/05/0111/
上記情報処理装置による故障発生の通知を受けて、その情報処理装置からその情報処理装置の装置状態を表わす状態データを取り出すデータ取出部と、
上記通知に対応する故障を、互いに重篤度が異なる複数の故障タイプのうち、その故障の重篤度に対応する故障タイプに分類する故障分類部と、
上記データ取出部が取り出した状態データを、上記複数の故障タイプそれぞれに対応する複数の格納領域のうち、上記故障分類部によって分類された故障タイプに対応する格納領域に格納するデータ格納部とを備えたことを特徴とする。
上記データ格納部が、上記データ取出部が取り出した状態データを上記格納領域に格納する時には、その状態データを構成する複数のサブデータそれぞれを、その格納領域中の、互いに異なるデータサイズに対応した複数の格納部分のうち、そのサブデータのデータサイズに対応した格納部分に格納するものである」という形態は好ましい形態である。
上記データ格納部が、上記データ取出部が取り出した状態データを上記格納領域に格納する時には、その状態データを構成する複数のサブデータそれぞれを、その格納領域中の、互いに異なるデータサイズに対応した複数の格納部分のうち、そのサブデータのデータサイズに対応した格納部分に格納するものであり、
上記格納部分の広さを操作に応じた広さに変更することで、その格納部分における上記サブデータに対する最大格納数を変更する変更部を備えた」という形態も好ましい。
そのコンピュータ上に、
上記情報処理装置による故障発生の通知を受けて、その情報処理装置からその情報処理装置の装置状態を表わす状態データを取り出すデータ取出部と、
上記通知に対応する故障を、互いに重篤度が異なる複数の故障タイプのうち、その故障の重篤度に対応する故障タイプに分類する故障分類部と、
上記データ取出部が取り出した状態データを、上記複数の故障タイプそれぞれに対応する複数の格納領域のうち、上記故障分類部によって分類された故障タイプに対応する格納領域に格納するデータ格納部とを構築することを特徴とする。
上記情報処理装置による故障発生の通知を受けて、その情報処理装置からその情報処理装置の装置状態を表わす状態データを取り出すデータ取出部と、
上記通知に対応する故障を、互いに重篤度が異なる複数の故障タイプのうち、その故障の重篤度に対応する故障タイプに分類する故障分類部と、
上記データ取出部が取り出した状態データを、上記複数の故障タイプそれぞれに対応する複数の格納領域のうち、上記故障分類部によって分類された故障タイプに対応する格納領域に格納するデータ格納部とを備えた監視装置;
とを備えたことを特徴とする。
一方、Allscan2K部分122a_9については、変更前のサイズをS3、新たなサイズをS4、区画1個分のサイズをSbとすると、以下の式で表わされる減少分L2だけ、Major2K部分122a_1内の区画数が減ることとなる。
本実施形態では、このようなサイズ変更により、所望の格納部分における区画数すなわちその格納部分におけるサブデータの最大格納数を増やすことで、そのその格納部分における上書きの頻度を下げ、その格納部分におけるサブデータの保護性が高められる。
Claims (5)
- 所定の情報処理動作を実行しその情報処理動作の実行中に故障が発生すると故障発生を通知する情報処理装置の動作を監視する監視装置において、
異なるデータサイズに対応した複数の格納部分をそれぞれ備える、互いに重篤度が異なる複数の故障タイプのそれぞれに対応して設けられた複数の格納領域を有する記憶部と、
前記情報処理装置による故障発生の通知を受けて、該情報処理装置の装置状態を表わす状態データを該情報処理装置から取り出すデータ取出部と、
前記通知に対応する故障を、通知された故障の重篤度に対応する故障タイプに分類する故障分類部と、
前記データ取出部が取り出した状態データを、前記複数の格納領域のうち、前記故障分類部によって分類された故障タイプに対応する格納領域内の、取り出した状態データのデータサイズに対応した格納部分に格納するデータ格納部とを備えたことを特徴とする監視装置。 - 前記データ取出部が、前記状態データとして、前記情報処理装置を構成する複数の構成部品それぞれの部品状態を表わす複数のサブデータを該情報処理装置から取り出すものであり、
前記データ格納部が、状態データを前記格納領域に格納する時に、その状態データを構成する複数のサブデータそれぞれを、該格納領域中の、互いに異なるデータサイズに対応した複数の格納部分のうち、該サブデータのデータサイズに対応した格納部分に格納するものであることを特徴とする請求項1記載の監視装置。 - 前記監視装置は更に、
前記格納部分の広さを変更し、該格納部分における前記状態データの最大格納数を変更する変更部を備えたことを特徴とする請求項1または2に記載の監視装置。 - 異なるデータサイズに対応した複数の格納部分をそれぞれ有し、互いに重篤度が異なる複数の故障タイプのそれぞれに対応して設けられた複数の格納領域を有する記憶部を備えたコンピュータに組み込まれ、該コンピュータに、所定の情報処理動作を実行しその情報処理動作の実行中に故障が発生すると故障発生を通知する情報処理装置の動作を監視させる監視プログラムにおいて、
該コンピュータ上に、
前記情報処理装置による故障発生の通知を受けて、該情報処理装置の装置状態を表わす状態データを該情報処理装置から取り出すデータ取出部と、
前記通知に対応する故障を、互いに重篤度が異なる複数の故障タイプのうち、通知された故障の重篤度に対応する故障タイプに分類する故障分類部と、
前記データ取出部が取り出した状態データを、前記故障分類部によって分類された故障タイプに対応する格納領域内の、前記取り出した状態データのデータサイズに対応した格納部分に格納するデータ格納部とを構築することを特徴とする監視プログラム。 - 所定の情報処理動作を実行し、情報処理動作の実行中に故障が発生すると故障発生を通知する情報処理装置;および、
前記情報処理装置からの故障発生の通知を受けて、該情報処理装置の装置状態を表わす状態データを該情報処理装置から取り出すデータ取出部と、
異なるデータサイズに対応した複数の格納部分をそれぞれ備える、互いに重篤度が異なる複数の故障タイプのそれぞれに対応して設けられた複数の格納領域を有する記憶部と、
前記通知に対応する故障を、通知された故障の重篤度に対応する故障タイプに分類する故障分類部と、
前記データ取出部が取り出した状態データを、前記故障分類部によって分類された故障タイプに対応する格納領域内の、前記取り出した状態データのデータサイズに対応した格納部分に格納するデータ格納部とを備えた監視装置;
を備えたことを特徴とする情報処理システム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2006/303724 WO2007099593A1 (ja) | 2006-02-28 | 2006-02-28 | 監視装置、監視プログラム、および情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007099593A1 JPWO2007099593A1 (ja) | 2009-07-16 |
JP4478196B2 true JP4478196B2 (ja) | 2010-06-09 |
Family
ID=38458716
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008502580A Expired - Fee Related JP4478196B2 (ja) | 2006-02-28 | 2006-02-28 | 監視装置、監視プログラム、および情報処理システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US7925745B2 (ja) |
JP (1) | JP4478196B2 (ja) |
WO (1) | WO2007099593A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8874610B2 (en) * | 2011-12-06 | 2014-10-28 | International Business Machines Corporation | Pattern-based stability analysis of complex data sets |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02297228A (ja) * | 1989-05-11 | 1990-12-07 | Fujitsu Ltd | 障害情報格納方式 |
JP3014490B2 (ja) * | 1991-06-18 | 2000-02-28 | 株式会社日立製作所 | 障害処理装置 |
JP2882263B2 (ja) * | 1993-12-03 | 1999-04-12 | 三菱電機株式会社 | ネットワーク監視方式 |
JPH10283230A (ja) * | 1997-03-31 | 1998-10-23 | Nec Corp | ファイルデータ格納装置およびプログラムを記録した機械読み取り可能な記録媒体 |
JP2001209561A (ja) * | 2000-01-27 | 2001-08-03 | Mitsubishi Electric Corp | 異常処理方式及び異常処理方法 |
JP3653219B2 (ja) * | 2000-10-30 | 2005-05-25 | シャープ株式会社 | 印刷装置およびそれを用いた通信装置または情報処理装置 |
JP2002229816A (ja) * | 2001-01-31 | 2002-08-16 | Fujitsu Ltd | 障害情報取得システム |
JP4369067B2 (ja) | 2001-02-15 | 2009-11-18 | ヤンマー株式会社 | エンジンのシリンダブロック加工方法 |
JP3570395B2 (ja) * | 2001-06-06 | 2004-09-29 | 日本電気株式会社 | 故障解析情報自動採取システム及び故障解析情報自動採取プログラム |
US6996580B2 (en) * | 2001-06-22 | 2006-02-07 | International Business Machines Corporation | System and method for granular control of message logging |
JP4045991B2 (ja) * | 2003-03-27 | 2008-02-13 | 株式会社日立製作所 | ポリシールールの生成方法およびそれを用いたジョブ運用管理方法 |
JP4455411B2 (ja) * | 2004-08-06 | 2010-04-21 | キヤノン株式会社 | 情報処理装置及びその情報通知方法、並びに制御プログラム |
-
2006
- 2006-02-28 JP JP2008502580A patent/JP4478196B2/ja not_active Expired - Fee Related
- 2006-02-28 WO PCT/JP2006/303724 patent/WO2007099593A1/ja active Application Filing
-
2008
- 2008-08-28 US US12/230,412 patent/US7925745B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2007099593A1 (ja) | 2007-09-07 |
JPWO2007099593A1 (ja) | 2009-07-16 |
US20090013075A1 (en) | 2009-01-08 |
US7925745B2 (en) | 2011-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4980581B2 (ja) | 性能監視装置、性能監視方法及びプログラム | |
JP5949780B2 (ja) | プログラム、情報処理装置および方法 | |
Di et al. | Logaider: A tool for mining potential correlations of hpc log events | |
US9128899B1 (en) | Predictive failover planning | |
US8271417B2 (en) | Health meter | |
EP2685380B1 (en) | Operations management unit, operations management method, and program | |
US7206912B2 (en) | Method for managing pair states in a storage system | |
TW202009705A (zh) | 用以自動管理發生於資料中心系統的硬體錯誤事件的方法及其系統 | |
CN107924360B (zh) | 计算系统中的诊断框架 | |
US20080282104A1 (en) | Self Healing Software | |
US20230342343A1 (en) | Data center modeling for facility operations | |
JP2007323193A (ja) | 性能負荷異常検出システム、性能負荷異常検出方法、及びプログラム | |
JP2006260056A (ja) | 統合運用管理サーバ、統合的な運用管理のためのメッセージの抽出方法、及び、プログラム | |
JP5975094B2 (ja) | 交換候補提示方法、情報処理装置、及びプログラム | |
Brandt et al. | OVIS-2: A robust distributed architecture for scalable RAS | |
US20130311646A1 (en) | Management method and management system | |
US20100011100A1 (en) | Health Check System, Server Apparatus, Health Check Method, and Storage Medium | |
JP4478196B2 (ja) | 監視装置、監視プログラム、および情報処理システム | |
Ahlgren et al. | Cray System Monitoring: Successes Requirements and Priorities. | |
JP2011180805A (ja) | 運用管理装置、運用管理方法、運用管理プログラム | |
JP5737789B2 (ja) | 仮想マシン運用監視システム | |
Lundin et al. | Significant advances in Cray system architecture for diagnostics, availability, resiliency and health | |
JP5696492B2 (ja) | 故障検出装置、故障検出方法、及び、故障検出プログラム | |
Sankar et al. | Soft failures in large datacenters | |
JP5655639B2 (ja) | 監視装置、監視方法、プログラム及び監視システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090522 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100309 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100312 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130319 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140319 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |