JP4909870B2 - 障害ログ管理方法 - Google Patents
障害ログ管理方法 Download PDFInfo
- Publication number
- JP4909870B2 JP4909870B2 JP2007279018A JP2007279018A JP4909870B2 JP 4909870 B2 JP4909870 B2 JP 4909870B2 JP 2007279018 A JP2007279018 A JP 2007279018A JP 2007279018 A JP2007279018 A JP 2007279018A JP 4909870 B2 JP4909870 B2 JP 4909870B2
- Authority
- JP
- Japan
- Prior art keywords
- service processor
- log
- load factor
- failure
- failure log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
測定した該負荷率が所定の範囲内にない場合、障害ログをキャッシュに一時的に保存し、
一定時間経過後、自サービスプロセッサの負荷率を再度測定して、該所定の範囲との関係を調べ、その結果、所定の範囲内になった時、該キャッシュに保存された該障害ログを該記憶装置に保存することを特徴とする障害ログ管理方法として構成される。
該サービスプロセッサは、該計算機の障害ログを取得して、前記障害ログを取得した場合における自サービスプロセッサの負荷率を測定し、該負荷率が所定の範囲内にある場合、該障害ログを該記憶装置に保存し、測定した負荷率が該所定の範囲内にない場合、該障害ログをキャッシュに一時的に保存し、
該キャッシュに一時的に保存された障害ログを該記憶装置に保存する際に、該サービスプロセッサの負荷率が所定の範囲内にあるかを判定し、該負荷率が所定の範囲内にない場合、該ネットワークに接続されている他グループの他サービスプロセッサの中から負荷率が所定の範囲内にある他サービスプロセッサを選定し、
選定された他サービスプロセッサへ該ネットワークを介して障害ログを送信し、
他サービスプロセッサは、受信した該障害ログを自身の記憶装置に保存することを特徴とする障害ログ管理方法として構成される。
該キャッシュの空き容量が所定以上の場合は該キャッシュに障害ログを保存し、該キャッシュの空き容量が所定以上でない場合は、ネットワークに接続されている他グループの他サービスプロセッサの中から負荷率が所定の範囲内にある他のサービスプロセッサを選定して、選定された該他サービスプロセッサへ障害ログを送信する。
また、好ましくは、測定した自サービスプロセッサの負荷率と、予め定められた負荷率の閾値と比較し、測定した負荷率が該閾値未満の場合、障害ログを記憶装置に保存し、測定した負荷率が該閾値以上の場合、障害ログをキャッシュに一時的に保存する。
図1は一実施形態における計算機システムの構成図を示す。
この計算機システムは、それぞれ複数の計算機105、205を制御、監視する複数のサービスプロセッサ10,20がネットワーク90を介して接続して構成される。
複数のサービスプロセッサ10、20は実質的に同じ構成を成している。特に断らない限り、以下、サービスプロセッサ10側を例に説明する。
システム制御部104は、キャッシュ106、保存要求テーブル107、カウンタ108、キャッシュテーブル109を有する。記憶装置101は障害ログを記憶する。また、キャッシュ106も障害ログを一時的に保存する。
カウンタ108は、システム制御部104がサービスプロセッサ10の負荷率と負荷率の閾値を比較した回数を記録する。キャッシュテーブル109は、キャッシュ内における計算機105の障害ログの保存状況を管理する。
また、キャッシュテーブル109は当該計算機のIDを保存して当該計算機の障害ログを管理する。なお、保存要求テーブル107、及びキャッシュテーブル109の構成例については、図6、図7を参照して後述する。
データパケットは、通信用ヘッダ部501、計算機ID部502、詳細ログ部503から成る。
通信用ヘッダ部501は、送信先のIPアドレス等の通信に必要な管理情報を格納する。計算機ID部502は、障害が発生した計算機を識別するためのID(識別情報)を格納する。詳細ログ部503は、計算機の障害を特定するためのログを格納する。
保存要求テーブル107には、障害ログ保存要求を複数の他サービスプロセッサへ送信する順番が登録される。この順番は、所定の規則例えば自サービスプロセッサから論理ネットワーク的に近い他サービスプロセッサから順番にするという規則によって予め規定されている。“1”が登録されているサービスプロセッサをスタートとして、“2”、“3”と登録されている順番に、対応するサービスプロセッサへ障害ログ保存要求を送信する。なお、自サービスプロセッサは“0”が登録され、通信先の対象ではないとする。
キャッシュテーブル109は、計算機105ごとにキャッシュ106に障害ログを保存しているか否かを管理する。そのために、計算機IDとフラグを用いて管理する。計算機IDはシステム制御部104が管理対象とする計算機の識別情報(ID)を示し、フラグは障害ログをキャッシュに保存済みか否かを示す。例えば、計算機ID:105−1に対応するフラグが“0”の場合には、当該計算機105−1の障害ログがキャッシュに未保存の状態を示し、計算機ID:105−2のフラグが“1”の場合には、計算機ID105−2の障害ログがキャッシュに保存済みであることを示す。
状態管理部103は、キャッシュテーブル109を参照することで、管轄下の複数の計算機105の障害ログのキャッシュにおける保存状況を知ることができる。
障害ログ保存要求および障害ログ保存要求応答のデータは、通信用ヘッダ部801、要求種別部802、データ部803から構成される。通信用ヘッダ部801には、送信元および送信先のIPアドレスが格納される。要求種別部802には、障害ログ保存要求か又は障害ログ保存要求応答かを示すフラグが格納される。例えば、障害ログ保存要求の場合は“0”、障害ログ保存要求応答の場合は“1”とする。データ部803には、障害ログ保存要求の場合は何も格納されておらず、障害ログ保存要求応答の場合は、要求承認または要求拒否を示すフラグが格納される。例えば、要求承認の場合は“0”、要求拒否の場合は“1”とする。
まず、システム制御部104は、障害を検知した計算機105から障害ログを取得して(S01)、カウンタ108を“0”に設定する(S02)。
その後、状態管理部103へ負荷率測定要求を送信し、状態管理部103からサービスプロセッサ10の負荷率を受信する(S03)。そして、受信した負荷率と、予め設定した負荷率の閾値を比較する(S04)。
比較の結果、キャッシュ106の空き容量がキャッシュ106の空き容量の閾値未満の場合はS15へ移行する。一方、キャッシュ106の空き容量がキャッシュ106の空き容量の閾値以上の場合、キャッシュ106に障害ログを保存して(S12)、キャッシュテーブル109における計算機105のフラグを保存済みに設定する(S13)。
その後、予め設定した時間待機して(S14)、再びS03へ移行する。
通信制御部102から障害ログ保存要求を受信すると(S31)、状態管理部103へ負荷率測定要求を送信し、状態管理部103からサービスプロセッサ10の負荷率を受信する(S32)。
その後、測定されたその空き容量と、予め設定した記憶装置101の空き容量の閾値と比較する(S35)。比較の結果、記憶装置101の空き容量が記憶装置101の空き容量の閾値以上の場合、障害ログ保存要求応答のデータパケットにおけるデータ部に要求承諾を設定し(S36)、通信制御部102に障害ログ保存要求応答のデータパケットを送信する(S37)。そして、通信制御部102から障害ログを受信し(S38)、障害ログを記憶装置に保存して(S39)、システム制御部104の動作は終了する。
複数台の計算機の障害をほぼ同時にサービスプロセッサが検知した場合における障害ログ保存の流れについて説明するものである。ここで、サービスプロセッサ10〜30は図1の構成と同じである。なお、説明の都合上、通信制御部102、202、状態管理部103,203、保存要求テーブル107,207、カウンタ108,208、キャッシュテーブル106,206の図示は省略してある。
サービスプロセッサ10が計算機105−1の障害を検知してその障害ログ110-1を取得した時、サービスプロセッサ10の負荷率は負荷率の閾値未満であり、記憶装置101の空き容量も記憶装置101の閾値以上である場合、障害ログ110-1は障害ログ保存経路P1を通ってサービスプロセッサ10の記憶装置101に保存される。
105、205、305:計算機
101、201、301:記憶装置 102、202:通信制御部
103、203:状態管理部 104、204:システム制御部
106、206、306:キャッシュ
107、207:保存要求テーブル
108、208:カウンタ
109、209:キャッシュテーブル
110、210:障害ログ
P1、P2,P3,P4:障害ログ保存経路。
Claims (5)
- サービスプロセッサによって計算機を監視し、該計算機に発生した障害を検知してその障害のログを管理する障害ログ管理方法において、
該計算機の障害ログを取得して、前記障害ログを取得した場合における自サービスプロセッサの負荷率を測定し、該負荷率が所定の範囲内にある場合、該障害ログを記憶装置に保存し、
測定した該負荷率が所定の範囲内にない場合、障害ログをキャッシュに一時的に保存し、
一定時間経過後、自サービスプロセッサの負荷率を再度測定して、該所定の範囲との関係を調べ、その結果、所定の範囲内になった時、該キャッシュに保存された該障害ログを該記憶装置に保存することを特徴とする障害ログ管理方法。 - 複数の計算機を複数のグループに分割し、グループ毎にサービスプロセッサを割り当てて、該サービスプロセッサをネットワークにより接続したシステムにおいて該計算機に発生した障害のログを管理する障害ログ管理方法であって、
該サービスプロセッサは、該計算機の障害ログを取得して、前記障害ログを取得した場合における自サービスプロセッサの負荷率を測定し、
該負荷率が所定の範囲内にある場合、該障害ログを該記憶装置に保存し、
測定した負荷率が該所定の範囲内にない場合、該障害ログをキャッシュに一時的に保存し、
該キャッシュに一時的に保存された障害ログを該記憶装置に保存する際に、該サービスプロセッサの負荷率が所定の範囲内にあるかを判定し、
該負荷率が所定の範囲内にない場合、該ネットワークに接続されている他グループの他サービスプロセッサの中から負荷率が所定の範囲内にある他サービスプロセッサを選定し、
選定された他サービスプロセッサへ該ネットワークを介して障害ログを送信し、
他サービスプロセッサは、受信した該障害ログを自身の記憶装置に保存することを特徴とする障害ログ管理方法。 - 該サービスプロセッサは自身のキャッシュに障害ログを保存する時、キャッシュの空き容量を測定し、
該キャッシュの空き容量が所定以上の場合は該キャッシュに障害ログを保存し、
該キャッシュの空き容量が所定以上でない場合は、ネットワークに接続されている他グループの他サービスプロセッサの中から負荷率が所定の範囲内にある他のサービスプロセッサを選定して、選定された該他サービスプロセッサへ障害ログを送信することを特徴とする請求項1又は2の障害ログ管理方法。 - 各サービスプロセッサは、他サービスプロセッサへ障害ログの保存を要求する場合、複数の他サービスプロセッサへ該要求を送信する順番を登録した保存要求テーブルを参照して、該要求の送信先となるサービスプロセッサを決めることを特徴とする請求項2又は3の障害ログ管理方法。
- 測定した自サービスプロセッサの負荷率と、予め定められた負荷率の閾値と比較し、測定した負荷率が該閾値未満の場合、障害ログを記憶装置に保存し、
測定した負荷率が該閾値以上の場合、障害ログをキャッシュに一時的に保存することを特徴とする請求項1乃至4のいずれかの障害ログ管理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007279018A JP4909870B2 (ja) | 2007-10-26 | 2007-10-26 | 障害ログ管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007279018A JP4909870B2 (ja) | 2007-10-26 | 2007-10-26 | 障害ログ管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009110078A JP2009110078A (ja) | 2009-05-21 |
JP4909870B2 true JP4909870B2 (ja) | 2012-04-04 |
Family
ID=40778540
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007279018A Expired - Fee Related JP4909870B2 (ja) | 2007-10-26 | 2007-10-26 | 障害ログ管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4909870B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5253353B2 (ja) * | 2009-10-26 | 2013-07-31 | 株式会社日立製作所 | 情報処理システム、及びストレージ監視サーバの管理方法 |
JP5609730B2 (ja) * | 2011-03-18 | 2014-10-22 | 富士通株式会社 | 情報処理プログラム及び方法、転送処理装置 |
JP5689783B2 (ja) * | 2011-11-24 | 2015-03-25 | 株式会社東芝 | コンピュータ、コンピュータシステム、および障害情報管理方法 |
JP6035909B2 (ja) * | 2012-06-29 | 2016-11-30 | 富士通株式会社 | ストレージシステムおよびストレージシステムの制御方法 |
JP6652464B2 (ja) * | 2016-08-15 | 2020-02-26 | 富士通フロンテック株式会社 | 通信制御プログラム、通信制御装置及び通信制御方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4836408B2 (ja) * | 2004-03-01 | 2011-12-14 | コニカミノルタビジネステクノロジーズ株式会社 | アクセスログ保存システムおよびデジタル複合機 |
JP4124374B2 (ja) * | 2006-06-12 | 2008-07-23 | 株式会社日立製作所 | 記憶システム |
-
2007
- 2007-10-26 JP JP2007279018A patent/JP4909870B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009110078A (ja) | 2009-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109951576B (zh) | 用于监视服务的方法、设备和存储介质 | |
US7225356B2 (en) | System for managing operational failure occurrences in processing devices | |
JP4909870B2 (ja) | 障害ログ管理方法 | |
US20080126831A1 (en) | System and Method for Caching Client Requests to an Application Server Based on the Application Server's Reliability | |
EP3258653A1 (en) | Message pushing method and device | |
CN107395458B (zh) | 系统监控方法及装置 | |
US20180101413A1 (en) | Control device and control method | |
US8589441B1 (en) | Information processing system and method for controlling the same | |
JPWO2008081844A1 (ja) | システム障害を精度良く検出する技術 | |
CN107566466A (zh) | 负载均衡方法及装置 | |
CN113067875B (zh) | 基于微服务网关动态流控的访问方法和装置以及设备 | |
US8555021B1 (en) | Systems and methods for automating and tuning storage allocations | |
KR100823732B1 (ko) | 스트리밍 서비스를 위한 컨텐츠 제공 시스템 및 그 방법 | |
CN110661673B (zh) | 一种心跳检测的方法及装置 | |
CN108235800B (zh) | 一种网络故障探测方法、控制中心设备及计算机存储介质 | |
US9003005B2 (en) | Monitoring apparatus, monitoring system, and information setting method | |
US10698758B2 (en) | Data transfer device, data transfer method, and non-transitory computer readable medium | |
JP2017174038A (ja) | 情報処理システム、情報処理方法およびプログラム | |
JP4595274B2 (ja) | 負荷分散方法及び負荷分散装置 | |
WO2015196769A1 (zh) | Iptv系统中的数据处理方法及网元设备 | |
CN110752939B (zh) | 一种业务进程故障处理方法、通知方法和装置 | |
CN111901421A (zh) | 一种数据处理方法及相关设备 | |
JP4002232B2 (ja) | プログラム制御方法及び実施装置並びに実施システムと処理プログラム | |
CN113225225B (zh) | 根镜像检测方法、装置、系统、电子设备及存储介质 | |
JP2014197350A (ja) | 情報処理装置、情報処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100119 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110426 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111220 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120116 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150120 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4909870 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |