JP4449929B2 - トランザクション装置、遅延障害検出装置及び方法、並びにプログラム - Google Patents
トランザクション装置、遅延障害検出装置及び方法、並びにプログラム Download PDFInfo
- Publication number
- JP4449929B2 JP4449929B2 JP2006072970A JP2006072970A JP4449929B2 JP 4449929 B2 JP4449929 B2 JP 4449929B2 JP 2006072970 A JP2006072970 A JP 2006072970A JP 2006072970 A JP2006072970 A JP 2006072970A JP 4449929 B2 JP4449929 B2 JP 4449929B2
- Authority
- JP
- Japan
- Prior art keywords
- transaction
- value
- execution time
- average
- executions
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
トランザクション要求を受け付けてトランザクションを実行するトランザクション装置であって、
トランザクションの実行を制御すると共に少なくともその実行時間を算出する情報を含む制御情報を出力するトランザクション制御手段と、
該トランザクション制御手段から制御情報を取得してトランザクションの実行時間及び実行回数を記憶保持する実行時間管理手段と、
該実行時間管理手段にて記憶保持されたトランザクションの実行時間及び実行回数に基づいて、直近の単位時間に実行されたトランザクションの集合における直近平均推定値最小値とそれ以前に実行されたトランザクション全体の集合における全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する遅延障害検出手段とを有し、
前記遅延障害検出手段は、標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより前記直近平均推定最小値を算出し、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより前記全体平均推定値最大値を算出する。
直近平均推定値最小値=実行時間平均値(直近)−1.96×(標準偏差÷√実行回数(直近))
によって前記直近平均推定最小値を算出することを特徴とする。
全体平均推定値最大値=実行時間平均値(全体)+1.96×(標準偏差÷√実行回数(全体))
によって前記全体平均推定値最大値を算出することを特徴とする。
続いて、上記直近平均推定値最小値と後述する方法で求められる全体平均推定値最大値とが比較され、直近平均推定値最小値が全体平均推定値最大値を上回る場合に、遅延障害として検出し、運用管理者への通知などの任意の処理を行う。
以上より、実行時間の平均値にそのばらつきを考慮した補正値が加算され、かかる値に基づいて決定されるため、計測回数が少ない場合であっても、不適切な遅延障害検出がなされることを抑制することができ、信頼性の高いスローダウン障害検出を行うことができる。
トランザクションの実行を制御すると共に少なくともその実行時間を算出する情報を含む制御情報を出力するトランザクション制御手段と、
該トランザクション制御手段から制御情報を取得してトランザクションの実行時間及び実行回数を記憶保持する実行時間管理手段と、
該実行時間管理手段にて記憶保持されたトランザクションの実行時間及び実行回数に基づいて、直近の単位時間に実行されたトランザクションの集合における直近平均推定値最小値とそれ以前に実行されたトランザクション全体の集合における全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する遅延障害検出手段とを有し、
前記遅延障害検出手段は、標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより前記直近平均推定最小値を算出し、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより前記全体平均推定値最大値を算出する。
トランザクションの実行時間及び実行回数を記憶保持する処理と、
該実行時間管理手段にて記憶保持されたトランザクションの実行時間及び実行回数に基づいて、直近の単位時間に実行されたトランザクションの集合における直近平均推定値最小値とそれ以前に実行されたトランザクション全体の集合における全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する処理とを有し、
標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより前記直近平均推定最小値を算出し、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより前記全体平均推定値最大値を算出する。
コンピュータに、
トランザクションの実行を制御すると共に少なくともその実行時間を算出する情報を含む制御情報を出力する手順と、
前記制御情報を取得してトランザクションの実行時間及び実行回数を記憶保持する手順と、
該記憶保持されたトランザクションの実行時間及び実行回数に基づいて、標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより、直近の単位時間に実行されたトランザクションの集合における直近平均推定最小値を算出する手順と、
該記憶保持されたトランザクションの実行時間及び実行回数に基づいて、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより、前記それ以前に実行されたトランザクション全体の集合における全体平均推定値最大値を算出する手順と、
前記直近平均推定最小値と前記全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する手順とを実行させる。
上記(式1)によって前記直近平均推定最小値を算出する手順を実行させる。
上記(式2)によって前記全体平均推定値最大値を算出する手順を実行させるプログラム。
続いて、下記の(式4)によって、トランザクション実行時間標準偏差(全体)を求める。この値は、トランザクション実行時間のばらつきを示す指標として用いられる。
ここで、上記(式3)で得られた標本トランザクション実行時間平均値(全体)は、得られた値から直接算出された値であり、長時間運用した際に得られる真のトランザクション実行時間平均値よりも大きい、もしくは小さいかもしれない。運用開始時にたまたま短い実行時間のトランザクションが連続した場合などに、標本トランザクション実行時間平均値(全体)が、長時間運用した際に得られる真のトランザクション実行時間平均値より下回る可能性がある。
(式5)の係数1.96は可変でよい。
つまり、長時間運用した場合に得られる真のトランザクション実行時間平均値は、97.5%の確率でトランザクション実行時間平均推定値最大値を下回ることとなる。なお、「1.96」という係数は、可変でもよい。
ここで、上記(式7)で得られた標本トランザクション実行時間平均値(直近)は、得られた値から直接算出された値であり、真のトランザクション実行時間平均値よりも大きい、もしくは小さいかもしれない。たまたま長い実行時間のトランザクションが連続した場合などに、標本トランザクション実行時間平均値(直近)が、真のトランザクション実行時間平均値より上回る可能性がある。
なお、統計学の見地から、トランザクション実行回数が30以上であるとき、真のトランザクション実行時間平均値は、95%の確率で以下の数6式に示す不等式を満たす。この範囲は、特定のデータ分布を仮定しない。
全体のとり得る最大のトランザクション実行時間平均値より、直近に実行されたトランザクションのとり得る最小の実行時間平均値が大きいということは、これら2つの集合は別の集合であり、かつ全体のトランザクション実行時間平均値より直近のトランザクション実行時間平均値のほうが大きいということができる。つまり、全体にくらべて直近に実行されたトランザクションが遅くなっていると判断できる。
そして、上述した(式10)に代入し、下記の(式11)、(式12)のようにして、直近、全体それぞれに対してトランザクション実行時間平均値を求める(ステップS13)。
トランザクション実行時間平均値(直近)=トランザクション実行時間合計(直近)106「105」÷トランザクション実行回数(直近)105「30」=3.5・・・(式12)
トランザクション実行時間標準偏差=√(トランザクション実行時間平方和÷トランザクション実行回数−トランザクション実行時間平均2)・・・(式13)
続いて、上述した(式13)より、下記の(式14)のようにして、トランザクション実行時間標準偏差(標準偏差)を求める(ステップS13)。
トランザクション実行時間平均推定値最大値=トランザクション実行時間平均+1.96×(トランザクション実行時間標準偏差÷√トランザクション実行回数)・・・(式15)
次に、上述した(式15)より、下記の(式16)のようにして、トランザクション実行時間平均推定値最大値(全体)を求める(ステップS14)。
トランザクション実行時間平均推定値最小値=トランザクション実行時間平均−1.96×(トランザクション実行時間標準偏差÷√トランザクション実行回数)・・・(式17)
次に、上述した(式17)より、下記の(式18)のようにして、トランザクション実行時間平均推定値最小値(直近)を求める(ステップS14)。
そして、トランザクション実行時間平均推定値最大値(全体)とトランザクション実行時間平均推定値最小値(直近)を比較し、スローダウンか否か判定する(ステップS15)。
トランザクション実行時間平均推定値最大値(全体)>トランザクション実行時間平均推定値最小値(直近)
であるため、スローダウンではないと判定される。もし、スローダウンと検出された場合は障害対応部15に伝えられ運用管理者への通知などの障害対応処理を行う(ステップ18)。
1A 演算装置
1B 記憶装置
2 クライアント端末
3 運用管理端末
11 トランザクション制御部
12 サーバアプリケーション部
13 実行時間管理部
14 障害検出部
15 障害対応部
16 管理表記憶部
Claims (13)
- トランザクション要求を受け付けてトランザクションを実行するトランザクション装置であって、
トランザクションの実行を制御すると共に少なくともその実行時間を算出する情報を含む制御情報を出力するトランザクション制御手段と、
該トランザクション制御手段から制御情報を取得してトランザクションの実行時間及び実行回数を記憶保持する実行時間管理手段と、
該実行時間管理手段にて記憶保持されたトランザクションの実行時間及び実行回数に基づいて、直近の単位時間に実行されたトランザクションの集合における直近平均推定値最小値とそれ以前に実行されたトランザクション全体の集合における全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する遅延障害検出手段とを有し、
前記遅延障害検出手段は、標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより前記直近平均推定最小値を算出し、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより前記全体平均推定値最大値を算出するトランザクション装置。 - 請求項1に記載のトランザクション装置において、
前記遅延障害検出手段は、
直近平均推定値最小値=実行時間平均値(直近)−1.96×(標準偏差÷√実行回数(直近))
によって前記直近平均推定最小値を算出することを特徴とするトランザクション装置。 - 請求項1に記載のトランザクション装置において、
前記遅延障害検出手段は、
全体平均推定値最大値=実行時間平均値(全体)+1.96×(標準偏差÷√実行回数(全体))
によって前記全体平均推定値最大値を算出することを特徴とするトランザクション装置。 - 請求項1乃至3のいずれか1項に記載のトランザクション装置において、
前記実行時間管理手段は、入力されるリセット操作に基づいて、前記記憶保持されている実行時間及び実行回数を消去することを特徴とするトランザクション装置。 - トランザクション要求を受け付けてトランザクションを実行するトランザクション装置にて単位時間に実行されたトランザクションの遅延障害を検出する遅延障害検出装置であって、
トランザクションの実行を制御すると共に少なくともその実行時間を算出する情報を含む制御情報を出力するトランザクション制御手段と、
該トランザクション制御手段から制御情報を取得してトランザクションの実行時間及び実行回数を記憶保持する実行時間管理手段と、
該実行時間管理手段にて記憶保持されたトランザクションの実行時間及び実行回数に基づいて、直近の単位時間に実行されたトランザクションの集合における直近平均推定値最小値とそれ以前に実行されたトランザクション全体の集合における全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する遅延障害検出手段とを有し、
前記遅延障害検出手段は、標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより前記直近平均推定最小値を算出し、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより前記全体平均推定値最大値を算出する遅延障害検出装置。 - 請求項5に記載の遅延障害検出装置において、
前記遅延障害検出手段は、
直近平均推定値最小値=実行時間平均値(直近)−1.96×(標準偏差÷√実行回数(直近))
によって前記直近平均推定最小値を算出することを特徴とする遅延障害検出装置。 - 請求項5に記載の遅延障害検出装置において、
前記遅延障害検出手段は、
全体平均推定値最大値=実行時間平均値(全体)+1.96×(標準偏差÷√実行回数(全体))
によって前記全体平均推定値最大値を算出することを特徴とする遅延障害検出装置。 - トランザクション要求を受け付けてトランザクションを実行するトランザクション装置にてトランザクションの処理が遅延したことを検出する遅延障害検出方法であって、
トランザクションの実行時間及び実行回数を記憶保持する処理と、
該実行時間管理手段にて記憶保持されたトランザクションの実行時間及び実行回数に基づいて、直近の単位時間に実行されたトランザクションの集合における直近平均推定値最小値とそれ以前に実行されたトランザクション全体の集合における全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する処理とを有し、
標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより前記直近平均推定最小値を算出し、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより前記全体平均推定値最大値を算出する遅延障害検出方法。 - 請求項8に記載の遅延障害検出方法において、
直近平均推定値最小値=実行時間平均値(直近)−1.96×(標準偏差÷√実行回数(直近))
によって前記直近平均推定最小値を算出することを特徴とする遅延障害検出方法。 - 請求項8に記載の遅延障害検出方法において、
全体平均推定値最大値=実行時間平均値(全体)+1.96×(標準偏差÷√実行回数(全体))
によって前記全体平均推定値最大値を算出することを特徴とする遅延障害検出方法。 - トランザクション要求を受け付けてトランザクションを実行するトランザクション装置にてトランザクションの処理が遅延したことを検出するためのプログラムであって、
コンピュータに、
トランザクションの実行を制御すると共に少なくともその実行時間を算出する情報を含む制御情報を出力する手順と、
前記制御情報を取得してトランザクションの実行時間及び実行回数を記憶保持する手順と、
該記憶保持されたトランザクションの実行時間及び実行回数に基づいて、標準偏差を直近の単位時間にトランザクションが実行された実行回数に基づく値にて除算した値に所定の係数をかけた値を直近の単位時間に実行されたトランザクションの集合における実行時間平均値から減算することにより、直近の単位時間に実行されたトランザクションの集合における直近平均推定最小値を算出する手順と、
該記憶保持されたトランザクションの実行時間及び実行回数に基づいて、標準偏差を前記実行回数に基づく値にて除算した値に所定の係数をかけた値をそれ以前に実行されたトランザクション全体の集合における実行時間平均値に加算することにより、前記それ以前に実行されたトランザクション全体の集合における全体平均推定値最大値を算出する手順と、
前記直近平均推定最小値と前記全体平均推定値最大値とを比較し、前記トランザクション装置の遅延障害を検出する手順とを実行させるためのプログラム。 - 請求項11に記載のプログラムにおいて、
コンピュータに、
直近平均推定値最小値=実行時間平均値(直近)−1.96×(標準偏差÷√実行回数(直近))
によって前記直近平均推定最小値を算出する手順を実行させるためのプログラム。 - 請求項11に記載のプログラムにおいて、
コンピュータに、
全体平均推定値最大値=実行時間平均値(全体)+1.96×(標準偏差÷√実行回数(全体))
によって前記全体平均推定値最大値を算出する手順を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006072970A JP4449929B2 (ja) | 2006-03-16 | 2006-03-16 | トランザクション装置、遅延障害検出装置及び方法、並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006072970A JP4449929B2 (ja) | 2006-03-16 | 2006-03-16 | トランザクション装置、遅延障害検出装置及び方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007249663A JP2007249663A (ja) | 2007-09-27 |
JP4449929B2 true JP4449929B2 (ja) | 2010-04-14 |
Family
ID=38593878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006072970A Active JP4449929B2 (ja) | 2006-03-16 | 2006-03-16 | トランザクション装置、遅延障害検出装置及び方法、並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4449929B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5249569B2 (ja) * | 2007-12-11 | 2013-07-31 | 株式会社日本総合研究所 | 業務パフォーマンス把握システムおよび方法 |
JP5313101B2 (ja) * | 2009-09-30 | 2013-10-09 | 富士通フロンテック株式会社 | 情報管理プログラム、情報管理方法、及び、情報管理装置 |
JP5388122B2 (ja) * | 2009-12-16 | 2014-01-15 | Kddi株式会社 | サーバ監視装置およびそのサーバ障害判定方法 |
JP5696627B2 (ja) * | 2011-09-14 | 2015-04-08 | 富士通株式会社 | プログラム、情報処理装置、及び、情報処理方法 |
CN104104554B (zh) * | 2013-04-10 | 2018-09-25 | 深圳市腾讯计算机系统有限公司 | 检测数据访问请求的生命周期方法和装置 |
JP6163982B2 (ja) * | 2013-09-04 | 2017-07-19 | 日本電気株式会社 | 業務アプリケーション遅延検出装置、方法およびプログラム |
-
2006
- 2006-03-16 JP JP2006072970A patent/JP4449929B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2007249663A (ja) | 2007-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2523115B1 (en) | Operation management device, operation management method, and program storage medium | |
JP4449929B2 (ja) | トランザクション装置、遅延障害検出装置及び方法、並びにプログラム | |
JP4983795B2 (ja) | システム管理プログラム、システム管理装置およびシステム管理方法 | |
US8429455B2 (en) | Computer system management method and management system | |
JP4826831B2 (ja) | 障害検知装置、障害検知方法及びそのプログラム | |
CN109284220B (zh) | 集群故障恢复时长估算方法、装置、设备及存储介质 | |
JP6387747B2 (ja) | 情報処理装置、障害回避方法およびコンピュータプログラム | |
US20180101413A1 (en) | Control device and control method | |
US20070168201A1 (en) | Formula for automatic prioritization of the business impact based on a failure on a service in a loosely coupled application | |
JP2007323193A (ja) | 性能負荷異常検出システム、性能負荷異常検出方法、及びプログラム | |
JP2011103030A (ja) | インシデント管理方法および運用管理サーバ | |
US20170206125A1 (en) | Monitoring system, monitoring device, and monitoring program | |
JP5419819B2 (ja) | 計算機システムの管理方法、及び管理システム | |
JP2013201695A (ja) | 障害重要度処理サーバ装置、ネットワーク管理システム、障害重要度推定方法およびプログラム | |
CN111078480B (zh) | 一种异常恢复方法和服务器 | |
JP7059859B2 (ja) | 制御方法、制御装置および制御プログラム | |
JP4353155B2 (ja) | トランザクション装置、監視時間決定装置及び方法、プログラム | |
JP2013011987A (ja) | 異常状態検知装置及び異常状態検知方法 | |
US10511502B2 (en) | Information processing method, device and recording medium for collecting logs at occurrence of an error | |
CN111294335A (zh) | 一种登录方法及装置 | |
JP6572722B2 (ja) | 事象発生通知プログラム、事象発生通知方法、及び、事象発生通知装置 | |
JP6508202B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
US10116543B2 (en) | Dynamic asynchronous communication management | |
JPWO2013129061A1 (ja) | 同時接続数制御システム、同時接続数制御サーバ、同時接続数制御方法および同時接続数制御プログラム | |
JP5797602B2 (ja) | 障害回避処理装置及び障害回避方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090610 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100105 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4449929 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130205 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130205 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140205 Year of fee payment: 4 |