JP2013522741A - 診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム - Google Patents
診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム Download PDFInfo
- Publication number
- JP2013522741A JP2013522741A JP2012557526A JP2012557526A JP2013522741A JP 2013522741 A JP2013522741 A JP 2013522741A JP 2012557526 A JP2012557526 A JP 2012557526A JP 2012557526 A JP2012557526 A JP 2012557526A JP 2013522741 A JP2013522741 A JP 2013522741A
- Authority
- JP
- Japan
- Prior art keywords
- state
- computing environment
- diagnostic data
- data
- monitor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004590 computer program Methods 0.000 title claims description 9
- 230000001052 transient effect Effects 0.000 claims abstract description 30
- 230000007704 transition Effects 0.000 claims abstract description 9
- 230000004044 response Effects 0.000 claims abstract description 8
- 230000001934 delay Effects 0.000 claims abstract description 5
- 230000000977 initiatory effect Effects 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 9
- 230000009471 action Effects 0.000 claims description 7
- 238000013480 data collection Methods 0.000 description 13
- 101001074449 Crotalus durissus terrificus Phospholipase A2 inhibitor CNF Proteins 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000003111 delayed effect Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 241001522296 Erithacus rubecula Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0781—Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0715—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
- G06F11/0754—Error or fault detection not based on redundancy by exceeding limits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Recording Measured Values (AREA)
Abstract
【解決手段】 この装置は、コンピューティング環境が所定の無効状態にあるとモニターが判断したことに応答して、遅延しきい値を有するトラップ遅延コンポーネントを開始するための手段と、第1のスレッドにより、コンピューティング環境に関する診断データを記録するための手段とを含み,それがコンピューティング環境の過渡状態以外の状態であるという所定のインジケータに対応する合計カウントまたは期間について前記所定の無効状態が前記判断を繰り返したと前記モニターが判断するまで診断データを記録するための前記手段の動作を遅延設定が遅延させ、過渡状態は1つまたは複数の他のスレッドによる第1の有効状態から第2の有効状態へのコンピューティング環境の遷移に対応する。
【選択図】 図1
Description
1.新たに作成されたリスト項目が未初期化(その結果、無効な)メモリ参照(ポインタ)を含むようなリンク・リスト・データ構造への項目の追加。メモリ参照が未初期化である間、コンピューティング環境302は無効状態にある。しかし、無効状態は、新しいリスト入力が作成される前の有効状態と、新しいリスト入力が適切にリンク・リスト・データ構造に統合されたときの有効状態との間に発生する。したがって、無効状態は2つの有効状態の間の過渡状態を構成する。
2.カウンタに所定のしきい値を超えさせるようなカウンタのインクリメント。カウンタがしきい値を超えている間、コンピューティング環境302は無効状態にある。しかし、無効状態は、インクリメントする前のカウンタの有効状態と、カウンタがしきい値を超えたことをソフトウェアが検出し、カウンタをリセットした後の有効状態との間に発生する。したがって、無効状態は2つの有効状態の間の過渡状態を構成する。
3.後で成功する失敗動作を再試行するように例外ハンドラが実現された場合の例外の捕捉に対応する一連のソフトウェア動作。例外ハンドラに入った瞬間に、コンピューティング環境は無効状態(例外状態)にある。しかし、無効状態は、例外前の有効状態と、成功を達成するために動作を再試行するように例外ハンドラを処理した後の有効状態との間に発生する。したがって、無効状態は2つの有効状態の間の過渡状態を構成する。
Claims (11)
- 診断データを収集するためにマルチスレッド化コンピューティング環境を操作するための方法であって、前記方法が、
前記コンピューティング環境が所定の無効状態にあるとモニターが判断したことに応答して、遅延しきい値を有するトラップ遅延コンポーネントを開始するステップと、
第1のスレッドにより、前記コンピューティング環境に関する診断データを記録するステップとを含み,
それが前記コンピューティング環境の過渡状態以外の状態であるという所定のインジケータに対応する合計カウントまたは期間のうちの少なくとも一方について前記所定の無効状態が繰り返されたと前記モニターが判断するまで診断データを記録する前記ステップを前記トラップ遅延コンポーネントが遅延させ、前記過渡状態が1つまたは複数の他のスレッドによる第1の有効状態から第2の有効状態への前記コンピューティング環境の遷移に対応する、方法。 - 前記所定の無効状態が前記コンピューティング環境のデータ・ストア内のデータの内容によって示される、請求項1記載の方法。
- 前記データが破損している、請求項2記載の方法。
- 前記データが不完全である、請求項2記載の方法。
- 前記無効状態が前記コンピューティング環境で発生する一連のイベントによって示される、請求項1記載の方法。
- 前記一連のイベントが、前記コンピューティング環境内の1つまたは複数のスレッドで行われる処理アクションに対応する、請求項5記載の方法。
- 前記所定のインジケータを前記所定の無効状態の発生の合計カウントに設定することをさらに含む、請求項1ないし6のいずれかに記載の方法。
- 前記所定のインジケータを前記所定の無効状態の発生をモニターするための期間に設定することをさらに含む、請求項1ないし7のいずれかに記載の方法。
- 診断データを収集するためのマルチスレッド化コンピューティング環境における装置であって、
前記コンピューティング環境が所定の無効状態にあるとモニターが判断したことに応答して、遅延しきい値を有するトラップ遅延コンポーネントを開始するための手段と、
第1のスレッドにより、前記コンピューティング環境に関する診断データを記録するための手段とを含み,
それが前記コンピューティング環境の過渡状態以外の状態であるという所定のインジケータに対応する合計カウントまたは期間のうちの少なくとも一方について前記所定の無効状態が繰り返されたと前記モニターが判断するまで診断データを記録するための前記手段の動作を前記トラップ遅延コンポーネントが遅延させ、前記過渡状態が1つまたは複数の他のスレッドによる第1の有効状態から第2の有効状態への前記コンピューティング環境の遷移に対応する、装置。 - 中央演算処理装置と、メモリ・サブシステムと、入出力サブシステムと、前記中央演算処理装置、前記メモリ・サブシステム、前記入出力サブシステム、および請求項9記載の前記装置を相互接続するバス・サブシステムとを含む装置。
- コンピュータ・システムにロードされ、そこで実行されたときに、請求項1ないし8のいずれかに記載の方法の前記ステップを前記コンピュータに実行させるためのコンピュータ・プログラム・コードを含むコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10156667.7 | 2010-03-16 | ||
EP10156667 | 2010-03-16 | ||
PCT/EP2011/053886 WO2011113828A1 (en) | 2010-03-16 | 2011-03-15 | Diagnostic data capture in a computing environment |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013522741A true JP2013522741A (ja) | 2013-06-13 |
JP5623557B2 JP5623557B2 (ja) | 2014-11-12 |
Family
ID=43827983
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012557526A Expired - Fee Related JP5623557B2 (ja) | 2010-03-16 | 2011-03-15 | 診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US9009537B2 (ja) |
JP (1) | JP5623557B2 (ja) |
CN (1) | CN102792278B (ja) |
DE (1) | DE112011100168B4 (ja) |
GB (1) | GB2491274B (ja) |
WO (1) | WO2011113828A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112011100168B4 (de) * | 2010-03-16 | 2023-12-14 | International Business Machines Corporation | Erfassen von Diagnosedaten in einer Datenverarbeitungsumgebung |
US9183048B2 (en) * | 2012-12-20 | 2015-11-10 | Oracle International Corporation | System and method for implementing scalable contention-adaptive statistics counters |
CN104239168B (zh) * | 2013-06-09 | 2018-03-23 | 腾讯科技(深圳)有限公司 | 卡顿检测方法和设备 |
US9535780B2 (en) * | 2013-11-18 | 2017-01-03 | International Business Machines Corporation | Varying logging depth based on user defined policies |
US10169130B2 (en) | 2016-07-19 | 2019-01-01 | International Business Machines Corporation | Tailoring diagnostic information in a multithreaded environment |
US11221908B1 (en) * | 2021-03-02 | 2022-01-11 | International Business Machines Corporation | Discovery of an inexplicit link between a change and an incident in a computing environment |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10512109A (ja) * | 1994-12-23 | 1998-11-17 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 故障監視 |
US20050246590A1 (en) * | 2004-04-15 | 2005-11-03 | Lancaster Peter C | Efficient real-time analysis method of error logs for autonomous systems |
US20060200823A1 (en) * | 2005-03-02 | 2006-09-07 | Microsoft Corporation | Systems and methods of reporting multiple threads involved in a potential data race |
US7165190B1 (en) * | 2002-07-29 | 2007-01-16 | Oracle International Corporation | Method and mechanism for managing traces within a computer system |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4371930A (en) * | 1980-06-03 | 1983-02-01 | Burroughs Corporation | Apparatus for detecting, correcting and logging single bit memory read errors |
US7849465B2 (en) | 2003-02-19 | 2010-12-07 | Intel Corporation | Programmable event driven yield mechanism which may activate service threads |
US7395458B2 (en) * | 2004-05-21 | 2008-07-01 | Bea Systems, Inc. | Diagnostic instrumentation |
US7984220B2 (en) * | 2004-09-02 | 2011-07-19 | International Business Machines Corporation | Exception tracking |
US7814374B2 (en) | 2007-01-19 | 2010-10-12 | International Business Machines Corporation | System and method for the capture and preservation of intermediate error state data |
US20090320021A1 (en) | 2008-06-19 | 2009-12-24 | Microsoft Corporation | Diagnosis of application performance problems via analysis of thread dependencies |
US8489938B2 (en) | 2009-09-18 | 2013-07-16 | International Business Machines Corporation | Diagnostic data capture in a computing environment |
DE112011100168B4 (de) * | 2010-03-16 | 2023-12-14 | International Business Machines Corporation | Erfassen von Diagnosedaten in einer Datenverarbeitungsumgebung |
-
2011
- 2011-03-15 DE DE112011100168.1T patent/DE112011100168B4/de active Active
- 2011-03-15 WO PCT/EP2011/053886 patent/WO2011113828A1/en active Application Filing
- 2011-03-15 CN CN201180013864.1A patent/CN102792278B/zh not_active Expired - Fee Related
- 2011-03-15 JP JP2012557526A patent/JP5623557B2/ja not_active Expired - Fee Related
- 2011-03-15 US US13/635,260 patent/US9009537B2/en not_active Expired - Fee Related
- 2011-03-15 GB GB1209514.7A patent/GB2491274B/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10512109A (ja) * | 1994-12-23 | 1998-11-17 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 故障監視 |
US7165190B1 (en) * | 2002-07-29 | 2007-01-16 | Oracle International Corporation | Method and mechanism for managing traces within a computer system |
US20050246590A1 (en) * | 2004-04-15 | 2005-11-03 | Lancaster Peter C | Efficient real-time analysis method of error logs for autonomous systems |
US20060200823A1 (en) * | 2005-03-02 | 2006-09-07 | Microsoft Corporation | Systems and methods of reporting multiple threads involved in a potential data race |
Non-Patent Citations (2)
Title |
---|
CSNH200700095003; 平野敬幸 外1名: 'BANCS接続システム(3)-ホストオンライン処理に要求される信頼性・パフォーマンスの実現' UNISYS TECHNOLOGY REVIEW 第75号, 20021130, p.42-53, 日本ユニシス株式会社 * |
JPN6014019759; 平野敬幸 外1名: 'BANCS接続システム(3)-ホストオンライン処理に要求される信頼性・パフォーマンスの実現' UNISYS TECHNOLOGY REVIEW 第75号, 20021130, p.42-53, 日本ユニシス株式会社 * |
Also Published As
Publication number | Publication date |
---|---|
GB201209514D0 (en) | 2012-07-11 |
CN102792278B (zh) | 2015-09-16 |
US9009537B2 (en) | 2015-04-14 |
US20130013963A1 (en) | 2013-01-10 |
DE112011100168B4 (de) | 2023-12-14 |
GB2491274B (en) | 2016-03-30 |
CN102792278A (zh) | 2012-11-21 |
DE112011100168T5 (de) | 2012-10-31 |
GB2491274A (en) | 2012-11-28 |
WO2011113828A1 (en) | 2011-09-22 |
JP5623557B2 (ja) | 2014-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8141053B2 (en) | Call stack sampling using a virtual machine | |
US8949671B2 (en) | Fault detection, diagnosis, and prevention for complex computing systems | |
US11061756B2 (en) | Enabling symptom verification | |
JP5623557B2 (ja) | 診断データを収集するためのマルチスレッド化コンピューティング環境における方法、装置、およびコンピュータ・プログラム | |
JP2020512613A5 (ja) | ||
US20100017583A1 (en) | Call Stack Sampling for a Multi-Processor System | |
US20150149630A1 (en) | Event management in a distributed processing system | |
JP4562568B2 (ja) | 異常検出プログラムおよび異常検出方法 | |
US8286134B2 (en) | Call stack sampling for a multi-processor system | |
US8230429B2 (en) | Detecting a deadlock condition by monitoring firmware inactivity during the system IPL process | |
US20110072299A1 (en) | Leak monitoring system and associated methods | |
CN114328102A (zh) | 设备状态监控方法、装置、设备及计算机可读存储介质 | |
US10043139B2 (en) | Method and apparatus for resolving contention in a computer system | |
US20120180057A1 (en) | Activity Recording System for a Concurrent Software Environment | |
US20120089724A1 (en) | Diagnosis of application server performance problems via thread level pattern analysis | |
US20120246518A1 (en) | Operating a computer system | |
Ghanbari et al. | Stage-aware anomaly detection through tracking log points | |
US8489938B2 (en) | Diagnostic data capture in a computing environment | |
US10740166B2 (en) | Thread based dynamic data collection | |
JP4992740B2 (ja) | マルチプロセッサシステム、障害検出方法および障害検出プログラム | |
JP5365273B2 (ja) | 情報処理システム、監視方法及び監視プログラム | |
WO2009147738A1 (ja) | 情報処理装置及びその制御方法並びにモニタプログラム | |
JP2012108848A (ja) | 動作ログ収集システム及びプログラム | |
US20150121352A1 (en) | Identification of code synchronization points | |
CN113704088A (zh) | 一种进程追溯方法、进程追溯系统及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140520 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140813 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140819 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140924 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5623557 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |