JP5911096B2 - データ処理システム、データ処理システムの被疑解析方法、被疑解析プログラム - Google Patents
データ処理システム、データ処理システムの被疑解析方法、被疑解析プログラム Download PDFInfo
- Publication number
- JP5911096B2 JP5911096B2 JP2012048933A JP2012048933A JP5911096B2 JP 5911096 B2 JP5911096 B2 JP 5911096B2 JP 2012048933 A JP2012048933 A JP 2012048933A JP 2012048933 A JP2012048933 A JP 2012048933A JP 5911096 B2 JP5911096 B2 JP 5911096B2
- Authority
- JP
- Japan
- Prior art keywords
- transaction
- buffer
- information
- data processing
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
図2において、トランザクション測定回路1は、FIFOバッファ2にトランザクション入力があると(ステップS1 Yes)、トランザクション情報保持レジスタ11がクリア状態(ALL”0”)か否かを判定し(ステップS2)、クリア状態でなければ(ステップS2 No)、ホールド信号生成回路15により、トランザクション情報保持レジスタ11の情報をホールドする(ステップS3)。
図3において、時刻t0以前では、図3(D)に示すように、トランザクション情報保持レジスタ11がクリア状態(ALL”0”)であったとする。トランザクション情報保持レジスタ11がクリア状態のときには、トランザクション情報保持レジスタ11は、FIFOバッファ2の入力データ(図3(B))を取り込む。時刻t0では、図3(B)に示すように、FIFOバッファ2にはデータData0が入力される。このため、図3(D)に示すように、時刻t1でこのData0がトランザクション情報保持レジスタ11に取り込まれ、時刻t1から、トランザクション情報保持レジスタ11の出力はデータData0となる。
図4は、CPUとI/Oを有する複数のノードの間でデータ転送を行うようにしたデータ処理システムの基本構成を示すものである。図4において、ノード100は、CPU101及び102と、I/O104及び105と、ノードコントローラ103とを備えている。ノード110は、CPU111及び112と、I/O114及び115と、ノードコントローラ113とを備えている。ノード100のノードコントローラ103と、ノード110のノードコントローラ113とは、ノード間経路120を介して接続されている。ノード100及び110は、ネットワークを構成する端末である。また、ノードコントローラ103及び113は、各ノード内の情報をコントロールするためのコントローラである。
CPU101から出されたトランザクションは、先ず、FIFOバッファ200に格納される。次に、先読み先出し制御によりFIFOバッファ200から出力されたトランザクションは、共通経路207を経由して、ルーティングバッファ202へ格納される。ルーティングバッファ202は、トランザクションの行き先を判断し、行き先がI/O105であることが分かるため、トランザクションはルーティングバッファ202により共通経路208を経由して、FIFOバッファ204へ格納される。FIFOバッファ204から出力されたトランザクションは、I/O105のFIFOバッファ206へ格納され、I/O105に到達する。
CPU102から出されたトランザクションは、先ず、FIFOバッファ201に格納される。次に、先読み先出し制御によりFIFOバッファ201から出力されたトランザクションは、共通経路207を経由してルーティングバッファ202へ格納される。ルーティングバッファ202はトランザクションの行き先を判断し、行き先がI/O115であることが分かるため、トランザクションはルーティングバッファ202によりノード間経路120を経由して、ノード110側のルーティングバッファ212へ格納される。ルーティングバッファ212は、トランザクションの行き先を再度判断し、行き先がI/O115であることが分かるため、トランザクションはルーティングバッファ212より共通経路218を経由して、FIFOバッファ214へ格納される。FIFOバッファ214から出力されたトランザクションはI/O115のFIFOバッファ216へ格納され、I/O115に到達する。
図6は、障害発生から復旧までの手順を示すフローチャートである。図6に示すように、先ず、障害が発生すると、マネージメントファームウェアは、システムログ採取を行う(ステップS101)。システムログとはハードウェア上にあるトランザクション情報、装置情報などのデータであり、障害情報も含まれる。
CPU102で障害が発生すると、マネージメントファームウェアはシステムログを採取する(ステップS1)。採取されたログは被疑解析プログラムにより解析される(ステップS2)。このとき被疑解析プログラムはログからCPU102でタイムアウト障害が発生したことと、タイムアウトしたトランザクションの行き先がI/O105であることが判断できるので、「障害を検出した箇所(CPU102)」と「タイムアウトしたトランザクションの行き先(I/O105)」を被疑として指摘することになる。なお、行き先を被疑として指摘していたのはトランザクションの行き先で故障が起きた可能性を示すためである。
上述した実施形態では、本発明によるデータ処理システムの一実施形態として図7に示す構成について説明したが、本発明によるデータ処理システムの基本構成は、図13に示すとおりである。
すなわち、本発明によるデータ処理システム1001は、各ノード中の各バッファ1003の格納状態を検出するトランザクション測定手段1002と、タイムアウト障害が発生した場合に、システムログ1004と共に前記トランザクション測定手段1002の計測値を取得し、前記システムログ1004の結果と前記トランザクション測定手段1002の計測値を基に、被疑の部位を特定する被疑解析手段1005とを備えることを特徴とする。
複数のノード間でデータ転送を行うようにしてデータ処理システムであって、
各ノード中の各バッファの格納状態を検出するトランザクション測定手段と、
タイムアウト障害が発生した場合に、障害情報を含むシステムログの情報と前記トランザクション測定手段の計測値からバッファの格納状態の情報を取得し、前記システムログの情報と前記バッファの格納状態の情報を基に、被疑の部位を特定する被疑解析手段と
を備えることを特徴とするデータ処理システム。
前記トランザクション測定手段は、バッファにトランザクションが入力されてから、当該入力トランザクションと同一のトランザクションが前記バッファから出力されるまでのクロック数を計数することを特徴とする付記1に記載のデータ処理システム。
前記被疑解析手段は、前記バッファの格納状態の情報と閾値とを比較し、前記閾値を超える格納状態のバッファに障害が発生した場合に想定される部位を解析して、被疑を追加することを特徴とする付記1又は2に記載のデータ処理システム。
前記閾値は、前記バッファの容量に基づいて設定することを特徴とする付記3に記載のデータ処理システム。
複数のノード間でデータ転送を行うようにしてデータ処理システムの被疑解析方法であって、
障害情報を含むシステムログの情報と各ノード中の各バッファの格納状態の情報を取得し、
タイムアウト障害が発生した場合に、前記システムログの情報と前記各バッファの格納状態の情報を基に被疑の部位を特定する
ことを特徴とするデータ処理システムの被疑解析方法。
バッファにトランザクションが入力されてから、当該入力トランザクションと同一のトランザクションが前記バッファから出力されるまでのクロック数を計数することで、各ノード中の各バッファの格納状態の情報を取得する
ことを特徴とする付記5に記載のデータ処理システムの被疑解析方法。
複数のノード間でデータ転送を行うようにしてデータ処理システムの被疑解析プログラムであって、
障害情報を含むシステムログの情報と各ノード中の各バッファの格納状態の情報を取得するステップと、
タイムアウト障害が発生した場合に、前記システムログの情報と前記各バッファの格納状態の情報を基に被疑の部位を特定するステップと
を含むことを特徴とするデータ処理システムの被疑解析プログラム。
各ノード中の各バッファの格納状態の情報を取得するステップでは、バッファにトランザクションが入力されてから、当該入力トランザクションと同一のトランザクションが前記バッファから出力されるまでのクロック数を計数する
ことを特徴とする付記7に記載のデータ処理システムの被疑解析プログラム。
バッファに入力されるトランザクション情報を取り込んで保持するトランザクション保持レジスタと、
前記トランザクション保持レジスタにトランザクションが取り込まれてから、前記トランザクション保持レジスタに取り込まれたトランザクションと同様のトランザクションが前記バッファから出力されるまで、クロックをカウントするトランザクション測定用カウンタとを備え、
前記トランザクション測定用カウンタのカウント値により前記バッファの格納状態を計測する
ことを特徴とするトランザクション測定回路。
12:トランザクション測定用カウンタ
13:クリア信号生成回路
14:インクリメントイネーブル信号生成回路
15:ホールド信号生成回路
200、201、203、204、205、206、210、211、213、214、215、216:FIFOバッファ
300、301、303、304、305、306、310、311、313、314、315、316:トランザクション測定回路
Claims (8)
- 複数のノード間でデータ転送を行うようにしてデータ処理システムであって、
各ノード中の各バッファの格納状態を検出するトランザクション測定手段と、
タイムアウト障害が発生した場合に、障害情報を含むシステムログの情報と前記トランザクション測定手段の計測値からつまりが発生しているバッファを特定し、被疑の部位に関連付けてタイムアウトが検出されたトランザクションの行き先とつまりが発生しているバッファの識別情報とを格納する対応表を参照して、被疑の部位を特定する被疑解析手段とを備えることを特徴とするデータ処理システム。 - 前記トランザクション測定手段は、バッファにトランザクションが入力されてから、当該入力トランザクションと同一のトランザクションが前記バッファから出力されるまでのクロック数を計数することを特徴とする請求項1に記載のデータ処理システム。
- 前記被疑解析手段は、前記バッファの格納状態の情報と閾値とを比較し、前記閾値を超える格納状態のバッファに障害が発生した場合に想定される部位を解析して、被疑を追加することを特徴とする請求項1又は2に記載のデータ処理システム。
- 前記閾値は、前記バッファの容量に基づいて設定することを特徴とする請求項3に記載のデータ処理システム。
- 複数のノード間でデータ転送を行うようにしてデータ処理システムの被疑解析方法であって、
障害情報を含むシステムログの情報と各ノード中の各バッファの格納状態の情報を取得し、
タイムアウト障害が発生した場合に、前記システムログの情報と前記取得された格納状態からつまりが発生しているバッファを特定し、
被疑の部位に関連付けてタイムアウトが検出されたトランザクションの行き先とつまりが発生しているバッファの識別情報とを格納する対応表を参照して、前記特定されたバッファに基づいて被疑の部位を特定する
ことを特徴とするデータ処理システムの被疑解析方法。 - バッファにトランザクションが入力されてから、当該入力トランザクションと同一のトランザクションが前記バッファから出力されるまでのクロック数を計数することで、各ノード中の各バッファの格納状態の情報を取得する
ことを特徴とする請求項5に記載のデータ処理システムの被疑解析方法。 - 複数のノード間でデータ転送を行うようにしてデータ処理システムの被疑解析プログラムであって、
障害情報を含むシステムログの情報と各ノード中の各バッファの格納状態の情報を取得するステップと、
タイムアウト障害が発生した場合に、前記システムログの情報と前記取得された格納状態からつまりが発生しているバッファを特定するステップと、
被疑の部位に関連付けてタイムアウトが検出されたトランザクションの行き先とつまりが発生しているバッファの識別情報とを格納する対応表を参照して、前記特定されたバッファに基づいて被疑の部位を特定するステップと
を含むことを特徴とするデータ処理システムの被疑解析プログラム。 - 各ノード中の各バッファの格納状態の情報を取得するステップでは、バッファにトランザクションが入力されてから、当該入力トランザクションと同一のトランザクションが前記バッファから出力されるまでのクロック数を計数する
ことを特徴とする請求項7に記載のデータ処理システムの被疑解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012048933A JP5911096B2 (ja) | 2012-03-06 | 2012-03-06 | データ処理システム、データ処理システムの被疑解析方法、被疑解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012048933A JP5911096B2 (ja) | 2012-03-06 | 2012-03-06 | データ処理システム、データ処理システムの被疑解析方法、被疑解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013186524A JP2013186524A (ja) | 2013-09-19 |
JP5911096B2 true JP5911096B2 (ja) | 2016-04-27 |
Family
ID=49387934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012048933A Active JP5911096B2 (ja) | 2012-03-06 | 2012-03-06 | データ処理システム、データ処理システムの被疑解析方法、被疑解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5911096B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108021809A (zh) * | 2017-12-19 | 2018-05-11 | 北京明朝万达科技股份有限公司 | 一种数据处理方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008176477A (ja) * | 2007-01-17 | 2008-07-31 | Hitachi Ltd | 計算機システム |
JP5505966B2 (ja) * | 2010-02-25 | 2014-05-28 | エヌイーシーコンピュータテクノ株式会社 | 障害管理システム及び方法 |
-
2012
- 2012-03-06 JP JP2012048933A patent/JP5911096B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013186524A (ja) | 2013-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10296408B2 (en) | Operation management apparatus, operation management method, and program | |
JP5874936B2 (ja) | 運用管理装置、運用管理方法、及びプログラム | |
JP6183450B2 (ja) | システム分析装置、及び、システム分析方法 | |
JP4573179B2 (ja) | 性能負荷異常検出システム、性能負荷異常検出方法、及びプログラム | |
JP6183449B2 (ja) | システム分析装置、及び、システム分析方法 | |
JP5446894B2 (ja) | ネットワーク管理支援システム、ネットワーク管理支援装置、ネットワーク管理支援方法およびプログラム | |
JP5495310B2 (ja) | 情報処理装置、障害解析方法及び障害解析プログラム | |
US9009537B2 (en) | Diagnostic data capture in a computing environment | |
JP5911096B2 (ja) | データ処理システム、データ処理システムの被疑解析方法、被疑解析プログラム | |
JP4449929B2 (ja) | トランザクション装置、遅延障害検出装置及び方法、並びにプログラム | |
US10009151B2 (en) | Packet storage method, information processing apparatus, and non-transitory computer-readable storage medium | |
JP4559974B2 (ja) | 管理装置及び管理方法及びプログラム | |
US9690639B2 (en) | Failure detecting apparatus and failure detecting method using patterns indicating occurrences of failures | |
JP2017211806A (ja) | 通信の監視方法、セキュリティ管理システム及びプログラム | |
EP3812940A1 (en) | Vulnerability analyzer | |
JP5958987B2 (ja) | 情報処理装置、故障診断制御装置、故障判定方法、故障判定プログラム | |
JP5679347B2 (ja) | 障害検知装置、障害検知方法、及びプログラム | |
US9830403B2 (en) | Communication apparatus, and CAM failure diagnosis method | |
KR20180035835A (ko) | 확률적 프로세서 모니터링 | |
JPWO2019022207A1 (ja) | イベント監視システム、端末装置、監視サーバ、イベント監視方法および記録媒体 | |
CN115509906A (zh) | 软件缺陷检测方法、装置、设备和存储介质 | |
KR101527149B1 (ko) | 중복 패킷을 방지하는 패킷 처리 방법 및 그 장치 | |
KR101415363B1 (ko) | 작은 메모리를 이용해서 스프레드를 근사하는 알고리즘 | |
CN115543689A (zh) | 一种数据恢复方法、系统、设备及存储介质 | |
CN115865723A (zh) | 基于分布式系统应用的全链路健康体检方法、终端及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20140804 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151013 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160324 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5911096 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |