JP2006079485A - 電子計算機における障害解析用情報収集方式 - Google Patents

電子計算機における障害解析用情報収集方式 Download PDF

Info

Publication number
JP2006079485A
JP2006079485A JP2004264849A JP2004264849A JP2006079485A JP 2006079485 A JP2006079485 A JP 2006079485A JP 2004264849 A JP2004264849 A JP 2004264849A JP 2004264849 A JP2004264849 A JP 2004264849A JP 2006079485 A JP2006079485 A JP 2006079485A
Authority
JP
Japan
Prior art keywords
data processing
task
information
storage device
recording unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004264849A
Other languages
English (en)
Inventor
Rin Kobayashi
臨 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Communication Systems Ltd
Original Assignee
NEC Communication Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Communication Systems Ltd filed Critical NEC Communication Systems Ltd
Priority to JP2004264849A priority Critical patent/JP2006079485A/ja
Publication of JP2006079485A publication Critical patent/JP2006079485A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】 障害の状態に到るまでの処理経過情報をオーバヘッド少なく収集することのできる障害解析用情報収集方式を提供する。
【解決手段】 演算処理装置101上で稼働する複数のデータ処理タスク110−1、110−2で主記憶装置102上の1つの履歴記録部220を共用する。各データ処理タスク110−1、110−2で異常が検出されない期間中、データ処理タスク110−1、110−2の処理経過情報は、履歴記録部220にラップアラウンド方式で記録される。何れかのデータ処理タスク110−1、110−2で異常が検出されると、履歴記録部220に記録された処理経過情報が外部記憶装置103に出力される。
【選択図】 図3

Description

本発明は、複数のデータ処理タスクが稼働する電子計算機における障害解析用情報収集方式に関する。
電子計算機に何らかの障害が発生した場合、障害の解析に役立つ情報を残すために、障害が検出された時の情報を外部記憶装置に出力することが行われている。
例えば特許文献1では、セグメンテーション・ページングによる仮想記憶機能を有する電子計算機システムにおいて、実行命令トレース手段が命令実行部で実行される命令を時系列に記録し、プログラム例外検出手段が実行命令の処理が正常に実行できないことを検出すると、障害情報格納手段が実行命令トレース手段に記録されている最新の実行命令情報から順に分析して、参照/更新されたセグメント情報を抽出し、そのセグメント情報をメモリから取り込んで二次記憶装置上の障害情報格納領域に格納し、さらにセグメント情報がメモリに存在せず二次記憶装置の仮想メモリ空間上に存在する場合には仮想メモリ空間から読み込んで二次記憶装置上の障害情報格納領域に格納する。
また特許文献2では、CPU、メモリおよびI/O制御回路のそれぞれに、障害発生原因となったエラー要因を保持するエラーレジスタと各装置の動作状態を設定するためのモードレジスタなどから構成される障害情報レジスタを設け、電源がオフされたことを電源異常検出回路が検出すると、クロック発生回路がクロックを生成し、シフトモード設定回路が障害情報レジスタをシフトモードに設定することにより各障害情報レジスタに格納されている障害情報データを障害パスを介して不揮発性メモリ制御回路に転送し、不揮発性メモリ制御回路が転送されてきた障害情報データを不揮発性メモリに記憶する。
特許文献1および2と同様に障害発生時のメモリ内容を外部記録装置に出力する技術は特許文献3、4および5にも記載されている。
特開平5−158753号公報 特開平11−149392号公報 特開平4−278747号公報 特開平5−197581号公報 特開平8−30565号公報
従来は上述したようにして障害の解析に役立つ情報を外部記憶装置に残すようにしているが、以下のような課題があった。
障害が検出された時の情報しか残らず、その状態に到るまでの処理経過情報が残らないため、障害の原因究明が困難になる場合がある。特に、多重処理環境でオンライン処理を行う場合、再現性に乏しいため障害に到るまでの処理経過情報が残っていないと障害の解析が困難になる。
障害に到るまでの処理経過情報を従来技術によって収集しようとすると、外部記憶装置への頻繁なアクセスが発生する。これは本来の業務処理にとってオーバヘッドになるため、即時性が要求されるオンラインシステムでは、業務処理能力が大幅に低下するという課題がある。
また特許文献1および2に見られるような障害情報収集では、複数のデータ処理タスクが稼働する電子計算機の場合、個々のデータ処理タスク単位あるいは複数のデータ処理タスク単位で障害情報を収集できないため、データ処理タスクで検出された障害の解析を容易に行うことができないという課題がある。
本発明はこのような事情に鑑みて提案されたものであり、その目的は、障害の状態に到るまでの処理経過情報をオーバヘッド少なく収集することのできる障害解析用情報収集方式を提供することにある。
本発明の別の目的は、複数のデータ処理タスクが稼働する電子計算機において、個々のデータ処理タスク単位あるいは複数のデータ処理タスク単位で、障害の状態に到るまでの処理経過情報をオーバヘッド少なく収集することのできる障害解析用情報収集方式を提供することにある。
本発明の第1の電子計算機における障害解析用情報収集方式は、データ処理タスクが稼働する電子計算機における障害解析用情報収集方式において、前記データ処理タスクで異常が検出されない期間中、前記データ処理タスクの処理経過情報を主記憶装置上のラップアラウンド方式の履歴記録部に記録する手段と、異常が検出された際に前記履歴記録部に記録された処理経過情報を外部記憶装置へ出力する手段とを前記データ処理タスクが有することを特徴とする。より具体的には、演算処理装置と主記憶装置と外部記憶装置とを備え、前記演算処理装置上で複数のデータ処理タスクが稼働する電子計算機における障害解析用情報収集方式において、ラップアラウンド方式の履歴記録部を前記主記憶装置に前記データ処理タスク対応に備え、前記データ処理タスクは、入力データを入力して業務処理を実行し結果を出力するデータ処理モジュールと、自タスクに対応する前記履歴記録部への処理経過情報の記録および前記履歴記録部に記録された処理経過情報の前記外部記憶装置への出力を行う情報収集モジュールとを備え、前記データ処理モジュールに、処理経過情報の記録要求を自タスクの前記情報収集モジュールに出力する記録要求部と、自タスクにおける異常検出時に処理経過情報の出力要求を自タスクの前記情報収集モジュールに出力する掃出し要求部とを備え、前記情報収集モジュールに、自タスクの前記データ処理モジュールから出力された記録要求に従って処理経過情報を自タスクに対応する前記履歴記録部に記録する記録部と、自タスクの前記データ処理モジュールから出力された出力要求に従って自タスクに対応する前記履歴記録部に記録された処理経過情報を前記外部記憶装置に出力する出力部とを備えることを特徴とする。
本発明の第2の電子計算機における障害解析用情報収集方式は、第1の電子計算機における障害解析用情報収集方式において、複数の前記データ処理タスクで同じ前記履歴記録部を共用することを特徴とする。より具体的には、演算処理装置と主記憶装置と外部記憶装置とを備え、前記演算処理装置上で複数のデータ処理タスクが稼働する電子計算機における障害解析用情報収集方式において、ラップアラウンド方式の履歴記録部を、前記複数のデータ処理タスクで共有される前記主記憶装置上の共有領域に前記複数のデータ処理タスク対応に備え、前記データ処理タスクは、入力データを入力して業務処理を実行し結果を出力するデータ処理モジュールと、自タスクに対応する前記履歴記録部への処理経過情報の記録および前記履歴記録部に記録された処理経過情報の前記外部記憶装置への出力を行う情報収集モジュールとを備え、前記データ処理モジュールに、処理経過情報の記録要求を自タスクの前記情報収集モジュールに出力する記録要求部と、自タスクにおける異常検出時に処理経過情報の出力要求を自タスクの前記情報収集モジュールに出力する掃出し要求部とを備え、前記情報収集モジュールに、自タスクの前記データ処理モジュールから出力された記録要求に従って、排他制御を行って、処理経過情報を自タスクに対応する前記履歴記録部に記録する記録部と、自タスクの前記データ処理モジュールから出力された出力要求に従って、排他制御を行って、自タスクに対応する前記履歴記録部に記録された処理経過情報を前記外部記憶装置に出力する出力部とを備えることを特徴とする。
『作用』
本発明の第1の電子計算機における障害解析用情報収集方式にあっては、データ処理タスクで異常が検出されない期間中、データ処理タスクの処理経過情報は、主記憶装置上のラップアラウンド方式の履歴記録部に記録され、異常が検出された際、履歴記録部に記録された処理経過情報が外部記憶装置に出力される。
本発明の第2の電子計算機における障害解析用情報収集方式にあっては、各データ処理タスクで異常が検出されない期間中、データ処理タスクの処理経過情報は、主記憶装置上のラップアラウンド方式の履歴記録部に記録され、履歴記録部を共用する何れかのデータ処理タスクで異常が検出された際、履歴記録部に記録された処理経過情報が外部記憶装置に出力される。
本発明の第1の電子計算機における障害解析用情報収集方式によれば、個々のデータ処理タスク単位で、障害の状態に到るまでの処理経過情報をオーバヘッド少なく収集することができる。その理由は、データ処理タスクと履歴記録部とを1対1に対応付け、データ処理タスクで異常が検出されない期間中は、データ処理タスクの処理経過情報を高速アクセス可能な主記憶装置上の履歴記録部に記録し、異常が検出された際、履歴記録部に記録された処理経過情報を外部記憶装置に出力するようにしているためである。
本発明の第2の電子計算機における障害解析用情報収集方式によれば、複数のデータ処理タスク単位で、障害の状態に到るまでの処理経過情報をオーバヘッド少なく収集することができ、かつ、直接障害が発生していないデータ処理タスクの処理経過情報も別タスクの障害発生を契機に外部記憶装置に収集することができる。その理由は、複数のデータ処理タスクで1つの履歴記録部を共用し、各データ処理タスクで異常が検出されない期間中は、各データ処理タスクの処理経過情報を高速アクセス可能な主記憶装置上の履歴記録部に記録し、何れかのデータ処理タスクで異常が検出された際、履歴記録部に記録された処理経過情報を外部記憶装置に出力するようにしているためである。
『第1の実施の形態』
図1を参照すると、本発明の第1の実施の形態にかかる電子計算機100は、演算処理装置101と、主記憶装置102と、ハードディスク装置(HDD)などの外部記憶装置103と、外部のネットワークを通じて端末と通信するための通信装置やコンソール装置などのその他装置104とから構成されている。
本実施の形態の電子計算機100は、オンライン処理を行う計算機であり、演算処理装置101上でユーザタスクである1以上のデータ処理タスク110が稼働する。ここで、タスクとはマルチプログラミングによって資源が配分され与えられる対象であり、多くの場合、タスクとプログラムは1対1に対応する。従って、本明細書における「データ処理タスク」は「データ処理プログラム」と読み替えることができる。また主記憶装置102には、データ処理タスク110に1対1に対応する履歴記録部120が設けられている。
履歴記録部120は、それぞれ1つの処理経過情報を記録するエントリがE1〜EnのN個設けられており、最大N個の処理経過情報を記録する。先頭のエントリE1から順に最後のエントリEnまで処理経過情報を順番に記録すると、また先頭のエントリE1に戻って古い情報を新しい情報で上書きしていく、いわゆるラップアラウンド方式であり、常に最新N個の処理経過情報が残るようになっている。
図2に履歴記録部120の構成例を示す。管理部121とデータ部122とから構成され、データ部122にN個のエントリE1〜Enが設けられ、管理部121には、次に書き込みを行うエントリを指し示す書込ポインタWPが設けられる。
データ処理タスク110は、ユーザタスクであり、データ処理モジュール130と情報収集モジュール140とで構成される。
データ処理モジュール130は、その他装置104を構成する通信装置において受信された端末からの入力データやコンソール装置からの入力データを入力する入力部S1と、この入力された入力データの記録を情報収集モジュール140に対して要求する記録要求部S2と、前記入力された入力データが予め定められた範囲の値であるかどうかを調べるチェック部S3と、異常のなかった入力データを用いて所定の業務処理を実行し結果を要求元に返却する業務処理部S4と、入力データに異常があった場合に履歴記録部120に記録されている処理経過情報の出力を情報収集モジュール140に要求する掃出し要求部S5とで構成される。
情報収集モジュール140は、データ処理モジュール130の記録要求部S2から出力された記録要求に従って、記録を要求された入力データに必要に応じて所定の付加データを付加したものを処理経過情報とし、履歴記録部120に記録する記録部S11と、データ処理モジュール130の掃出し要求部S5から出力された出力要求に従って、履歴記録部120に記録された処理経過情報を外部記憶装置103に出力する出力部S12とを有する。前記所定の付加データとしては、現在時刻データ、データ処理タスク110を一意に識別するタスクIDがある。
次に本実施の形態の動作を説明する。
その他装置104を構成する通信装置において端末からの入力データが受信されると、その入力データを処理するデータ処理タスク110に渡され、処理される。データ処理タスク110のデータ処理モジュール130は、入力部S1により入力データを入力し、記録要求部S2により、入力データの記録を情報収集モジュール140に対して要求する。情報収集モジュール140の記録部S11は、記録を要求された入力データに現在時刻データとタスクIDを付加したものを処理経過情報とし、履歴記録部120に記録する。具体的には、図2の書込ポインタWPが指し示すエントリEi(i=1〜n)に処理経過情報を書き込み、書込ポインタWPの値を1エントリ分だけインクリメントする。ただし、最後のエントリEnに書き込んだときは書込ポインタWPの値を先頭のエントリE1を指し示すように初期化する。
記録要求部S2により入力データの記録を情報収集モジュール140に対して要求したデータ処理モジュール130は、引き続いて、チェック部S3により、入力データが予め定められた範囲の値であるかどうかを調べ、異常がなければ、業務処理部S4により、入力データを用いて所定の業務処理を実行し結果を要求元に返却する。
他方、入力データに異常があった場合、データ処理モジュール130は、掃出し要求部S5により、処理経過情報の出力を情報収集モジュール140に対して要求し、データ処理モジュール130の処理を終える。情報収集モジュール140は、この要求を受けると、出力部S12により、履歴記録部120に記録された全ての処理経過情報を外部記憶装置103に出力する。
次に本実施の形態の効果を説明する。
本実施の形態によれば、データ処理タスク110で異常が検出されるまでの処理経過情報をオーバヘッド少なく収集することができる。その理由は、異常が検出されるまでは外部記憶装置103に比べて高速アクセス可能な主記憶装置102上の履歴記録部120に処理経過情報を記録するためである。また、履歴記録部120への処理経過情報の書き込みは、データ処理タスク110自身が行うため、オペレーティングシステム(OS)の介在によるオーバヘッドがないからである。
また本実施の形態によれば、データ処理タスク110で異常が検出されるまでの処理経過情報をデータ処理タスク単位で収集することができる。その理由は、データ処理タスク110に1対1に対応する履歴記録部120を使用するからである。
以上の実施の形態では、データ処理タスク110の入力データを処理経過情報として残すようにした。入力データを履歴として残す利点として「再現性」が挙げられる。障害情報から障害箇所そのものは特定できても、なぜそこに至ったかは記録として残らないことが少なからずある。そのような場合にも、データ処理タスク110の入力データが残っていれば、障害解析用の別システムにおいて同じことを実施することにより、同じ障害を引き起こすことが可能となる。障害解析用の別システムで同じ事象を起こすことができれば、追加で様々な情報を収集することも可能であり、障害の解明に大きく役立つ。しかし、本発明は入力データ以外のデータを処理経過情報として残すようにしてもよいことは勿論のことである。
また以上の実施の形態では、データ処理タスク110で入力データの異常を検出した際に履歴記録部120の処理経過情報を外部記憶装置103へ出力したが、データ処理タスク110が検出する異常は入力データの異常に限られず、他の任意の異常を検出したときに履歴記録部120の処理経過情報を外部記憶装置103へ出力するようにしてもよい。
『第2の実施の形態』
図3を参照すると、本発明の第2の実施の形態にかかる電子計算機200は、演算処理装置101上でユーザタスクであるデータ処理タスク110−1、110−2が稼働し、このデータ処理タスク110−1とデータ処理タスク110−2間で共有される主記憶装置102上のメモリ領域に、これら2つのデータ処理タスク110−1、110−2で共用する履歴記録部220が設けられている点で、図1に示した第1の実施の形態にかかる電子計算機100と相違する。システムのオペレーティングシステム(OS)がタスク間における共有メモリ機能を具備している場合、その機能によって提供される共有メモリ上に履歴記録部220が生成される。
図4に履歴記録部220の構成例を示す。図2の履歴記録部120と同様に、管理部221とデータ部222とから構成され、データ部222にN個のエントリE1〜Enが設けられているが、管理部221には、次に書き込みを行うエントリを指し示す書込ポインタWPに加えて、ロックフラグLFが設けられている。ロックフラグLFは、データ処理タスク110−1とデータ処理タスク110−2とが履歴記録部220を同時にアクセスしないよう排他制御するために使用される。
データ処理タスク110−1、110−2は、ユーザタスクであり、データ処理モジュール130−1、130−2と、情報収集モジュール140−1、140−2とで構成される。
データ処理モジュール130−1、130−2は、図1のデータ処理モジュール130と同様の構成を有している。
情報収集モジュール140−1、140−2は、自タスク内のデータ処理モジュール130−1、130−2の記録要求部S2から出力された記録要求に従って、記録を要求された入力データに必要に応じて現在時刻データおよびタスクIDなど所定の付加データを付加したものを処理経過情報とし、排他制御を行って履歴記録部220に記録する記録部S21と、自タスク内のデータ処理モジュール130−1、130−2の掃出し要求部S5から出力された出力要求に従って、履歴記録部220に記録された処理経過情報を排他制御を行って外部記憶装置103に出力する出力部S22とを有する。
次に本実施の形態の動作を説明する。
その他装置104を構成する通信装置において端末からの入力データが受信されると、その入力データを処理するデータ処理タスクに渡され、処理される。ここでは、データ処理タスク110−1で処理される場合を例に動作を説明する。データ処理タスク110−1のデータ処理モジュール130−1は、入力部S1により入力データを入力し、記録要求部S2により、入力データの記録を情報収集モジュール140−1に対して要求する。情報収集モジュール140−1の記録部S21は、記録を要求された入力データに現在時刻データとタスクIDを付加したものを処理経過情報とし、排他制御を行って履歴記録部220に記録する。具体的には、図4のロックフラグLFが非ロック状態を示す値(例えば論理値0とする)かどうかを調べて、若し非ロック状態であればロック状態を示す値(例えば論理値1とする)に書き換える操作を、テスト・アンド・セット命令などを用いて実行する。若し、ロックフラグLFをロック状態にする操作に失敗すれば、つまりロックフラグLFが既にロック状態ならば、一定時間経過後に再試行する。他方、ロックフラグLFをロック状態にする操作に成功すれば、書込ポインタWPが指し示すエントリEi(i=1〜n)に処理経過情報を書き込み、書込ポインタWPの値を1エントリ分だけインクリメントする。ただし、最後のエントリEnに書き込んだときは書込ポインタWPの値を先頭のエントリE1を指し示すように初期化する。そして、ロックフラグLFを非ロック状態を示す値に書き換える。
記録要求部S2により入力データの記録を情報収集モジュール140−1に対して要求したデータ処理モジュール130−1は、引き続いて、チェック部S3により、入力データが予め定められた範囲の値であるかどうかを調べ、異常がなければ、業務処理部S4により、入力データを用いて所定の業務処理を実行し結果を要求元に返却する。
他方、入力データに異常があった場合、データ処理モジュール130−1は、掃出し要求部S5により、処理経過情報の出力を情報収集モジュール140−1に対して要求し、データ処理モジュール130−1の処理を終える。情報収集モジュール140−1は、この要求を受けると、出力部S22により、履歴記録部220に記録された全ての処理経過情報を外部記憶装置103に出力する。具体的には、図4のロックフラグLFが非ロック状態を示す値かどうかを調べて、若し非ロック状態であればロック状態を示す値に書き換える操作を、テスト・アンド・セット命令などを用いて実行する。若し、ロックフラグLFをロック状態にする操作に失敗すれば、一定時間経過後に再試行する。そして、ロックフラグLFをロック状態にする操作に成功すれば、履歴記録部220に記録された全ての処理経過情報を外部記憶装置103に出力し、その完了後にロックフラグLFを非ロック状態を示す値に書き換える。
他のデータ処理タスク110−2もデータ処理タスク110−1と同様に、処理経過情報の履歴記録部220への記録、異常検出による履歴記録部220中のデータの外部記録装置103への掃き出しを行う。
次に本実施の形態の効果を説明する。
本実施の形態によれば、データ処理タスク110−1、110−2で異常が検出されるまでの処理経過情報をオーバヘッド少なく収集することができる。その理由は、異常が検出されるまでは外部記憶装置103に比べて高速アクセス可能な主記憶装置102上の履歴記録部220に処理経過情報を記録するためである。また、履歴記録部220への処理経過情報の書き込みは、データ処理タスク110−1、110−2自身が行うため、オペレーティングシステム(OS)の介在によるオーバヘッドがないからである。
また本実施の形態によれば、データ処理タスク110−1、110−2で異常が検出されるまでの処理経過情報をデータ処理タスク110−1と110−2の組単位で収集することができる。その理由は、データ処理タスク110−1とデータ処理タスク110−2の組に1対1に対応する履歴記録部220を使用するからである。
さらに本実施の形態によれば、データ処理タスク110−1とデータ処理タスク110−2とで同じ履歴記録部220を共用しており、何れか一方のタスクで異常が検出された際に履歴記録部220に記憶された全ての処理経過情報が外部記録装置103に出力されるため、直接障害が発生していないデータ処理タスクの処理経過情報も別タスクの障害発生を契機に外部記憶装置に収集することができる。これにより、例えば、各々のデータ処理タスクが「状態管理部」「信号編集部」などのように、機能毎に存在しているような場合、異常を検出したタスクの処理経過情報のみでなく、別のタスクの処理経過情報も収集することができ、解明が容易になる。
また本実施の形態によれば、履歴記録部220の内容を外部記憶装置103に出力する際に排他を行っているため、正常なデータ処理タスクによる新たな処理経過情報の履歴記録部220への記録を掃き出しが終わるまで待たせることができる。このため、異常検出時刻後の処理経過情報によって異常検出時刻前の処理経過情報が書き換えられてしまうのを防止することができる。
以上の実施の形態では、データ処理タスク110−1、110−2の入力データを処理経過情報として残すようにしたが、入力データ以外のデータを処理経過情報として残すようにしてもよいことは勿論のことである。
また以上の実施の形態では、データ処理タスク110−1、110−2で入力データの異常を検出した際に履歴記録部220の処理経過情報を外部記憶装置103へ出力したが、データ処理タスク110−1、110−2が検出する異常は入力データの異常に限られず、他の任意の異常を検出したときに履歴記録部220の処理経過情報を外部記憶装置103へ出力するようにしてもよい。
さらに以上の実施の形態では、1つの履歴記録部220を2つのデータ処理タスクで共用したが、3以上のデータ処理タスクで同じ履歴記録部220を共用するようにしてもよい。
また以上の実施の形態では、ロックフラグを用いて排他制御を実現したが、排他制御を実現する手法は従来より各種提案されているので、それらの任意の手法を使用することが可能である。
本発明の第1の実施の形態にかかる電子計算機における障害解析用情報収集方式のブロック図である。 本発明の第1の実施の形態における履歴記録部の構成例を示す図である。 本発明の第2の実施の形態にかかる電子計算機における障害解析用情報収集方式のブロック図である。 本発明の第2の実施の形態における履歴記録部の構成例を示す図である。
符号の説明
100、200…電子計算機
101…演算処理装置
102…主記憶装置
103…外部記憶装置
104…その他装置
110、110−1、110−2…データ処理タスク
120、220…履歴記録部
130、130−1、130−2…データ処理モジュール
140、140−1、140−2…情報収集モジュール
S1…入力部
S2…記録要求部
S3…チェック部
S4…業務処理部
S5…掃出し要求部
S11、S21…記録部
S12、S22…出力部

Claims (6)

  1. データ処理タスクが稼働する電子計算機における障害解析用情報収集方式において、
    前記データ処理タスクで異常が検出されない期間中、前記データ処理タスクの処理経過情報を主記憶装置上のラップアラウンド方式の履歴記録部に記録する手段と、異常が検出された際に前記履歴記録部に記録された処理経過情報を外部記憶装置へ出力する手段とを前記データ処理タスクが有することを特徴とする電子計算機における障害解析用情報収集方式。
  2. 複数の前記データ処理タスクで同じ前記履歴記録部を共用することを特徴とする請求項1記載の電子計算機における障害解析用情報収集方式。
  3. 演算処理装置と主記憶装置と外部記憶装置とを備え、前記演算処理装置上で複数のデータ処理タスクが稼働する電子計算機における障害解析用情報収集方式において、
    ラップアラウンド方式の履歴記録部を前記主記憶装置に前記データ処理タスク対応に備え、
    前記データ処理タスクは、入力データを入力して業務処理を実行し結果を出力するデータ処理モジュールと、自タスクに対応する前記履歴記録部への処理経過情報の記録および前記履歴記録部に記録された処理経過情報の前記外部記憶装置への出力を行う情報収集モジュールとを備え、
    前記データ処理モジュールに、処理経過情報の記録要求を自タスクの前記情報収集モジュールに出力する記録要求部と、自タスクにおける異常検出時に処理経過情報の出力要求を自タスクの前記情報収集モジュールに出力する掃出し要求部とを備え、
    前記情報収集モジュールに、自タスクの前記データ処理モジュールから出力された記録要求に従って処理経過情報を自タスクに対応する前記履歴記録部に記録する記録部と、自タスクの前記データ処理モジュールから出力された出力要求に従って自タスクに対応する前記履歴記録部に記録された処理経過情報を前記外部記憶装置に出力する出力部とを備えることを特徴とする電子計算機における障害解析用情報収集方式。
  4. 演算処理装置と主記憶装置と外部記憶装置とを備え、前記演算処理装置上で複数のデータ処理タスクが稼働する電子計算機における障害解析用情報収集方式において、
    ラップアラウンド方式の履歴記録部を、前記複数のデータ処理タスクで共有される前記主記憶装置上の共有領域に前記複数のデータ処理タスク対応に備え、
    前記データ処理タスクは、入力データを入力して業務処理を実行し結果を出力するデータ処理モジュールと、自タスクに対応する前記履歴記録部への処理経過情報の記録および前記履歴記録部に記録された処理経過情報の前記外部記憶装置への出力を行う情報収集モジュールとを備え、
    前記データ処理モジュールに、処理経過情報の記録要求を自タスクの前記情報収集モジュールに出力する記録要求部と、自タスクにおける異常検出時に処理経過情報の出力要求を自タスクの前記情報収集モジュールに出力する掃出し要求部とを備え、
    前記情報収集モジュールに、自タスクの前記データ処理モジュールから出力された記録要求に従って、排他制御を行って、処理経過情報を自タスクに対応する前記履歴記録部に記録する記録部と、自タスクの前記データ処理モジュールから出力された出力要求に従って、排他制御を行って、自タスクに対応する前記履歴記録部に記録された処理経過情報を前記外部記憶装置に出力する出力部とを備えることを特徴とする電子計算機における障害解析用情報収集方式。
  5. 前記処理経過情報は、データ処理タスクの入力データ、時刻データおよびタスクIDを含むことを特徴とする請求項1乃至4の何れか1項に記載の電子計算機における障害解析用情報収集方式。
  6. 前記データ処理タスクはユーザタスクであることを特徴とする請求項1乃至4の何れか1項に記載の電子計算機における障害解析用情報収集方式。
JP2004264849A 2004-09-13 2004-09-13 電子計算機における障害解析用情報収集方式 Pending JP2006079485A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004264849A JP2006079485A (ja) 2004-09-13 2004-09-13 電子計算機における障害解析用情報収集方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004264849A JP2006079485A (ja) 2004-09-13 2004-09-13 電子計算機における障害解析用情報収集方式

Publications (1)

Publication Number Publication Date
JP2006079485A true JP2006079485A (ja) 2006-03-23

Family

ID=36158860

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004264849A Pending JP2006079485A (ja) 2004-09-13 2004-09-13 電子計算機における障害解析用情報収集方式

Country Status (1)

Country Link
JP (1) JP2006079485A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008123357A (ja) * 2006-11-14 2008-05-29 Honda Motor Co Ltd 並列計算機システム、並列計算方法および並列計算機用プログラム
JP2008186111A (ja) * 2007-01-29 2008-08-14 Fuji Xerox Co Ltd データ処理装置、その制御方法および画像処理装置
JP2009003686A (ja) * 2007-06-21 2009-01-08 Honda Motor Co Ltd ソフトウェア動作解析装置、ソフトウェア動作解析方法、及びソフトウェア動作解析用プログラム
JP2009070279A (ja) * 2007-09-14 2009-04-02 Tokyo Electron Ltd 処理システムの制御装置、処理システムの制御方法および制御プログラムを記憶した記憶媒体
WO2013040922A1 (zh) * 2011-09-22 2013-03-28 中兴通讯股份有限公司 基站故障后的数据获取方法和装置
US11113179B2 (en) 2018-03-19 2021-09-07 Mitsubishi Electric Corporation Information processing device, information processing method, and computer readable medium for a trace process

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008123357A (ja) * 2006-11-14 2008-05-29 Honda Motor Co Ltd 並列計算機システム、並列計算方法および並列計算機用プログラム
JP2008186111A (ja) * 2007-01-29 2008-08-14 Fuji Xerox Co Ltd データ処理装置、その制御方法および画像処理装置
JP2009003686A (ja) * 2007-06-21 2009-01-08 Honda Motor Co Ltd ソフトウェア動作解析装置、ソフトウェア動作解析方法、及びソフトウェア動作解析用プログラム
JP2009070279A (ja) * 2007-09-14 2009-04-02 Tokyo Electron Ltd 処理システムの制御装置、処理システムの制御方法および制御プログラムを記憶した記憶媒体
WO2013040922A1 (zh) * 2011-09-22 2013-03-28 中兴通讯股份有限公司 基站故障后的数据获取方法和装置
CN103024784A (zh) * 2011-09-22 2013-04-03 中兴通讯股份有限公司 基站故障后的数据获取方法和装置
US11113179B2 (en) 2018-03-19 2021-09-07 Mitsubishi Electric Corporation Information processing device, information processing method, and computer readable medium for a trace process

Similar Documents

Publication Publication Date Title
CN101377750B (zh) 一种用于机群容错的系统和方法
Ma et al. {Kernel-Supported}{Cost-Effective} Audit Logging for Causality Tracking
CN103729442B (zh) 记录事务日志的方法和数据库引擎
US7996686B2 (en) Branch trace methodology
US7458078B2 (en) Apparatus and method for autonomic hardware assisted thread stack tracking
US10089169B2 (en) Identifying solutions to application execution problems in distributed computing environments
Vömel et al. Correctness, atomicity, and integrity: defining criteria for forensically-sound memory acquisition
US20130219367A9 (en) Atomicity violation detection using access interleaving invariants
US9262283B2 (en) Method for reading kernel log upon kernel panic in operating system
US10732841B2 (en) Tracking ownership of memory in a data processing system through use of a memory monitor
EP3274839B1 (en) Technologies for root cause identification of use-after-free memory corruption bugs
EP2645249A1 (en) Information processing apparatus, and method of controlling information processing apparatus
US7644114B2 (en) System and method for managing memory
JP2006079485A (ja) 電子計算機における障害解析用情報収集方式
JP4894567B2 (ja) トレース情報出力装置、および、トレース情報出力方法
US10997057B2 (en) Debugging asynchronous functions
US7814288B2 (en) Protecting memory operations involving zero byte allocations
US7934067B2 (en) Data update history storage apparatus and data update history storage method
CN112395141A (zh) 一种数据页管理方法、装置、电子设备及存储介质
JP2513060B2 (ja) 故障回復型計算機
CN112286909A (zh) 执行状态确定方法、装置、服务器及存储介质
JP3491379B2 (ja) 情報処理装置及びトレース情報格納方法
JP6111731B2 (ja) 並列デバッグシステム、並列デバッグ方法、及び、並列デバッグプログラム
US8614799B2 (en) Memory paging
TW202230119A (zh) 用來進行多系統日誌存取管理之方法、系統單晶片積體電路以及非暫態計算機可讀取媒體

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070810

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090610

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090630

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091104