JP2006040001A - コンピュータシステム及びメモリダンプ方法 - Google Patents

コンピュータシステム及びメモリダンプ方法 Download PDF

Info

Publication number
JP2006040001A
JP2006040001A JP2004219888A JP2004219888A JP2006040001A JP 2006040001 A JP2006040001 A JP 2006040001A JP 2004219888 A JP2004219888 A JP 2004219888A JP 2004219888 A JP2004219888 A JP 2004219888A JP 2006040001 A JP2006040001 A JP 2006040001A
Authority
JP
Japan
Prior art keywords
failure
memory
main program
subprogram
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004219888A
Other languages
English (en)
Inventor
Minoru Nakade
実 中出
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Heavy Industries Ltd
Original Assignee
Mitsubishi Heavy Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Heavy Industries Ltd filed Critical Mitsubishi Heavy Industries Ltd
Priority to JP2004219888A priority Critical patent/JP2006040001A/ja
Publication of JP2006040001A publication Critical patent/JP2006040001A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】 障害発生の外部通知並びにメモリダンプの確実性を高めたコンピュータシステムを提供することを目的とする。
【解決手段】 障害発生時に、実行される障害時メインプログラムと、障害時メインプログラムの実行中に障害が発生した場合に、実行される障害時サブプログラムとを備え、障害時メインプログラムは、情報伝達媒体を介して接続される外部装置に対して、障害発生を通知する障害通知機能と、揮発性メモリ2に格納されている内容を不揮発性メモリ3へ複写する第1のメモリダンプ機能とを備え、障害時サブプログラムは、揮発性メモリ2に格納されている内容及び前記障害時メインプログラムを不揮発性メモリ3へ複写する第2のメモリダンプ機能を備えている。
【選択図】 図1

Description

本発明は、障害通知機能及びメモリダンプ機能を備えるコンピュータシステムに係り、特に、障害時に実行する障害時プログラムを複数備えることにより、メモリダンプの確実性を高めたコンピュータシステムに関するものである。
従来、コンピュータシステムにおいて、障害が発生した場合には、主記憶装置の内容を外部記憶装置に退避させるメモリダンプを実施し、障害の原因解析に役立てる手法が取られている。
このようなメモリダンプ機能を備えたコンピュータシステムとして、例えば、特開平9−81467号公報(特許文献1)に示されるものがある。
上記特許文献1には、コンピュータシステムに異常が発生した場合には、メモリの内容を複写し、そのまま格納するメモリダンプ装置と、メモリダンプ装置によりメモリダンプされた情報から障害解析を行う障害解析装置と、障害解析の結果などを通信回線を介してシステム保守センタへ送信する通信部とを備えたコンピュータシステムが開示されている。
特開平9−81467号公報(段落[0009]〜[0019]、及び図1、図2)
しかしながら、上記特許文献1の発明では、メモリダンプを行っている最中に、障害が再度発生してしまうと、メモリダンプを完全に実行することができなくなるため、障害解析を実施することができない。
更に、メモリダンプ情報に基づいて障害解析を行った後に、保守センタなどの外部機器に対して障害発生通知がなされるため、通知が迅速になされないという不都合も生ずる。
また、このようなタイムラグの問題を解消するために、障害発生通知処理とメモリダンプ処理とを並行処理することも考えられる。
しかしながら、障害発生箇所が通信に関連する箇所であった場合には、障害発生通知処理の実行中に、エラーが発生してしまい、結局、メモリダンプ処理を完全に実行することができないこととなる。
本発明は、上記問題を解決するためになされたもので、障害発生の外部通知並びにメモリダンプの確実性を高めたコンピュータシステムを提供することを目的とする。
上記課題を解決するために、本発明は以下の手段を採用する。
本発明は、障害発生時に、実行される障害時メインプログラムと、前記障害時メインプログラムの実行中に障害が発生した場合に、実行される障害時サブプログラムとを備え、前記障害時メインプログラムは、情報伝達媒体を介して接続される外部装置に対して、障害発生を通知する障害通知機能及び揮発性メモリに格納されている内容を不揮発性メモリへ複写する第1のメモリダンプ機能を備え、前記障害時サブプログラムは、前記揮発性メモリに格納されている内容及び前記障害時メインプログラムを前記不揮発性メモリへ複写する第2のメモリダンプ機能を備えるコンピュータシステムを提供する。
本発明によれば、障害発生時には、障害時メインプログラムが実行されるので、情報伝達媒体を介して接続される外部の装置へ障害発生を通知させることが可能となるとともに、揮発性メモリに格納されている情報を不揮発性メモリへ退避させることが可能となる。
更に、上記障害時メインプログラムの実行時において、障害が発生した場合においても、障害時サブプログラムが実行されるので、再度の障害発生などに対しても、揮発性メモリに格納されている情報及び上記障害時メインプログラムを不揮発性メモリへ退避させることが可能となる。
障害発生時とは、例えば、メモリの不正アクセスによりCPU例外が発生した場合や、WDT(Watch Dog Timer)タイムアウトによりプログラムの暴走が検知され、NMI(Non Maskable Interrupt)が発生した場合などをいう。
メモリダンプとは、主記憶装置(RAM等の揮発性メモリ)の内容を、不揮発性メモリである二次記憶装置に保存する処理である。一般のメモリダンプでは、コンピュータシステムが障害によって停止する際に、主記憶装置内の全てのデータが、ハードディスク装置(HDD)などの二次記憶装置に出力される。このようにして、保存されたデータ(メモリダンプデータ)は、主に、障害内容の解析に役立てられる。
情報伝達媒体とは、有線、無線を問わず、情報を外部装置へ伝達する媒体をいう。
本発明のコンピュータシステムにおいて、前記障害時メインプログラム及び前記障害時サブプログラムは、障害が発生する前から揮発性メモリの所定のメモリ領域に格納されていることが好ましい。
更に、コンピュータシステムの通常動作時において、前記障害時メインプログラム及び前記障害時サブプログラムが格納されているメモリ領域は、内容の書き換えから保護されていることが好ましい。
このように、予め障害時メインプログラム及び障害時サブプログラムを揮発性メモリ内の所定のメモリ領域に格納しておくことにより、障害発生時に不揮発性メモリからこれらのプログラムを読み出して実行する処理手順を省略することが可能となるので、障害発生時における対応を迅速に行うことができる。
また、コンピュータシステムの通常動作時において、前記障害時メインプログラム及び前記障害時サブプログラムが格納されているメモリ領域は、内容の書き換えから保護されているので、一度揮発性メモリに書き込まれた情報は上書き等されることなく、揮発性メモリに保持されることが可能となる。
例えば、ページング等のメモリ保護機能により、内容の書き換えから保護することが可能となる。
本発明のコンピュータシステムは、例えば、火力プラント制御装置等の24時間起動され、重大な情報を取り扱うものとして採用されるのに適している。
本発明は、情報伝達媒体を介して接続される外部装置に対して、障害発生を通知する障害通知機能及び揮発性メモリに格納されている内容を不揮発性メモリへ複写する第1のメモリダンプ機能を備える障害時メインプログラムと、前記揮発性メモリに格納されている内容及び前記障害時メインプログラムを前記不揮発性メモリへ複写する第2のメモリダンプ機能を備える障害時サブプログラムとを備えるコンピュータシステムにおいて、障害発生時に、前記障害時メインプログラムを実行し、前記障害時メインプログラムの実行中に障害が発生した場合には、前記障害時サブプログラムを実行するメモリダンプ方法を提供する。
このメモリダンプ方法によれば、障害発生時には、障害時メインプログラムを実行することで、情報伝達媒体を介して接続される外部の装置へ障害発生を通知させることが可能となるとともに、揮発性メモリに格納されている情報を不揮発性メモリへ退避させることが可能となる。
更に、上記障害時メインプログラムの実行時において、障害が発生した場合には、障害時サブプログラムを実行するので、再度の障害発生などに対しても、揮発性メモリに格納されている情報及び上記障害時メインプログラムを不揮発性メモリへ退避させることが可能となる。
本発明のコンピュータシステムによれば、障害時メインプログラムだけでなく、障害時サブプログラムを備えているので、再度の障害発生に対しても揮発性メモリ内の情報を不揮発性メモリへ退避させることが可能となり、より確実にメモリダンプを実行することができる。
以下に、本発明にかかるコンピュータシステムの一実施形態について、図面を参照して説明する。
図1は、本実施形態に係るコンピュータシステムの概略構成を示したブロック図である。
図1に示すように、本実施形態に係るコンピュータシステムは、当該システムの制御中枢となるCPU1、図示しないROM(Read
Only Memory)などに格納されている各種プログラムが展開され、作業領域などとして使用される揮発性メモリ2、障害発生時において揮発性メモリ2の内容が格納される不揮発性メモリ3、ネットワーク(情報伝達媒体)を介して接続されている外部装置(図示略)との間で情報の授受を行うための通信部4を主な構成として備えている。
上記揮発性メモリ2は、例えば、RAM(Random Access Memory)などであり、後述する第1のメモリ領域21、第2のメモリ領域22、第3のメモリ領域23を備えている。
上記第1のメモリ領域21は、当該コンピュータシステムの通常動作時において、各種プログラムの実行ルーチンやデータなどが書き込まれ、いわゆる作業領域として使用される。
第2のメモリ領域22は、後述の障害時メインプログラムの格納及び動作領域である。
第3のメモリ領域23は、後述の障害時サブプログラムの格納及び動作領域である。
第2のメモリ領域22及び第3のメモリ領域23は、当該コンピュータシステムの通常動作中は、ページング等のメモリ保護機能により、CPU1による内容の書き換えが禁止されている。これにより、障害時メインプログラム及び障害時サブプログラムを常に揮発性メモリ2に保持することが可能となる。
不揮発性メモリ3は、例えば、ハードディスク装置(HDD)などであり、上記障害時メインプログラムの実行、或いは、障害時サブプログラムの実行により、揮発性メモリ2内の内容が書き込まれる。
通信部4は、CPU1の命令に従い、障害発生通知を行う。
障害メインプログラムは、ネットワークを介して接続される外部装置(図示略)に対して、障害発生を通知する障害通知機能と、揮発性メモリ2の第1のメモリ領域21の内容を不揮発性メモリ3へ書き込む第1のメモリダンプ機能とを備えている。
また、障害時サブプログラムは、第1のメモリ領域21に格納されている情報及び第2のメモリ領域22に格納されている障害時メインプログラムを不揮発性メモリ3へ書き込む第2のメモリダンプ機能を備えている。
次に、上記構成からなるコンピュータシステムの動作について、図1及び図2を参照して説明する。
まず、コンピュータシステムの起動時において、CPU1は、図示しないROMなどに格納されている障害時メインプログラム並びに障害時サブプログラムを読み出して、揮発性メモリ2の第2のメモリ領域22及び第3のメモリ領域23にそれぞれ書き込む。
その後、CPU1は、オペレーションシステムなどの各種プログラムを起動し、種々の処理を実行する。
次に、通常動作中に、オペレーションシステムやハードウェアなどに障害が発生することにより、CPU例外などが発生した場合には、CPU1は、揮発性メモリ2内の第2のメモリ領域22に格納されている障害時メインプログラムを実行する(図2のステップSP1)。
CPU1は、この障害時メインプログラムを実行することにより、障害通知処理とメモリダンプ処理を平行して行う(ステップSP2)。
これにより、通信部4を経由して障害が外部装置へ通知されるとともに、揮発性メモリ2の第1のメモリ領域22の内容が不揮発性メモリ3に複写され、保存される。
この間、障害時サブプログラムが格納されている第3のメモリ領域23については、未だ内容の書き換えから保護されている。
続いて、上記障害時メインプログラムの実行中に、再度障害が発生した場合には(ステップSP3において「YES」)、CPU1は、第3のメモリ領域23に格納されている障害時サブプログラムを実行する(ステップSP4)。
これにより、揮発性メモリ2の第1のメモリ領域21の内容及び第2のメモリ領域22の内容が不揮発性メモリ3に複写され、保存される(ステップSP5)。
そして、上記障害時メインプログラム又は障害時サブプログラムが正常に終了した場合には、自動リセットを動作させることにより、コンピュータシステムを自動的に起動させる。
そして、不揮発性メモリ3に退避させた障害発生時におけるデータなどについては、当該コンピュータシステムの再起動後に読み出す、或いは、通信回線などにより接続される他の外部装置から読み出すことにより、障害発生の解析に利用することが可能となる。
以上述べてきたように、本実施形態に係るコンピュータシステムによれば、障害時メインプログラムだけでなく、障害時サブプログラムを備えているので、障害時メインプログラムが実行されている最中に、再度、何らかの障害が発生した場合においても、障害時サブプログラムを実行することにより、メモリダンプを実現することができる。これにより、メモリダンプの確実性を高めることができるという効果を奏する。
また、障害時サブプログラムに障害通知機能を持たせないこととしたので、初回の障害発生箇所が通信に関連する箇所であった場合でも、メモリダンプ処理を確実に行うことが可能となる。
つまり、初回の障害発生箇所が通信に関連する箇所であった場合、障害時サブプログラムにも障害通知機能を持たせてしまうと、この障害通知機能のプログラム実行時において再度のエラーが発生し、障害時サブプログラムも正常に終了させることができなくなってしまう。従って、上述のように、メモリダンプ処理のみを持たせることにより、このような不都合を回避することができる。
また、障害時サブプログラムは、揮発性メモリ2の第2のメモリ領域22に格納されている障害時メインプログラムについてもメモリダンプの対象としているので、障害時メインプログラム自体に起因する障害発生についても、その解析することが可能となる。
以上、本発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計変更等も含まれる。
第1に、上記不揮発性メモリ3は、それ自体単独でコンピュータシステム内に設けられていても良いし、一般的によく利用されるHDD(Hard Disk Drive)などの中に領域割り当てされていてもよい。
第2に、障害時メインプログラム及び障害時サブプログラムは、メモリダンプの対象となっている揮発性メモリ内に、通常の作業領域とは分離されたメモリ領域に格納されていてもよいし、また、その他の揮発性メモリに格納されていても良い。
第3に、不揮発性メモリ3へのデータ保存は、ファイル形式でも、そのままのイメージファイルでもよく、圧縮ファイルとイメージファイルとを含む形で保存されていても良い。
第4に、メモリダンプ処理などが正常に終了した場合には、上述のように、自動的に再起動させる他、例えば、手動リセット待ちの状態となり、再度の起動を待つようにしても良い。
本発明の一実施形態に係るコンピュータシステムの概略構成を示す図である。 本発明の一実施形態に係るコンピュータシステムにより実現される障害時の処理内容を示すフローチャートである。
符号の説明
1 CPU
2 揮発性メモリ
3 不揮発性メモリ
4 通信部
21 第1のメモリ領域
22 第2のメモリ領域
23 第3のメモリ領域

Claims (4)

  1. 障害発生時に、実行される障害時メインプログラムと、
    前記障害時メインプログラムの実行中に障害が発生した場合に、実行される障害時サブプログラムとを備え、
    前記障害時メインプログラムは、情報伝達媒体を介して接続される外部装置に対して、障害発生を通知する障害通知機能及び揮発性メモリに格納されている内容を不揮発性メモリへ複写する第1のメモリダンプ機能を備え、
    前記障害時サブプログラムは、前記揮発性メモリに格納されている内容及び前記障害時メインプログラムを前記不揮発性メモリへ複写する第2のメモリダンプ機能を備えるコンピュータシステム。
  2. 前記障害時メインプログラム及び前記障害時サブプログラムは、障害が発生する前から揮発性メモリの所定のメモリ領域に格納されている請求項1に記載のコンピュータシステム。
  3. 前記通常動作時において、前記障害時メインプログラム及び前記障害時サブプログラムが格納されているメモリ領域は、内容の書き換えから保護されている請求項2に記載のコンピュータシステム。
  4. 情報伝達媒体を介して接続される外部装置に対して、障害発生を通知する障害通知機能及び揮発性メモリに格納されている内容を不揮発性メモリへ複写する第1のメモリダンプ機能を備える障害時メインプログラムと、前記揮発性メモリに格納されている内容及び前記障害時メインプログラムを前記不揮発性メモリへ複写する第2のメモリダンプ機能を備える障害時サブプログラムとを備えるコンピュータシステムにおいて、
    障害発生時に、前記障害時メインプログラムを実行し、前記障害時メインプログラムの実行中に障害が発生した場合には、前記障害時サブプログラムを実行するメモリダンプ方法。
JP2004219888A 2004-07-28 2004-07-28 コンピュータシステム及びメモリダンプ方法 Withdrawn JP2006040001A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004219888A JP2006040001A (ja) 2004-07-28 2004-07-28 コンピュータシステム及びメモリダンプ方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004219888A JP2006040001A (ja) 2004-07-28 2004-07-28 コンピュータシステム及びメモリダンプ方法

Publications (1)

Publication Number Publication Date
JP2006040001A true JP2006040001A (ja) 2006-02-09

Family

ID=35904925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004219888A Withdrawn JP2006040001A (ja) 2004-07-28 2004-07-28 コンピュータシステム及びメモリダンプ方法

Country Status (1)

Country Link
JP (1) JP2006040001A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012004854A1 (ja) * 2010-07-06 2012-01-12 三菱電機株式会社 プロセッサ装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012004854A1 (ja) * 2010-07-06 2012-01-12 三菱電機株式会社 プロセッサ装置及びプログラム
JP5225515B2 (ja) * 2010-07-06 2013-07-03 三菱電機株式会社 プロセッサ装置及びプログラム
US8583960B2 (en) 2010-07-06 2013-11-12 Mitsubishi Electric Corporation Processor device and program

Similar Documents

Publication Publication Date Title
JP4810172B2 (ja) 制御装置及びバージョンアップ方法並びにプログラム
US20060107031A1 (en) Portable terminal
US8489933B2 (en) Data processing device and method for memory dump collection
US7752496B2 (en) Method, apparatus, and computer product for managing log data
JP2005071303A (ja) プログラム起動装置
JP2006338445A (ja) 異常情報格納装置
JP2006040001A (ja) コンピュータシステム及びメモリダンプ方法
JP2000099372A (ja) コンピュータシステム
JP4358943B2 (ja) 自動バックアップシステム及び自動バックアッププログラムを記録した記録媒体
JP2003122644A (ja) 計算機及びその記憶装置
WO2014147707A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP4876662B2 (ja) メモリダンプ機能を備えたコンピュータシステム、プログラム及びメモリダンプの方法
JP2007164392A (ja) 計算機
JP2000132461A (ja) 情報制御装置
JP3812281B2 (ja) 印刷装置
JPH09330253A (ja) メモリダンプ方法及びそれを適用したメモリダンプシステム
JP7074291B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2872008B2 (ja) コンピュータシステムおよびそのシステム縮退運転実現方法
JP2009086980A (ja) ロギングシステム
JP2008198152A (ja) 冗長構成を有するコンピュータシステム及びコンピュータシステムの系切り換え方法
JP2011150383A (ja) ファームウェア書き込み方法
JP2009075992A (ja) 情報処理装置のメモリダンプ採取方法
JP2009015757A (ja) 信号処理装置における異常状態処理方式
JP2000339100A (ja) ファイル更新監視方法とそのシステム
JPH06266573A (ja) 障害復旧情報管理システム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071002