JP2007094537A - Memory dump device and memory dump collection method - Google Patents

Memory dump device and memory dump collection method Download PDF

Info

Publication number
JP2007094537A
JP2007094537A JP2005280203A JP2005280203A JP2007094537A JP 2007094537 A JP2007094537 A JP 2007094537A JP 2005280203 A JP2005280203 A JP 2005280203A JP 2005280203 A JP2005280203 A JP 2005280203A JP 2007094537 A JP2007094537 A JP 2007094537A
Authority
JP
Japan
Prior art keywords
computer system
memory dump
unit
memory
state monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005280203A
Other languages
Japanese (ja)
Inventor
Takeshi Nasu
健 那須
Kazuto Matsumoto
一人 松本
Hidenori Omiya
英典 大宮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005280203A priority Critical patent/JP2007094537A/en
Publication of JP2007094537A publication Critical patent/JP2007094537A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a method for surely storing all the content of a main storage part in an external storage part as memory dump even under critical circumstances where it is impossible to execute interruption such as hardware lock. <P>SOLUTION: A status in a computer system is monitored, and when it is determined that any failure has occurred in the computer system, memory dump collection to make an external storage part 5 store the content of a main storage part 3 is automatically executed, and when memory dump collection has not been executed due to hardware lock or the like, memory dump collection is executed after system reset. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、計算機システムのメモリダンプ採取機能における、メモリダンプ採取装置及び方法に関する。   The present invention relates to a memory dump collection device and method in a memory dump collection function of a computer system.

計算機システムが障害を起こした際に主記憶装置の内容を外部記憶装置に保存することができる計算機システムにおいて、障害が発生した場合、メモリダンプ採取プログラムを起動するための割込み命令(Non Maskable Interrupt:NMI、以下NMIと称する)を発生させ、メモリダンプ採取プログラムを実行することで主記憶装置の内容を外部記憶装置に保存している。
しかし、計算機システムにハードウェアロックのような、割り込みが実行できない深刻な障害が発生した場合は、NMIが発動されても計算機システム内で伝達がされず、メモリダンプ採取プログラムを起動させることができない。また、その障害を解消するために計算機システムのリブートを実行すると、主記憶装置の内容が初期化されてしまう。従って、ハードウェアロックが起こってしまった場合には、主記憶装置内の内容を外部記憶装置に保存することができなかった。
In a computer system that can save the contents of the main storage device to an external storage device when a failure occurs in the computer system, if a failure occurs, an interrupt command (Non Maskable Interrupt: NMI (hereinafter referred to as NMI) is generated and the memory dump collection program is executed to save the contents of the main storage device in the external storage device.
However, if a serious failure such as a hardware lock that cannot be interrupted occurs in the computer system, even if NMI is activated, it is not transmitted within the computer system and the memory dump collection program cannot be started. . If the computer system is rebooted to eliminate the failure, the contents of the main storage device are initialized. Therefore, when a hardware lock occurs, the contents in the main storage device cannot be saved in the external storage device.

特許文献1には、ハードウェアロック状態に陥った場合にメモリダンプを採取できないという問題を解決する手法についての開示がある。計算機システムがハードウェアロックした場合、オペレータが、メモリダンプ採取プログラムが入っているディスクを計算機システムに挿入し、コンソールを操作してディスクからリブートするようリセットをかける。この動作により、メモリダンプ採取プログラムが計算機システムの主記憶装置上の、通常稼動時には使用されない空き領域にロードされ、プログラムを実行することで、メモリダンプ採取プログラムがロードされたエリア以外の主記憶装置の内容を、外部記憶装置に保存することができる。   Patent Document 1 discloses a technique for solving the problem that a memory dump cannot be collected when a hardware lock state occurs. When the computer system is hardware-locked, the operator inserts the disk containing the memory dump collection program into the computer system, and resets to reboot from the disk by operating the console. By this operation, the memory dump collection program is loaded into a free area that is not used during normal operation on the main storage device of the computer system, and by executing the program, the main storage device other than the area where the memory dump collection program is loaded Can be stored in an external storage device.

また特許文献2には、計算機システムリブート前に自動でメモリダンプを採取する手法についての開示がある。計算機システムが障害により停止した場合、オペレーティングシステムの中核部がおかれているメモリ領域のみを自動的にダンプし、後の領域に関してはシステムリセット後に順次ダンプを出力する。
特開平8−95834号公報 特開平10−333944号公報
Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for automatically collecting a memory dump before rebooting a computer system. When the computer system stops due to a failure, only the memory area in which the core of the operating system is placed is automatically dumped, and dumps are sequentially output after the system reset for the subsequent areas.
JP-A-8-95834 JP-A-10-333944

ところで、従来は計算機システムに、ハードウェアロックのような割り込みが実行できない深刻な障害が発生した場合は、NMIが計算機システム内を伝達されず、メモリダンプ採取プログラムを起動させることができなかった。また、ハードウェアロックの状態を解消させるために計算機システムのリブートを実行すると、主記憶装置の内容が初期化されてしまう。従って、ハードウェアロック時には、主記憶装置内の内容を外部記憶装置に保存することができなかった。   By the way, conventionally, when a serious failure such as hardware lock that cannot execute an interrupt occurs in the computer system, the NMI is not transmitted through the computer system, and the memory dump collection program cannot be started. In addition, if the computer system is rebooted to cancel the hardware lock state, the contents of the main storage device are initialized. Therefore, when the hardware is locked, the contents in the main storage device cannot be saved in the external storage device.

特許文献1に記載の手法では計算機システムがハードウェアロックしたという確認やその後の処理すべてに対しオペレータの介在が必要であった。   The technique described in Patent Document 1 requires operator intervention for confirmation that the computer system is hardware-locked and all subsequent processing.

また特許文献2に記載の手法では、計算機システムが障害により停止した場合に自動で起動するメモリダンプのプログラムが、実際に起動したか否かを確認する手段を備えておらず、ハードウェアロックのような、割り込みが実行できない状況が起きた場合の対策が不十分であった。   Further, in the method described in Patent Document 2, a memory dump program that automatically starts when the computer system is stopped due to a failure is not provided with a means for confirming whether or not it has actually started. Measures for situations where interrupts cannot be executed such as these were insufficient.

本発明はかかる点に鑑みてなされたものであり、ハードウェアロックのような割り込みが実施できない深刻な状況においても、主記憶装置の内容全てをメモリダンプとして外部記憶装置に確実に保存する手法を提供することを目的とする。   The present invention has been made in view of such a point, and even in a serious situation where an interrupt such as hardware lock cannot be performed, a method for reliably saving all the contents of the main storage device to the external storage device as a memory dump. The purpose is to provide.

本発明は、計算機システムに障害が発生した際に、主記憶部内の内容をメモリダンプとして外部記憶部に保存することが出来る計算機システムにおいて、計算機システム内の状態を監視し、計算機システムが障害を起こしたと判断した場合に自動的にメモリダンプ採取を行わせ、ハードウェアロックなどが原因でメモリダンプ採取が行われなかった場合は、システムリセット後にメモリダンプ採取を行えるようにしたものである。   The present invention monitors the status of a computer system in a computer system that can save the contents of the main storage unit as a memory dump to an external storage unit when a failure occurs in the computer system. A memory dump is automatically collected when it is determined that it has occurred. If a memory dump is not collected due to a hardware lock or the like, a memory dump can be collected after a system reset.

本発明によると、計算機システムに障害が発生した場合にそれを自動で感知し、システムリセット前にメモリダンプ採取を行えるようにしたことに加え、ハードウェアロック状態などでメモリダンプ採取プログラムが正常に起動しない状況下においても、ハードウェアロック状態を解除した上でメモリダンプ採取を行えるようにしているため、障害発生時の主記憶装置内の情報を全て、消失させること無くメモリダンプとして外部記憶装置に保存することができる。   According to the present invention, when a failure occurs in a computer system, it is automatically detected and a memory dump can be collected before the system is reset. Even if the system does not start up, it is possible to collect a memory dump after releasing the hardware lock state, so that all the information in the main memory at the time of failure is saved as an external storage device without losing all the information. Can be saved.

以下、本発明の一実施の形態の例を、図1〜図3を参照して説明する。   Hereinafter, an example of an embodiment of the present invention will be described with reference to FIGS.

図1は、本実施の形態による処理を適用したメモリダンプ採取装置の構成を示した図である。計算機システムは、CPU(中央演算装置)1、主記憶部3、外部記憶部5を有する。CPU1と主記憶部3との間には、CPU1と主記憶部3間の入出力を制御するメモリコントローラ2が配置され、CPU1と外部記憶部3の間には、CPU1と外部記憶部3間の入出力を制御するI/O(Input/output)コントローラ4が配置されている。   FIG. 1 is a diagram showing a configuration of a memory dump collection device to which the processing according to the present embodiment is applied. The computer system includes a CPU (Central Processing Unit) 1, a main storage unit 3, and an external storage unit 5. A memory controller 2 that controls input / output between the CPU 1 and the main storage unit 3 is arranged between the CPU 1 and the main storage unit 3. Between the CPU 1 and the external storage unit 3, there is a connection between the CPU 1 and the external storage unit 3. An I / O (Input / output) controller 4 for controlling the input / output of each is arranged.

CPU1内の記憶部には状態監視プログラム部8が実装されており、計算機システムの状態を監視している。LSI(大規模集積回路)には状態監視部6が組み込まれており、計算機システム障害検知時にメモリダンプ採取プログラムを実行させるよう処理を行う。メモリダンプ採取プログラム10は、主記憶部3内に格納されている。   A state monitoring program unit 8 is installed in the storage unit in the CPU 1 and monitors the state of the computer system. An LSI (Large Scale Integrated circuit) incorporates a state monitoring unit 6 and performs processing to execute a memory dump collection program when a computer system failure is detected. The memory dump collection program 10 is stored in the main storage unit 3.

システムBIOS(Basic Input / Output System)には、起動初期化プログラム部12が組み込まれており、状態監視部6の処理内容に応じ、適したシステムリセット処理を行う。状態監視部6、起動初期化プログラム部12の詳細については、後述する動作説明の中で説明する。   A system BIOS (Basic Input / Output System) incorporates a startup initialization program unit 12 and performs an appropriate system reset process according to the processing content of the state monitoring unit 6. Details of the state monitoring unit 6 and the startup initialization program unit 12 will be described in the description of operations described later.

また、計算機システム筐体にリセットボタン7が配置されており、押下することで、計算機システム障害を検知した場合と同様に、メモリダンプ採取プログラム10を実行させるためのNMIが発動させることができる。   Further, the reset button 7 is arranged on the computer system housing, and when pressed, the NMI for executing the memory dump collection program 10 can be activated in the same manner as when a computer system failure is detected.

計算機システムが正常に稼動しているか否かは、状態監視部により監視、判断される。状態監視部は状態監視プログラム部8と状態監視部6とで構成されており、計算機システムの監視は状態監視プログラム部8が、判断は状態監視部6が行っている。状態監視部6は、計算機システムが障害を起こしたと判断した場合には、カウンタを起動させた上でNMIを発動する。   Whether or not the computer system is operating normally is monitored and determined by the state monitoring unit. The state monitoring unit includes a state monitoring program unit 8 and a state monitoring unit 6. The state monitoring program unit 8 performs monitoring of the computer system, and the state monitoring unit 6 performs determination. If the state monitoring unit 6 determines that the computer system has failed, the state monitoring unit 6 activates the counter and activates the NMI.

NMIは、I/Oコントローラ4、CPU1、メモリコントローラ2を経由して主記憶部3に伝達され、NMI処理コード9が実行される。NMI処理コード9にはメモリダンプ採取プログラムが組み込まれており、NMI処理コード9が実施されるとメモリダンプ採取が行われるようにしてある。採取されたメモリダンプ情報は、外部記憶部5に保存させるようにしてある。   The NMI is transmitted to the main storage unit 3 via the I / O controller 4, the CPU 1, and the memory controller 2, and the NMI processing code 9 is executed. The NMI processing code 9 incorporates a memory dump collection program, and when the NMI processing code 9 is executed, the memory dump collection is performed. The collected memory dump information is stored in the external storage unit 5.

NMI処理コード9には、実行時に、状態監視部6が既に発動しているカウンタを止めるカウント停止機能11も組み込まれており、NMI処理コード9が実行されれば、状態監視部6がNMI発動時に起動したカウントも停止されるようにしてある。   The NMI processing code 9 also incorporates a count stop function 11 that stops the counter that is already activated by the state monitoring unit 6 at the time of execution. If the NMI processing code 9 is executed, the state monitoring unit 6 is activated by the NMI processing code 9. The count that is sometimes activated is also stopped.

また、状態監視部6は、自身が発動したカウントが停止しているかどうかを確認することにより、NMI処理コードが実行されたか否かの判断も行っている。NMI処理コードが実行されなかった場合、つまりメモリダンプ採取が行われなかった場合は、システムリセット後にメモリダンプ採取を行う必要がある。   The state monitoring unit 6 also determines whether or not the NMI processing code has been executed by checking whether or not the count activated by the state monitoring unit 6 has stopped. If the NMI processing code is not executed, that is, if the memory dump is not collected, it is necessary to collect the memory dump after the system reset.

状態監視部6は、システムリセット後にメモリダンプ採取を行う必要があるか否かを起動初期化プログラム部に伝える手段として、メモリダンプモード起動フラグを有しており、フラグの設定/未設定を行った後にシステムリセットを行う。   The state monitoring unit 6 has a memory dump mode activation flag as a means for informing the activation initialization program unit whether or not it is necessary to collect a memory dump after a system reset, and sets / unsets the flag After a system reset.

起動初期化プログラム部12は、システムリセット後に動作し、状態監視部6内のメモリダンプモード起動フラグの有無を確認した上で、フラグの状態に応じメモリダンプモードでの起動、もしくは通常の計算機システムのリブートを行う。メモリダンプモードとは、システムリセット後に、主記憶部3の初期化とオペレーティングシステムの起動は行わずに、メモリダンプ採取を行うモードのことである。   The startup initialization program unit 12 operates after a system reset, confirms the presence or absence of a memory dump mode startup flag in the status monitoring unit 6, and then starts up in the memory dump mode according to the state of the flag, or a normal computer system Reboot. The memory dump mode is a mode in which, after the system reset, the memory dump is collected without initializing the main storage unit 3 and starting the operating system.

リセットスイッチ7は、押下されることで、状態監視部6に対し計算機システム障害検知時と同様の動作である、NMIの発動を行うよう指令を行う。   When pressed, the reset switch 7 instructs the state monitoring unit 6 to activate the NMI, which is the same operation as when a computer system failure is detected.

次に、本例の動作について、図2及び図3のフローチャートを参照して説明する。まず、計算機システムが障害を起こした場合は計算システム内の通信網が途切れるため、状況監視プログラム部8からの信号が状態監視部6に届かない。状態監視部6は、状態監視プログラム部8からの信号を一定時間受信できなかった場合に、計算機システムが障害を起こしたと判断する(ステップS1)。   Next, the operation of this example will be described with reference to the flowcharts of FIGS. First, when a failure occurs in the computer system, the communication network in the computer system is interrupted, so that the signal from the situation monitoring program unit 8 does not reach the state monitoring unit 6. The state monitoring unit 6 determines that the computer system has failed when the signal from the state monitoring program unit 8 cannot be received for a certain period of time (step S1).

状態監視部6はカウンタを持っており、計算機システムが障害を起こしたと判断した場合は、カウンタを動作させた上でNMIを発動する(ステップS2)。このNMIがI/Oコントローラ4、CPU1、メモリコントローラ2を経由して主記憶部3に伝達され、NMI処理コード9が実行される。NMI処理コード9にはメモリダンプ採取プログラム10が格納されており、メモリダンプ採取プログラム10が実施されることにより、メモリダンプ採取が行われる。メモリダンプ採取プログラム10が正常に起動した場合は、同じくNMI処理コード9内に組み込まれているカウント停止機能11が起動して、NMI発動時に情報監視部6により開始されたカウントが停止される。(ステップS5)。   The state monitoring unit 6 has a counter, and when it is determined that the computer system has failed, the NMI is activated after the counter is operated (step S2). This NMI is transmitted to the main storage unit 3 via the I / O controller 4, the CPU 1, and the memory controller 2, and the NMI processing code 9 is executed. A memory dump collection program 10 is stored in the NMI processing code 9, and the memory dump collection is performed by executing the memory dump collection program 10. When the memory dump collection program 10 is started normally, the count stop function 11 also incorporated in the NMI processing code 9 is started, and the count started by the information monitoring unit 6 is stopped when the NMI is activated. (Step S5).

一方、ハードウェアロック状態などによりNMIが主記憶部3に伝達されなかった場合は、NMI処理コード9が実行されないため、メモリダンプ採取プログラム10は起動せず、カウントも停止されない。従って、カウントの停止を確認できなかった場合、状態監視部6はメモリダンプ採取プログラム10がハードウェアロックにより正常に起動しなかったものと判断し(ステップS4)、メモリダンプモード起動フラグを立てた上で、計算機システムをリセットする。この段階でシステムリセットが行われることにより、計算機システムのハードウェアロック状態が解除される。(ステップS6)。   On the other hand, when the NMI is not transmitted to the main storage unit 3 due to a hardware lock state or the like, the NMI processing code 9 is not executed, so the memory dump collection program 10 is not started and the count is not stopped. Therefore, when the stop of the count cannot be confirmed, the state monitoring unit 6 determines that the memory dump collection program 10 has not started normally due to hardware lock (step S4), and sets the memory dump mode start flag. Above, reset the computer system. By performing a system reset at this stage, the hardware lock state of the computer system is released. (Step S6).

システムリセット後は、起動初期化プログラム部12が状態監視部6内のフラグの有無を確認し(ステップS7)、フラグを確認できた場合は(ステップS8)メモリダンプモードに遷移して(ステップS9)自動的にメモリダンプを採取し(ステップS10)、フラグを取り消す(ステップS11)。その後起動初期化プログラム部12が再度計算機システムをリセットする(ステップS12)。その際にはメモリダンプモード起動フラグは立っていないため、主記憶部3の初期化とオペレーティングシステムの起動を行う通常のリブートが実施される(ステップS13)。   After the system reset, the startup initialization program unit 12 checks the presence / absence of the flag in the state monitoring unit 6 (step S7), and if the flag can be confirmed (step S8), transitions to the memory dump mode (step S9). ) A memory dump is automatically collected (step S10), and the flag is canceled (step S11). Thereafter, the startup initialization program unit 12 resets the computer system again (step S12). At that time, since the memory dump mode activation flag is not set, normal rebooting for initializing the main storage unit 3 and starting the operating system is performed (step S13).

また、リセットスイッチ7をオペレータが押下した場合は(ステップS3)、計算機システム障害を検知した場合と同様に、状態監視部6よりメモリダンプ採取プログラム10を実行させるためのNMIが発動され、これによりメモリダンプが実施される。万一この処理中に障害が発生したとしても、上述と同様の処理が実行され、主記憶部の内容は自動的に外部記憶部に保存される。   When the operator presses the reset switch 7 (step S3), the state monitoring unit 6 activates an NMI for executing the memory dump collection program 10 in the same manner as when a computer system failure is detected. A memory dump is performed. Even if a failure occurs during this process, the same process as described above is executed, and the contents of the main memory are automatically saved in the external memory.

このように本例の計算機システムによると、ハードウェアロックのような割り込みが実施できない深刻な状況においても、主記憶装置の内容全てをメモリダンプとして外部記憶装置に確実に保存する手法を提供することができる。   As described above, according to the computer system of this example, it is possible to provide a method for reliably storing the entire contents of the main storage device as a memory dump in an external storage device even in a serious situation where an interrupt such as hardware lock cannot be performed. Can do.

また、状態監視プログラム部8と状態監視部6が常に計算機システムの状態を監視しており、障害の発生も自動で認識されるため、障害発生を確認するためのオペレータが不要となる効果がある。   Further, since the state monitoring program unit 8 and the state monitoring unit 6 constantly monitor the state of the computer system and the occurrence of a failure is automatically recognized, there is an effect that an operator for confirming the occurrence of the failure is unnecessary. .

また、これまではハードウェアロックのような深刻な状況下においてメモリダンプ採取を行う場合はオペレータの介在が必要とされていたが、ハードウェアロックの検知からシステムリセットによるハードウェアロック状態の解除、主記憶部3の初期化とオペレーティングシステムの起動は行わずに主記憶部3の内容を外部記憶部5に移動させるメモリダンプ採取までの全てが自動で行われるため、オペレータの介在が不要となる効果がある。   Also, until now, when taking a memory dump under a serious situation such as hardware lock, operator intervention was required, but from the detection of hardware lock, the release of the hardware lock state by system reset, Since the main storage unit 3 is not initialized and the operating system is not activated, everything from the contents of the main storage unit 3 to the external storage unit 5 is automatically performed, so no operator intervention is required. effective.

また、リセットスイッチ7を押下すればメモリダンプ採取プログラムが起動する仕組みにより、障害発生時でなくても、好きなタイミングでメモリダンプを採取できるという効果がある。   In addition, the memory dump collection program is started when the reset switch 7 is pressed, so that it is possible to collect a memory dump at a desired timing even when a failure has not occurred.

また、ハードウェアロック状態においてもメモリダンプを確実に採取することができるため、ハードウェアロック時の解析にもメモリダンプ情報を利用することができ、障害解析の効率化が図れるという効果がある。   Further, since the memory dump can be reliably collected even in the hardware lock state, the memory dump information can be used for the analysis at the time of the hardware lock, and there is an effect that the efficiency of the failure analysis can be improved.

本発明の一実施の形態による端末の内部構成例を示すブロック図である。It is a block diagram which shows the internal structural example of the terminal by one embodiment of this invention. 本発明の一実施の形態によるメモリダンプ採取手法を示すフローチャートである。It is a flowchart which shows the memory dump collection method by one embodiment of this invention. 本発明の一実施の形態によるメモリダンプ採取手法を示すフローチャートである。It is a flowchart which shows the memory dump collection method by one embodiment of this invention.

符号の説明Explanation of symbols

1…CPU、2…メモリコントローラ、3…主記憶部、4…I/Oコントローラ、5…外部記憶部、6…状態監視部、7…リセットスイッチ、8…状態監視プログラム部、9…NMI処理コード、10…メモリダンプ採取プログラム、11…カウント停止機能、12…起動初期化プログラム部   DESCRIPTION OF SYMBOLS 1 ... CPU, 2 ... Memory controller, 3 ... Main memory part, 4 ... I / O controller, 5 ... External storage part, 6 ... Status monitoring part, 7 ... Reset switch, 8 ... Status monitoring program part, 9 ... NMI processing Code: 10 ... Memory dump collection program, 11 ... Count stop function, 12 ... Start initialization program part

Claims (5)

計算機システムに障害が発生した際に、主記憶部内の内容をメモリダンプとして外部記憶部に保存することが出来る計算機システムにおいて、
前記計算機システムは、前記計算機システム内の状態を監視し、前記計算機システムが障害を起こしたと判断した場合に、メモリダンプ採取を行うための指示を行う状態監視部と、
前記状態監視部からの指示に基づいて主記憶部の内容を外部記憶部に保存するメモリダンプ採取部と、
前記状態監視部からの指示に基づき、前記計算機システムのリブートを行う起動初期化プログラム部と、
前記メモリダンプ採取部にメモリダンプ採取を行わせるリセット手段とを備えたことを特徴とする計算機システム。
In a computer system that can save the contents in the main memory as a memory dump in the external memory when a failure occurs in the computer system,
The computer system monitors a state in the computer system, and when it is determined that the computer system has failed, a state monitoring unit that gives an instruction to collect a memory dump;
A memory dump collection unit that saves the contents of the main storage unit in an external storage unit based on an instruction from the state monitoring unit;
Based on an instruction from the state monitoring unit, a startup initialization program unit that reboots the computer system;
A computer system comprising: a reset unit that causes the memory dump collection unit to collect a memory dump.
請求項1記載の計算機システムにおいて、
前記状態監視部は、定期的に信号を発信して計算機システムの健全性のチェックを行うことを特徴とする計算機システム。
The computer system according to claim 1,
The state monitoring unit periodically transmits a signal to check the soundness of the computer system.
請求項2記載の計算機システムにおいて、
前記状態監視部は、計算機システムの健全性を確認出来なかった場合に、計算機システムが障害を起こしていると判断し、カウンタを起動させた上で、メモリダンプ採取を行うための割り込み命令を発動させることを特徴とする計算機システム。
The computer system according to claim 2,
When the state monitoring unit cannot confirm the soundness of the computer system, it determines that the computer system has failed, activates a counter, and then issues an interrupt command for collecting a memory dump. A computer system characterized by letting
請求項3記載の計算機システムにおいて、
前記状態監視部は、メモリダンプ採取が行われたか否かを判断し、行われなかった場合は、前記初期化プログラム部に対し、システムリセット後に主記憶部の初期化とオペレーティングシステムの起動は行わずに主記憶部内の内容をメモリダンプとして外部記憶部に保存させるよう指示を行い、前記起動初期化プログラム部は、前記状態監視部の指示があった場合はメモリダンプ採取を行い、指示がなかった場合は計算機システムのリブートを行うことを特徴とする計算機システム。
In the computer system according to claim 3,
The state monitoring unit determines whether or not a memory dump has been collected. If not, the initialization program unit initializes the main memory and starts the operating system after a system reset. Without instructing the contents to be stored in the external storage unit as a memory dump, and the startup initialization program unit collects the memory dump when there is an instruction from the state monitoring unit, and there is no instruction. A computer system characterized by rebooting the computer system in case of failure.
計算機システムの健全性について判断を行い、
健全性が確認できなかった場合にメモリダンプの採取を指示するメモリダンプ採取指示処理と、
前記指示処理に基づき、主記憶部の内容を外部記憶部に保存するメモリダンプ採取処理と、
前記指示処理に基づき、前記計算機システムのリブートを行う起動初期化処理と、
前記メモリダンプ採取処理を行わせるためのリセット処理とを行うことを特徴とするメモリダンプ採取方法。
Make a judgment about the soundness of the computer system,
Memory dump collection instruction processing that instructs to collect a memory dump when soundness cannot be confirmed;
Based on the instruction process, a memory dump collection process for storing the contents of the main storage unit in the external storage unit,
Based on the instruction process, a startup initialization process for rebooting the computer system;
A memory dump collection method, comprising: performing a reset process for performing the memory dump collection process.
JP2005280203A 2005-09-27 2005-09-27 Memory dump device and memory dump collection method Pending JP2007094537A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005280203A JP2007094537A (en) 2005-09-27 2005-09-27 Memory dump device and memory dump collection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005280203A JP2007094537A (en) 2005-09-27 2005-09-27 Memory dump device and memory dump collection method

Publications (1)

Publication Number Publication Date
JP2007094537A true JP2007094537A (en) 2007-04-12

Family

ID=37980221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005280203A Pending JP2007094537A (en) 2005-09-27 2005-09-27 Memory dump device and memory dump collection method

Country Status (1)

Country Link
JP (1) JP2007094537A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237884A (en) * 2008-03-27 2009-10-15 Yazaki Corp Operation history collection device
JP2011232986A (en) * 2010-04-28 2011-11-17 Fujitsu Ltd Information processor and memory dump collection method
JP2012069032A (en) * 2010-09-27 2012-04-05 Hitachi Cable Ltd Information processor
WO2012143978A1 (en) 2011-04-22 2012-10-26 富士通株式会社 Information processing device and information processing device processing method

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0250758U (en) * 1988-09-30 1990-04-10
JPH10149317A (en) * 1996-11-20 1998-06-02 Nec Corp Information processor
JPH1153225A (en) * 1997-07-31 1999-02-26 Hitachi Ltd Fault processor
JPH11120032A (en) * 1997-10-13 1999-04-30 Nissin Electric Co Ltd Device for monitoring and automatically recovering fault of computer
JP2000099372A (en) * 1998-09-24 2000-04-07 Yamaha Corp Computer system
JP2001306363A (en) * 2000-04-25 2001-11-02 Hitachi Ltd Fault connect informing method for computer system
JP2002182951A (en) * 2000-12-18 2002-06-28 Hitachi Ltd Maintenance method for information processor and information processor
JP2004038529A (en) * 2002-07-03 2004-02-05 Nec Corp Information processor

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0250758U (en) * 1988-09-30 1990-04-10
JPH10149317A (en) * 1996-11-20 1998-06-02 Nec Corp Information processor
JPH1153225A (en) * 1997-07-31 1999-02-26 Hitachi Ltd Fault processor
JPH11120032A (en) * 1997-10-13 1999-04-30 Nissin Electric Co Ltd Device for monitoring and automatically recovering fault of computer
JP2000099372A (en) * 1998-09-24 2000-04-07 Yamaha Corp Computer system
JP2001306363A (en) * 2000-04-25 2001-11-02 Hitachi Ltd Fault connect informing method for computer system
JP2002182951A (en) * 2000-12-18 2002-06-28 Hitachi Ltd Maintenance method for information processor and information processor
JP2004038529A (en) * 2002-07-03 2004-02-05 Nec Corp Information processor

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237884A (en) * 2008-03-27 2009-10-15 Yazaki Corp Operation history collection device
JP2011232986A (en) * 2010-04-28 2011-11-17 Fujitsu Ltd Information processor and memory dump collection method
US8489933B2 (en) 2010-04-28 2013-07-16 Fujitsu Limited Data processing device and method for memory dump collection
JP2012069032A (en) * 2010-09-27 2012-04-05 Hitachi Cable Ltd Information processor
US8677185B2 (en) 2010-09-27 2014-03-18 Hitachi Metals, Ltd. Information processing apparatus
WO2012143978A1 (en) 2011-04-22 2012-10-26 富士通株式会社 Information processing device and information processing device processing method
US9448871B2 (en) 2011-04-22 2016-09-20 Fujitsu Limited Information processing device and method for selecting processor for memory dump processing

Similar Documents

Publication Publication Date Title
JP5120664B2 (en) Server system and crash dump collection method
JP2008225858A (en) Device, method and program for recovery from bios stall failure
JP2012069032A (en) Information processor
US20180089047A1 (en) Detecting and handling an expansion card fault during system initialization
JP2007241832A (en) Computer system, startup monitoring method, and startup monitoring program
JP2003208314A (en) Computer system of which operating system can be automatically replaced and automatic replacement method of operating system using the system
JP5609242B2 (en) Information processing apparatus and memory dump collection method
US20220055637A1 (en) Electronic control unit and computer readable medium
KR100899582B1 (en) Information processing apparatus, control apparatus therefor, control method therefor and control program
JP2007094537A (en) Memory dump device and memory dump collection method
CN115904793B (en) Memory transfer method, system and chip based on multi-core heterogeneous system
JP2008040698A (en) Emergency supervisory system for programmable controller
JP4269362B2 (en) Computer system
JPH08286779A (en) Application automatic restarting device
JPH1153225A (en) Fault processor
KR101300806B1 (en) Apparatus and method for handling abnormal processing in multi process system
WO2010018619A1 (en) Information processor and hang-up cause investigation information acquiring method
TWI461905B (en) Computing device capable of remote crash recovery, method for remote crash recovery of computing device, and computer readable medium
WO2007077604A1 (en) Information processor and method of monitoring hang-up
JP4633553B2 (en) Debug system, debugging method and program
JP2006323494A (en) Failure recovery method and microcomputer
JP6424134B2 (en) Computer system and computer system control method
JPH11259160A (en) Computer starting method, computer and storage medium recording starting processing program
Sollom Cray’s node health checker: an overview
JP3266192B2 (en) Operation monitoring method and system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070725

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100202

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100831