JPH10333944A - Memory dump sample system - Google Patents

Memory dump sample system

Info

Publication number
JPH10333944A
JPH10333944A JP9141689A JP14168997A JPH10333944A JP H10333944 A JPH10333944 A JP H10333944A JP 9141689 A JP9141689 A JP 9141689A JP 14168997 A JP14168997 A JP 14168997A JP H10333944 A JPH10333944 A JP H10333944A
Authority
JP
Japan
Prior art keywords
dump
area
memory
output
operating system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9141689A
Other languages
Japanese (ja)
Inventor
Takahide Shibata
隆秀 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Solution Innovators Ltd
Original Assignee
NEC Solution Innovators Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Solution Innovators Ltd filed Critical NEC Solution Innovators Ltd
Priority to JP9141689A priority Critical patent/JPH10333944A/en
Publication of JPH10333944A publication Critical patent/JPH10333944A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To shorten the time until computer system restart and to sample memory contents required for the investigation of the cause of a fault without omission by successively dumping and outputting a memory area not dumped or outputted yet after an operating system by the fault is reloaded. SOLUTION: An operating system core part area dump sample means 101 dumps only the memory area where the operating system is placed before reloading the core part of the operating system in the case that a computer system is stopped by the fault. An area allocation time dump sample means 102 outputs the image of the memory area when the memory area is not the dumped and outputted area before using a certain memory area after the operating system is reloaded. A dump non-outputted area dump sample means 103 successively dumps and outputs the memory area not dumped or outputted yet after reloading the operating system.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、コンピュータシス
テム障害時の情報採取に関し、特に大規模メモリを持つ
コンピュータシステム障害時のメモリダンプ採取に関す
る。
The present invention relates to the collection of information when a computer system fails, and more particularly to the collection of a memory dump when a computer system having a large-scale memory fails.

【0002】[0002]

【従来の技術】従来、コンピュータシステム障害時に情
報採取を行うメモリダンプ採取方式又は採取装置があ
る。
2. Description of the Related Art Conventionally, there is a memory dump collecting method or a collecting device for collecting information when a computer system fails.

【0003】例えば、特開平5−151034号公報の
ダンプ出力装置には、障害の解析に必要なシステム制御
領域のメモリイメージだけを選択してダンプすることに
よりシステムの再立ち上げ時間を短縮しダンプに必要な
二次記憶装置の容量を削減することが記載されている。
For example, the dump output device disclosed in Japanese Patent Application Laid-Open No. H5-151034 reduces the time required to restart the system by selecting and dumping only a memory image of a system control area necessary for analyzing a failure. It is described that the capacity of the secondary storage device required for the above is reduced.

【0004】また、特開平5−53882号公報のメモ
リダンプ収集方式には、システムダウンを引き起こした
プロセスに関連するプロセスでありシステムダウン時に
主記憶装置に存在するプロセスのみのメモリイメージだ
けを選択してダンプすることによりシステムの再立ち上
げ時間を短縮しダンプに必要な二次記憶装置の容量を削
減することが記載されている。
In the memory dump collection system disclosed in Japanese Patent Application Laid-Open No. 5-53882, only a memory image of a process related to a process that caused a system down and existing in a main storage device at the time of system down is selected. It is described that the time required to restart the system is shortened by dumping the data and the capacity of the secondary storage device required for dumping is reduced.

【0005】更に、特開平2−186451号公報の計
算機システムのメモリダンプ採取制御方式には、障害解
析に必要とされる情報を選択してダンプファイルに出力
することによりシステムの再立ち上げ時間を短縮しダン
プに必要な二次記憶装置の容量を削減することが記載さ
れている。
Further, in the memory dump collection control method of the computer system disclosed in Japanese Patent Application Laid-Open No. 2-186451, information required for failure analysis is selected and output to a dump file to reduce the system restart time. It describes shortening and reducing the capacity of a secondary storage device required for dumping.

【0006】更に、特開平3−255547号公報のメ
モリダンプ出力方式には、異常終了時のフェーズで参照
・更新されるメモリ領域のみのダンプ出力をすることに
より、メモリダンプ処理時間を短縮することが記載され
ている。
Further, the memory dump output method disclosed in Japanese Patent Application Laid-Open No. 3-255555 reduces the memory dump processing time by dumping only the memory area that is referenced and updated in the abnormal termination phase. Is described.

【0007】従来に於いては、コンピュータシステムで
障害が発生して、システムが停止した場合、その原因を
調査する上で有効となる障害発生時のメモリイメージの
保存(メモリダンプ採取)は、実装されているメモリ全
体を採取するか、上記各公報の従来例に示されているよ
うに特定の領域のみを選択して採取し、メモリダンプの
採取が終了してから、システムの再立ち上げを行ってい
た。
Conventionally, when a failure occurs in a computer system and the system stops, saving a memory image (collecting a memory dump) at the time of failure, which is effective in investigating the cause, is implemented. Collect the entire memory, or select and collect only a specific area as shown in the conventional examples of the above publications, and after the memory dump collection is completed, restart the system. I was going.

【0008】[0008]

【発明が解決しようとする課題】従来技術に於いてはメ
モリダンプの採取が完了するまで、システムの再立ち上
げが行えず、その間コンピュータシステムを使用しての
業務ができなくなる問題点があった(システム稼働率の
低下)。近年増えてきた大規模なメモリを持つコンピュ
ータシステムで、メモリ全体をダンプする場合はメモリ
ダンプ採取に要する時間も膨大となり、この問題はより
顕著となる。上記公報に示される技術を使用して特定の
領域のみを選択して採取する場合でも、障害の状況によ
ってはメモリダンプの採取に多くの時間を必要とする可
能性はあった。
In the prior art, there is a problem that the system cannot be restarted until the memory dump has been collected, and that the business using the computer system cannot be performed during that time. (Decrease in system operation rate). In a computer system having a large-scale memory, which has increased in recent years, when dumping the entire memory, the time required for collecting the memory dump becomes enormous, and this problem becomes more remarkable. Even when only a specific area is selected and collected by using the technique disclosed in the above-mentioned publication, depending on the state of the failure, there is a possibility that much time is required to collect a memory dump.

【0009】それは、従来の技術に於いては、システム
の再立ち上げ時、またはシステムの再立ち上げ後は、以
前のメモリイメージを保存することなしに、新たなプロ
グラムをロードしたり、その他の目的でメモリ領域を更
新してしまうため、システムの再立ち上げの前にメモリ
ダンプ採取を完了させる必要があったからである。ま
た、上記公報に示された技術に於いても、障害が検出さ
れた時に動作していたプロセスやモジュール、及びそれ
らに関連するプロセスやモジュールが参照・更新してい
た領域が大きければ、メモリダンプの採取時間も多く必
要となり、システムの停止時間も長くなるからである。
In the prior art, when the system is restarted or after the system is restarted, it is possible to load a new program or save other programs without saving the previous memory image. This is because the memory area was updated for the purpose, and it was necessary to complete the memory dump collection before restarting the system. Also, in the technology disclosed in the above publication, if a process or module operating at the time of detection of a failure and an area referred or updated by a process or module related thereto are large, a memory dump is performed. This requires a lot of sampling time, and the system downtime becomes longer.

【0010】また、上記公報に示された技術を使用し
て、特定の領域のみのメモリダンプを採取する場合、障
害の原因を調査するのに必要となる領域のメモリイメー
ジが対象から漏れ、原因の調査ができなくなる可能性が
あるという問題点があった。
When a memory dump of only a specific area is collected by using the technique disclosed in the above publication, a memory image of an area necessary for investigating a cause of a failure is leaked from a target, and There was a problem that it might not be possible to conduct an investigation.

【0011】それは、上記公報で示される技術に於いて
は、システムの障害が検出された時に動いていたプロセ
スやモジュール、及びそれに関連するプロセスやモジュ
ールが参照・更新した領域、あるいはシステムの障害を
検出した場所や状況から判断される領域のみを選択して
採取することとしているが、障害の原因が障害を検出し
たときに動作していたプロセスやモジュールとは一見無
関係なプロセスやモジュールに起因していることが少な
くないからである。このような場合、障害の原因となっ
たプロセスやモジュールが参照・更新していた領域がダ
ンプの対象とならないため、原因の調査ができないこと
になる。
In the technique disclosed in the above publication, the process or module that was running when the system failure was detected, and the area referenced or updated by the related process or module, or the system failure was determined. Although only the area determined from the detected location or situation is selected and collected, the cause of the failure is caused by a process or module that is apparently unrelated to the process or module that was operating when the failure was detected. This is because there are many cases. In such a case, the area that has been referenced or updated by the process or module that caused the failure is not targeted for dumping, so that the cause cannot be investigated.

【0012】そこで本発明の目的は、コンピュータシス
テムの障害による停止から、システム再立ち上げまでの
時間を短縮し、障害の原因を調査するのに必要となるメ
モリ領域の内容を漏れなく採取することができるメモリ
ダンプ採取方式を提供することである。
It is an object of the present invention to reduce the time from the stoppage due to a failure in a computer system to the restart of the system, and to collect the contents of a memory area required for investigating the cause of the failure without omission. The purpose of the present invention is to provide a memory dump collection method that can perform the above.

【0013】[0013]

【課題を解決するための手段】本発明によるメモリダン
プ採取方式は、コンピュータシステムが障害により停止
した場合、オペレーディングシステムの中核部を再ロー
ドする前にオペレーティングシステムの中核部が置かれ
ているメモリ領域のみをダンプするオペレーティングシ
ステム中核部領域ダンプ採取手段と、前記オペレーティ
ングシステムが再ロードされた後にあるメモリ領域を使
用する前に、該メモリ領域がダンプ出力済みの領域でな
ければ、該メモリ領域のイメージをダンプ出力する領域
割り当て時ダンプ採取手段と、前記オペレーティングシ
ステムが再ロードされた後に、まだダンプ出力済みでな
いメモリ領域を順次ダンプ出力するダンプ未出力領域ダ
ンプ採取手段とを有し、前記障害による前記オペレーテ
ィングシステム停止から、前記オペレーティング再起動
までの時間を短縮することを特徴とする。
According to the memory dump collecting method of the present invention, when the computer system is stopped due to a failure, the memory in which the core of the operating system is located before reloading the core of the operating system. An operating system core area dumping means for dumping only the area, and before using the memory area after the operating system is reloaded, if the memory area is not an area for which dump output has been performed, An area allocation dump collecting means for dumping an image; and a dump non-output area dump collecting means for sequentially dumping a memory area which has not been dumped after the operating system is reloaded. Operating system outage From, characterized in that to shorten the time until the operating restarted.

【0014】また、本発明によるメモリダンプ採取方式
は、更に、メモリ領域のページ単位のダンプ済み状態を
記録するメモリダンプ採取領域管理テーブルを備え、前
記前記中核部領域ダンプ採取手段は、前記メモリダンプ
採取領域管理テーブルの中核部領域にあるページに対応
するフラグをリセット値以外の値にし、他の全てのペー
ジに対応するフラグをリセット値にし、前記領域割り当
て時ダンプ採取手段と前記ダンプ未出力領域ダンプ採取
手段とは、ダンプ出力終了後に前記メモリダンプ採取領
域管理テーブルのダンプしたメモリ領域のページに対応
するフラグをリセット値以外の値にし、前記領域割り当
て時ダンプ採取手段と前記ダンプ未出力領域ダンプ採取
手段とは、前記フラグがリセット値であれば対応するメ
モリ領域がダンプ出力済みでないと判断することを特徴
とする。
Further, the memory dump collecting method according to the present invention further comprises a memory dump collecting area management table for recording a dumped state of the memory area in units of pages, wherein the core area dump collecting means comprises: The flag corresponding to the page in the core area of the collection area management table is set to a value other than the reset value, the flags corresponding to all other pages are set to the reset value, the area allocation dump collecting means and the dump non-output area The dump collecting means sets the flag corresponding to the page of the dumped memory area of the memory dump collecting area management table to a value other than a reset value after the dump output, sets the area allocation time dump collecting means and the dump non-output area dump If the flag is a reset value, the corresponding memory area is dumped. Characterized in that it determined not to be a force already.

【0015】更に、本発明によるメモリダンプ採取方式
は、前記ダンプ未出力領域ダンプ採取手段は、最低の優
先度で実行されることを特徴とする。
Further, in the memory dump collecting method according to the present invention, the dump non-output area dump collecting means is executed with the lowest priority.

【0016】更に、本発明によるメモリダンプ採取方式
は、前記領域割り当て時ダンプ採取手段とダンプ未出力
領域ダンプ採取手段とは並列して実行されることを特徴
とする。
Further, the memory dump collecting method according to the present invention is characterized in that the area-collecting dump collecting means and the dump non-output area dump collecting means are executed in parallel.

【0017】本発明による記録媒体は、上記のメモリダ
ンプ採取方式をコンピュータに実行させるためのプログ
ラムを記録したことを特徴とする。
A recording medium according to the present invention is characterized by recording a program for causing a computer to execute the above-described memory dump collecting method.

【0018】[作用]システムの再立ち上げ後、新たな
プログラムのロードやその他の目的で、メモリ領域を割
り当てる際に、割り当てようとする領域のイメージがま
だダンプ出力されていなければ、領域割り当て時ダンプ
採取手段によりダンプ出力されるため、コンピュータシ
ステムが障害で停止した場合、オペレーティングシステ
ムの中核部が置かれているメモリ領域だけをOS中核部
領域ダンプ採取手段によりダンプ出力した後、メモリダ
ンプ採取が完了するのを待つことなしにシステムの再立
ち上げが可能となる。
[Operation] After the system is restarted, when allocating a memory area for loading a new program or for other purposes, if an image of the area to be allocated has not been dumped yet, the time of area allocation is Since the dump is output by the dump collecting means, if the computer system stops due to a failure, only the memory area where the core of the operating system is located is dumped by the OS core area dump collecting means, and then the memory dump is collected. The system can be restarted without waiting for completion.

【0019】また、ダンプ未出力領域ダンプ採取手段に
より、ダンプ出力されていない領域についても順次ダン
プ採取するので、システム再立ち上げ後、新たに使用さ
れることのない領域についても漏れなくダンプ採取する
ことが可能となる。
[0019] Further, since the dump non-output area dump collecting means sequentially collects dumps even in areas where no dump has been output, after the system is restarted, dumps are newly collected in areas which will not be newly used. It becomes possible.

【0020】[0020]

【発明の実施の形態】本発明の実施形態について、図面
を参照しながら説明する。
Embodiments of the present invention will be described with reference to the drawings.

【0021】本実施形態に於いては、メモリダンプ採取
方式は、図1に示すように障害によりコンピュータシス
テムが停止(S110)した場合、システム再立ち上げ
の際システムローダによって内容が書き換えられるオペ
レーティングシステムの中核部(メモリ常駐部)が置か
れているメモリ領域だけのメモリダンプ採取を行うOS
中核部領域ダンプ採取手段101と、システムの再立ち
上げを行った後、新たなプログラムをメモリにロードす
るなどの目的でメモリ領域を割り当てる際、その割り当
てようとする領域がダンプ未採取領域であるか否かを判
断し、未採取の領域であれば割り当て前のイメージをメ
モリダンプファイルに出力する領域割り当て時ダンプ採
取手段102と、ダンプ未採取領域のイメージを順次メ
モリダンプファイルに出力するダンプ未出力領域ダンプ
採取手段103より構成される。
In this embodiment, as shown in FIG. 1, when the computer system is stopped due to a failure (S110), the contents of the operating system are rewritten by the system loader when the system is restarted, as shown in FIG. OS that collects memory dumps only in the memory area where the core part (memory resident part) is located
When the memory area is allocated for the purpose of loading a new program into the memory after the system is restarted with the core area dump collecting means 101, the area to be allocated is a non-dumped area. It is determined whether or not the area has not been collected. If the area has not been collected, the area allocation-time dump collecting means 102 outputs an image before allocation to a memory dump file. The output area dump collecting means 103 is provided.

【0022】次に、本実施形態の動作について図1に加
えて図2を参照しながら説明する。
Next, the operation of this embodiment will be described with reference to FIG. 2 in addition to FIG.

【0023】コンピュータシステムが障害を検出して、
その運用が停止(S110)した場合、まずOS中核部
領域ダンプ採取手段101によりオペレーティングシス
テムの中核部202(メモリ常駐部)が置かれているメ
モリ領域のイメージをメモリダンプファイル204(図
2)に出力する。
When the computer system detects the fault,
When the operation is stopped (S110), first, the OS core area dumping means 101 stores the image of the memory area where the core 202 (memory resident) of the operating system is located in the memory dump file 204 (FIG. 2). Output.

【0024】その後システムローダによりオペレーティ
ングシステムの中核部をメモリ201上の専用の位置2
02に再ロードし、システムの再立ち上げを行う(S1
11)。システム再立ち上げの後、新たなプログラム2
06のロードやその他の目的でメモリ領域が必要になっ
たとき(S112)、領域割り当て時ダンプ採取手段1
02により、割り当てようとするメモリ領域203のイ
メージが既にメモリダンプファイル204に出力されて
いるか否かをチェックし(S113)、出力済みでなけ
ればメモリイメージをメモリダンプファイル204に出
力する(S114)。
Thereafter, the core part of the operating system is stored in a dedicated location 2 on the memory 201 by the system loader.
02, and restart the system (S1
11). After system restart, new program 2
When a memory area is required for loading the 06 or other purposes (S112), the dump collection means 1 at the time of area allocation
In step S113, it is checked whether the image of the memory area 203 to be allocated has already been output to the memory dump file 204 (S113). If not, the memory image is output to the memory dump file 204 (S114). .

【0025】また、システム再立ち上げの後、ダンプ未
出力領域ダンプ採取手段103を起動して、そのイメー
ジがメモリダンプファイル204に出力されていないメ
モリ領域のイメージを順次メモリダンプファイル204
に出力する(S116、S117)。このダンプ未出力
領域ダンプ採取手段103と上記領域割り当て時ダンプ
採取手段102は並行して動作する。
After the system is restarted, the dump non-output area dump collecting means 103 is activated, and the images of the memory areas whose images have not been output to the memory dump file 204 are sequentially stored in the memory dump file 204.
(S116, S117). The dump non-output area dump collecting means 103 and the area allocation-time dump collecting means 102 operate in parallel.

【0026】このことから分かるように、本発明の実施
によりコンピュータシステムが障害で停止した場合、メ
モリダンプ全ての出力が終わるのを待つことなしにシス
テムの再立ち上げが可能となり、システムの停止時間を
短縮することが可能となる。また、メモリ全体のダンプ
採取を行うので障害の原因を調査するのに必要となるメ
モリ領域のイメージが採取漏れとなることがないため、
障害の再発を防止できる可能性が高くなる。
As can be seen from the above, when the computer system is stopped due to the failure according to the embodiment of the present invention, the system can be restarted without waiting for the output of all the memory dumps to be completed. Can be shortened. In addition, since the entire memory is dumped, the image of the memory area required for investigating the cause of the failure will not be overlooked.
The likelihood of preventing a recurrence of the disorder increases.

【0027】[0027]

【実施例】本発明の一実施例について、図面を参照しな
がら詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described in detail with reference to the drawings.

【0028】本実施例に於いては、メモリダンプ採取方
式は、図1に示すように障害によりコンピュータシステ
ムが停止した場合、システム再立ち上げの際システムロ
ーダによって内容が書き換えられるオペレーティングシ
ステムの中核部(メモリ常駐部)が置かれているメモリ
領域だけのメモリダンプ採取を行うOS中核部領域ダン
プ採取手段101と、システムの再立ち上げを行った
後、新たなプログラムをメモリにロードするなどの目的
でメモリ領域を割り当てる際、その割り当てようとする
領域がダンプ未採取領域であるか否かを判断し、未採取
の領域であれば割り当て前のイメージをメモリダンプフ
ァイルに出力する領域割り当て時ダンプ採取手段102
と、ダンプ未採取領域のイメージを順次メモリダンプフ
ァイルに出力するダンプ未出力領域ダンプ採取手段10
3より構成される。
In this embodiment, the memory dump collection method is based on the core part of the operating system whose contents are rewritten by the system loader when the computer system is stopped due to a failure as shown in FIG. OS core area dump collecting means 101 for collecting a memory dump only in the memory area where the (memory resident unit) is located, and a purpose of loading a new program into the memory after restarting the system. When allocating a memory area, determine whether the area to be allocated is an uncollected area, and if it is an uncollected area, output the image before allocation to a memory dump file. Means 102
And a dump non-output area dump collecting means 10 for sequentially outputting an image of the dump non-collection area to a memory dump file
3

【0029】本実施例に於いては、OS中核部領域ダン
プ採取手段101と、領域割り当て時ダンプ採取手段1
02は、オペレーティングシステムの中核部の一部とし
て実装し、ダンプ未出力領域ダンプ採取手段103は、
独立したプログラムとして実装する。このダンプ未出力
領域ダンプ採取手段103をメモリ201にロードする
際には、領域割り当て時ダンプ採取手段102が働く。
但し、ダンプ未出力領域ダンプ採取手段103は必ずし
も独立したプログラムとして実装しなければならないの
ではなく、OS中核部202に含まれても良い。また、
各メモリ領域のイメージがメモリダンプファイル204
に出力済みであるかどうかを記録し、チェックの際に使
用するメモリダンプ採取領域管理テーブル301(図
3)を持つ。
In this embodiment, the OS core area dump collecting means 101 and the area allocation time dump collecting means 1
02 is implemented as a part of the core part of the operating system.
Implement as an independent program. When the dump non-output area dump collecting means 103 is loaded into the memory 201, the area collecting dump collecting means 102 operates.
However, the dump non-output area dump collecting unit 103 does not necessarily have to be implemented as an independent program, and may be included in the OS core unit 202. Also,
The image of each memory area is a memory dump file 204
Is stored in the memory dump collection area management table 301 (FIG. 3) used for checking.

【0030】メモリダンプ採取領域管理テーブル301
はメモリ領域の割り当て単位(ページ)に対応して要素
(フラグ)を持ち、各要素(フラグ)は対応するメモリ
領域の割り当て単位のイメージがメモリダンプファイル
204に出力済みであるときにはリセット値以外の値、
まだ出力されていないときにはリセット値を保持する。
すなわち、各要素(フラグ)はメモリダンプ採取済フラ
グの役目を果たす。メモリダンプ採取領域管理テーブル
301はメモリ201(図2)上のOS中核部領域20
2内に常駐する。
Memory dump collection area management table 301
Has an element (flag) corresponding to the allocation unit (page) of the memory area. Each element (flag) has a value other than the reset value when the image of the corresponding allocation unit of the memory area has been output to the memory dump file 204. value,
When not yet output, the reset value is held.
That is, each element (flag) serves as a memory dump collection completed flag. The memory dump collection area management table 301 stores the OS core area 20 in the memory 201 (FIG. 2).
Resident in 2

【0031】次に、本実施例の動作について説明する。Next, the operation of this embodiment will be described.

【0032】コンピュータシステムが障害を検出して、
その運用が停止(S110)した場合、まずOS中核部
領域ダンプ採取手段101によりオペレーティングシス
テムの中核部202(メモリ常駐部)が置かれているメ
モリ領域のイメージをディスク上のメモリダンプファイ
ル204に出力する。このときメモリダンプ採取領域管
理テーブル301のオペレーティングシステム中核部2
02が置かれているメモリ領域に対応する要素の値を例
えば1とし、その他の要素を例えば0として、メモリダ
ンプ採取領域管理テーブル205をディスク上に一旦退
避させる。オペレーティングシステムの中核部202
は、メモリ201の先頭に置かれ、その大きさはシステ
ムローダにより、OS中核部領域サイズ格納変数303
に設定される。OS中核部ダンプ採取手段101は、こ
のOS中核部領域サイズ格納変数を参照することで、オ
ペレーティングシステムの中核部202が置かれている
領域のサイズを認識する。
When the computer system detects a fault,
When the operation is stopped (S110), first, the OS core area dumping means 101 outputs an image of the memory area where the operating system core 202 (memory resident) is located to the memory dump file 204 on the disk. I do. At this time, the operating system core unit 2 of the memory dump collection area management table 301
The value of the element corresponding to the memory area where 02 is placed is set to, for example, 1 and the other elements are set to, for example, 0, and the memory dump collection area management table 205 is temporarily saved on the disk. Core 202 of the operating system
Is stored at the top of the memory 201, and its size is determined by the system loader by the OS core area size storage variable 303.
Is set to The OS core part dump collection means 101 recognizes the size of the area where the core part 202 of the operating system is located by referring to the OS core part area size storage variable.

【0033】その後、システムローダによりオペレーテ
ィングシステムの中核部をメモリ上にロードし、さらに
ディスク上に退避した上記メモリダンプ採取領域管理テ
ーブル205を再びメモリ201上に読み込み、システ
ムの再立ち上げを行う(S111)。システムの再立ち
上げの後、新たなプログラム206のロードやその他の
目的でメモリ領域が必要になったとき(S112)、領
域割り当て時ダンプ採取手段102では、割り当てよう
とするメモリ領域203に対応するメモリダンプ採取領
域管理テーブル301の要素を参照して要素の値が0で
あれば(S113)、領域のイメージが未だメモリダン
プファイル204に出力されていないと判断し、メモリ
イメージをメモリダンプファイル204に出力する(S
114)。メモリダンプファイル204はメモリ201
と完全に対応しており、各メモリ領域のイメージは、そ
の領域が存在するメモリ201上の絶対アドレスとメモ
リダンプファイルの先頭からのオフセットが等しくなる
メモリダンプファイル204上の場所に出力する。同時
にメモリダンプ採取領域管理テーブル301の対応する
要素の値を1に更新する。
After that, the core part of the operating system is loaded on the memory by the system loader, and the memory dump collection area management table 205 saved on the disk is read again on the memory 201 to restart the system ( S111). After the system is restarted, when a memory area is required for loading a new program 206 or for another purpose (S112), the area allocation time dump collection unit 102 corresponds to the memory area 203 to be allocated. If the value of the element is 0 with reference to the element of the memory dump collection area management table 301 (S113), it is determined that the image of the area has not yet been output to the memory dump file 204, and the memory image is stored in the memory dump file 204. (S
114). The memory dump file 204 is stored in the memory 201
The image of each memory area is output to a location on the memory dump file 204 where the absolute address on the memory 201 where the area exists and the offset from the beginning of the memory dump file are equal. At the same time, the value of the corresponding element in the memory dump collection area management table 301 is updated to 1.

【0034】また、システム再立ち上げの後、ダンプ未
出力領域ダンプ採取手段103を実装したプログラムを
起動する。起動の際にCPUの割り当て優先度を最低に
設定して他のプログラムがCPUを使用していないとき
(アイドル状態)に動作するようにし、他のプログラム
の動作への影響を最小限に抑えるようにする。但し、シ
ステムの状況によっては優先度を変えることもある。こ
のプログラムはメモリダンプ採取領域管理テーブル30
1の各要素を順次チェックし(S116)、その値が0
であればその要素に対応するメモリ領域のイメージをメ
モリダンプファイル204に出力し、同時に要素の値を
1に更新する(S117)。
After the system is restarted, a program in which the dump non-output area dump collecting means 103 is mounted is started. At the time of startup, the CPU allocation priority is set to the lowest, so that the other program operates when the CPU is not using the CPU (idle state), and the influence on the operation of the other program is minimized. To However, the priority may be changed depending on the status of the system. This program uses the memory dump collection area management table 30
Each element of 1 is sequentially checked (S116), and the value is 0
If so, the image of the memory area corresponding to the element is output to the memory dump file 204, and at the same time, the value of the element is updated to 1 (S117).

【0035】この処理を繰り返してメモリダンプ採取領
域管理テーブル301の全ての要素が0でなくなったと
き、すなわち全てのメモリ領域のダンプ採取が終了する
とこのプログラムは終了する(S118)。
When this processing is repeated and all the elements of the memory dump collection area management table 301 are not 0, that is, when the dump collection of all the memory areas is completed, this program ends (S118).

【0036】[0036]

【発明の効果】以上説明したように本発明によれば、領
域割り当て時ダンプ採取手段により、システム再立ち上
げ後に最初に各メモリ領域の割り当て単位(ページ)の
イメージを更新する前に、そのメモリ領域のイメージを
メモリダンプファイルに出力するため、メモリダンプ全
体の出力が終わるのを待つことなしにシステムの再立ち
上げが可能となるので、コンピュータシステムが障害で
停止した場合、システムの停止時間を短縮することが可
能となる。
As described above, according to the present invention, before the image of the allocation unit (page) of each memory area is first updated by the area allocation dump collection means after the system is restarted, the memory of the memory is updated. Since the image of the area is output to the memory dump file, the system can be restarted without waiting for the entire memory dump to be output. It can be shortened.

【0037】更に、最終的にはメモリ全体のダンプ採取
を行うので障害の原因を調査するのに必要となるメモリ
領域のイメージが採取漏れとなることがないため、原因
調査、調査結果に基づく処置が可能となる場合が増大す
るので、障害の再発を防止できる可能性が高くなる。
Furthermore, since dumping of the entire memory is ultimately performed, the image of the memory area required for investigating the cause of the failure does not become uncollected. Since the number of cases in which the failure becomes possible increases, the possibility of preventing the recurrence of the failure increases.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明によるメモリダンプ採取方式の処理の流
れを説明する図である。
FIG. 1 is a diagram illustrating the flow of processing of a memory dump collection method according to the present invention.

【図2】本発明によるメモリダンプ採取方式に於ける関
連する情報の位置関係を表す図である。
FIG. 2 is a diagram showing a positional relationship of related information in a memory dump collection method according to the present invention.

【図3】本発明によるメモリダンプ採取方式に於けるメ
モリダンプ採取領域管理テーブルとメモリ領域割り当て
単位(ページ)の関連、および、OS中核部領域サイズ
格納変数とオペレーティングシステムの中核部(メモリ
常駐部)の関係を示す図である。
FIG. 3 shows the relationship between the memory dump collection area management table and the memory area allocation unit (page) in the memory dump collection method according to the present invention, the OS core area size storage variable, and the core of the operating system (memory resident section). FIG.

【符号の説明】[Explanation of symbols]

101 OS中核部領域ダンプ採取手段 102 領域割り当て時ダンプ採取手段 103 ダンプ未出力領域ダンプ採取手段 201 メモリ 202 OS中核部 203 割り当てようとするメモリ領域 204 ディスクに待避されたメモリダンプファイル 205 メモリダンプ採取領域管理テーブル 206 新たにロードしようとするプログラムファイ
ル 301 メモリダンプ採取領域管理テーブル 302 メモリ 303 OS中核部領域サイズ格納変数
101 OS core part area dump collecting means 102 Dump collecting means at the time of area allocation 103 Dump non-output area dump collecting means 201 Memory 202 OS core part 203 Memory area to be allocated 204 Memory dump file saved on disk 205 Memory dump collecting area Management table 206 Program file to be newly loaded 301 Memory dump collection area management table 302 Memory 303 OS core area size storage variable

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 コンピュータシステムが障害により停止
した場合、オペレーディングシステムの中核部を再ロー
ドする前に前記オペレーティングシステムの中核部が置
かれているメモリ領域のみをダンプするオペレーティン
グシステム中核部領域ダンプ採取手段と、 前記オペレーティングシステムが再ロードされた後にあ
るメモリ領域を使用する前に、該メモリ領域がダンプ出
力済みの領域でなければ、該メモリ領域のイメージをダ
ンプ出力する領域割り当て時ダンプ採取手段と、 前記オペレーティングシステムが再ロードされた後に、
まだダンプ出力済みでないメモリ領域を順次ダンプ出力
するダンプ未出力領域ダンプ採取手段とを有することを
特徴とするメモリダンプ採取方式。
1. An operating system core area dumping method for dumping only a memory area where the operating system core is located before reloading the operating system core when the computer system is stopped due to a failure. Means for collecting an area allocation dump for dumping an image of the memory area before using the memory area after the operating system is reloaded, if the memory area is not an area for which dump output has been performed; After the operating system has been reloaded,
A dump non-output area dump collecting means for sequentially dump-outputting memory areas which have not yet been dump output.
【請求項2】 更に、前記メモリ領域のページ単位のダ
ンプ済み状態を記録するメモリダンプ採取領域管理テー
ブルを備え、 前記中核部領域ダンプ採取手段は、前記メモリダンプ採
取領域管理テーブルの中核部領域にあるページに対応す
るフラグをリセット値以外の値にし、他の全てのページ
に対応するフラグをリセット値にし、 前記領域割り当て時ダンプ採取手段と前記ダンプ未出力
領域ダンプ採取手段とは、ダンプ出力終了後に前記メモ
リダンプ採取領域管理テーブルのダンプしたメモリ領域
のページに対応するフラグをリセット値以外の値にし、 前記領域割り当て時ダンプ採取手段と前記ダンプ未出力
領域ダンプ採取手段とは、前記フラグがリセット値であ
れば対応するメモリ領域がダンプ出力済みでないと判断
することを特徴とする請求項1に記載のメモリダンプ採
取方式。
2. A memory dump collection area management table for recording a dumped state of the memory area in units of pages, wherein the core area dump collection means is provided in a core area of the memory dump collection area management table. The flag corresponding to a certain page is set to a value other than the reset value, the flags corresponding to all other pages are set to the reset value, and the area allocation time dump collection means and the dump non-output area dump collection means complete dump output. Later, the flag corresponding to the page of the dumped memory area in the memory dump collection area management table is set to a value other than the reset value, and the area allocation time dump collection means and the dump non-output area dump collection means reset the flag. If the value is a value, it is determined that the corresponding memory area has not been dumped. The memory dump collection method according to claim 1.
【請求項3】 前記ダンプ未出力領域ダンプ採取手段
は、最低の優先度で実行されることを特徴とする請求項
1又は2に記載のメモリダンプ採取方式。
3. The memory dump collecting method according to claim 1, wherein the dump non-output area dump collecting means is executed with the lowest priority.
【請求項4】 前記領域割り当て時ダンプ採取手段とダ
ンプ未出力領域ダンプ採取手段とは並列して実行される
ことを特徴とする請求項1乃至3のいずれか1項に記載
のメモリダンプ採取方式。
4. The memory dump collection method according to claim 1, wherein the area allocation dump collection unit and the dump non-output area dump collection unit are executed in parallel. .
【請求項5】 請求項1乃至4のいずれか1項に記載の
メモリダンプ採取方式をコンピュータに実行させるため
のプログラムを記録したことを特徴とする記録媒体。
5. A recording medium recording a program for causing a computer to execute the memory dump collection method according to claim 1. Description:
JP9141689A 1997-05-30 1997-05-30 Memory dump sample system Pending JPH10333944A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9141689A JPH10333944A (en) 1997-05-30 1997-05-30 Memory dump sample system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9141689A JPH10333944A (en) 1997-05-30 1997-05-30 Memory dump sample system

Publications (1)

Publication Number Publication Date
JPH10333944A true JPH10333944A (en) 1998-12-18

Family

ID=15297937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9141689A Pending JPH10333944A (en) 1997-05-30 1997-05-30 Memory dump sample system

Country Status (1)

Country Link
JP (1) JPH10333944A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6952793B2 (en) 2000-05-18 2005-10-04 Hitachi, Ltd. Computer system and methods for acquiring dump information and system recovery
US7010725B2 (en) 2000-09-04 2006-03-07 Hitachi, Ltd. Method and apparatus for getting dump of a computer system
JP2006072931A (en) * 2004-09-06 2006-03-16 Fujitsu Ltd Program for panic dump collection, method, and mechanism
JP2007122552A (en) * 2005-10-31 2007-05-17 Nec Corp Memory dumping method, computer system and program
WO2013080313A1 (en) 2011-11-30 2013-06-06 株式会社日立製作所 Memory dump collection technique
US8719639B2 (en) 2007-03-19 2014-05-06 Fujitsu Limited Virtual machine control program, virtual machine control system, and dump capturing method
WO2015015589A1 (en) 2013-07-31 2015-02-05 富士通株式会社 Information processing device, memory dump method, and memory dump program
JP2015114750A (en) * 2013-12-10 2015-06-22 富士通株式会社 Examination program, information processing device, and information processing method

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6952793B2 (en) 2000-05-18 2005-10-04 Hitachi, Ltd. Computer system and methods for acquiring dump information and system recovery
US7010725B2 (en) 2000-09-04 2006-03-07 Hitachi, Ltd. Method and apparatus for getting dump of a computer system
JP2006072931A (en) * 2004-09-06 2006-03-16 Fujitsu Ltd Program for panic dump collection, method, and mechanism
JP4677214B2 (en) * 2004-09-06 2011-04-27 富士通株式会社 Program, method and mechanism for collecting panic dump
JP2007122552A (en) * 2005-10-31 2007-05-17 Nec Corp Memory dumping method, computer system and program
JP4645837B2 (en) * 2005-10-31 2011-03-09 日本電気株式会社 Memory dump method, computer system, and program
US8719639B2 (en) 2007-03-19 2014-05-06 Fujitsu Limited Virtual machine control program, virtual machine control system, and dump capturing method
WO2013080313A1 (en) 2011-11-30 2013-06-06 株式会社日立製作所 Memory dump collection technique
WO2015015589A1 (en) 2013-07-31 2015-02-05 富士通株式会社 Information processing device, memory dump method, and memory dump program
US10025670B2 (en) 2013-07-31 2018-07-17 Fujitsu Limited Information processing apparatus, memory dump method, and storage medium
JP2015114750A (en) * 2013-12-10 2015-06-22 富士通株式会社 Examination program, information processing device, and information processing method

Similar Documents

Publication Publication Date Title
US6615364B1 (en) Computer system and methods for acquiring dump information and system recovery
EP1638000B1 (en) Method, apparatus and program for performing panic memory dump
JP3481737B2 (en) Dump collection device and dump collection method
JP2007133544A (en) Failure information analysis method and its implementation device
US8245085B2 (en) Dump output control apparatus and dump output control method
JPH10333944A (en) Memory dump sample system
US5819024A (en) Fault analysis system
JP2015114750A (en) Examination program, information processing device, and information processing method
US6898736B2 (en) Dynamic sizing logic for dump list generation
US6832342B2 (en) Method and apparatus for reducing hardware scan dump data
US20090138633A1 (en) Computer, external storage and method for processing data information in external storage
US6141635A (en) Method of diagnosing faults in an emulated computer system via a heterogeneous diagnostic program
JP2007172414A (en) Compact core dump program for built-in equipment and method using compact core dump
JP2001290677A (en) High-speed dump sampling method
US6425063B1 (en) Method and arrangement for memory management
US6950916B2 (en) Dynamically setting the optimal base addresses of process components
JP3399741B2 (en) Dump data display method and failure analysis system
JP2000132432A (en) Memory dump system for parallel nodes
JP2006190069A (en) Method for collecting failure information
CN117215840A (en) Log storage method and device for terminal and kernel exception thereof, and readable storage medium
CN118550762A (en) Processing method of operating system fault and acceleration card
CN118193337A (en) Data transfer method and device
JPH02242447A (en) Memory dump collecting system
JPH07152574A (en) Program loading system
JPH02109147A (en) Memory dump collection system