JP3903678B2 - Computer system dump processing method - Google Patents

Computer system dump processing method Download PDF

Info

Publication number
JP3903678B2
JP3903678B2 JP2000041375A JP2000041375A JP3903678B2 JP 3903678 B2 JP3903678 B2 JP 3903678B2 JP 2000041375 A JP2000041375 A JP 2000041375A JP 2000041375 A JP2000041375 A JP 2000041375A JP 3903678 B2 JP3903678 B2 JP 3903678B2
Authority
JP
Japan
Prior art keywords
memory
dump
computer system
address
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000041375A
Other languages
Japanese (ja)
Other versions
JP2001229053A (en
Inventor
雅彦 山内
秀樹 村山
和雄 堀川
寛 屋代
雄介 菅波
大介 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2000041375A priority Critical patent/JP3903678B2/en
Publication of JP2001229053A publication Critical patent/JP2001229053A/en
Application granted granted Critical
Publication of JP3903678B2 publication Critical patent/JP3903678B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、障害が発生した計算機システムの障害情報の取得、及び障害が発生した計算機システムの再起動に関する。
【0002】
【従来の技術】
従来、オペレーティングシステムはシステム動作中にデータの整合性等をチェックしており、何らかの障害によりデータの不整合が発生した場合、計算機システムを緊急停止するためにパニック処理を実行する。
【0003】
パニック処理では、システム管理者が後で障害の原因を突き止めることができるように、障害発生時のメモリ内容をハードディスク等の補助記憶装置に保存する。メモリ内容を補助記憶装置に保存する処理はダンプ処理と呼ばれており、ダンプ処理終了後、計算機システムは再起動される。
【0004】
ダンプ処理では、計算機システムのすべてのメモリをダンプする場合(全ダンプ)と、一部分のメモリをダンプする場合がある。メモリを全ダンプする場合には、一部分のメモリをダンプする場合と比較して、ダンプ処理に要する時間が長い。ダンプ処理時間を短縮するために、一部分のメモリを選択し、選択したメモリのみをダンプする技術については、特開昭64―25255号公報に記載されている。
【0005】
システム再起動処理では、ハードディスク等の補助記憶装置に保存したメモリ内容を、システム管理者等が障害原因を解析可能なファイル形式に変換する。補助記憶装置の使用容量を節約するために、ファイル形式変換時にファイルの圧縮処理を実行する場合もある。
【0006】
計算機システムで障害が発生した後、計算機システムを再起動するまでの一連の処理は、「Panic! UNIXシステムクラッシュの追跡と対策」(1997)、ISBN4−7561−1912−3の第27ページから第33ページに記載されている。
【0007】
【発明が解決しようとする課題】
近年、計算機システムに搭載するメモリ量が増加し、計算機システムで障害が発生してから再起動するまでに必要な時間が増加している。
【0008】
先に述べたように、一部分のメモリを選択してダンプすることで、全ダンプする場合と比較して、ダンプする必要のあるメモリ量は少ない。しかし、障害発生時のメモリ内容を解析する前に、障害に関連するメモリ範囲を特定するのは困難な場合がある。さらに、一部分のメモリを選択してダンプしても、選択したメモリをすべてダンプ完了するまで再起動処理を実行できない。
【0009】
また、先に述べたように、補助記憶装置の使用容量を節約するため、再起動時にファイル圧縮処理を実行する場合には、再起動に必要な時間がさらに増大する。計算機システムで障害が発生してから再起動を終了するまでの間、計算機システムはサービスをユーザに提供できない。そのため、ある一定期間における計算機システムの稼動時間は減少し、利用効率が下がるという課題があった。
【0010】
本発明の目的は、計算機システムで障害が発生してから再起動を終了するまでの時間を短縮し、計算機システムの稼働率を向上すると共に、障害原因の分析に必要なメモリ内容をシステム管理者等に提供することにある。
【0011】
【課題を解決するための手段】
上記目的を達成するために本発明は、初期化するメモリの領域を指定するアドレスまたはメモリ量を示すメモリ範囲指定情報およびメモリのアドレスまたはメモリ量によりメモリを複数の領域に分割する数値を示すメモリ構成情報を有し、ダンプ取得範囲指定手段が1回目のダンプ処理で保存するメモリ範囲を指定し、ダンプ取得手段が該ダンプ取得範囲指定手段で指定された範囲のメモリ内容を該ダンプ格納領域に保存し、さらに、ダンプファイル生成手段は、該ダンプ格納領域に保存したメモリ内容をファイルに変換する。そして、計算機システムで障害が発生した場合に、該ダンプ取得手段が該ダンプ取得範囲指定手段で指定されるメモリ範囲の内容を該ダンプ格納領域に保存し、計算機システムを再起動する時は、障害発生時に保存したメモリ範囲のみを初期化し、該ダンプファイル生成手段が該ダンプ格納領域の内容をファイルに変換し、計算機システムの再起動が完了した後、障害発生時に保存しなかったメモリ内容を該ダンプ格納領域に保存すると共に、該ダンプ格納領域の内容をファイルに変換する。
【0012】
【発明の実施の形態】
本発明における実施例を説明する。
【0013】
図1は、本発明の一実施例を示す計算機システムのブロック図である。本図において、計算機システム124は、プログラム命令列やデータを永続的に格納するための磁気ディスク等の補助記憶装置111、プログラム命令列やデータを永続的に格納するためのEEPROM(Electrically Erasable Programmable Read Only Memory)等の不揮発性メモリ101、プログラム命令列やデータを格納するためのメモリ107、不揮発性メモリ101やメモリ107に格納したプログラム命令列を実行するプロセッサ100、計算機の各ブロック間の伝送路であるバス110から構成される。
【0014】
補助記憶装置111には、計算機システムの障害発生時に保存するメモリ107の範囲を指定するダンプ取得範囲指定ファイル112、計算機システム124の補助記憶装置111やメモリ107等の資源を管理するオペレーティングシステム(OS)のプログラム命令列やデータを格納するためのOS格納領域113、障害が発生した際のメモリ内容を保存するダンプ格納領域114を持つ。ダンプ格納領域114には、最初の1回目のダンプ処理で使用する1次ダンプ格納領域116と、2回目のダンプ処理で使用する2次ダンプ格納領域115を持つ。本実施例中では、ダンプ格納領域114に2つの格納領域115、116を持つ計算機システムについて説明しているが、必要に応じて2つ以上の複数の格納領域を備えていてもよい。
【0015】
不揮発性メモリ101には、計算機システム124が搭載するメモリ107の大きさを保持するための構成情報102、補助記憶装置111における1次ダンプ格納領域116や2次ダンプ格納領域115の場所を管理するためのダンプ格納領域管理情報105、電源スイッチをONにした時やリセット信号を検出した時に計算機システム124を起動するために実行するシステム起動手続き106を持つ。構成情報102では、計算機システム124を起動する時に使用するメモリ量を保持する実メモリ量格納領域103と、計算機システム124を起動した後で追加して使用するメモリ量を保持する予約メモリ量格納領域104を持つ。
【0016】
メモリ107(1)は、最初の1回目のダンプ処理で保存するメモリ範囲に対応しており、1次ダンプ取得範囲108(1)には、ユーザが使用するプログラム命令列とデータを保持するユーザ領域109(1)と、OSが使用するプログラム命令列とデータを保持するOS領域119を持つ。OS領域119には、OSがユーザにメモリを割り当てるために使用するメモリ管理情報120、計算機システム124で障害が発生した時に実行する障害処理手続き121、計算機システム124が再起動した時にダンプ格納領域114の内容をファイルに変換するためのダンプファイル生成手続き122と、計算機システム124が再起動した後で予約メモリ量104で指定したメモリを追加して利用するためのメモリ増設手続き123を持つ。障害処理手続き121やダンプファイル生成手続き122の実施形態としては、各々「Panic! UNIXシステムクラッシュの追跡と対策」(1997)、ISBN4−7561−1912−3の第29ページ、第39ページに記載のpanic()ルーチン、savecoreプログラムに詳しい。
【0017】
計算機システム124で、OSの初期化終了後にOSを再初期化することなく、メモリ増設に必要な管理領域を予約するために必要な情報を保持する構成情報102、OSがメモリ増設のために予約した管理領域を更新するためのメモリ増設手続き123の実施形態については、特願平10―2796号公報に記載されている。
【0018】
図2は、本発明におけるメモリ管理情報120の一実施例を示す。メモリ管理情報120は、プロセッサ100が使用するメモリ107の範囲について、使用先頭アドレス201と使用最終アドレス202を持ち、プロセッサ100が使用するメモリ107の別な範囲について、予約先頭アドレス203と予約最終アドレス204を持つ。予約先頭アドレス203から予約最終アドレス204までの範囲については、計算機システム124が起動後、OSは使用できない。 OSはメモリ増設手続き123を実行することによって、予約先頭アドレス203から予約最終アドレス204までの範囲を使用できる。
【0019】
図3は、本発明におけるダンプ格納領域管理情報105の一実施例を示す。ダンプ領域管理情報105は、補助記憶装置111における1次ダンプ格納領域116の場所を示す値であるオフセットを1次ダンプ格納領域オフセット301に保持し、補助記憶装置111における2次ダンプ格納領域116の場所を示す値であるオフセットを2次ダンプ格納領域オフセット302に保持し、補助記憶装置111におけるダンプ格納領域114の最後尾を示す値である最大オフセットをダンプ格納領域最大オフセット303に保持し、1次ダンプ格納領域116に保持しているメモリ管理情報120の場所を示す値であるオフセットをメモリ管理情報オフセット304に保持する。
【0020】
図4は、本発明における障害発生から再起動完了までの概略処理フローの一実施例を示すフローチャートである。
【0021】
まず、計算機システムに障害が発生した時、すなわちOSがプログラム命令列の実行中にデータ不整合等の状態を検出した時に、ステップ401を実行する。ステップ401では障害処理手続き121を実行し、ダンプ取得範囲指定ファイル112で指定するメモリ107の内容を、1次ダンプ格納領域116に保存する。ここで、1次ダンプ取得範囲108(1)とはダンプ取得範囲指定ファイル12によって決定される範囲である。ここでは、1次ダンプ取得範囲108(1)のサイズが1GBの例で説明する。ダンプ取得範囲指定ファイルでは“1GB”と記述する。1GBは0x40000000番地(「0x」は16進数を意味する)に対応するので、ダンプ取得範囲は0番地から0x40000000番地までのメモリ内容となる。他の例ではファイルに「FROM=0、TO=0x40000000」と記述する。この場合も、ダンプ取得範囲は0番地から0x40000000番地までのメモリ内容となる。
【0022】
次に、計算機システムを再起動するためにステップ402を実行する。ステップ402では、1次ダンプ取得範囲108(1)のメモリのみを使用してシステムを再起動する。また、1次ダンプ取得範囲108(1)以外のメモリ、すなわち2次ダンプ取得範囲108(2)のメモリを、OSから使用できないように設定する。2次ダンプ取得範囲をOSが使用できないように設定する理由は、障害発生時のメモリ内容を破壊しないためである。もし、OSが2次ダンプ取得範囲のメモリ108(2)を使用すると、障害発生時のメモリ内容を失って障害原因の解析が不可能になる。
【0023】
次に、計算機システムの再起動を完了するとステップ403を実行する。計算機システムの再起動を完了した時点で、ユーザのプログラム命令列を実行できる。ステップ403ではダンプファイル生成手続き122を実行する。ダンプファイル生成手続き122は、1次ダンプ格納領域116に保存したメモリ内容を、システム管理者等がダンプ解析ツールで解析可能なファイル形式に変換する。また、2次ダンプ取得範囲108(2)のメモリ内容を2次ダンプ格納領域115に保存し、ダンプ解析ツールで解析可能なファイル形式に変換する。本実施例では、2次ダンプ取得範囲108(2)のメモリ内容を2次ダンプ格納領域115に保存してから、ファイル形式に変換する例を説明する。ここでは、2次ダンプ格納領域115に保存せず、メモリ内容を直接ファイル形式に変換してもよい。
【0024】
次に、ダンプファイル生成手続き122の実行を完了するとステップ404を実行する。ステップ404では、システム再起動時に使用しなかった2次ダンプ取得範囲108(2)のメモリを、OSが使用できるようにメモリ増設手続き123を実行する。
【0025】
図5は、本発明における障害処理手続きの一実施例を示すフローチャートである。
【0026】
まず、ステップ501では、メモリ管理情報120の使用先頭アドレス201から、ダンプ取得範囲指定ファイル112で指定したアドレスまでのメモリ内容を、ダンプ領域管理情報105の1次ダンプ格納領域のオフセット301が指定する1次ダンプ格納領域116に保存する。
【0027】
ステップ502では、ステップ501で保存した1次ダンプ格納領域116の最後尾の位置(オフセット)を2次ダンプ格納領域オフセット302に設定する。
【0028】
ステップ503では、1次ダンプ格納領域116に保存したメモリ管理情報120の位置(オフセット)をメモリ管理情報オフセット304に設定する。
【0029】
ステップ504では、予約メモリ量104には、実メモリ量103からダンプ取得範囲指定ファイル112で指定されたアドレスに対応するメモリ量を引いた値を設定する。
【0030】
ステップ505では、ダンプ取得範囲指定ファイル112で指定したアドレスが対応するメモリ量を、実メモリ量103に設定する。例えば、ダンプ取得範囲指定ファイル112でファイルに“1GB”と記述されている場合には1GBを実メモリ量に設定する。他の例として、ファイルに“FROM=0、TO=0x40000000”と記述されている場合には0x40000000番地に対応するメモリ量1GBを実メモリ量に設定する。
【0031】
図6は、本発明におけるシステム起動手続きの一実施例を示すフローチャートである。
【0032】
まず、ステップ601では、プロセッサ100が補助記憶装置111とメモリ107に読み書きできるように、プロセッサ100、補助記憶装置111及び実メモリ量103で保持する量のメモリ107を初期化する。
【0033】
ステップ602では、プロセッサ100がOS格納領域113からOSのプログラム命令列とデータを読み出して、ステップ601で初期化したメモリ107に書き込み、OSのプログラム命令列に制御を移す。
【0034】
ステップ603では、構成情報102を読み出して、メモリ管理情報120を作成する。メモリ管理情報120を作成する際に、使用先頭アドレス201と使用最終アドレス202については、例えば使用先頭アドレス201に0を設定し、構成情報102の実メモリ量103を読み出して対応するアドレスに変換して使用最終アドレス202に設定する。実メモリ量103に1GBが設定されていた場合には、使用最終アドレス202には0x40000000番地を設定する。
【0035】
また、予約先頭アドレス203と予約最終アドレス204については、例えば予約先頭アドレス203には、使用最終アドレス202と同じアドレスを設定し、構成情報102の予約メモリ量104を読み出してアドレスに変換して予約先頭アドレス203に加えたアドレスを、予約最終アドレス204に設定する。例えば、予約先頭アドレスに0x40000000番地、予約メモリ量104に1GBが設定されていた場合には、0x40000000番地から1GB分のメモリを追加した場合の最終アドレスである0x80000000番地を予約最終アドレス204に設定する。
【0036】
図7は、本発明におけるダンプファイル生成手続きの一実施例を示すフローチャートである。
【0037】
まず、ステップ701ではダンプ領域管理情報105からメモリ管理情報オフセット304を読み出し、補助記憶装置装置111からオフセットを使用して、ステップ501で保存した使用最終アドレス202を読み出す。
【0038】
ステップ702では2次ダンプ格納領域オフセット302を読み出して、2次ダンプ格納領域115を決定する。
【0039】
ステップ703では、ステップ505で設定した実メモリ量103に対応するアドレスから、ステップ701で読み出した使用最終アドレス202までのメモリ107の内容を、ステップ702で決定した2次ダンプ格納領域115に保存する。
【0040】
ステップ704では、savecore手続きを実行する。savecore手続きの実施形態は「Panic! UNIXシステムクラッシュの追跡と対策」(1997)、ISBN4−7561−1912−3の39頁に記載されている。
【0041】
ステップ705では、メモリ増設手続き123を実行する。
【0042】
本実施例では、ステップ704にて、1次ダンプ格納領域116と2次ダンプ格納領域115に障害発生時のメモリ内容を格納した後、ダンプ解析ツールで解析可能なファイル形式(ダンプファイル)に変換する計算機システムについて説明している。他の実施例として、ステップ701の前に、savecore手続き呼び出しを実行し、1次ダンプ格納領域116のみをダンプファイルに変換し、ステップ704では、2次ダンプ格納領域115のみをダンプファイルに変換する計算機システムであってもよい。
【0043】
図8は、本発明におけるメモリ増設手続きの一実施例を示すフローチャートである。
【0044】
まず、ステップ801では実メモリ量103に対応するアドレスから、実メモリ量103に対応するアドレスに予約メモリ量104に対応するアドレスを加えたアドレスまでメモリ107を初期化する。例えば、実メモリ量103が対応するアドレスとは、実メモリ量103に1GBが設定されている場合には1GBが対応する0x40000000番地となる。予約メモリ量104に1GBが設定されている場合には、実メモリ量が対応する0x40000000番地に予約メモリ量1GBに対応する0x40000000を加えた0x80000000番地までのメモリを初期化する。
【0045】
ステップ802では、実メモリ量103と予約メモリ量104を加えたメモリ量を、実メモリ量103に設定する。
【0046】
ステップ803では、予約メモリ量を0に設定する。
【0047】
ステップ804では、OSのメモリ管理情報120を変更する。ステップ801で初期化を完了したメモリを使用するため、使用最終アドレス202を変更する。例えば使用最終アドレス202と予約先頭アドレス203が同一アドレスの場合には、予約最終アドレス204の保持する値を使用最終アドレスに設定する。その後、予約メモリ量が0であることを示すために、使用最終アドレス202の値を、予約先頭アドレス203及び予約最終アドレス204に設定する。
【0048】
次に本発明を仮想記憶制御する計算機システムに適用した実施例を説明する。
【0049】
仮想記憶制御とは、アドレス空間を一定のサイズ毎に分割して管理し、管理単位(ページと呼ばれる)の番号とページ中のオフセットから構成される論理アドレスを、物理メモリのアドレスに対応付ける仕組みである。ユーザプログラムでは、プロセッサがユーザプログラムの命令列やデータにアクセスする際には論理アドレスを使用する。ユーザプログラムで論理アドレスを使用することにより、ユーザプログラムのプログラマはプログラムが動作する物理メモリのアドレスを意識する必要がない。またOSでは使用頻度の低いページの内容を、物理メモリから補助記憶装置に追い出すことにより、物理メモリを有効に使用することが可能となる。仮想記憶制御についての詳細は、バーニー・グッドハート、ジェームス・コックス著、桜川貴司監訳プレンティスホール出版「UNIXカーネルの魔法SystemVリリース4のアーキテクチャ」(1997)の第80ページから第85ページに記載にされている。
【0050】
図9は、本発明における仮想記憶制御する計算機システムのメモリ管理情報120の一実施例を示す。
【0051】
仮想記憶制御する計算機では、メモリ管理情報は図2で説明した使用先頭アドレス201、使用最終アドレス202、予約先頭アドレス203、予約最終アドレス204の他に、アドレス変換不要先頭アドレス901、アドレス変換不要最終アドレス902、論理アドレス・物理アドレス変換表903、フリーリスト904から構成される。
【0052】
アドレス変換不要先頭アドレス901とアドレス変換不要最終アドレス902は、論理アドレスから物理アドレスに変換する必要がない領域を示す。
【0053】
論理アドレス・物理アドレス変換表903は論理アドレスと物理アドレスとの対応表である。
【0054】
フリーリスト904は、計算機システム124で使用するメモリ資源を管理するための情報を管理する。
【0055】
仮想記憶制御では、プロセッサがある論理アドレスにアクセスした時に、アクセスしたページが物理メモリではなく補助記憶装置に存在する場合がある。この場合、物理メモリに割り付けてあるページを使用頻度等の情報に基づいて選択した後に補助記憶装置に選択したページ内容を転送して、その代わりにアクセスされたページ内容を補助記憶装置から物理メモリに転送する。
【0056】
ここで、ページ内容を補助記憶装置から物理メモリに転送するプログラム命令列を含むページが補助記憶装置に存在した場合には、プロセッサがアクセスしたページを物理メモリに転送することができない。このような状況が発生しないようにページ内容を補助記憶装置から物理メモリに転送するプログラム命令列等を含むページは、必ず物理メモリに存在する必要がある。
【0057】
このようなページは、アドレス変換不要先頭アドレス901とアドレス変換不要最終アドレス902によってアドレス変換が不要な領域に含まれている。アドレス変換が不要な領域のデータは通常固定したサイズで管理されているため、計算機システムが再起動した後で、プロセッサが使用するメモリの大きさが変化する場合には、予め予約しておくことが必要となる。
【0058】
予約が必要なデータとしては、論理アドレス・物理アドレス変換表やフリーリスト等があり、これはOSの実装によって異なる。本実施例では、論理アドレス・物理アドレス変換表とフリーリストの予約が必要なOSについて説明する。
【0059】
図10は、本発明における論理アドレス・物理アドレス変換表903の一実施例を示す。
【0060】
論理アドレス・物理アドレス変換表903は、物理アドレスのページ番号を保持する物理ページ番号1001、論理アドレスのページ番号を保持する論理ページ番号1002、同一行にある物理ページ番号と論理ページ番号の変換対が有効かどうかを示すフラグ等を含む管理情報1003から構成される。
【0061】
本図は、約2GBのメモリを搭載するページサイズが4KB(0x1000)の計算機システムにおいて、メモリ管理情報120が物理ページ番号0〜0x1000、OS領域が物理ページ番号0〜0x8000、ユーザ領域109(1)が物理ページ番号0x8001〜0x40000、ユーザ領域109(2)が物理ページ番号0x40001〜0x80000、1次ダンプ取得範囲108(1)が物理ページ番号0〜0x40000、2次ダンプ取得範囲108(2)が物理ページ番号0x40001〜0x80000に各々対応している。
【0062】
本図において、論理ページ番号0x10000とページ中のオフセット0x123から構成される論理アドレス0x10000123は、論理ページ番号0x10000に対応する物理アドレス番号0x40000とオフセット0x123を使って物理アドレス0x4000123に変換される。
【0063】
論理アドレス・物理アドレス変換表903の詳細については、Gerry Kane著、Prentice Hall出版「PA−RISC 2.0 ARCHITECTURE」ISBN 0―13―182734―0(1996)の第3−9ページから第3−16ページに記載されている。
【0064】
仮想記憶制御する計算機システムに適用した場合のシステム起動手続き106について説明する。基本的な処理内容は図6で説明したフローチャート(601〜603)と同様である。仮想記憶制御する計算機システムでは、メモリ管理情報120に、アドレス変換不要先頭アドレス901、アドレス変換不要最終アドレス902、論理アドレス・物理アドレス変換表903、フリーリスト904が追加されている。そのため、ステップ603では、OS領域119の先頭アドレスと最終アドレスを各々アドレス変換不要先頭アドレス901とアドレス変換不要最終アドレス902に設定し、実メモリ量103と予約メモリ量104を合計したメモリ量を管理できるように論理アドレス・物理アドレス変換表903とフリーリスト903を格納する領域を確保する。フリーリスト903に登録したページのうち、予約メモリ量104に対応する分については、PAGE構造体のページロックを用いて、予約済みとし、OSが使用できないように設定する。ページロックの実施形態は、バーニー・グッドハート、ジェームス・コックス著、桜川貴司監訳プレンティスホール出版「UNIXカーネルの魔法SystemVリリース4のアーキテクチャ」(1997)の第80ページから第85ページに記載にされている。
【0065】
次に、仮想記憶制御する計算機システムに適用した場合のメモリ増設手続き123について説明する。基本的な処理内容は図8で説明したフローチャート(801〜804)と同様である。ステップ804にて、予約メモリ量104に対応する分のPAGE構造体のページロックを解除することにより、OSを再初期化することなく、予約メモリ量104のメモリを使用できる。
【0066】
【発明の効果】
本発明によれば、計算機システムが停止してから再起動を完了してユーザにサービスを提供するまでに要する時間を短縮することができ、その結果、ある一定期間における計算機システムの稼動率が向上する。
【0067】
また、再起動してから、最初の一回目の処理で保存しなかったメモリ範囲をファイルに変換し、障害の原因分析に必要なメモリ内容をシステム管理者に提供することができる。また、計算機システムの搭載するメモリの大きさよりも小さいダンプ格納領域しか持たない計算機システムでも、すべてのメモリ内容を含むファイルを入手でき、障害原因について十分な解析ができる。
【図面の簡単な説明】
【図1】本発明の一実施例を示す計算機システム124のブロック図である。
【図2】本発明におけるメモリ管理情報120の一実施例である。
【図3】本発明におけるダンプ格納領域管理情報105の一実施例である。
【図4】本発明における障害発生から再起動完了までの概略処理フローの一実施例を示すフローチャートである。
【図5】本発明における障害処理手続き121の一実施例を示すフローチャートである。
【図6】本発明におけるシステム起動手続き106の一実施例を示すフローチャートである。
【図7】本発明におけるダンプファイル生成手続き122の一実施例を示すフローチャートである。
【図8】本発明におけるメモリ増設手続き123の一実施例を示すフローチャートである。
【図9】本発明における仮想記憶制御する計算機システムのメモリ管理情報120の一実施例を示す。
【図10】本発明における論理アドレス・物理アドレス変換表903の一実施例を示す。
【符号の説明】
100:プロセッサ、101:不揮発性メモリ、102:構成情報、105 ダンプ格納領域管理情報、106:システム起動手続き、107:メモリ、108:ダンプ取得範囲、109:ユーザ領域、110:バス、111:補助記憶装置、112:ダンプ取得範囲指定ファイル、113:OS格納領域、114:ダンプ格納領域、119:OS領域、120:メモリ管理情報、121:障害処理手続き、122:ダンプファイル生成手続き、123:メモリ増設手続き
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to acquisition of failure information of a computer system in which a failure has occurred, and restart of the computer system in which a failure has occurred.
[0002]
[Prior art]
Conventionally, the operating system checks data consistency during system operation. When data inconsistency occurs due to some kind of failure, panic processing is executed to urgently stop the computer system.
[0003]
In the panic process, the memory contents at the time of the failure are stored in an auxiliary storage device such as a hard disk so that the system administrator can find out the cause of the failure later. The process of saving the memory contents in the auxiliary storage device is called a dump process, and after completion of the dump process, the computer system is restarted.
[0004]
In the dump processing, there are cases where all the memory of the computer system is dumped (all dumps) and a part of the memory is dumped. When dumping all of the memory, the time required for dump processing is longer than when dumping a portion of memory. Japanese Patent Application Laid-Open No. 64-25255 discloses a technique for selecting a part of memory and dumping only the selected memory in order to shorten the dump processing time.
[0005]
In the system restart process, the memory content stored in the auxiliary storage device such as a hard disk is converted into a file format that allows the system administrator to analyze the cause of the failure. In order to save the capacity of the auxiliary storage device, a file compression process may be executed at the time of file format conversion.
[0006]
A series of processing until a computer system is restarted after a failure has occurred in the computer system is described in “Panic! UNIX System Crash Tracking and Countermeasures” (1997), page 27 of ISBN 4-7561-1912-3. See page 33.
[0007]
[Problems to be solved by the invention]
In recent years, the amount of memory installed in a computer system has increased, and the time required to restart after a failure has occurred in the computer system has increased.
[0008]
As described above, by selecting and dumping a part of memory, the amount of memory that needs to be dumped is smaller than in the case of full dumping. However, it may be difficult to identify the memory range associated with the failure before analyzing the memory contents at the time of the failure. Furthermore, even if a part of the memory is selected and dumped, the restart process cannot be executed until all the selected memories are dumped.
[0009]
Further, as described above, in order to save the use capacity of the auxiliary storage device, when file compression processing is executed at the time of restart, the time required for restart further increases. The computer system cannot provide the service to the user after the failure occurs in the computer system until the restart is finished. For this reason, there has been a problem that the operating time of the computer system during a certain period of time decreases and the utilization efficiency decreases.
[0010]
The object of the present invention is to shorten the time from the occurrence of a failure in the computer system to the end of the restart, improve the operating rate of the computer system, and determine the memory contents necessary for analyzing the cause of the failure. It is to provide to etc.
[0011]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides a memory range specification information indicating an address or memory amount for specifying an area of a memory to be initialized, and a memory indicating a numerical value for dividing the memory into a plurality of areas according to the memory address or the memory amount. It has configuration information, the dump acquisition range designation means designates the memory range to be saved in the first dump processing, and the dump acquisition means stores the memory contents in the range designated by the dump acquisition range designation means in the dump storage area Further, the dump file generation means converts the memory contents stored in the dump storage area into a file. When a failure occurs in the computer system, when the dump acquisition unit saves the contents of the memory range specified by the dump acquisition range specification unit in the dump storage area and restarts the computer system, Only the memory range saved at the time of occurrence is initialized, the dump file generation means converts the contents of the dump storage area into a file, and after the restart of the computer system is completed, the memory contents that were not saved at the time of failure are In addition to saving in the dump storage area, the contents of the dump storage area are converted into a file.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
Examples of the present invention will be described.
[0013]
FIG. 1 is a block diagram of a computer system showing an embodiment of the present invention. In this figure, a computer system 124 includes an auxiliary storage device 111 such as a magnetic disk for permanently storing program instruction sequences and data, and an EEPROM (Electrically Erasable Programmable Read) for permanently storing program instruction sequences and data. A non-volatile memory 101 such as an only memory), a memory 107 for storing a program instruction sequence and data, a processor 100 for executing the program instruction sequence stored in the non-volatile memory 101 and the memory 107, and a transmission path between each block of the computer It is comprised from the bus | bath 110 which is.
[0014]
The auxiliary storage device 111 includes an operating system (OS) that manages resources such as the dump acquisition range specification file 112 that specifies the range of the memory 107 to be saved when a failure occurs in the computer system, the auxiliary storage device 111 of the computer system 124, the memory 107, and the like. ) Program instruction sequence and data storage area 113 for storing data, and a dump storage area 114 for storing memory contents when a failure occurs. The dump storage area 114 has a primary dump storage area 116 used in the first dump process and a secondary dump storage area 115 used in the second dump process. In the present embodiment, a computer system having two storage areas 115 and 116 in the dump storage area 114 is described, but two or more storage areas may be provided as necessary.
[0015]
The non-volatile memory 101 manages configuration information 102 for holding the size of the memory 107 installed in the computer system 124 and the location of the primary dump storage area 116 and the secondary dump storage area 115 in the auxiliary storage device 111. Dump storage area management information 105, and a system activation procedure 106 executed to activate the computer system 124 when a power switch is turned on or when a reset signal is detected. In the configuration information 102, an actual memory amount storage area 103 that holds the amount of memory used when the computer system 124 is started, and a reserved memory amount storage area that holds a memory amount that is additionally used after the computer system 124 is started. 104.
[0016]
The memory 107 (1) corresponds to the memory range stored in the first dump process. The primary dump acquisition range 108 (1) includes a program instruction sequence used by the user and a user holding data. It has an area 109 (1) and an OS area 119 for holding program instruction sequences and data used by the OS. The OS area 119 includes memory management information 120 used by the OS to allocate memory to the user, a failure processing procedure 121 executed when a failure occurs in the computer system 124, and a dump storage area 114 when the computer system 124 is restarted. A dump file generation procedure 122 for converting the contents of the file into a file, and a memory expansion procedure 123 for adding and using the memory specified by the reserved memory amount 104 after the computer system 124 is restarted. Embodiments of the failure processing procedure 121 and the dump file generation procedure 122 are described in “Panic! UNIX System Crash Tracking and Countermeasures” (1997), ISBN 4-7561-1912-3, pages 29 and 39, respectively. It is familiar with the panic () routine and the savecore program.
[0017]
In the computer system 124, configuration information 102 that holds information necessary for reserving a management area necessary for memory expansion without reinitializing the OS after the OS initialization is completed, and the OS reserves for memory expansion. An embodiment of the memory expansion procedure 123 for updating the management area is described in Japanese Patent Application No. 10-27996.
[0018]
FIG. 2 shows an embodiment of the memory management information 120 in the present invention. The memory management information 120 has a use start address 201 and a use end address 202 for the range of the memory 107 used by the processor 100, and a reservation start address 203 and a reservation end address for another range of the memory 107 used by the processor 100. It has 204. For the range from the reservation start address 203 to the reservation end address 204, the OS cannot be used after the computer system 124 is activated. The OS can use the range from the reservation start address 203 to the reservation end address 204 by executing the memory expansion procedure 123.
[0019]
FIG. 3 shows an embodiment of the dump storage area management information 105 in the present invention. The dump area management information 105 holds an offset, which is a value indicating the location of the primary dump storage area 116 in the auxiliary storage device 111, in the primary dump storage area offset 301, and stores the offset of the secondary dump storage area 116 in the auxiliary storage apparatus 111. The offset indicating the location is held in the secondary dump storage area offset 302, and the maximum offset indicating the end of the dump storage area 114 in the auxiliary storage device 111 is held in the dump storage area maximum offset 303. An offset indicating a location of the memory management information 120 held in the next dump storage area 116 is held in the memory management information offset 304.
[0020]
FIG. 4 is a flowchart showing an embodiment of a schematic processing flow from the occurrence of a failure to the completion of restart in the present invention.
[0021]
First, when a failure occurs in the computer system, that is, when the OS detects a state such as data inconsistency during execution of the program instruction sequence, step 401 is executed. In step 401, the failure processing procedure 121 is executed, and the contents of the memory 107 designated by the dump acquisition range designation file 112 are stored in the primary dump storage area 116. Here, the primary dump acquisition range 108 (1) is a range determined by the dump acquisition range specification file 12. Here, an example in which the size of the primary dump acquisition range 108 (1) is 1 GB will be described. In the dump acquisition range specification file, “1 GB” is described. Since 1 GB corresponds to address 0x40000000 (“0x” means a hexadecimal number), the dump acquisition range is the memory contents from address 0 to address 0x40000000. In another example, “FROM = 0, TO = 0x40000000” is described in the file. In this case as well, the dump acquisition range is the memory contents from address 0 to address 0x40000000.
[0022]
Next, step 402 is executed to restart the computer system. In step 402, the system is restarted using only the memory in the primary dump acquisition range 108 (1). Further, a memory other than the primary dump acquisition range 108 (1), that is, a memory in the secondary dump acquisition range 108 (2) is set so that it cannot be used from the OS. The reason for setting the secondary dump acquisition range so that the OS cannot be used is to not destroy the contents of the memory when a failure occurs. If the OS uses the memory 108 (2) in the secondary dump acquisition range, the memory contents at the time of the failure are lost and the cause of the failure cannot be analyzed.
[0023]
Next, when the restart of the computer system is completed, step 403 is executed. When the restart of the computer system is completed, the user's program instruction sequence can be executed. In step 403, a dump file generation procedure 122 is executed. The dump file generation procedure 122 converts the memory contents saved in the primary dump storage area 116 into a file format that can be analyzed by a system administrator or the like with a dump analysis tool. Further, the memory contents of the secondary dump acquisition range 108 (2) are stored in the secondary dump storage area 115 and converted into a file format that can be analyzed by the dump analysis tool. In the present embodiment, an example will be described in which the memory contents of the secondary dump acquisition range 108 (2) are stored in the secondary dump storage area 115 and then converted into a file format. Here, the memory contents may be directly converted into a file format without being stored in the secondary dump storage area 115.
[0024]
Next, when the execution of the dump file generation procedure 122 is completed, step 404 is executed. In step 404, the memory expansion procedure 123 is executed so that the OS can use the memory in the secondary dump acquisition range 108 (2) that was not used when the system was restarted.
[0025]
FIG. 5 is a flowchart showing an embodiment of the failure processing procedure in the present invention.
[0026]
First, in step 501, the offset 301 of the primary dump storage area of the dump area management information 105 specifies the memory contents from the use start address 201 of the memory management information 120 to the address specified by the dump acquisition range specification file 112. Saved in the primary dump storage area 116.
[0027]
In step 502, the last position (offset) of the primary dump storage area 116 saved in step 501 is set as the secondary dump storage area offset 302.
[0028]
In step 503, the position (offset) of the memory management information 120 stored in the primary dump storage area 116 is set in the memory management information offset 304.
[0029]
In step 504, the reserved memory amount 104 is set to a value obtained by subtracting the memory amount corresponding to the address specified in the dump acquisition range specifying file 112 from the actual memory amount 103.
[0030]
In step 505, the memory amount corresponding to the address specified in the dump acquisition range specification file 112 is set as the real memory amount 103. For example, when “1 GB” is described in the dump acquisition range designation file 112, 1 GB is set as the actual memory amount. As another example, when “FROM = 0, TO = 0x40000000” is described in the file, the memory amount 1 GB corresponding to the address 0x40000000 is set as the actual memory amount.
[0031]
FIG. 6 is a flowchart showing an embodiment of the system startup procedure in the present invention.
[0032]
First, in step 601, the processor 100, the auxiliary storage device 111, and the amount of memory 107 held by the real memory amount 103 are initialized so that the processor 100 can read and write to the auxiliary storage device 111 and the memory 107.
[0033]
In step 602, the processor 100 reads the OS program instruction sequence and data from the OS storage area 113, writes the OS program instruction sequence and data in the memory 107 initialized in step 601, and transfers control to the OS program instruction sequence.
[0034]
In step 603, the configuration information 102 is read and the memory management information 120 is created. When creating the memory management information 120, with respect to the use start address 201 and the use end address 202, for example, the use start address 201 is set to 0, and the real memory amount 103 of the configuration information 102 is read and converted into a corresponding address. To use final address 202. When 1 GB is set in the real memory amount 103, the use end address 202 is set to 0x40000000.
[0035]
As for the reservation start address 203 and the reservation end address 204, for example, the reservation start address 203 is set to the same address as the use end address 202, and the reserved memory amount 104 of the configuration information 102 is read and converted into an address for reservation. An address added to the head address 203 is set as a reserved final address 204. For example, if 0x40000000 is set as the reservation start address and 1 GB is set as the reservation memory amount 104, the address 0x80000000, which is the final address when 1 GB of memory is added from the address 0x40000000, is set as the reservation final address 204. .
[0036]
FIG. 7 is a flowchart showing an embodiment of the dump file generation procedure in the present invention.
[0037]
First, in step 701, the memory management information offset 304 is read from the dump area management information 105, and the use final address 202 saved in step 501 is read from the auxiliary storage device 111 using the offset.
[0038]
In step 702, the secondary dump storage area offset 302 is read to determine the secondary dump storage area 115.
[0039]
In step 703, the contents of the memory 107 from the address corresponding to the actual memory amount 103 set in step 505 to the use final address 202 read in step 701 are stored in the secondary dump storage area 115 determined in step 702. .
[0040]
In step 704, a savecore procedure is executed. An embodiment of the savecore procedure is described in “Panic! UNIX System Crash Tracking and Countermeasures” (1997), page 39 of ISBN 4-7561-1912-3.
[0041]
In step 705, the memory expansion procedure 123 is executed.
[0042]
In this embodiment, after the memory contents at the time of failure are stored in the primary dump storage area 116 and the secondary dump storage area 115 in step 704, they are converted into a file format (dump file) that can be analyzed by the dump analysis tool. It explains the computer system to do. As another embodiment, a savecore procedure call is executed before step 701 to convert only the primary dump storage area 116 into a dump file, and at step 704, only the secondary dump storage area 115 is converted into a dump file. It may be a computer system.
[0043]
FIG. 8 is a flowchart showing an embodiment of the memory expansion procedure according to the present invention.
[0044]
First, in step 801, the memory 107 is initialized from an address corresponding to the real memory amount 103 to an address obtained by adding an address corresponding to the reserved memory amount 104 to an address corresponding to the real memory amount 103. For example, the address corresponding to the real memory amount 103 is the address 0x40000000 corresponding to 1 GB when 1 GB is set in the real memory amount 103. When 1 GB is set in the reserved memory amount 104, the memory up to the address 0x80000000 is initialized by adding 0x40000000 corresponding to the reserved memory amount 1GB to the address 0x40000000 corresponding to the actual memory amount.
[0045]
In step 802, the memory amount obtained by adding the real memory amount 103 and the reserved memory amount 104 is set as the real memory amount 103.
[0046]
In step 803, the reserved memory amount is set to zero.
[0047]
In step 804, the OS memory management information 120 is changed. In order to use the memory that has been initialized in step 801, the use final address 202 is changed. For example, when the use final address 202 and the reservation head address 203 are the same address, the value held in the reservation final address 204 is set as the use final address. Thereafter, in order to indicate that the reserved memory amount is 0, the value of the use final address 202 is set to the reservation start address 203 and the reservation final address 204.
[0048]
Next, an embodiment in which the present invention is applied to a computer system that performs virtual storage control will be described.
[0049]
Virtual storage control is a system that manages the address space divided into fixed sizes, and associates logical addresses, which are composed of management unit numbers (called pages) and offsets in pages, with physical memory addresses. is there. In the user program, a logical address is used when the processor accesses an instruction sequence or data of the user program. By using the logical address in the user program, the programmer of the user program does not need to be aware of the address of the physical memory where the program operates. Further, in the OS, it is possible to effectively use the physical memory by evicting the contents of pages that are not frequently used from the physical memory to the auxiliary storage device. Details on virtual memory control can be found on pages 80-85 of Barney Goodhart, James Cox, and translated by Takashi Sakuragawa, Prentice Hall, "Unix Kernel Magic System V Release 4 Architecture" (1997). Has been.
[0050]
FIG. 9 shows an embodiment of the memory management information 120 of the computer system for controlling virtual storage in the present invention.
[0051]
In a computer that performs virtual storage control, the memory management information includes the use start address 201, use end address 202, reservation start address 203, and reservation end address 204 described with reference to FIG. It consists of an address 902, a logical address / physical address conversion table 903, and a free list 904.
[0052]
An address conversion unnecessary first address 901 and an address conversion unnecessary final address 902 indicate areas that do not need to be converted from a logical address to a physical address.
[0053]
The logical address / physical address conversion table 903 is a correspondence table between logical addresses and physical addresses.
[0054]
The free list 904 manages information for managing memory resources used in the computer system 124.
[0055]
In virtual storage control, when a processor accesses a certain logical address, the accessed page may exist in an auxiliary storage device instead of physical memory. In this case, the selected page content is transferred to the auxiliary storage device after selecting the page allocated to the physical memory based on information such as the frequency of use, and the accessed page content is transferred from the auxiliary storage device to the physical memory instead. Forward to.
[0056]
Here, if a page including a program instruction sequence for transferring the page contents from the auxiliary storage device to the physical memory exists in the auxiliary storage device, the page accessed by the processor cannot be transferred to the physical memory. In order to prevent such a situation from occurring, a page including a program instruction sequence for transferring the page contents from the auxiliary storage device to the physical memory must always exist in the physical memory.
[0057]
Such a page is included in an area where no address conversion is required by an address conversion unnecessary start address 901 and an address conversion unnecessary final address 902. Since the data in the area that does not require address translation is usually managed in a fixed size, if the memory used by the processor changes after the computer system restarts, reserve it in advance. Is required.
[0058]
Data that needs to be reserved includes a logical address / physical address conversion table, a free list, and the like, which differ depending on the OS implementation. In this embodiment, an OS that requires reservation of a logical address / physical address conversion table and a free list will be described.
[0059]
FIG. 10 shows an embodiment of the logical address / physical address conversion table 903 in the present invention.
[0060]
The logical address / physical address conversion table 903 includes a physical page number 1001 that holds the page number of the physical address, a logical page number 1002 that holds the page number of the logical address, and a conversion pair of the physical page number and the logical page number in the same row. Management information 1003 including a flag indicating whether or not is valid.
[0061]
This figure shows that in a computer system with a page size of 4 KB (0x1000) in which about 2 GB of memory is mounted, the memory management information 120 is the physical page number 0-0x1000, the OS area is the physical page number 0-0x8000, and the user area 109 (1 ) Is the physical page number 0x8001 to 0x40000, the user area 109 (2) is the physical page number 0x40001 to 0x80000, the primary dump acquisition range 108 (1) is the physical page number 0-0x40000, and the secondary dump acquisition range 108 (2) is Each corresponds to physical page numbers 0x40001 to 0x80000.
[0062]
In this figure, a logical address 0x10000123 composed of a logical page number 0x10000 and an offset 0x123 in the page is converted into a physical address 0x4000123 using a physical address number 0x40000 and an offset 0x123 corresponding to the logical page number 0x10000.
[0063]
For details of the logical address / physical address conversion table 903, pages 3-9 to 3 of Gary Kane, published by Prentice Hall "PA-RISC 2.0 ARCHITECTURE" ISBN 0-13-182734-0 (1996). It is described on page 16.
[0064]
A system startup procedure 106 when applied to a computer system that performs virtual storage control will be described. The basic processing content is the same as the flowchart (601 to 603) described in FIG. In a computer system that performs virtual storage control, an address conversion unnecessary start address 901, an address conversion unnecessary final address 902, a logical address / physical address conversion table 903, and a free list 904 are added to the memory management information 120. Therefore, in step 603, the start address and the final address of the OS area 119 are set to the address conversion unnecessary start address 901 and the address conversion unnecessary final address 902, respectively, and the total memory amount 103 and the reserved memory amount 104 are managed. An area for storing the logical address / physical address conversion table 903 and the free list 903 is secured as possible. Of the pages registered in the free list 903, the page corresponding to the reserved memory amount 104 is set as reserved using the page lock of the PAGE structure so that the OS cannot be used. Embodiments of page locks are described on pages 80-85 of Prentice Hall's "Unix Kernel Magic System V Release 4 Architecture" (1997), written by Bernie Goodhart, James Cox, and translated by Takashi Sakuragawa. ing.
[0065]
Next, the memory expansion procedure 123 when applied to a computer system that performs virtual storage control will be described. The basic processing contents are the same as those in the flowchart (801 to 804) described in FIG. In step 804, by releasing the page lock of the PAGE structure corresponding to the reserved memory amount 104, the memory of the reserved memory amount 104 can be used without reinitializing the OS.
[0066]
【The invention's effect】
According to the present invention, it is possible to reduce the time required to complete the restart after the computer system is stopped and to provide the service to the user, and as a result, the operating rate of the computer system is improved during a certain period. To do.
[0067]
Further, after rebooting, the memory range that was not saved in the first first process can be converted into a file, and the memory contents necessary for failure cause analysis can be provided to the system administrator. Even in a computer system having a dump storage area smaller than the size of the memory installed in the computer system, a file including all memory contents can be obtained, and the cause of the failure can be sufficiently analyzed.
[Brief description of the drawings]
FIG. 1 is a block diagram of a computer system 124 showing an embodiment of the present invention.
FIG. 2 is an example of memory management information 120 in the present invention.
FIG. 3 is an example of dump storage area management information 105 according to the present invention.
FIG. 4 is a flowchart showing an embodiment of a schematic processing flow from the occurrence of a failure to the completion of restart in the present invention.
FIG. 5 is a flowchart showing an embodiment of a failure processing procedure 121 in the present invention.
FIG. 6 is a flowchart showing an embodiment of a system activation procedure 106 according to the present invention.
FIG. 7 is a flowchart showing an embodiment of a dump file generation procedure 122 according to the present invention.
FIG. 8 is a flowchart showing an embodiment of a memory expansion procedure 123 in the present invention.
FIG. 9 shows an example of memory management information 120 of a computer system that controls virtual storage according to the present invention.
FIG. 10 shows an example of a logical address / physical address conversion table 903 according to the present invention.
[Explanation of symbols]
100: Processor, 101: Non-volatile memory, 102: Configuration information, 105 Dump storage area management information, 106: System startup procedure, 107: Memory, 108: Dump acquisition range, 109: User area, 110: Bus, 111: Auxiliary Storage device 112: Dump acquisition range specification file 113: OS storage area 114: Dump storage area 119: OS area 120: Memory management information 121: Failure processing procedure 122: Dump file generation procedure 123: Memory Expansion procedure

Claims (3)

メモリと補助記憶装置と前記メモリと前記補助記憶装置を制御する制御手段とを有する計算機システムのダンプ処理方法であって
前記計算機システムは、前記制御手段がユーザにメモリを割当てるメモリ管理情報に基づいて分割した複数の領域のメモリ内容を補助記憶装置に保存するダンプ保存手段と、前記補助記憶装置に保存したメモリ内容をファイルに変換するダンプファイル生成手段と、メモリのアドレスまたはメモリ量によりメモリを複数の領域に分割する数値を示すメモリ構成情報に基づいてメモリを初期化するメモリ初期化手段と、前記ダンプ保存手段が補助記憶装置にメモリ内容を保存する際に、メモリ内容を保存する格納場所を示すダンプ領域管理手段とを備え、
前記制御手段当該計算機システムの障害を検出した場合に、前記ダンプ保存手段は、前記メモリ管理情報及びダンプ取得範囲指定情報に基づいて分割した第1番目の領域のメモリ内容を補助記憶装置の前記ダンプ領域管理手段が示す格納場所に保存し、前記制御手段は前記ダンプ保存手段保存した領域のメモリ量前記メモリ構成情報に実メモリ量として設定すると共に前記メモリ初期化手段により前記第1番目の領域のメモリを初期化して前記計算機システムを再起動し、前記制御手段前記計算機システムの再起動を完了した後に、前記ダンプ保存手段で保存した第1番目の領域を補助記憶装置から読み出し、前記ダンプファイル生成手段が読み出したメモリ領域をファイルに変換し、前記メモリ管理情報に基づいて分割した第2番目以降の領域を補助記憶装置の前記ダンプ領域管理手段が示す格納場所に保存し、第2番目以降の領域を補助記憶装置からファイルに変換することを特徴とする計算機システムのダンプ処理方法
A computer system dump processing method comprising a memory, an auxiliary storage device, and a control means for controlling the memory and the auxiliary storage device ,
The computer system includes: a dump storage unit that stores, in an auxiliary storage device, memory contents of a plurality of areas divided based on memory management information that the control unit allocates a memory to a user; and memory contents stored in the auxiliary storage device. A dump file generating means for converting into a file, a memory initializing means for initializing the memory based on memory configuration information indicating a numerical value for dividing the memory into a plurality of areas according to a memory address or a memory amount , A dump area management means indicating a storage location for storing the memory contents when storing the memory contents in the auxiliary storage device;
When said control means detects a failure of the computer system, the dump storage means, said auxiliary storage memory contents of the first areas divided on the basis of the memory management information and dump area selected stored in the storage location indicated by the dump area management means, wherein the first by the memory initialization means with the control means sets as the actual amount of memory the amount of memory region in which the dump storage means has stored in the memory configuration information of the memory region and restart the computer system is initialized, after the control unit has completed the rebooting of said computer system, read the first th region stored at the dump storage means from the auxiliary storage device, wherein converting the dump file generation means memory areas read in the file, No. 2 which is divided based on the memory management information Wherein stored in the dump area management storage location means illustrated, dump processing method of a computer system and converting the second and subsequent area from the auxiliary storage device to a file and later region an auxiliary storage device.
前記ダンプ領域管理手段はダンプ格納領域の場所を示す値を有するエントリを少なくとも2つ保持していることを特徴とする請求項1に記載の計算機システムのダンプ処理方法。2. The dump processing method for a computer system according to claim 1, wherein the dump area management means holds at least two entries having values indicating the location of the dump storage area. 前記制御手段は仮想記憶制御機能を有することを特徴とする請求項1または2のいずれかに記載の計算機システムのダンプ処理方法。3. The computer system dump processing method according to claim 1, wherein the control means has a virtual storage control function.
JP2000041375A 2000-02-15 2000-02-15 Computer system dump processing method Expired - Fee Related JP3903678B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000041375A JP3903678B2 (en) 2000-02-15 2000-02-15 Computer system dump processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000041375A JP3903678B2 (en) 2000-02-15 2000-02-15 Computer system dump processing method

Publications (2)

Publication Number Publication Date
JP2001229053A JP2001229053A (en) 2001-08-24
JP3903678B2 true JP3903678B2 (en) 2007-04-11

Family

ID=18564626

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000041375A Expired - Fee Related JP3903678B2 (en) 2000-02-15 2000-02-15 Computer system dump processing method

Country Status (1)

Country Link
JP (1) JP3903678B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7509521B2 (en) * 2004-08-23 2009-03-24 Microsoft Corporation Memory dump generation with quick reboot
WO2007077604A1 (en) * 2005-12-28 2007-07-12 Fujitsu Limited Information processor and method of monitoring hang-up
JP5403054B2 (en) 2009-07-10 2014-01-29 富士通株式会社 Server having memory dump function and memory dump acquisition method
JPWO2012090290A1 (en) 2010-12-27 2014-06-05 富士通株式会社 Information processing apparatus having memory dump function, memory dump method, and memory dump program
JP6083136B2 (en) 2012-06-22 2017-02-22 富士通株式会社 Information processing apparatus having memory dump function, memory dump method, and memory dump program
JP2015114750A (en) * 2013-12-10 2015-06-22 富士通株式会社 Examination program, information processing device, and information processing method

Also Published As

Publication number Publication date
JP2001229053A (en) 2001-08-24

Similar Documents

Publication Publication Date Title
JP5255348B2 (en) Memory allocation for crash dump
JP5021190B2 (en) Memory dump generation with fast restart
US6526472B2 (en) Access control method, access control apparatus and computer readable memory storing access control program
TWI514140B (en) Non-volatile memory apparatus and operating method thereof
US6275917B1 (en) High-speed address translation system
KR100734823B1 (en) Method and apparatus for morphing memory compressed machines
JP5071798B2 (en) Computer system, memory management method, and program thereof
US9298472B2 (en) High-speed restart method, information processing device, and program
JP2002140227A (en) Memory compression managing device
KR20100132244A (en) Memory system and method of managing memory system
US7117338B2 (en) Virtual memory address translation control by TLB purge monitoring
JP2001517830A (en) Method and system for restoring physical memory state when focus is changed between application programs in a computer
JPH1125033A (en) Bus bridge
US20070220225A1 (en) Storage system issuing optimum I/O command to allocation-on-use enabled volume and controlling method therefor
JP3882321B2 (en) Computer with operating system module program
US20130007367A1 (en) Information processing apparatus and method of controlling same
KR101392062B1 (en) Fast speed computer system power-on & power-off method
JP3903678B2 (en) Computer system dump processing method
CN115617542A (en) Memory exchange method and device, computer equipment and storage medium
JP2002132582A (en) Reuse space reserve of compression memory system
JP5531476B2 (en) Information processing apparatus and information processing program
JP2005122334A (en) Memory dump method, memory dumping program and virtual computer system
EP1103898A2 (en) Microprocessor and memory
RU2294010C1 (en) Digital data processing method
JP4164452B2 (en) Information processing method and apparatus

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060417

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070101

LAPS Cancellation because of no payment of annual fees