JP2001290677A - High-speed dump sampling method - Google Patents

High-speed dump sampling method

Info

Publication number
JP2001290677A
JP2001290677A JP2000111871A JP2000111871A JP2001290677A JP 2001290677 A JP2001290677 A JP 2001290677A JP 2000111871 A JP2000111871 A JP 2000111871A JP 2000111871 A JP2000111871 A JP 2000111871A JP 2001290677 A JP2001290677 A JP 2001290677A
Authority
JP
Japan
Prior art keywords
system
dump
data
step
standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000111871A
Other languages
Japanese (ja)
Inventor
Hideomi Idei
Hirofumi Nagasuga
Tatsutoshi Sakuraba
英臣 出射
健年 櫻庭
弘文 長須賀
Original Assignee
Hitachi Ltd
株式会社日立製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, 株式会社日立製作所 filed Critical Hitachi Ltd
Priority to JP2000111871A priority Critical patent/JP2001290677A/en
Publication of JP2001290677A publication Critical patent/JP2001290677A/en
Application status is Pending legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To solve the problem where the time required for system restart is delayed since the sample time of dump information to be sampled for finding the cause is prolonged when a fault occurs in a computer system. SOLUTION: Concerning the dump sampling method for the computer system, with which the computer system is divided into plural systems while using a function for dividing system resources, certain one among plural systems is operated for reserve and the other systems are operated for ordinary jobs, this method is provided with a first step for copying data and virtual stored information in the system under performing the ordinary job to the system for reserve, when a fault occurs in the system and a second step for restarting the system, where the fault occurs, after the end of copy. In parallel with the second step, a third step is provided for outputting the data copied in the first step and data, which are located on an auxiliary storage device on the basis of the copied virtual stored information, to a dump file together.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】本発明は、計算機システムの障害発生時に、障害要因を究明するために必要となるダンプ情報の採取方法に関する。 The present invention relates is the computer upon failure of the system relates to how to collect dump information needed to investigate the cause of the error.

【0002】 [0002]

【従来の技術】計算機システムに障害が発生した際、障害の原因を究明するため、障害発生時の情報であるダンプ情報を主記憶、及び仮想記憶から採取するシステム運用が一般的であるが、従来の技術では、ダンプ情報を全て採取した後にシステムを再起動するため、通常業務再開までの時間が長くなるという問題がある。 When the Related Art computer system fails, in order to determine the cause of the failure, the main memory dump information is information at the time of the failure, and system operation to be collected from the virtual storage is common, in the prior art, in order to restart the system after it has taken all of the dump information, there is a problem that the time until normal operations resume longer.

【0003】一方、近年、プロセッサ性能の向上に伴い、一つの計算機で実行されるプログラム処理量、及びデータ量は増大する一方である。 On the other hand, in recent years, with improvement in processor performance, the program processing amount executed by one computer, and the amount of data that is one to increase. 更に、より効率的な処理を一つの計算機システム内で実行するには、大量のデータを主記憶装置上に直接配置したり、仮想記憶上に展開する必要があり、これらを実現するために、主記憶や仮想記憶のアドレスを表現できるサイズを拡張することが不可欠となる。 Furthermore, to perform a more efficient processing within one computer system, or placed directly in the main memory a large amount of data must be developed on the virtual storage, in order to realize these, to extend the size that can represent the address of the main storage or virtual storage is essential.

【0004】こうした背景のもと、各計算機システムのアーキテクチャでは、主記憶ならびに仮想記憶のアドレスサイズが拡張され、また、アドレスサイズが拡張された計算機システムに対応したオペレーティングシステムが出現してきている。 [0004] Against this background, the architecture of the computer system is mainly address size of the memory and virtual memory is expanded, also the operating system has emerged which addresses size corresponding to enhanced computer system.

【0005】以上の主記憶ならびに仮想記憶のアドレスサイズ拡張に伴い、システム障害時に採取するダンプ情報は増大し、ダンプ情報の採取時間も長くなる。 [0005] With the above main storage and address size expansion of the virtual storage, dump information to be collected at the time of system failure increases, also it increases acquisition time of the dump information. そのため、ダンプ情報採取からシステム再起動による通常業務再開までの時間が長くなるという上記問題に一層拍車がかかる。 Therefore, more is applied spur to the above problem that the time until normal operations resume longer by the system restart from the dump information collected.

【0006】こうしたダンプ情報採取によるシステム再起動の遅延を回避する方法として、特開平7−2348 [0006] As a method to avoid the delay of the system restart by such dump information collected, JP-A-7-2348
08号公報や特開平10−333944号公報がある。 There are 08 and JP 10-333944 JP.

【0007】特開平7−234808号公報では、2重化された主記憶装置を有する計算機システムにおいて、 [0007] In JP-A-7-234808 discloses, in a computer system having a main memory which is duplexed,
システム障害が発生した際は、片方のメモリ情報をダンプ情報として採取し、もう片方のメモリを利用してシステムの再起動を行うことで、ダンプ情報採取によるシステム再起動の遅延を防止する方法を開示している。 When a system failure occurs, collect the memory information of one as dump information, by performing a restart of the system using the other memory, a method for preventing the delay system restart by dump information collected It discloses.

【0008】特開平10−333944号公報では、システム再起動のための操作を行う前に、まずオペレーティングシステムの中各部をロードするメモリ領域のダンプ情報採取を行う。 [0008] In JP-A-10-333944 discloses, prior to the operation for system restart, first performs dump information collected in the memory area for loading each unit in the operating system. その後、使用するメモリ領域がダンプ済みでなければ使用する前にダンプ情報を採取しながらシステムの再起動を行うプログラムと、ダンプ済みでない領域を順次ダンプするプログラムとを並行して実行させることで、ダンプ情報採取によるシステム再起動の遅延を防止する方法を開示している。 Thereafter, the memory space used to execute in parallel the program to reboot the system with dumped information before using unless already dumped, and a program for sequentially dumped regions not been dumped, It discloses a method of preventing a delay system restart by dump information collected.

【0009】 [0009]

【発明が解決しようとする課題】以上のように従来の技術では、システム障害の際、ダンプ情報の採取が完了するまでシステムの再起動ができず、通常業務再開までの時間が遅延するという問題があった。 In the [0006] above in the prior art, when the system failure, can not restart the system until the collection of the dump information is complete, a problem that the time until normal operations resume to delay was there. その問題を解決するため、前述したような方法があるが、それらも主記憶内のダンプ情報しか採取できないという問題や、ダンプを出力しながらシステムの再起動を行うため、再起動時期は早まるものの起動処理自体が遅くなり、十分な時間短縮はできないという問題が残っていた。 To solve the problem, there is a method as described above, they also or problems that can only collect dump information in the main memory, for performing system reboot while outputting the dump, although restart timing earlier start-up process itself is slower, it was still a problem that can not be reduced enough time.

【0010】本発明が解決しようとする課題は、システム障害の際、主記憶ならびに仮想記憶内のダンプ情報採取によるシステム再起動の遅延を回避し、通常業務再開までの時間を短縮することにある。 [0010] The object of the present invention is to provide, at the time of a system failure, to avoid the main memory as well as system restart by dump information collected in the virtual memory delay, is to shorten the time until normal business resumed .

【0011】 [0011]

【課題を解決するための手段】上記課題を解決するために、システム資源を分割する機能を用いて、計算機システムを複数のシステムに分割し、その中である一つのシステムを待機用、それ以外を通常業務用として運用する計算機システムのダンプ採取方法において、通常業務を行っているシステムに障害が発生した際、そのシステム内のデータ、及び仮想記憶情報を待機用のシステムにコピーする第1のステップ、コピー終了後、障害が発生したシステムを再起動する第2のステップを設ける。 In order to solve the above problems SUMMARY OF THE INVENTION, by using the function of dividing the system resources, it divides the computer system into a plurality of systems, for waiting for one system is therein, otherwise the in dump method of a computer system to operate as a normal business, when the system performs the normal operations fails, the first to copy data in the system, and the virtual storage information to the system for standby step, after the copy ends, providing a second step of restarting a failed system.

【0012】さらに、第2のステップと並行して、第1 [0012] Furthermore, in parallel with the second step, the first
のステップでコピーしたデータと、コピーした仮想記憶情報を元に補助記憶装置上に配置されたデータを合わせてダンプファイルに出力する第3のステップを設ける。 And copying the data in step, the combined copied data arranged on the auxiliary storage device based on the virtual storage information provided third step of outputting to the dump file.

【0013】 [0013]

【発明の実施の形態】図1から図6を用いて、本発明の実施の形態を説明する。 From DETAILED DESCRIPTION OF THE INVENTION Figure 1 with reference to FIG. 6, an embodiment of the present invention.

【0014】まず、図1から図3を用いて、第1の発明の実施の形態について説明する。 [0014] First, with reference to FIGS. 1 to 3 will be described embodiments of the first aspect of the present invention.

【0015】図1は、本発明の実施の形態を示す計算機システムの構成である。 [0015] Figure 1 is a configuration of a computer system illustrating an embodiment of the present invention. 100は計算機システムである。 100 is a computer system. 計算機システム(100)は、CPU(110)を持ち、コンソール(102)、補助記憶装置(10 Computer system (100) has a CPU (110), the console (102), an auxiliary storage device (10
4)、ダンプファイル(106)と接続している。 4), it is connected to the dump file (106).

【0016】また、計算機システム(100)は、システム分割機能(120)により、システム1(13 Further, the computer system (100), the system partitioner (120), the system 1 (13
0)、システム2(140)、システム3(150)に分割され、システム1(130)、及びシステム2(1 0), the system 2 (140), is divided into the system 3 (150), the system 1 (130), and system 2 (1
40)は通常業務用のシステムとして、システム3(1 40) as a system for the normal business system 3 (1
50)は待機用のシステムとして運用する。 50) to operate as a system for standby. システム1 System 1
(130)、システム2(140)、システム3(15 (130), system 2 (140), system 3 (15
0)には、それぞれ同サイズのメモリ(132,14 To 0), each of the same size memory (132,14
2,152)を割り当て、メモリ(132,142)には、通常業務を処理するためのデータ(160)を配置する。 2,152) assigned to, the memory (132, 142), placing the data (160) for processing the normal operations. また、補助記憶装置(104)にデータ(17 The data in the auxiliary storage device (104) (17
0)を配置した場合は、配置先を示す仮想記憶情報(1 If you place a 0), the virtual storage information indicating a placement destination (1
62)をメモリ上に格納する。 62) to store in memory. システム3(150)に割り当てたメモリ(152)は、待機用システムのメモリであるため通常時は使用しない。 Memory allocated to the system 3 (150) (152) is normal is not used for a memory standby system.

【0017】コンソール(102)は、システム運用者から計算機システム(100)に対する処理要求を受け付け、また、計算機システム(100)側からのメッセージを表示する。 The console (102) receives the processing request for the computer system (100) from the system operator, also displays a message from the computer system (100) side. ダンプファイル(106)は、システム障害発生時に採取する全ダンプ情報を格納する。 Dump file (106) stores all the dump information to be collected at the time of system failure.

【0018】図2は、通常業務用のシステム1(13 [0018] FIG. 2, the system 1 for the normal course of business (13
0)に障害が発生した場合のダンプ情報採取とシステム再起動までの処理を示すブロック図であり、図3はその処理の流れを示すフローチャートである。 0) is a block diagram showing the processing up to dump information collection and system restart in case of failure, Figure 3 is a flow chart showing the flow of the processing. ここで、通常業務用のシステム2(140)に障害が発生した場合の処理も同様である。 Here, the same applies processing when a failure occurs in the system 2 (140) for normal operations.

【0019】システム1(130)は、通常業務の処理(ステップ300)中にシステム障害(200)を起こした際、コンソール(102)にシステム障害が発生したことを示すメッセージ(210)を表示し(ステップ302)、システム運用者に障害が発生したことを通知する。 [0019] System 1 (130), the processing of the routine work when caused the system failure (200) in (step 300), displays a message (210) indicating that a system failure occurred console (102) (step 302), notifying that a failure occurs in the system operator.

【0020】メッセージ(210)により、システム運用者はコンソール(102)を通して、システム1(1 [0020] The message (210), the system operator, through the console (102), the system 1 (1
30)から待機用システム3(150)にメモリコピーする命令(220)をシステム分割機能(120)に発行する(ステップ310)。 Instructions to memory copy standby system 3 (150) 30) a (220) is issued to the system partitioner (120) (step 310).

【0021】命令(220)を受け付けたシステム分割機能(120)は、システム1(130)のメモリ(1 The instruction system splitting function accepted (220) (120), the memory system 1 (130) (1
32)上に存在するデータ(160)、及び仮想記憶情報(162)を全て待機用システム3(150)のメモリ(152)上にコピーする処理(230)を実行する(ステップ320)。 32) data existing on the (160), and executing a process of copying in the memory (152) of the virtual storage information (all 162) waiting for the system 3 (150) (230) (step 320). メモリコピー処理終了後、システム分割機能(120)は、コンソール(102)にメモリコピー完了を示すメッセージ(240)を表示する(ステップ322)。 After the memory copy process ends, the system partitioner (120) displays a message (240) indicating a memory copy completion to the console (102) (step 322).

【0022】メッセージ(240)により、システム運用者はコンソール(102)を通して、システム再起動命令(250)をシステム1(130)に発行し(ステップ312)、続いてダンプ情報出力命令(260)をシステム3(150)に発行する(ステップ314)。 [0022] The message (240), through the system operator console (102), and issuing system restart instruction (250) to the system 1 (130) (steps 312), followed by dump information output command (260) issuing system 3 (150) (step 314).

【0023】システム再起動命令(250)を受け付けたシステム1(130)は、システム再起動処理(ステップ304)を実行しシステムを再起動する。 The system restart instruction (250) System 1 (130) that has received the performs system reboot process (step 304) to restart the system. この時、 At this time,
システム1(130)は、システム障害(200)発生時に使用していた補助記憶装置(104)とは別の補助記憶装置に切替え、補助記憶装置(104)内の内容を破壊しないようにする。 System 1 (130) is switched to a different auxiliary storage device and system failure (200) an auxiliary storage device that used in the event (104), so as not to destroy the contents of the auxiliary storage device (104). システム再起動後、システム1 After a system reboot, system 1
(130)は、通常業務処理(ステップ300)を再開する。 (130) and resumes normal business processing (step 300).

【0024】一方、ダンプ出力命令(260)を受け付けたシステム3(150)は、ステップ320でメモリ(152)上にコピーしたシステム1(130)のデータ(160)をダンプファイル(106)に全て出力する処理(270)を実行する(ステップ330)。 On the other hand, the dump command (260) system 3 that received the (150) are all in the memory (152) dump file (106) the data (160) of the system 1 (130) copied on in step 320 It executes the output processing (270) (step 330). また、同じくステップ320でメモリ(152)上にコピーした仮想記憶情報(162)からデータ(170)を配置している場所を割り出し、そこからデータ(17 Further, also determine where that places data (170) from the virtual storage information copied into the memory (152) (162) in step 320, the data from which (17
0)を読み出してダンプファイル(106)に出力する処理(280)を実行する(ステップ332)。 0) reads out and executes a process (280) to be output to the dump file (106) (step 332). 全ダンプ情報の出力が完了すると、システム3(150)はコンソール(102)にダンプ情報出力完了のメッセージ(290)を表示する(ステップ334)。 When the output of all the dump information is completed, the system 3 (150) displays a message (290) of the dump information output completion to the console (102) (step 334).

【0025】コンソール(102)が、システム3(1 [0025] console (102), system 3 (1
50)から受け付けたメッセージ(290)を表示することで、一連の処理を完了する(ステップ316)。 By displaying the message (290) received from the 50), a series of the processing is completed (step 316).

【0026】次に、図4から図5を用いて第2の発明の実施の形態について説明する。 Next, embodiments of the second invention will be described with reference to FIGS 4.

【0027】図4は、図2と同じく通常業務用のシステム1(130)に障害が発生した場合のダンプ情報採取とシステム再起動までの処理を示すブロック図であり、 [0027] FIG. 4 is a block diagram showing the processing up to dump information collection and system restart when a failure occurs in the system 1 (130) for same normal business and 2,
図5は、その処理の流れを示すフローチャートである。 Figure 5 is a flow chart showing the flow of the processing.

【0028】第1と第2の発明の実施の形態の違いは、 The difference in the embodiment of the first and second invention,
通常業務用システムに障害が発生した際、一連の処理にシステム運用者が関与するのではなく、上記システム分割機能(120)に自動ダンプ採取プログラム(40 When the normal business system fails, rather than the system operator is involved in a series of processes, automatic dump program (40 to the system partitioner (120)
0)を用意しておき、当該プログラム(400)が自動的にダンプ情報を採取することである。 0) is prepared, and is that the program (400) to automatically collect dump information.

【0029】通常業務の処理中、システム障害(20 [0029] During the processing of the normal course of business, system failure (20
0)が発生したシステム1(130)は、自動ダンプ採取プログラム(400)にシステム障害が発生したことを示すコード(410)を送信する(ステップ50 0) System 1 (130) that occurred transmits a code (410) indicating that a system failure occurred in the automatic dump program (400) (Step 50
0)。 0).

【0030】コード(410)を受信した自動ダンプ採取プログラム(400)は、システム1のメモリ内容をシステム3のメモリ上にコピーした後、システム再起動命令(250)をシステム1(130)に発行し(ステップ510)、続いてダンプ情報出力命令(260)をシステム3(150)に発行する(ステップ520)。 The automatic dump program that has received the code (410) (400) issues a memory content of the system 1 after copying in the memory of the system 3, system restart instruction (250) to the system 1 (130) (step 510), followed by issuing the dump information output instruction (260) to the system 3 (150) (step 520).

【0031】第1の発明と同じく、システム再起動命令(250)を受け付けたシステム1(130)は、補助記憶装置を切り替えてシステムを再起動した後、通常業務を再開する。 [0031] As with the first invention, the system 1 that has received the system restart instruction (250) (130), after restarting the system by switching the auxiliary storage device resumes normal operations.

【0032】一方、ダンプ出力命令(260)を受け付けたシステム3(150)は、メモリ(152)上のデータ、及び補助記憶装置(104)に配置しているデータ(170)をダンプ情報としてダンプファイル(10 On the other hand, the dump command (260) system 3 that received the (150), dump the data in the memory (152), and data are arranged in the auxiliary storage device (104) to (170) as the dump information file (10
6)に出力する。 And outputs it to 6). 全ダンプ情報の出力終了後、システム3(150)は、自動ダンプ採取プログラム(400) After completion of output total dump information, system 3 (150), automatic dump program (400)
にダンプ情報出力が完了したことを示すコード(42 Indicates that the dump information output is completed in the code (42
0)を送信する(ステップ530)。 0) to the (step 530).

【0033】コード(420)を受信した自動ダンプ採取プログラム(400)は、システム1に障害が発生しダンプ情報を採取したことを示すメッセージ(430) The code automatically dump program that has received (420) (400), a message indicating that the system 1 fault has dumped information generated (430)
をコンソールに表示し(ステップ540)、処理を終了する(ステップ550)。 Is displayed on the console (step 540), the processing is terminated (step 550).

【0034】以上のように、第2の発明では、自動ダンプ採取プログラム(400)がシステム運用者に代わって一連の処理を行うため、システム運用者のオペレーションを軽減する効果がある。 [0034] As described above, in the second invention, since the automatic dump program (400) performs a series of processes on behalf of the system operator, the effect of reducing the operation of the system operator.

【0035】最後に、図6を用いて、第3の発明の実施の形態について説明する。 [0035] Finally, with reference to FIG. 6, it will be described the third embodiment of the present invention.

【0036】図6は、図2と同じく通常業務用のシステム1(130)に障害が発生した場合のダンプ情報採取とシステム再起動までの処理を示すブロック図である。 [0036] FIG. 6 is a block diagram showing the processing up to dump information collection and system restart when a failure occurs in the system 1 (130) for same normal business and Fig.

【0037】第2と第3の発明の実施の形態の違いは、 The difference in the embodiment of the second and third invention,
自動ダンプ採取プログラム(400)をシステム分割機能(120)に用意するのではなく、待機用システム3 Instead of providing the system splitting function automatic dump program (400) (120), waiting for the system 3
(150)内に用意しておくことである。 Is that to be prepared to (150) in the. そのため、システム3(150)は、他のシステム(130,14 Therefore, system 3 (150), the other system (130,14
0)より、当該プログラム(400)のサイズ分だけ多くメモリ領域を割当てておく必要がある。 From 0), it is necessary to assign a size of as many memory areas of the program (400). 処理の流れは、第2の発明の実施の形態と同様に、システム障害発生時、当該プログラムが障害システムから待機システムへのデータコピーを実行し、以下、障害システムへの再起動命令発行、コピーしたデータ、及び補助記憶装置内のデータのダンプ出力を実行する。 Process flow, similar to the embodiment of the second invention, when a system failure occurs, the program executes the data copy from the failed system to the standby system, hereinafter, restart instruction issue to failing system, copy run data, and dump the data in the auxiliary storage device.

【0038】以上のように、第3の発明では、自動ダンプ採取プログラム(400)により、第2の発明と同じく、システム運用者のオペレーションを軽減し、また、 [0038] As described above, in the third invention, the automatic dump program (400), as in the second invention, to reduce the operation of the system operator, also,
当該プログラムをシステム3(150)上に用意することで、当該プログラムは単体のプログラムとなり、開発の工数を低減する効果がある。 By providing the program to a system 3 (150) on, the program becomes a single program, the effect of reducing the man-hours for development.

【0039】 [0039]

【発明の効果】本発明により、システム資源を分割して運用する計算機システムにおいて、通常業務用のシステムに障害が発生した際、システム内のデータを待機用システムにコピーした後、直ちにシステムを再起動するため、通常業務を再開するまでの時間を短縮することが可能となる。 According to the present invention, in a computer system to operate by dividing the system resources, when the system for routine work fails, after copying the data in the system standby system immediately system re to start, it is possible to shorten the time to resume normal business.

【0040】また、障害が発生したシステムの仮想記憶情報も合わせて待機用システムにコピーし、その情報を元に、補助記憶装置上に配置されているデータも出力するため、主記憶上のデータだけでなく仮想記憶上のデータもダンプ情報として採取することが可能となる。 Further, by copying the virtual storage information even together the standby system in the system fails, based on the information, to output also data arranged on an auxiliary storage device, data stored in the main memory data on the virtual storage not only it becomes possible to collect as dump information.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】本発明の実施の形態を示す計算機システムの構成図である。 1 is a configuration diagram of a computer system showing an embodiment of the present invention.

【図2】第1の発明の実施の形態において、システムに障害が発生した場合のダンプ情報採取とシステム再起動までの処理を示すブロック図である。 In the embodiment of Figure 2 the first invention, it is a block diagram showing the processing up to dump information collection and system restart if the system fails.

【図3】第1の発明の実施の形態において、システムに障害が発生した場合のダンプ情報採取とシステム再起動までの処理の流れを示すフローチャートである。 [3] In the embodiment of the first invention, it is a flowchart showing the flow of processing up to dump information collection and system restart if the system fails.

【図4】第2の発明の実施の形態において、システムに障害が発生した場合のダンプ情報採取とシステム再起動までの処理を示すブロック図である。 In the embodiment of Figure 4 to a second aspect of the present invention, it is a block diagram showing the processing up to dump information collection and system restart if the system fails.

【図5】第2の発明の実施の形態において、システムに障害が発生した場合のダンプ情報採取とシステム再起動までの処理の流れを示すフローチャートである。 In the embodiment of Figure 5 to a second aspect of the present invention, it is a flowchart showing the flow of processing up to dump information collection and system restart if the system fails.

【図6】第3の発明の実施の形態において、システムに障害が発生した場合のダンプ情報採取とシステム再起動までの処理を示すブロック図である。 In the embodiment of Figure 6 to a third aspect of the present invention, it is a block diagram showing the processing up to dump information collection and system restart if the system fails.

【符号の説明】 DESCRIPTION OF SYMBOLS

100…計算機システム、102…コンソール、104 100 ... computer system 102 ... console, 104
…補助記憶装置、106…ダンプファイル、110…C ... auxiliary storage device, 106 ... dump file, 110 ... C
PU、120…システム分割機能、130,140…通常業務用システム、150…待機用システム、132, PU, 120 ... system division function, 130, 140 ... the normal course of business for the system, 150 ... waiting for the system, 132,
142,152…メモリ、160…データ、162…仮想記憶情報、170…補助記憶装置上のデータ,400 142, 152 ... memory, 160 ... data, 162 ... virtual storage information 170 ... data on the auxiliary storage device, 400
…自動ダンプ採取プログラム。 ... automatic dump program.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 長須賀 弘文 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 Fターム(参考) 5B042 KK08 MC07 ────────────────────────────────────────────────── ─── front page of the continuation (72) inventor Nagasuka Hirofumi Kawasaki City, Kanagawa Prefecture Aso District Ozenji 1099 address Co., Ltd., Hitachi systems development Laboratory in the F-term (reference) 5B042 KK08 MC07

Claims (4)

    【特許請求の範囲】 [The claims]
  1. 【請求項1】 システム障害発生時、システム再起動により通常業務を再開する計算機システムのダンプ採取方法において、 上記計算機システムは、システム資源を分割し、複数のシステムを同時に起動するシステム分割機能を有し、 当該機能により複数に分割されたシステムの中で、一つのシステムを待機用、残りのシステムを通常業務用として運用し、 上記通常業務用のシステムに障害が発生した際、当該システム内のデータを上記待機用のシステムにコピーした後、直ちにシステムを再起動して通常業務を再開し、 それと並行して、上記待機用のシステムにコピーしたデータを出力することを特徴とするダンプ採取方法。 At 1. A system failure, the dump process of resuming computer system normal operational by the system restart, the computer system may have a system dividing function of dividing the system resources, to start multiple systems simultaneously and, in a system that is divided into a plurality by the functional, for waiting for one system, it operates the rest of the system as a routine work, when the system for the routine work fails in the system after copying the data to the system for the standby, the normal business resumed immediately restart the system, and in parallel, dump method and outputting the data copied into the system for the standby .
  2. 【請求項2】 当該計算機システムは補助記憶装置を有し、 上記障害が発生したシステムから待機用システムへのデータコピーの際、障害システムが保持している仮想記憶情報も合わせてコピーし、 上記待機用のシステムからデータを出力する際、当該仮想記憶情報を元に、補助記憶装置上に配置されているデータを合わせて出力することを特徴とするダンプ採取方法。 Wherein said computer system includes an auxiliary storage device, when the data copy from the system in which the failure has occurred to the standby system, also copying the combined virtual storage information failing system is holding, the when outputting data from the system for standby, dump method characterized by based on the virtual storage information, and outputs the combined data is arranged on an auxiliary storage device.
  3. 【請求項3】 上記システム分割機能に自動ダンプ採取プログラムを用意し、 上記通常業務用システムに障害が発生した際、当該自動ダンプ採取プログラムが、請求項1記載の一連の処理を自動的に実行することを特徴とするダンプ採取方法。 3. Prepare an automatic dump program to the system partition function, when the above-mentioned normal business system failure, the automatic dump program, automatically executes a series of processing according to claim 1, wherein dump method which is characterized in that.
  4. 【請求項4】 請求項3記載の自動ダンプ採取プログラムを上記待機用のシステムに搭載することを特徴とするダンプ採取方法。 4. A dump method auto dump program according to claim 3, wherein the mounting system for the standby.
JP2000111871A 2000-04-07 2000-04-07 High-speed dump sampling method Pending JP2001290677A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000111871A JP2001290677A (en) 2000-04-07 2000-04-07 High-speed dump sampling method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000111871A JP2001290677A (en) 2000-04-07 2000-04-07 High-speed dump sampling method

Publications (1)

Publication Number Publication Date
JP2001290677A true JP2001290677A (en) 2001-10-19

Family

ID=18624136

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000111871A Pending JP2001290677A (en) 2000-04-07 2000-04-07 High-speed dump sampling method

Country Status (1)

Country Link
JP (1) JP2001290677A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007265137A (en) * 2006-03-29 2007-10-11 Oki Electric Ind Co Ltd Multi-task processing method and multi-task processing apparatus
JP2008165777A (en) * 2006-12-26 2008-07-17 Internatl Business Mach Corp <Ibm> Method for resource recovery, information processing system, and computer program
US7761737B2 (en) 2005-03-29 2010-07-20 Fujitsu Limited Apparatus, method, and computer product for executing program
KR101201186B1 (en) 2004-08-23 2012-11-13 마이크로소프트 코포레이션 Memory dump generation with quick reboot
US8719639B2 (en) 2007-03-19 2014-05-06 Fujitsu Limited Virtual machine control program, virtual machine control system, and dump capturing method
WO2015011749A1 (en) * 2013-07-22 2015-01-29 株式会社日立製作所 Storage system and fault management method for storage system
CN106776153A (en) * 2015-11-25 2017-05-31 华为技术有限公司 job control method and server

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101201186B1 (en) 2004-08-23 2012-11-13 마이크로소프트 코포레이션 Memory dump generation with quick reboot
US7761737B2 (en) 2005-03-29 2010-07-20 Fujitsu Limited Apparatus, method, and computer product for executing program
JP2007265137A (en) * 2006-03-29 2007-10-11 Oki Electric Ind Co Ltd Multi-task processing method and multi-task processing apparatus
JP2008165777A (en) * 2006-12-26 2008-07-17 Internatl Business Mach Corp <Ibm> Method for resource recovery, information processing system, and computer program
US8719639B2 (en) 2007-03-19 2014-05-06 Fujitsu Limited Virtual machine control program, virtual machine control system, and dump capturing method
WO2015011749A1 (en) * 2013-07-22 2015-01-29 株式会社日立製作所 Storage system and fault management method for storage system
US9471434B2 (en) 2013-07-22 2016-10-18 Hitachi, Ltd. Storage system and storage system failure management method
CN106776153A (en) * 2015-11-25 2017-05-31 华为技术有限公司 job control method and server

Similar Documents

Publication Publication Date Title
US6802062B1 (en) System with virtual machine movable between virtual machine systems and control method
CN1096034C (en) Multiprocessor system
CN102834822B (en) Quick shared by the virtual machine cluster - full backup
JP3154942B2 (en) Computer system distributed checkpointing method and the method is applied
ES2717603T3 (en) VEX - Virtual extension framework
CN101271409B (en) Device and method for migration of a logical partition, and equipment therefor
US5805790A (en) Fault recovery method and apparatus
US8381032B2 (en) System-directed checkpointing implementation using a hypervisor layer
US20010018717A1 (en) Computer system, operating system switching system, operating system mounting method, operating system switching method, storage medium, and program transmission apparatus
US6996828B1 (en) Multi-OS configuration method
US6684396B1 (en) Method for upgrading running software processes without compromising fault-tolerance
JP2007226413A (en) Memory dump method, memory dump program and computer system
US6687849B1 (en) Method and apparatus for implementing fault-tolerant processing without duplicating working process
FI78993B (en) Oevervakare of drift in the system.
JP2000066902A (en) Multi branch correction processing system in dynamic translator
JPH08505965A (en) Context switching device and method
US5752268A (en) Minimum-delay recoverable disk control system using checkpoints and nonvolatile memory
JPH11134117A (en) Computer system
JP2002505768A (en) How to reconstruct the state of the computing and system
JPH0652511B2 (en) Address translation system of the information processing apparatus
JPH096636A (en) Check point acquisition system
JPH0814795B2 (en) Multi-processor virtual machine system
JPH07219665A (en) Method and computer system for stopping and restarting state of system
JPH07200112A (en) Information processing system
JP2005128590A (en) Disk array device with snapshot simulation function