JP2001188690A - Computer system and checkpoint information preserving method - Google Patents

Computer system and checkpoint information preserving method

Info

Publication number
JP2001188690A
JP2001188690A JP37352999A JP37352999A JP2001188690A JP 2001188690 A JP2001188690 A JP 2001188690A JP 37352999 A JP37352999 A JP 37352999A JP 37352999 A JP37352999 A JP 37352999A JP 2001188690 A JP2001188690 A JP 2001188690A
Authority
JP
Japan
Prior art keywords
page
checkpoint
information
stored
updated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP37352999A
Other languages
Japanese (ja)
Inventor
Kuninori Tanaka
邦典 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP37352999A priority Critical patent/JP2001188690A/en
Publication of JP2001188690A publication Critical patent/JP2001188690A/en
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a computer system capable of coping with generation of faults and being recovered without preventing the lowering of system performance. SOLUTION: Checkpoint information of a process is managed for every unit of page, an updated page is recorded, whether or not the updated page is stored in the case of the previous collection of the checkpoint information as well is compared, when the updated page is stored in the case of the previous collection of the checkpoint information, only the updated part is transmitted from a primary computer to a backup computer and in other cases, the entire page is transmitted from the primary computer to the backup computer.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明が属する技術分野】本発明は、プロセスを実行す
るプライマリコンピュータの他にバックアップコンピュ
ータを備えたコンピュータシステムに係り、特に、プラ
イマリコンピュータに障害が発生した時にバックアップ
コンピュータによりプロセスを実行することができるよ
うにしたコンピュータシステム及びチェックポイント情
報保存方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a computer system having a backup computer in addition to a primary computer for executing a process, and more particularly, to executing a process by a backup computer when a failure occurs in the primary computer. The present invention relates to a computer system and a checkpoint information storage method as described above.

【0002】[0002]

【従来の技術】図14は、この種のコンピュータシステ
ムの動作を説明したものであり、該システムは、プライ
マリコンピュータ1とバックアップコンピュータ2とか
ら構成されている。そして、プライマリコンピュータ1
で動作しているプロセス3のチェックポイント情報4を
定期的に採取し、バックアップコンピュータ2に転送し
てチェックポイント情報5として保存している。この場
合、障害発生によってプライマリコンピュータ1がダウ
ンしてプロセス3が続行できなくなると、チェックポイ
ント情報5を元にして、バックアップコンピュータ2で
プロセス6を再生し、処理を続行するようになってい
る。
2. Description of the Related Art FIG. 14 illustrates the operation of a computer system of this kind. The system comprises a primary computer 1 and a backup computer 2. And the primary computer 1
The checkpoint information 4 of the process 3 operating in the step 3 is periodically collected, transferred to the backup computer 2 and stored as checkpoint information 5. In this case, if the failure causes the primary computer 1 to go down and the process 3 cannot continue, the backup computer 2 reproduces the process 6 based on the checkpoint information 5 and continues the processing.

【0003】この種のプライマリコンピュータとバック
アップコンピュータの2台のコンピュータで構成された
コンピュータシステムとしては、米国特許明細書第5907
673号「Checkpointing Computer System Having Duplic
ated Files forExecuting Process and Method for Man
aging the Duplicated Files forRestoring the Proces
s」や、論文「分散チェックポイント方式との組合せに
よりフォールトトレラントシステムを実現する分散レプ
リケーション方式」(電子情報通信学会論文誌D-1 Vol.
J82-D-1 No3 pp.496-507 1999年3月)がある。
[0003] A computer system composed of two computers of this kind, a primary computer and a backup computer, is disclosed in US Pat.
Issue 673, `` Checkpointing Computer System Having Duplic
ated Files forExecuting Process and Method for Man
aging the Duplicated Files for Restoring the Proces
s "and a paper" Distributed Replication Method Realizing Fault-Tolerant System by Combining with Distributed Checkpoint Method "(Transactions of the Institute of Electronics, Information and Communication Engineers, D-1 Vol.
J82-D-1 No3 pp.496-507 March 1999).

【0004】これらのコンピュータシステムにおいて
は、システム全体の性能低下を防ぐため、プライマリコ
ンピュータで採取したチェックポイント情報をバックア
ップコンピュータに転送する場合、転送するデータ量を
極力抑える必要がある。
In these computer systems, in order to prevent the performance of the entire system from deteriorating, when transferring checkpoint information collected by a primary computer to a backup computer, it is necessary to minimize the amount of data to be transferred.

【0005】従来は、プロセスのチェックポイント情報
の大半を占めるアドレス空間のデータ量を抑えるため、
アドレス空間をページ単位で管理し、ページが更新され
た時はそのページの情報を記録し、チェックポイント情
報採取時には、記録されたページの内容のみを保存す
る、差分チェックポイントという手法が用いられてい
た。
Conventionally, in order to reduce the amount of data in an address space that occupies most of the checkpoint information of a process,
Address space is managed in page units, and when a page is updated, the information of that page is recorded, and when checkpoint information is collected, only the contents of the recorded page are saved, a method called differential checkpoint. Was.

【0006】この手法では、以前のチェックポイントか
ら更新されたページの内容のみを保存することになるた
め、アドレス空間全体を保存するよりも、チェックポイ
ントのデータ量を大幅に小さくすることが可能となる。
In this method, since only the contents of the page updated from the previous checkpoint are stored, it is possible to greatly reduce the data amount of the checkpoint as compared with storing the entire address space. Become.

【0007】図15は、従来の差分チェックポイント方
式を示しており、チェックポイントxで保存されるペー
ジを説明したものである。すなわち、チェックポイント
(x−1)以降に更新したページA、Dの情報を記録し
ておき、チェックポイントxでは記録したページA、D
を保存することを示している。
FIG. 15 shows a conventional difference checkpoint method, and explains a page stored at a checkpoint x. That is, the information of the pages A and D updated after the checkpoint (x-1) is recorded, and the recorded pages A and D are recorded at the checkpoint x.
Indicates that you want to save.

【0008】[0008]

【発明が解決しようとする課題】従来の技術で述べた、
アドレス空間をページ単位で管理し、チェックポイント
時には更新ページのみを保存する差分チェックポイント
方法では、プロセスが更新するページにローカリティが
あるので、更新ページ数が少なくなるような処理を実行
する場合は、データ量の削減には効果的に働き、保存デ
ータ量を大幅に小さくすることができる。
SUMMARY OF THE INVENTION As described in the prior art,
In the differential checkpoint method that manages the address space in page units and saves only the updated pages at the time of checkpoint, since the pages updated by the process have locality, when performing processing that reduces the number of updated pages, It works effectively to reduce the amount of data, and can greatly reduce the amount of stored data.

【0009】しかし、リレーショナルデータベースの様
に、プロセスが多数のページの少量ずつのデータを頻繁
に更新する様な処理を実行する場合には、差分保存する
メリットは失われ、チェックポイントごとに多数のペー
ジを保存することになる。その結果、データ量が大きく
なり、プライマリコンピュータからバックアップコンピ
ュータへの転送時に大きなオーバーヘッドが発生し、シ
ステム全体の性能を著しく低下させてしまうことにな
る。
However, when a process executes a process that frequently updates a small amount of data of a large number of pages, as in a relational database, the advantage of storing the differences is lost, and a large number of checkpoints are lost for each checkpoint. You will save the page. As a result, the data amount becomes large, a large overhead is generated at the time of transfer from the primary computer to the backup computer, and the performance of the entire system is significantly reduced.

【0010】図16(a)は、従来技術の差分チェック
ポイント方式によって斜線で示された更新部分を保存す
る際、この方式が有効に機能する場合をケース1として
示し、図16(b)は、ほとんど効果がない場合をケー
ス2として示したものである。図16(a)に示すケー
ス1は、ページEのみが広い範囲で更新されているた
め、チェックポイント情報採取時にはページEのみを保
存するだけで済む。一方、図16(b)に示すケース2
は、ページA、B、C、D、E、Fの各々狭い範囲が更
新されているため、チェックポイント情報採取時にはペ
ージA、B、C、D、E、Fを採取しなければならな
い。
FIG. 16A shows a case 1 in which this method works effectively when an updated portion indicated by oblique lines is stored by the conventional differential checkpoint method, and FIG. , The case where there is almost no effect is shown as Case 2. In case 1 shown in FIG. 16A, since only page E is updated in a wide range, only page E needs to be stored when checkpoint information is collected. On the other hand, case 2 shown in FIG.
, Pages A, B, C, D, E, and F must be collected when checkpoint information is collected because each of the narrow ranges of pages A, B, C, D, E, and F is updated.

【0011】本発明の目的は、リレーショナルデータベ
ースの様な多数のページの少量ずつのデータを頻繁に更
新するような処理を実行するプロセスにおいても、保存
するデータ量を少なくし、プライマリコンピュータから
バックアップコンピュータへの転送量を抑えることによ
って、システム性能の低下を防ぐことが可能なコンピュ
ータシステム及びチェックポイント情報保存方法を提供
することにある。
An object of the present invention is to reduce the amount of data to be stored even in a process for frequently updating small data of a large number of pages, such as a relational database, and to reduce the amount of data to be stored from a primary computer to a backup computer. It is an object of the present invention to provide a computer system and a checkpoint information storage method capable of preventing a decrease in system performance by suppressing a transfer amount to a checkpoint information.

【0012】[0012]

【課題を解決するための手段】上記課題を解決するため
請求項1に係る発明は、プライマリコンピュータとバッ
クアップコンピュータとから構成され、前記プライマリ
コンピュータで実行されているプロセスのチェックポイ
ント情報を前記バックアップコンピュータに転送し、前
記プライマリコンピュータで障害が発生したとき、該チ
ェックポイント情報に基づき前記プロセスを前記バック
アップコンピュータで実行するコンピュータシステムに
おいて、前記プライマリコンピュータは、前記プロセス
のチェックポイント情報を採取し該チェックポイント情
報をページ単位で管理するチェックポイント情報管理手
段と、更新されたページを記録する更新ページ記録手段
と、更新されたページが以前のチェックポイント情報採
取時にも保存されているかを比較する更新ページ比較手
段と、更新されたページが以前のチェックポイント情報
採取時に保存されている場合には更新された部分のみを
保存し、これ以外の場合はページ全体を保存するチェッ
クポイント情報保存手段と、このチェックポイント情報
保存手段に保存されたチェックポイント情報を前記バッ
クアップコンピュータに送信する手段とを具備すること
を特徴とする。
According to a first aspect of the present invention, there is provided a computer system comprising a primary computer and a backup computer, wherein checkpoint information of a process executed on the primary computer is stored in the backup computer. In a computer system that executes the process on the backup computer based on the checkpoint information when a failure occurs on the primary computer, the primary computer collects the checkpoint information of the process, Checkpoint information management means for managing information in page units, updated page recording means for recording updated pages, and updated pages are stored even when previous checkpoint information was collected. An updated page comparing means for comparing whether or not an updated page has been saved at the time of previous checkpoint information collection, and save only the updated portion, otherwise save the entire page It is characterized by comprising an information storage means and means for transmitting the checkpoint information stored in the checkpoint information storage means to the backup computer.

【0013】また、請求項2に係る発明は、請求項1に
おけるバックアップコンピュータが、前記チェックポイ
ント保存手段に保存されたページ情報がページ全体の情
報であるか以前のチェックポイント情報採取時に保存し
たページ情報との差分情報であるかを判別するページ情
報判別手段と、保存されたページ情報が以前のチェック
ポイント情報採取時に保存したページ情報との差分情報
である場合に以前のチェックポイント情報採取時に保存
したページ情報とマージすることによりページ全体の情
報を復元するページ情報復元手段とを具備することを特
徴とする。
According to a second aspect of the present invention, there is provided the backup computer according to the first aspect, wherein the page information stored in the checkpoint storage means is information of the entire page or the page stored at the time of previous checkpoint information collection. Page information discriminating means for discriminating whether or not the information is difference information, and when the saved page information is difference information from the page information saved when the previous checkpoint information was collected, the page information is saved when the previous checkpoint information was collected Page information restoring means for restoring information of the entire page by merging with the page information.

【0014】請求項3に係る発明は、請求項1又は2に
おける前記プライマリコンピュータが、前記チェックポ
イント保存手段において保存したページを1つ以上のブ
ロックに分割して管理するページ内ブロック管理手段
と、更新された部分を含む1つ以上のブロック全体をそ
のページの更新データとして保存するページ内ブロック
保存手段とを具備することを特徴とする。
According to a third aspect of the present invention, in the first or second aspect, the primary computer divides a page stored in the checkpoint storage unit into one or more blocks and manages the intra-page block management unit; And an intra-page block storing means for storing one or more blocks including the updated part as update data of the page.

【0015】請求項4に係る発明は、プライマリコンピ
ュータとバックアップコンピュータとからなるコンピュ
ータシステムで、前記プライマリコンピュータで障害が
発生したとき、前記バックアップコンピュータでプロセ
スを引継いで実行させるためのチェックポイント情報保
存方法であって、前記プロセスのチェックポイント情報
をページ単位で管理し、更新されたページを記録し、該
更新されたページが以前のチェックポイント情報採取時
にも保存されているかを比較して該更新されたページが
以前のチェックポイント情報採取時に保存されている場
合には更新された部分のみを、これ以外の場合はページ
全体を前記バックアップコンピュータに送信することを
特徴とする。
According to a fourth aspect of the present invention, in a computer system including a primary computer and a backup computer, a checkpoint information storing method for causing a backup computer to take over and execute a process when a failure occurs in the primary computer. Managing the checkpoint information of the process on a page-by-page basis, recording the updated page, and comparing whether the updated page is saved at the time of the previous checkpoint information collection. If the updated page is stored at the time of previous checkpoint information collection, only the updated portion is transmitted to the backup computer, otherwise, the entire page is transmitted to the backup computer.

【0016】請求項1,4に係る発明によれば、プライ
マリコンピュータは、プロセスのチェックポイント情報
をページ単位で管理するものとして以前のチェックポイ
ント情報採取時から更新されたページを記録する。そし
て、以前のチェックポイント情報採取時から更新された
ページが以前のチェックポイント情報採取時にも保存さ
れているかを比較して以前のチェックポイント情報採取
時から更新されたページが以前のチェックポイント情報
採取時に保存されている場合には更新された部分のみを
保存し、これ以外の場合はページ全体を保存する。これ
により、プライマリコンピュータで障害が発生した時に
保存すべきチェックポイント情報は少ないものとなり、
プライマリコンピュータからバックアップコンピュータ
へのデータ量は抑えられる。
According to the first and fourth aspects of the present invention, the primary computer records the page updated from the previous checkpoint information collection time as managing the checkpoint information of the process in page units. Then, compare whether the pages updated since the previous checkpoint information collection were saved when the previous checkpoint information was collected, and compare the pages updated since the previous checkpoint information collection with the previous checkpoint information collection. Sometimes only save the updated part if it has been saved, otherwise save the entire page. This reduces the amount of checkpoint information to be saved when a failure occurs on the primary computer,
The amount of data from the primary computer to the backup computer is reduced.

【0017】よって、リレーショナルデータベースの様
な多数のページの少量ずつのデータを頻繁に更新するよ
うな処理を実行するプロセスにおいても、保存するデー
タ量は少ないものとなり、プライマリコンピュータから
バックアップコンピュータへの転送量を抑えることによ
って、システム性能の低下を防ぐことが可能となる。
Therefore, even in a process of frequently updating small data of a large number of pages, such as a relational database, the amount of data to be saved is small, and the data is transferred from the primary computer to the backup computer. By suppressing the amount, it is possible to prevent a decrease in system performance.

【0018】請求項2に係る発明によれば、プライマリ
コンピュータからバックアップコンピュータへの転送量
が抑えられたチェックポイント情報に基づき、ページ情
報がページ全体の情報であるか以前のチェックポイント
情報採取時に保存したページ情報との差分情報であるか
を判別し、保存されたページ情報が以前のチェックポイ
ント情報採取時に保存したページ情報との差分情報であ
る場合に以前のチェックポイント情報採取時に保存した
ページ情報とマージすることによりページ全体の情報を
復元することにより、プライマリコンピュータに障害が
発生した時にであっても、バックアップコンピュータに
よりプロセスを再生し、処理を続行することが可能とな
る。
According to the second aspect of the present invention, based on the checkpoint information in which the transfer amount from the primary computer to the backup computer is suppressed, whether the page information is the information of the entire page or saved at the time of the previous checkpoint information collection Page information saved at the time of previous checkpoint information collection if the saved page information is difference information from the page information saved at the time of the previous checkpoint information collection By restoring the information of the entire page by merging with the backup computer, even when a failure occurs in the primary computer, the process can be reproduced by the backup computer and the processing can be continued.

【0019】請求項3に係る発明にによれば、前記プラ
イマリコンピュータは、ブロック管理を行い、該ブロッ
ク毎に更新された部分を判定して更新データを保存する
ので、更新部分が少ない場合は特に保存データ量を低減
することができる。
According to the third aspect of the present invention, the primary computer performs block management, determines a portion updated for each block, and stores the updated data. The amount of stored data can be reduced.

【0020】[0020]

【発明の実施の形態】以下、本発明に係るコンピュータ
システムの一実施形態を図面を参照して説明する。図1
は本実施形態のコンピュータシステムを示しており、プ
ライマリコンピュータ10とバックアップコンピュータ
20とがケーブル30と接続されている。通常時には、
プライマリコンピュータ10によりプロセス40が処理
されている。プライマリコンピュータ10で実行されて
いるプロセス40のチェックポイント情報を適宜バック
アップコンピュータ20に転送し、プライマリコンピュ
ータ10で障害が発生したとき、該チェックポイント情
報に基づきプロセス40´をバックアップコンピュータ
20で実行する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of a computer system according to the present invention will be described below with reference to the drawings. FIG.
1 shows a computer system of the present embodiment, in which a primary computer 10 and a backup computer 20 are connected to a cable 30. Usually,
The process 40 is processed by the primary computer 10. The checkpoint information of the process 40 executed by the primary computer 10 is appropriately transferred to the backup computer 20. When a failure occurs in the primary computer 10, the process 40 'is executed by the backup computer 20 based on the checkpoint information.

【0021】またプライマリコンピュータ10は、チェ
ックポイント情報管理部11、更新ページ比較部12、
チェックポイント情報保存部13及び更新ページ記録部
14を備え、チェックポイント情報に係るページ単位又
はページ内のブロック単位で更新の有無を比較判定し、
該判定の下で保存すべきデータを決定する。
The primary computer 10 includes a checkpoint information management unit 11, an updated page comparison unit 12,
A checkpoint information storage unit 13 and an updated page recording unit 14 are provided, and the presence or absence of an update is compared and determined on a page basis or on a block basis within the page related to the checkpoint information,
The data to be stored is determined based on the determination.

【0022】さらにバックアップコンピュータ20は、
ページ情報判別部21、ページ情報復元部22を備え、
プライマリコンピュータ10に保存され且つ転送されて
きたチェックポイント情報を基にプロセス40´を再現
し、プロセス処理を続行する。
Further, the backup computer 20
A page information determining unit 21 and a page information restoring unit 22;
The process 40 'is reproduced based on the checkpoint information stored and transferred to the primary computer 10, and the process is continued.

【0023】プライマリコンピュータ10の各部につい
て図2を参照して詳細に説明する。すなわち、チェック
ポイント情報管理部11は、プロセス40の各チェック
ポイントでページ毎又はページ内ブロック毎に情報を採
取し、且つ保存したチェックポイント情報を管理するも
のであり、具体的には、更新ページ比較部12及びチェ
ックポイント保存部13において必要とされる、比較保
存するページ又はページ内ブロックに関するチェックポ
イント情報を管理するものである。更新ページ比較部1
2は、チェックポイント情報管理部11及び更新ページ
記録部14からのチェックポイント情報に基づきチェッ
クポイント(x−1)以降に更新されたページが、チェ
ックポイント(x−1)(又はそれ以前、つまりx−
2、x−3、…)のチェックポイントで保存されている
か比較する。チェックポイント情報保存部13は、更新
ページ比較部12によって比較したページが、チェック
ポイント(x−1)(又はそれ以前、つまりx−2、x
−3、…)のチェックポイントで保存されている場合
は、その情報との差分情報を、保存されていない場合は
ページ全体を保存する。更新ページ記録部14は、チェ
ックポイント(x−1)以降に変更されたページを記録
する。
Each part of the primary computer 10 will be described in detail with reference to FIG. That is, the checkpoint information management unit 11 collects information for each page or for each block in a page at each checkpoint of the process 40, and manages the stored checkpoint information. It manages checkpoint information related to a page to be compared and stored or a block in a page, which is required in the comparison unit 12 and the checkpoint storage unit 13. Update page comparison part 1
2 indicates that the pages updated after the checkpoint (x-1) based on the checkpoint information from the checkpoint information management unit 11 and the update page recording unit 14 are updated to the checkpoint (x-1) (or earlier, that is, x-
2, x-3,...) Are compared. The checkpoint information storage unit 13 determines that the page compared by the updated page comparison unit 12 is the checkpoint (x-1) (or earlier, that is, x-2, x
-3,...), The difference information from the information is stored. Otherwise, the entire page is stored. The updated page recording unit 14 records a page changed after the check point (x-1).

【0024】以下に、チェックポイントxで保存するペ
ージ情報を作成する流れを、時系列的に説明する。尚、
以降の説明では、チェックポイント(x−1)以前に更
新されたページには表記の最後に(x−1)を付記し、
チェックポイント(x−1)以降に更新されたページに
は表記の最後にxを付記している。
Hereinafter, a flow of creating page information to be stored at the checkpoint x will be described in chronological order. still,
In the following description, pages updated before checkpoint (x-1) will be appended with (x-1) at the end of the notation,
Pages updated after the checkpoint (x-1) are marked with x at the end of the description.

【0025】図2において、当初、チェックポイント
(x−1)で、ページA、B、E、Gのデータをページ
A(x−1)、B(x−1)、E(x−1)、G(x−
1)として保存し、これらをチェックポイント管理部1
1により管理する。次に、チェックポイント(x−1)
以降、例えばチェックポイントxに更新されたページ
B、C、FのデータをページBx、Cx、Fxとして保
存し、チェックポイント更新ページ記録部14により記
録する。
In FIG. 2, initially, at checkpoint (x-1), data of pages A, B, E, and G are converted into pages A (x-1), B (x-1), and E (x-1). , G (x−
1) and save them as checkpoint management unit 1
1 to manage. Next, checkpoint (x-1)
Thereafter, for example, the data of the pages B, C, and F updated to the checkpoint x are stored as pages Bx, Cx, and Fx, and are recorded by the checkpoint updated page recording unit 14.

【0026】チェックポイント更新ページ記録部14に
より保存したページA(x−1)、B(x−1)、E
(x−1)、G(x−1)と、ページBx、Cx、Fx
について、更新ページ比較部12により、チェックポイ
ント(x−1)で保存したページ情報と、以降の処理で
あるチェックポイントxで保存したページ情報とを比較
する。
The pages A (x-1), B (x-1), E stored by the checkpoint update page recording unit 14
(X-1), G (x-1) and pages Bx, Cx, Fx
, The updated page comparison unit 12 compares the page information stored at the checkpoint (x-1) with the page information stored at the checkpoint x, which is a subsequent process.

【0027】次に、チェックポイント保存部13によ
り、チェックポイント(x−1)でも保存されたページ
Bは、ページB(x−1)との差分のみをページBxと
して保存する。チェックポイント(x−1)で保存され
なかったページC、Fはページ全体をページCx、Fx
として保存する。
Next, for the page B stored at the checkpoint (x-1) by the checkpoint storage unit 13, only the difference from the page B (x-1) is stored as the page Bx. Pages C and F that were not saved at checkpoint (x-1) are replaced by pages Cx and Fx.
Save as

【0028】次に、先に保存したデータを、チェックポ
イント情報管理部11により管理する。
Next, the previously stored data is managed by the checkpoint information management unit 11.

【0029】以上の処理により、プライマリコンピュー
タ10で障害が発生した時に保存すべきチェックポイン
ト情報は、更新された一部又は全部のページとすること
ができ、全体としては少ない情報となり、プライマリコ
ンピュータ10からバックアップコンピュータ20への
データ量は抑えられる。
According to the above processing, the checkpoint information to be saved when a failure occurs in the primary computer 10 can be updated part or all of the pages, and the information as a whole becomes small, and the primary computer 10 From the backup computer 20 to the backup computer 20 can be reduced.

【0030】よって、リレーショナルデータベースの様
な多数のページの少量ずつのデータを頻繁に更新するよ
うな処理を実行するプロセスにおいても、プライマリコ
ンピュータ10において保存すべきデータ量は少ないも
のとなり、プライマリコンピュータ10からバックアッ
プコンピュータ20への転送量を抑えることによって、
システム性能の低下を防ぐことが可能となる。
Therefore, even in a process such as a relational database that frequently updates a small amount of data of a large number of pages, the amount of data to be stored in the primary computer 10 is small, and the primary computer 10 By reducing the amount of data transferred to the backup computer 20 from
It is possible to prevent a decrease in system performance.

【0031】上述したチェックポイント情報の採取及び
保存について。更に具体的な例を図3〜図5を参照して
説明する。図3は、請求項3に対応する、チェックポイ
ント情報管理部11が管理するチェックポイント情報の
採取及び保存の一例を示す図であり、以下に採取の流れ
を示す。なお、ライトプロテクトの掛けられたページは
斜線で示している。また図3は、ページ毎にライトプロ
テクトの掛け外しを行うことにより、更新の有無を判定
するものとしては、図4及び図5に示す方法共に共通で
ある。そして、図4は、現在のチェックポイント時と前
回のチェックポイント時のページ差分を比較するもので
あるに対し、図5は現在のチェックポイント時と2回前
以上のチェックポイント時のページの差分を比較するも
のである点が相違する。
The collection and storage of the checkpoint information described above. More specific examples will be described with reference to FIGS. FIG. 3 is a diagram showing an example of collection and storage of checkpoint information managed by the checkpoint information management unit 11 according to claim 3, and the flow of collection is shown below. The pages protected by write protection are indicated by diagonal lines. FIG. 3 is common to both the methods shown in FIGS. 4 and 5 in that the presence / absence of update is determined by undoing write protection for each page. 4 compares the page difference between the current checkpoint and the previous checkpoint, while FIG. 5 illustrates the page difference between the current checkpoint and the checkpoint two or more times before. Are different from each other.

【0032】図3において、チェックポイント情報採取
時にページのデータを保存するチェックポイントモジュ
ール111と、ページフォールトが発生したページを記
録して、そのページのライトプロテクトを外すハンドル
112と、更新されたページ情報を記録する更新管理タ
グ113と、チェックポイント時にページ全体を保存す
る場合は“1”を設定し、また差分のみを保存する時は
“0”を設定する保存形式記録タグ114とを含む。
In FIG. 3, a checkpoint module 111 for storing page data when checkpoint information is collected, a handle 112 for recording a page in which a page fault has occurred and removing write protection for the page, and an updated page An update management tag 113 for recording information and a storage format recording tag 114 for setting "1" when saving the entire page at the time of a checkpoint and setting "0" when saving only the difference are included.

【0033】チェックポイント情報採取に際して次のよ
うに処理が行われる。
At the time of checkpoint information collection, the following processing is performed.

【0034】図3(a)に示すように、各ページにライ
トプロテクトを掛ける。これは、プロセス空間情報をペ
ージ単位で管理するために前提である。そして、ページ
フォールトが発生した時の処理を行うためのハンドラ1
12を設定し、チェックポイント情報採取時に更新ペー
ジを保存するためのチェックポイントモジュール111
を作成する。また、ページが更新されたことを記録する
ための更新管理タグ113を各ページに付加する。これ
ら一連の措置により、あるページが更新されると当該ペ
ージにはフォールトが発生したことになる。
As shown in FIG. 3A, each page is write-protected. This is a premise for managing the process space information in page units. And a handler 1 for performing processing when a page fault occurs.
Checkpoint module 111 for setting 12 and saving the updated page when checkpoint information is collected
Create Also, an update management tag 113 for recording that the page has been updated is added to each page. As a result of these series of measures, when a page is updated, a fault has occurred in the page.

【0035】ここで、一例としてページBが更新された
とすると、該ページBにはページフォールトが発生する
ことになり、ハンドラ112に制御が移る。図3(b)
に示すように、ハンドラ112は、更新されたページB
の情報を、更新管理タグ113に記録し、そのページの
ライトプロテクトを解除する。
Here, if the page B is updated as an example, a page fault occurs in the page B, and the control is transferred to the handler 112. FIG. 3 (b)
As shown in the figure, the handler 112 updates the page B
Is recorded in the update management tag 113, and the write protection of the page is released.

【0036】次に、図3(c)に示すように、最初のチ
ェックポイント情報採取時、チェックポイントモジュー
ル111は更新されたページB全体のデータをページB
1として保存し、保存形式記録タグ114に“1”を設
定する。また、ページBのライトプロテクトを掛け直
す。
Next, as shown in FIG. 3C, when the first checkpoint information is collected, the checkpoint module 111 stores the updated data of the entire page B in the page B.
1, and “1” is set in the storage format recording tag 114. Further, the write protection of page B is re-applied.

【0037】次に、ページ毎の今回と前回との差分比較
を行う方法について図4を参照して説明する。図4に示
すように、x回目のチェックポイント情報採取時には、
チェックポイント(x−1)以降に更新されたページ
B、Dと、チェックポイントモジュール111が管理し
ているページデータとを比較する。チェックポイントモ
ジュール111は、1回目のチェックポイントCP1の
採取時にページB全体のデータをページB1として、
(x−1)回目のチェックポイントCP(x−1)採取
時にページA、D全体のデータを各々ページA(x−
1)、D(x−1)として保存している。
Next, a method for comparing the difference between the current time and the previous time for each page will be described with reference to FIG. As shown in FIG. 4, at the time of the x-th checkpoint information collection,
The pages B and D updated after the checkpoint (x-1) are compared with the page data managed by the checkpoint module 111. The checkpoint module 111 sets the data of the entire page B as the page B1 when the first checkpoint CP1 is collected.
When the (x−1) -th checkpoint CP (x−1) is collected, the data of the entire pages A and D are respectively transferred to the page A (x−
1) and D (x-1).

【0038】この場合、ページBは、チェックポイント
CP(x−1)で保存されていないため、ページ全体の
データをページBxとして、ページDはチェックポイン
トCP(x−1)で保存されているため、ページD(x
−1)との差分のみをページDxとして保存する。
In this case, since page B is not stored at checkpoint CP (x-1), page D is stored at checkpoint CP (x-1) with the data of the entire page as page Bx. Therefore, page D (x
Only the difference from -1) is stored as page Dx.

【0039】その際、ページBxの保存形式記録タグ1
14には“1”を設定し、またページDxの保存形式記
録タグ114には“0”を設定し、更にページDxに
は、後述する復元の際に必要となる差分データのページ
内のオフセット及び差分データサイズを付加する。
At this time, the storage format recording tag 1 of the page Bx
14 is set to “1”, the storage format recording tag 114 of the page Dx is set to “0”, and the page Dx is further provided with an offset within the page of the difference data necessary for the later-described restoration. And a difference data size.

【0040】次に、ページ毎の今回と2回以上前との差
分比較を行う方法を、図3及び図5を参照して説明す
る。この例は、請求項5に対応するものであつて、チェ
ックポイント情報管理部11が管理するチェックポイン
ト情報の採取及び保存の他例である。図示された各モジ
ュールの機能及び図3の流れは図4に示す先の例と同じ
であるため、ここでは、先の例と異なるx回目のチェッ
クポイント処理についてのみ説明する。
Next, a method for comparing the difference between the current page and the page twice or more for each page will be described with reference to FIGS. This example corresponds to claim 5 and is another example of collection and storage of checkpoint information managed by the checkpoint information management unit 11. Since the functions of the illustrated modules and the flow of FIG. 3 are the same as those in the previous example shown in FIG. 4, here, only the x-th checkpoint processing different from the previous example will be described.

【0041】図5に示すように、x回目のチェックポイ
ント情報の採取時、チェックポイント(x−1)以降に
更新されたページB、Dと、チェックポイントモジュー
ル111が管理しているページデータとを比較する。
As shown in FIG. 5, when the x-th checkpoint information is collected, the pages B and D updated after the checkpoint (x-1) and the page data managed by the checkpoint module 111 are stored. Compare.

【0042】チェックポイントモジュール111は、1
回目のチェックポイントCP1の採取時にページB全体
のデータをページB1として保存し、また(x−1)回
目のチェックポイントCP(x−1)の採取時にページ
A、D全体のデータを各々ページA(x−1)、D(x
−1)として保存している。
The checkpoint module 111 has 1
The data of the entire page B is stored as the page B1 when the checkpoint CP1 is collected for the first time, and the data of the entire pages A and D are respectively stored on the page A when the checkpoint CP (x-1) is collected for the (x-1) th time. (X-1), D (x
-1).

【0043】ページBはチェックポイントCP1で保存
されているため、ページB1との差分のみをページBx
として保存し、またページDはチェックポイントCP
(x−1)で保存されているため、ページD(x−1)
との差分のみをページDxとして保存する。
Since page B is stored at checkpoint CP1, only the difference from page B1 is stored in page Bx
And save page D as checkpoint CP
Since it is stored as (x-1), page D (x-1)
Is stored as page Dx.

【0044】ページBx、Dx共に保存形式記録タグに
“0”を設定し、図4の例と同様に、復元の際に必要と
される差分データのページ内のオフセット及び差分デー
タサイズを付加する。
In both the pages Bx and Dx, the storage format recording tag is set to "0", and the offset in the page and the difference data size of the difference data required at the time of restoration are added as in the example of FIG. .

【0045】上述した図4に示す採取保存方式と、図5
に示す採取保存方式との違いは、前者が今回のチェック
ポイントのページと前回のチェックポイントのページと
の差分を比較する方式であることに対し、後者は今回の
チェックポイントのページと2回以上前のチェックポイ
ントのページとの差分を比較する方式であることが相違
し、比較すべきチェックポイント以外については両者と
も共通である。
The collecting and preserving method shown in FIG.
The difference from the collection and storage method shown in Figure 2 is that the former compares the difference between the current checkpoint page and the previous checkpoint page, while the latter differs from the current checkpoint page two or more times. The difference is that the method is to compare the difference with the page at the previous checkpoint, and both methods are common except for the checkpoint to be compared.

【0046】上述の実施形態においては、ページ単位の
差分比較により保存すべき一部又は全部のページを決定
していたが、ページを複数ブロックに分割し該ブロック
毎の差分比較により保存すべきページ内の一部又は全部
のブロックを決定する手法を採用することができる。
In the above-described embodiment, a part or all of the pages to be stored are determined by the difference comparison of each page. However, the page is divided into a plurality of blocks, and the pages to be stored are compared by the difference comparison of each block. A method of determining a part or all of the blocks can be adopted.

【0047】このような実施形態を、図1〜図5と同一
部分には同一符号を付した図6及び図7を参照して説明
する。すなわち、プライマリコンピュータ10は、図1
〜図5におけるチェックポイント情報管理部11及びチ
ェックポイント情報保存部13に対応してページ内ブロ
ック管理部31及びページ内ブロック保存部32を設け
ている。
Such an embodiment will be described with reference to FIGS. 6 and 7, in which the same parts as those in FIGS. That is, the primary computer 10
5 is provided with an in-page block management unit 31 and an in-page block storage unit 32 corresponding to the checkpoint information management unit 11 and the checkpoint information storage unit 13 in FIG.

【0048】図2、図6及び図7において、x回目のチ
ェックポイント情報採取時に、チェックポイント(x−
1)以降に更新されたページDが、それまでのチェック
ポイントで保存されているかチェックポイント情報管理
部11、ページ内ブロック管理部31にて調べる。次
に、チェックポイント(x−1)でもページDのデータ
がページD(x−1)として保存されているため、ペー
ジDとページD(x−1)の差分を取る準備として、ペ
ージD及びページD(x−1)を各々N個の等しい大き
さのブロックに分割する。
In FIG. 2, FIG. 6, and FIG. 7, when the x-th checkpoint information is collected, the checkpoint (x-
1) It is checked by the checkpoint information management unit 11 and the in-page block management unit 31 whether or not the page D updated thereafter is stored at the checkpoint up to that time. Next, since the data of the page D is also stored as the page D (x-1) at the checkpoint (x-1), the page D and the page D (x-1) are prepared in order to prepare the difference between the page D and the page D (x-1). Divide page D (x-1) into N equally sized blocks each.

【0049】次に、図7に示すようにページD(x−
1)とページDの対応するブロック同士を比較し、一致
しなかったブロックa及びb(図6においては、斜線部
分)を、ページDxとしてページ内ブロック保存部32
に保存する。その際、各々のブロック番号を付加し、保
存形式記録タグに“0”を設定する。
Next, as shown in FIG. 7, page D (x-
1) and the corresponding blocks of the page D are compared with each other, and the blocks a and b (the hatched portions in FIG. 6) that do not coincide with each other are set as the page Dx, and the in-page block storage unit 32
To save. At that time, each block number is added, and “0” is set to the storage format recording tag.

【0050】このようにページ単位でなくページを複数
ブロックに分割し該ブロック毎の差分比較により保存す
べきページ内の一部又は全部のブロックを決定すること
ができ、これは更新するデータがページの一部に限られ
る場合に有効である。
As described above, the page is divided into a plurality of blocks instead of the page unit, and a part or all of the blocks in the page to be stored can be determined by the difference comparison for each block. It is effective when it is limited to a part of.

【0051】以上の実施形態の説明は、プライマリコン
ピュータ10におけるチェックポイント情報の保存形態
を示すものであり、これら保存されたチェックポイント
情報に関するデータは、図1におけるケーブル30を介
してバックアップコンピュータ20に送られ、ここでプ
ロセス40´の復元がなされる。
The description of the above embodiment shows the storage form of the checkpoint information in the primary computer 10, and the data relating to the stored checkpoint information is transmitted to the backup computer 20 via the cable 30 in FIG. Where it is restored.

【0052】このような復元を行う実施形態を、図1〜
図7と同一部分には同一符号を付した図8〜図10を参
照して説明する。図8〜図10は請求項2に対応する、
差分ページデータの復元方式を説明した図である。図示
された各モジュールの機能は、先の実施形態と同じであ
る。なお、図9に示す復元方法は、図4及び図5に示す
保存方法で保存したデータの復元方法を示しており、図
10に示す復元方法は、図6に示す保存方法で保存した
データの復元方法を示しており、図8に示す復元方法
は、包括的に図4〜図6に示す保存方法で保存したデー
タの復元方法を示している。
An embodiment for performing such restoration is shown in FIGS.
The same parts as those in FIG. 7 will be described with reference to FIGS. 8 to 10 correspond to claim 2,
FIG. 9 is a diagram illustrating a method for restoring difference page data. The function of each illustrated module is the same as in the previous embodiment. The restoring method shown in FIG. 9 shows the restoring method of the data saved by the saving method shown in FIGS. 4 and 5, and the restoring method shown in FIG. 10 shows the restoring method of the data saved by the saving method shown in FIG. FIG. 8 shows a restoring method, and the restoring method shown in FIG. 8 shows a restoring method of data stored by the saving method shown in FIGS.

【0053】図8においては、プライマリコンピュータ
10から伝送されたチェックポイント情報をページ情報
判別部21及びページ情報復元部22により判別処理し
て、一部のページ情報を復元することにより、各チェッ
クポイントの各ページの情報を復元するようにしてい
る。
In FIG. 8, each of the checkpoint information transmitted from the primary computer 10 is discriminated by the page information discriminating section 21 and the page information restoring section 22 to restore a part of the page information. The information of each page is restored.

【0054】図9においては、チェックポイントxで保
存したページDのデータであるページDxの保存形式記
録タグには“0”が設定されており、チェックポイント
(x−1)で保存したページDのデータであるページD
(x−1)の保存形式記録タグに“1”が設定されてい
るから、ページDxは、ページD(x−1)の差分デー
タであることが判明する。
In FIG. 9, "0" is set in the storage format recording tag of page Dx, which is the data of page D stored at checkpoint x, and page D stored at checkpoint (x-1). Page D which is the data of
Since “1” is set in the storage format recording tag of (x−1), it is determined that page Dx is difference data of page D (x−1).

【0055】次に、ページD(x−1)に対して、ペー
ジDxのページ内オフセットで指定された位置から差分
データサイズで指定されたサイズの差分データを上書き
してマージすることにより、チェックポイントxでロー
ルバックする時に使用するページDのデータが復元され
る。
Next, the page D (x-1) is checked by overwriting and merging the difference data of the size designated by the difference data size from the position designated by the intra-page offset of the page Dx. The data of page D used when rolling back at point x is restored.

【0056】図10においては、チェックポイントxで
保存したページDのデータであるページDxの保存形式
記録タグに“0”が設定されており、チェックポイント
(x−1)で保存したページDのデータであるページD
(x−1)の保存形式タグに“1”が設定されているか
ら、ページDxは、ページD(x−1)の差分データで
あることが判明する。
In FIG. 10, "0" is set in the storage format recording tag of page Dx, which is the data of page D stored at checkpoint x, and the data of page D stored at checkpoint (x-1) is stored. Page D which is data
Since “1” is set in the storage format tag of (x−1), it is determined that the page Dx is the difference data of the page D (x−1).

【0057】次に、ページD(x−1)に対して、ペー
ジDxに含まれるブロックa及びbのデータを対応する
ブロックに上書きしてマージすることにより、チェック
ポイントxでロールバックする時に使用するページDの
データが復元される。
Next, the page D (x-1) is used when rolling back at checkpoint x by overwriting the data of blocks a and b contained in page Dx with the corresponding blocks and merging them. The page D data to be restored is restored.

【0058】上述した各実施形態のチェックポイント情
報の保存復元方法のフローチャートを図11〜図13を
参照して説明する。
A flowchart of the checkpoint information saving and restoring method in each of the above embodiments will be described with reference to FIGS.

【0059】ステップS1 プロセス空間のページに対してライトプロテクトを設定
する。
Step S1 Write protection is set for a page in the process space.

【0060】ステップS2 ステップS1でライトプロテクトを設定したページに書
き込みが行われた時に発生するページフォールトの処理
を行うためのハンドラを設定する。
Step S2: Set a handler for processing a page fault that occurs when data is written to the page for which write protection has been set in step S1.

【0061】ステップS3 ステップS2で設定したハンドラにより更新記録された
ページを保存するためのチェックポイントモジュールを
作成する。
Step S3 A checkpoint module for storing the page updated and recorded by the handler set in step S2 is created.

【0062】ステップS4 1〜(x−1)回目のチェックポイント情報採取が終了
する。
Step S41 The first to (x-1) th checkpoint information collection ends.

【0063】ステップS5 ページPに書き込みが行われる。Step S5 The page P is written.

【0064】ステップS6 ステップS2で設定したハンドラが起動される。Step S6 The handler set in step S2 is started.

【0065】ステップS7 ハンドラはページPが更新されたことを記録しページP
のライトプロテクトを解除する。
Step S7: The handler records that the page P has been updated, and
Cancel write protection on.

【0066】結合子Aを経た図12に示すステップS8 x回目のチェックポイント処理を開始する。The x-th checkpoint process is started in step S8 shown in FIG.

【0067】ステップS9 ステップS3で設定したチェックポイントモジュール
が、(x−1)回目のチェックポイント以降に更新され
たページを調べる。
Step S9 The checkpoint module set in step S3 checks pages updated since the (x-1) th checkpoint.

【0068】ステップS10 ステップS10では、図4に示す今回と前回のチェック
ポイント情報の比較又は図5に示す今回と2回前以上の
チェックポイント情報の比較とのいずれかをステップS
11,S12として選択できる。
Step S10 In step S10, either the comparison of the current and previous checkpoint information shown in FIG. 4 or the comparison of the current and the checkpoint information more than twice before shown in FIG.
11, and S12.

【0069】ステップS11 図4の方法を選択した場合は、ステップS9のページと
(x−1)回目のチェックポイントで保存されたページ
を比較する。
Step S11 When the method of FIG. 4 is selected, the page of step S9 is compared with the page stored at the (x-1) -th checkpoint.

【0070】ステップS12 図5の方法を選択した場合は、ステップS9のページと
(x−1)回目又はそれ以前のチェックポイントで保存
されたページを比較する。
Step S12 When the method of FIG. 5 is selected, the page of step S9 is compared with the page saved at the (x-1) th or earlier checkpoint.

【0071】ステップS13 ステップS13では、図4,図5に示すデータ保存方法
又は図6に示すデータ保存方法のいずれかをステップS
15,S16として選択できる。
Step S13 In step S13, one of the data storage methods shown in FIGS. 4 and 5 or the data storage method shown in FIG.
15, S16.

【0072】ステップS14 ステップS11又はステップS12で、ステップS9と
同じページが以前のチェックポイントで保存されていな
い時は、ページP全体を保存する。
Step S14 In step S11 or S12, if the same page as in step S9 is not stored at the previous checkpoint, the entire page P is stored.

【0073】ステップS15 ステップS11又はステップS12でステップS9と同
じページが以前のチェックポイントで保存されている時
は、そのページデータとの差分のみを保存する。
Step S15 When the same page as in step S9 is stored at the previous checkpoint in step S11 or S12, only the difference from the page data is stored.

【0074】ステップS16 請求項4では、ステップS11又はステップS12でス
テップS9と同じページが以前のチェックポイントで保
存されている時は、ページPを複数のブロックに分割
し、前回保存したページデータから更新されたブロック
のみ保存する。
In step S16, when the same page as in step S9 is stored in the previous checkpoint in step S11 or step S12, the page P is divided into a plurality of blocks, Save only updated blocks.

【0075】ステップS17 ページPの更新記録をクリアし、保存したページPのラ
イトプロテクトを再設定する。
Step S17: The update record of the page P is cleared, and the write protection of the saved page P is reset.

【0076】結合子Bを経た図13に示すステップS1
8 x回目のチェックポイント処理が終了する。
Step S1 shown in FIG.
8. The x-th checkpoint process ends.

【0077】ステップS19 ロールバックが発生する。Step S19 Rollback occurs.

【0078】ステップS20 チェックポイントxで保存したページPが、ページ全体
を保存したか、前回保存したページとの差分のみを保存
したか調べる。
Step S20: It is checked whether the page P stored at the checkpoint x stores the entire page or only the difference from the previously stored page.

【0079】ステップS21 ステップS20においてページP全体が保存されている
時は、そのデータをそのままロールバックに使用する。
Step S21 If the entire page P is stored in step S20, the data is used as it is for rollback.

【0080】ステップS22 ステップS22では、図9又は図10に示すマージ方法
を選択できる。すなわち、ステップS20において以前
保存したページデータとの差分のみが保存されている時
は、前回保存したページPのデータに、差分保存したデ
ータを上書きしてマージする。
Step S22 In step S22, the merging method shown in FIG. 9 or FIG. 10 can be selected. That is, when only the difference from the previously stored page data is stored in step S20, the data of the previously stored page P is overwritten with the data stored in the difference and merged.

【0081】ステップS23 請求項4では、ステップS20において以前保存したペ
ージデータとの差分のみが保存されている時は、前回保
存したページPのデータに、差分保存したブロックを上
書きしてマージする。
In step S23, if only the difference from the previously stored page data is stored in step S20, the block of the previously stored page P is overwritten with the data of the previously stored page P and merged.

【0082】ステップS25 ステップS24又はステップS23でマージしたデータ
をロールバックに使用する。
Step S25 The data merged in step S24 or S23 is used for rollback.

【0083】[0083]

【発明の効果】以上説明したように本発明においては、
プロセスのチェックポイント情報をページ単位で管理
し、更新されたページを記録し、該更新されたページが
以前のチェックポイント情報採取時にも保存されている
かを比較して該更新されたページが以前のチェックポイ
ント情報採取時に保存されている場合には更新された部
分のみを、これ以外の場合はページ全体をプライマリコ
ンピュータからバックアップコンピュータに送信するこ
とにより、たとえリレーショナルデータベースの様な多
数のページの少量ずつのデータを頻繁に更新するような
処理を実行するプロセスにおいても、保存するデータ量
は少ないものとなり、プライマリコンピュータからバッ
クアップコンピュータへの転送量を抑えることによっ
て、システム性能の低下を防ぐことが可能となる。
As described above, in the present invention,
Process checkpoint information is managed on a page-by-page basis, updated pages are recorded, and whether the updated pages have been saved at the time of previous checkpoint information collection is compared to determine whether the updated pages have been updated. By sending only the updated part if it was saved at the time of checkpoint information collection, otherwise the entire page from the primary computer to the backup computer, so that a small amount of many pages, such as a relational database, The amount of data to be stored is small even in the process of executing the process that frequently updates the data of the system, and it is possible to prevent the system performance from being lowered by suppressing the transfer amount from the primary computer to the backup computer. Become.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係るコンピュータシステムの一実施形
態を示すブロック図。
FIG. 1 is a block diagram showing one embodiment of a computer system according to the present invention.

【図2】図1に示すコンピュータシステムにおけるチェ
ックポイント情報保存方法を示す図。
FIG. 2 is an exemplary view showing a checkpoint information storage method in the computer system shown in FIG. 1;

【図3】図2における差分チェックポイントのための準
備、更新ページの記録及び最初のチェックポイント処理
を説明する図。
FIG. 3 is a view for explaining preparation for difference check points, recording of an updated page, and first check point processing in FIG. 2;

【図4】図2におけるx回目のチェックポイント処理の
一例を説明する図。
FIG. 4 is a view for explaining an example of an x-th checkpoint process in FIG. 2;

【図5】図2におけるx回目のチェックポイント処理の
他例を説明する図。
FIG. 5 is a view for explaining another example of the x-th checkpoint process in FIG. 2;

【図6】本発明によるブロック毎のチェックポイント情
報保存方法を説明する図。
FIG. 6 is a view for explaining a checkpoint information storage method for each block according to the present invention.

【図7】本発明におけるx回目のチェックポイント処理
での差分データの保存方法を示す図。
FIG. 7 is a diagram showing a method for storing difference data in an x-th checkpoint process according to the present invention.

【図8】本発明によるバックアップコンピュータを示
し、該バックアップコンピュータにおけるチェックポイ
ント情報復元方法を示す図。
FIG. 8 is a view showing a backup computer according to the present invention, and showing a checkpoint information restoring method in the backup computer.

【図9】図8における保存した差分ページデータの復元
の一例を説明する図。
FIG. 9 is an exemplary view for explaining an example of restoring the saved difference page data in FIG. 8;

【図10】図8における保存した差分ページデータの復
元の他例を説明する図。
FIG. 10 is a view for explaining another example of restoring the saved difference page data in FIG. 8;

【図11】本発明によるチェックポイント情報保存及び
復元の方法を示す流れ図。
FIG. 11 is a flowchart illustrating a method for saving and restoring checkpoint information according to the present invention.

【図12】本発明によるチェックポイント情報保存及び
復元の方法を示す流れ図。
FIG. 12 is a flowchart illustrating a method for saving and restoring checkpoint information according to the present invention.

【図13】本発明によるチェックポイント情報保存及び
復元の方法を示す流れ図。
FIG. 13 is a flowchart illustrating a method of saving and restoring checkpoint information according to the present invention.

【図14】従来のプライマリコンピュータとバックアッ
プコンピュータとを有するコンピュータシステムを示す
ブロック図。
FIG. 14 is a block diagram showing a conventional computer system having a primary computer and a backup computer.

【図15】従来技術における差分保存チェックポイント
方法を説明する図。
FIG. 15 is a view for explaining a difference storage checkpoint method according to the related art.

【図16】従来技術における差分保存チェックポイント
方式の問題点を説明する図。
FIG. 16 is a diagram for explaining a problem of the difference storage checkpoint method in the related art.

【符号の説明】[Explanation of symbols]

10…プライマリコンピュータ、20…バックアップコ
ンピュータ、30…ケーブル、11…チェックポイント
情報管理部、12…更新ページ比較部、13…チェック
ポイント情報保存部、14…更新ページ記録部、21…
ページ情報復元部、22…ページ情報判別部、31…ペ
ージ内ブロック管理部、32…ページ内ブロック保存
部。
DESCRIPTION OF SYMBOLS 10 ... Primary computer, 20 ... Backup computer, 30 ... Cable, 11 ... Checkpoint information management part, 12 ... Update page comparison part, 13 ... Checkpoint information storage part, 14 ... Update page recording part, 21 ...
Page information restoring unit, 22: Page information discriminating unit, 31: In-page block managing unit, 32: In-page block storing unit.

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 プライマリコンピュータとバックアップ
コンピュータとから構成され、前記プライマリコンピュ
ータで実行されているプロセスのチェックポイント情報
を前記バックアップコンピュータに転送し、前記プライ
マリコンピュータで障害が発生したとき、該チェックポ
イント情報に基づき前記プロセスを前記バックアップコ
ンピュータで実行するコンピュータシステムにおいて、
前記プライマリコンピュータは、前記プロセスのチェッ
クポイント情報を採取し該チェックポイント情報をペー
ジ単位で管理するチェックポイント情報管理手段と、更
新されたページを記録する更新ページ記録手段と、更新
されたページが以前のチェックポイント情報採取時にも
保存されているかを比較する更新ページ比較手段と、更
新されたページが以前のチェックポイント情報採取時に
保存されている場合には更新された部分のみを保存し、
これ以外の場合はページ全体を保存するチェックポイン
ト情報保存手段と、このチェックポイント情報保存手段
に保存されたチェックポイント情報を前記バックアップ
コンピュータに送信する手段とを具備することを特徴と
するコンピュータシステム。
1. A backup system comprising a primary computer and a backup computer, wherein checkpoint information of a process executed on the primary computer is transferred to the backup computer, and when a failure occurs in the primary computer, the checkpoint information is transmitted. A computer system that executes the process on the backup computer based on
A checkpoint information management unit that collects checkpoint information of the process and manages the checkpoint information on a page basis; an updated page recording unit that records an updated page; An updated page comparing means for comparing whether or not the updated page is also stored at the time of collection of the checkpoint information, and, when the updated page is stored at the time of the collection of the previous checkpoint information, storing only the updated portion;
Otherwise, a computer system comprising: checkpoint information storage means for storing the entire page; and means for transmitting the checkpoint information stored in the checkpoint information storage means to the backup computer.
【請求項2】 前記バックアップコンピュータは、前記
チェックポイント保存手段に保存されたページ情報がペ
ージ全体の情報であるか以前のチェックポイント情報採
取時に保存したページ情報との差分情報であるかを判別
するページ情報判別手段と、保存されたページ情報が以
前のチェックポイント情報採取時に保存したページ情報
との差分情報である場合に以前のチェックポイント情報
採取時に保存したページ情報とマージすることによりペ
ージ全体の情報を復元するページ情報復元手段とを具備
することを特徴とする請求項1記載のコンピュータシス
テム。
2. The backup computer determines whether the page information stored in the checkpoint storage means is information of the entire page or difference information from the page information stored when the previous checkpoint information was collected. Page information discriminating means, and when the stored page information is difference information from the page information stored at the time of the previous checkpoint information collection, merging with the page information stored at the time of the previous checkpoint information collection to merge the entire page 2. The computer system according to claim 1, further comprising a page information restoring unit for restoring information.
【請求項3】 前記プライマリコンピュータは、前記チ
ェックポイント保存手段において保存したページを1つ
以上のブロックに分割して管理するページ内ブロック管
理手段と、更新された部分を含む1つ以上のブロック全
体をそのページの更新データとして保存するページ内ブ
ロック保存手段とを具備することを特徴とする請求項1
又は2記載のコンピュータシステム。
3. The in-page block management unit that divides a page stored in the checkpoint storage unit into one or more blocks and manages the page, and one or more blocks including an updated part. And an in-page block storage unit for storing the data as update data of the page.
Or the computer system according to 2.
【請求項4】 プライマリコンピュータとバックアップ
コンピュータとからなるコンピュータシステムで、前記
プライマリコンピュータで障害が発生したとき、前記バ
ックアップコンピュータでプロセスを引継いで実行させ
るためのチェックポイント情報保存方法であって、前記
プロセスのチェックポイント情報をページ単位で管理
し、更新されたページを記録し、該更新されたページが
以前のチェックポイント情報採取時にも保存されている
かを比較して該更新されたページが以前のチェックポイ
ント情報採取時に保存されている場合には更新された部
分のみを、これ以外の場合はページ全体を前記バックア
ップコンピュータに送信することを特徴とするコンピュ
ータシステムにおけるチェックポイント情報保存方法。
4. A checkpoint information storing method for causing a backup computer to take over and execute a process when a failure occurs in the primary computer in a computer system including a primary computer and a backup computer, wherein Manages the checkpoint information of each page, records the updated page, compares whether the updated page is saved even when the previous checkpoint information was collected, and compares the updated page with the previous checkpoint. A method of storing checkpoint information in a computer system, comprising: transmitting only an updated portion if point information is stored at the time of collection, and transmitting an entire page to the backup computer otherwise.
JP37352999A 1999-12-28 1999-12-28 Computer system and checkpoint information preserving method Pending JP2001188690A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP37352999A JP2001188690A (en) 1999-12-28 1999-12-28 Computer system and checkpoint information preserving method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP37352999A JP2001188690A (en) 1999-12-28 1999-12-28 Computer system and checkpoint information preserving method

Publications (1)

Publication Number Publication Date
JP2001188690A true JP2001188690A (en) 2001-07-10

Family

ID=18502319

Family Applications (1)

Application Number Title Priority Date Filing Date
JP37352999A Pending JP2001188690A (en) 1999-12-28 1999-12-28 Computer system and checkpoint information preserving method

Country Status (1)

Country Link
JP (1) JP2001188690A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199197A (en) * 2008-02-20 2009-09-03 Hitachi Ltd Computer system, data matching method and data matching program
JP2010026814A (en) * 2008-07-18 2010-02-04 Fujitsu Ltd Resource migration system, resource migration method, information processor, and computer program
WO2012114443A1 (en) * 2011-02-21 2012-08-30 富士通株式会社 Processor management method
WO2014064547A1 (en) * 2012-10-24 2014-05-01 International Business Machines Corporation In-memory continuous data protection
JP2017173921A (en) * 2016-03-18 2017-09-28 大同信号株式会社 Multithread electronic computer and program for multithread electronic computer

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009199197A (en) * 2008-02-20 2009-09-03 Hitachi Ltd Computer system, data matching method and data matching program
JP2010026814A (en) * 2008-07-18 2010-02-04 Fujitsu Ltd Resource migration system, resource migration method, information processor, and computer program
WO2012114443A1 (en) * 2011-02-21 2012-08-30 富士通株式会社 Processor management method
CN103403688A (en) * 2011-02-21 2013-11-20 富士通株式会社 Processor management method
US9342451B2 (en) 2011-02-21 2016-05-17 Fujitsu Limited Processor management method
JP5967073B2 (en) * 2011-02-21 2016-08-10 富士通株式会社 Processor management method
WO2014064547A1 (en) * 2012-10-24 2014-05-01 International Business Machines Corporation In-memory continuous data protection
US10055304B2 (en) 2012-10-24 2018-08-21 International Business Machines Corporation In-memory continuous data protection
JP2017173921A (en) * 2016-03-18 2017-09-28 大同信号株式会社 Multithread electronic computer and program for multithread electronic computer

Similar Documents

Publication Publication Date Title
US7031986B2 (en) Database system with backup and recovery mechanisms
JP2501152B2 (en) Method and apparatus for maximum utilization of undo-log usage
US7107294B2 (en) Method and apparatus for interrupting updates to a database to provide read-only access
EP0827079B1 (en) Checkpoint computer system
US6868506B2 (en) Data recovery method and apparatus
US7340645B1 (en) Data management with virtual recovery mapping and backward moves
US6898688B2 (en) Data management appliance
US7849111B2 (en) Online incremental database dump
US20050283504A1 (en) Disaster recovery system suitable for database system
JPH0715664B2 (en) How to recover data set
US20070208917A1 (en) Method and apparatus for performing data backup
JP3136258B2 (en) Disk update log recording method
US20050262033A1 (en) Data recording apparatus, data recording method, program for implementing the method, and program recording medium
JP2003223350A (en) Data base system
JP2001188690A (en) Computer system and checkpoint information preserving method
JPS62224843A (en) Database medium content maintaining system
US20060004846A1 (en) Low-overhead relational database backup and restore operations
JP4428887B2 (en) Database system
JPH0594356A (en) On-memory table data fault restoration system
JP2708610B2 (en) Database log management processing method
JP4565860B2 (en) Data backup system
JPH03265951A (en) Trouble recovery type computer
JP2004171529A (en) Data backup system and data backup method
JP3822449B2 (en) Stack saving method, stack saving program, and highly reliable computer system
JPH01237716A (en) Volume switching system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060620

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060821

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061003