JP2004054615A - Program for restoring equivalence of multiplexed external memory - Google Patents

Program for restoring equivalence of multiplexed external memory Download PDF

Info

Publication number
JP2004054615A
JP2004054615A JP2002211436A JP2002211436A JP2004054615A JP 2004054615 A JP2004054615 A JP 2004054615A JP 2002211436 A JP2002211436 A JP 2002211436A JP 2002211436 A JP2002211436 A JP 2002211436A JP 2004054615 A JP2004054615 A JP 2004054615A
Authority
JP
Japan
Prior art keywords
external memory
processing
copy
equivalence
completed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002211436A
Other languages
Japanese (ja)
Inventor
Noriaki Shimizu
清水 典明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2002211436A priority Critical patent/JP2004054615A/en
Publication of JP2004054615A publication Critical patent/JP2004054615A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Stored Programmes (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To reduce the throughput of all initializing processes to a minimum when starting a computer system, by performing the process of restoring the equivalence of an external memory concurrently with the other initializing processes in a well-balanced manner. <P>SOLUTION: A set copy value obtained by associating the amount of copies by each operation with copying intervals is stored and the contents of the external memory of a master system are copied onto the external memory of a slave system according to the set copy value. When copying of an entire area is complete, it is determined whether or not the other initializing processes are all complete; the set copy value is reset in such a way that when the other initializing processes are all complete, the process of restoring the equivalence of the external memory is preferentially performed to increase the amount of copies by each operation while shortening the copying intervals; when not all the other initializing processes are complete, the reverse is done. Thus, the throughput of all the initializing processes can be brought close to a minimum each time the computer system is started. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
本発明は、多重化された外部メモリの等価性回復処理に関し、特に多重化された外部メモリの等価性回復処理時におけるコンピュータシステム全体のスループットを向上させる技術に関する。
【0002】
【従来の技術】
バンキングシステムなどに代表される、コンピュータシステムのトラブルが単に企業活動や特定の内部問題にとどまらず社会問題に発展するような社会システムにおいては、複数のコンピュータシステムを利用したロードシェアシステムの形態が多用され、高処理能力はもとより高信頼性が強く要求されている。このような社会システムでは、より高速、かつ高信頼なホットスタンバイシステムの構築を目的として、I/O命令を出さずに高速にアクセスできる大容量の外部メモリを、複数のコンピュータシステムが共用して使用するように構成する場合がある。
【0003】
外部メモリは高速なデータ転送能力、大きな記憶容量(例えば128GB)、メインメモリと同等のデータ保護機能、二重化機構、または四重化機構を備えた高信頼性、バッテリバックアップ機能などを備えていることを特徴としており、データベースの格納やページング・スーパバイザのページング域、ソートマージの作業域、プログラム間共用領域などの使用に向いている。多重化されている外部メモリには、それぞれ同一のデータが格納されており、この状態を外部メモリの等価性と呼ぶ。
【0004】
外部メモリを多重化している場合には、常に等価性が保証されていなければならない。等価性が保証されていると、多重化されているいずれかの外部メモリに障害が発生した場合、障害が発生した外部メモリをコンピュータシステムから切り離し、残りの外部メモリを使用して運用を継続することが可能となる。外部メモリに書き込み中に、外部メモリやコンピュータ(CPU)のハードウェア障害が発生すると、外部メモリの等価性が失われる可能性がある。この場合、障害が発生した外部メモリは、外部メモリを制御するプログラムが切り離しを行うが、外部メモリの切り離し処理が完了する前に計算機システムが停止してしまうと外部メモリは等価性を失ったままとなっている可能性がある。
【0005】
コンピュータシステムの立ち上げ時に、初期化処理の一環として正しい内容が保持されている外部メモリ(主系)の内容を、障害が発生した外部メモリ(従系)に複写することによって等価性を回復させることを外部メモリの等価性回復処理と呼ぶ。しかしながら、コンピュータシステムの立ち上げ時点において、従系の外部メモリに障害が発生し、等価性が失われている状態かどうかを判断することは非常に困難である。
【0006】
コンピュータに電源が投入され、コンピュータシステムが利用できるようにするためには、IPL(Initial Program Loading)プログラム、核の初期化プログラム、マスタスケジューラの初期化プログラム、サブシステムの起動プログラムなど様々な初期化プログラム群が実行される。高信頼性が要求される社会システムなどでは、外部メモリの等価性を保証するために等価性回復プログラムが初期化プログラム群の1プログラムとしてコンピュータシステムを立ち上げる度に実行するようにしている。
【0007】
外部メモリの等価性回復処理は、外部メモリに対するCPU命令を介して、直前の稼働時にその外部メモリが主系であったか従系であったかを問い合わせ、内容が保証されている主系の外部メモリの内容を従系の外部メモリへ複写することにより実施されている。外部メモリは、外部記憶装置をアクセスする場合と異なりI/O命令を出す必要がないためデータ転送速度が早い反面、外部メモリの等価性回復処理中はCPUを占有してしまい、他のCPU処理との並行動作ができない問題がある。
【0008】
この問題を解決するため、主系の外部メモリの内容を従系の外部メモリへ複写する際に、複写処理を複数回に分け、他の初期化処理と並行動作するように実現させたり、特開平8−202627号公報に記載の「二重化された共用メモリの等価性回復処理方法および装置」に開示されているように、外部メモリを複数の領域に分割し、特定のコンピュータシステムが他のコンピュータシステムに複写する領域を指示し、それぞれのコンピュータシステムは同期をとって割り当てられた外部メモリの領域を一斉に複写するようにしていた。
【0009】
【発明が解決しようとする課題】
外部メモリの等価性の回復処理をコンピュータシステム立ち上げ時における他の初期化処理と並行して実行させる場合、コンピュータシステムの立ち上げ時間を最短とするためには、コンピュータシステム毎に最適な1回当りの複写量と複写間隔時間を設定する必要がある。しかしながら、コンピュータシステム毎に最適な1回当りの複写量と複写間隔時間を見積もるためには、コンピュータシステムが有する資源量やシステムパラメタなど様々な要素を考慮する必要があり非常に煩雑で困難な作業である。
【0010】
また、特開平8−202627号公報に記載の「二重化された共用メモリの等価性回復処理方法および装置」では、特定のコンピュータシステムが他のコンピュータシステムに複写する領域を指示したり、それぞれのコンピュータシステムは同期をとって割り当てられた外部メモリの領域を一斉に複写するための複雑なプログラム処理が必要となる。また、外部メモリの等価性の回復処理と他の初期化処理とが並行動作するように制御しているのではないため、外部メモリの等価性の回復処理単独の処理時間は高速化するが、外部メモリの等価性の回復処理を含めたコンピュータシステムの立ち上げ時における初期化処理全体のスループットを最短にすることにはならない。
【0011】
今後、データベースのアクセスをより高速化させるためにデータベースを構成するすべてのファイルを外部メモリに展開する運用の増加は見込まれ、かつデータベースも年々巨大化する傾向にある。外部メモリの等価性の回復処理時間は外部メモリ量の大きさに比例して長くなるため、システム立ち上げ時における初期化処理の時間の増加は必至の状況である。
【0012】
本発明は、上記のような事情に鑑みて提案されたものであり、初期化処理が外部記憶装置からのプログラムのLOAD処理や、外部記憶装置に格納された情報をメインメモリに展開するなど多くのI/O動作を伴うことに着目し、CPU命令が中心の外部メモリの等価性回復処理と他の初期化処理とをバランスよく並行動作させ、かつコンピュータシステムを立ち上げる度に複写設定値を自動的に補正しながらシステムの初期化全体のスループットを最短にしていくことを目的としている。
【0013】
【課題を解決するための手段】
図1は本発明の実施の形態1の全体構成図を示すものである。本発明の多重化された外部メモリの等価性回復プログラム11は、コンピュータ1を用いて、システム管理者が設定した1回当りの複写量と複写間隔時間とを対応付けた複写設定値41に基づき前回のコンピュータシステムの稼働時に主系であった外部メモリ0(主系)2の内容を外部メモリ1(従系)3へ複写し、多重化された外部メモリの等価性回復処理を行うものである。
【0014】
等価性回復プログラム11は、コンピュータシステムの立ち上げ時における初期化プログラム群の1プログラムとして位置付けられ、1回当たりの複写量と複写間隔時間とを対応付けた複写設定値を記憶装置、例えばメインメモリ5上の複写制御テーブル51に記憶させる設定値記憶手段111と、前記複写設定値に基づいて、外部メモリ0(主系)2の内容を外部メモリ1(従系)3へCPU命令を使用して複写する複写手段112と、等価性回復処理が完了すると、例えばメッセージログに記憶されている初期化プログラムの完了メッセージを参照するなどして、等価性回復処理が完了した時点で等価性回復処理と並行動作している他の処理群が既に終了していると判断した場合には等価性回復処理を優先して実行させるように、完了していないと判断した場合には等価性回復処理と並行動作している他の処理群の実行優先度を上げるように複写設定値を再設定する再設定手段113として機能するものである。
【0015】
なお、本発明では、等価性回復処理と並行動作している他の処理群に対して等価性回復処理の実行優先度を上げるためには、一回の複写量を増加させる、複写間隔時間を短くする、または一回の複写量を増加させ、かつ複写間隔時間を短くすることにより実現させている。また等価性回復処理に対して等価性回復処理と並行動作している他の処理群の実行優先度を上げるためには、一回の複写量を減少させる、複写間隔時間を長くする、または一回の複写量を減少させ、かつ複写間隔時間を長くすることにより実現させている。
【0016】
以上のように本発明を構成することにより、最初に設定した複写設定値が順次、次のコンピュータシステムの立ち上げ時における等価性回復処理のために再設定されていくことになり、コンピュータシステムを立ち上げる度にCPU処理中心の等価性回復処理と多量のI/O動作を伴う他の初期化処理とがバランスよく並行動作することが可能となり、コンピュータシステムの立ち上げ時における初期化処理全体のスループットを最短に近づけていくことが可能となる。
【0017】
【発明の実施の形態】
図1は本発明の実施の形態1の全体構成図を示すものである。本発明に係るコンピュータ1では電源が投入されると、コンピュータシステムを立ち上げるためにIPLプログラム12、核の初期化プログラム13、MS(マスタースケジューラ)の初期化プログラム14、サブシステムの起動プログラム15など一連の初期化処理プログラム群10が実行される。
【0018】
等価性回復プログラム11は、コンピュータシステムの立ち上げ時における初期化プログラム群10の1プログラムとして位置付けられ、システム管理者が設定した1回当たりの複写量と複写間隔時間とを対応付けた複写設定値41をメインメモリ5上の複写制御テーブル51に記憶させる設定値記憶手段111と、複写制御テーブル51に基づいて、外部メモリ0(主系)2の内容を外部メモリ1(従系)3へCPU命令を使用して複写する複写手段112と、
等価性回復処理が完了すると、メッセージログに記憶されている初期化プログラムの完了メッセージを参照して、等価性回復処理が完了した時点で等価性回復処理と並行動作している他の処理群が既に終了していると判断した場合には1回当りの複写量を増加させ、かつ複写間隔時間を短くし、完了していないと判断した場合には1回当りの複写量を減少させ、かつ複写間隔時間を長くするように複写設定値41を再設定する再設定手段113として機能するものであり、コンピュータ読み取り可能な記録媒体に記録されている。
【0019】
外部メモリ0(主系)2は、データベースの格納やページング・スーパバイザのページング域、ソートマージの作業域などとして使用される。また、外部メモリ1(従系)3には、外部メモリ0(主系)2と同じデータが格納され等価性が保たれている。本実施の形態1では、外部メモリを二重化した例としているが、本発明は、多重化した場合にも適用可能である。
【0020】
外部記憶装置4には、初期化プログラム群10が使用するシステムパラメタ42や、オペレーティングシステム(OS)のプログラムなどを格納したプログラムファイル43、システム管理者が設定した等価性回復プログラム11が使用する外部メモリの複写を制御するための1回当りの複写量と複写間隔時間を含む複写設定値41が格納されている。
【0021】
コンピュータ1のメインメモリ5には、等価性回復プログラム11の設定値記憶手段111が、システム管理者が設定した複写設定値41を複写制御テーブル51として記憶させている。
図2は、等価性回復プログラム11が外部メモリの複写制御のために使用する複写設定値が格納される。1回当りの複写量には、外部メモリ0(主系)2の内容を複数回に分けて従系の外部メモリに複写する際の、例えば5メガバイトなど1回当りの複写量が、複写間隔時間には、次の複写処理までの例えば1秒など間隔時間が格納される。
【0022】
図3は、本発明に係る実施の形態1における多重化された外部メモリの等価性回復処理の流れを示したフローチャートである。START1は本処理のエントリであり、START2は複数回に分けた次の複写処理のために複写設定値で指定された複写間隔時間でタイマ値を設定しWAIT状態となり、タイマ割り込みにより再び等価性回復プログラムに制御を渡される時のエントリである。
【0023】
コンピュータシステム立ち上げ時において等価性回復プログラム11が制御を渡されると先ず、システム管理者が設定した1回当りの複写量と複写間隔時間を含む複写設定値を記憶する(S301)。1回当りの複写量に従って外部メモリ0(主系)2の内容を外部メモリ1(従系)3へCPU命令を使用して複写する(S302)。1回分の複写が完了すると、外部メモリの全領域の複写が完了したかどうかを複数に分割したそれぞれの領域の最終アドレスなどに基づき判断する(S303)。
【0024】
未だ全領域の複写が完了していない場合には、ハードウェアのウォッチドッグタイマ割り込みの機能を利用し、タイマ値に複写間隔時間を、ウォッチドッグタイマ割り込みが発生した時にブランチするエントリアドレスとしてSTART2を設定し、等価性回復プログラムに実行権を与えた他の初期化プログラムへ制御を渡す(S304)。
【0025】
外部メモリの全領域の複写が完了すると、他の初期化プログラムの処理がすでに完了しているかどうかを判定する(S305)。コンピュータシステムの立ち上げ時は、未だOSが形成されつつある状態であるため、OSの機能は使用できないものとして処理する。そのため各初期化処理プログラムはシリアルに実行し、並行動作を行うにしても、ハードウェアの持つ機能を利用した擬似的な並行動作とせざるを得ない。他の初期化処理が完了しているかどうかを判定するにもOSの機能は使用できないため、例えば最後に実行する初期化プログラムが完了したことを示すメッセージがメッセージログに出力されているかどうかなどで判断する。
【0026】
他のインプリメント方法として、メインメモリ5上に最後に実行する初期化プログラムの処理が完了した旨のフラグを設け、最後に実行する初期化プログラムは処理が完了すると、このフラグをオンにすることにより等価性回復プログラムが最後の初期化プログラムの処理が完了したかどうかを判断できるようにしてもよい。
【0027】
他の初期化プログラムの処理がすべて完了していると判断した場合には、等価性回復プログラムの処理が他の初期化処理の完了までに完了しなかったので、等価性回復プログラムの実行優先度を上げるため、例えば図2のaで示すように複写量および複写間隔時間の設定値がそれぞれ5メガバイト、1秒であった場合、図2のbで示すように1回当りの複写量を10メガバイトに増加させ、かつ複写間隔時間を0.7秒に短くすることにより、次のコンピュータシステム立ち上げ時に、単位時間当りの等価性回復プログラムの実行する割合が多くなるように複写設定値の再設定を行う(S306)。
【0028】
等価性回復プログラムは、他のいずれか1つの初期化プログラムとウォッチドッグタイマ割り込みを利用した擬似的な2多重の並行動作を行っているため、前回設定した1回当りの複写量を増加すれば、複写量の増加に応じて実行時間も増加するため、単位時間当りの等価性回復プログラムの実行する割合は多くなり、処理を完了させるための時間は短くなる。同様に、前回設定した複写間隔時間を減少すれば等価性回復プログラムが他の初期化プログラムの処理の実行に割り込む頻度が高まるため単位時間当りの等価性回復プログラムの実行する割合は多くなり、処理を完了させるための時間は短くなる。なお、複写間隔時間は、1回当りの外部メモリを複写するために必要な時間に比べて十分大きな値であることが前提となる。
【0029】
他の初期化プログラムの処理がすべて完了していないと判断した場合には、等価性回復プログラムの処理が他の初期化処理の完了までに完了していたことになるので、例えば図2のaで示すように複写量および複写間隔時間の設定値がそれぞれ5メガバイト、1秒であった場合、等価性回復プログラムの実行優先度を下げるため図2のcで示すように1回当りの複写量を4メガバイトに減少させ、かつ複写間隔時間を2秒に長くすることにより、次のコンピュータシステム立ち上げ時に、単位時間当りの等価性回復プログラムの実行する割合が少なくなるように複写設定値の再設定を行う(S307)。
【0030】
本発明を適用すると、一度システム管理者が経験上の知識に基づき複写設定値を設定するだけで、コンピュータシステムを立ち上げる毎に、そのコンピュータシステムに最適な複写設定値に向かって再設定されていくことになり、コンピュータシステム立ち上げ時における、等価性回復処理を含めた初期化処理のスループットを最小時間に近づけていくことが可能となる。
【0031】
(付記1) 複数回に分けて主系の外部メモリの内容を従系の外部メモリへ複写することにより、多重化された外部メモリの等価性回復処理を行うプログラムであって、
1回当たりの複写量と複写間隔時間とを対応付けた複写設定値を記憶装置に記憶させる設定値記憶手段と、
前記複写設定値に基づいて、主系の外部メモリの内容を従系の外部メモリへ複写する複写手段と、
前記等価性回復処理が完了すると、前記等価性回復処理と並行動作している他の処理群の処理が完了している場合には前記等価性回復処理を、完了していない場合には前記等価性回復処理と並行動作している他の処理群の実行優先度を上げるように前記複写設定値を再設定する再設定手段と
してコンピュータを機能させる外部メモリの等価性回復プログラム。
【0032】
(付記2) 前記再設定手段は、前記等価性回復処理の完了時に前記等価性回復処理と並行動作している他の処理群が完了している場合には、前記1回当りの複写量を大きく、完了していない場合には、前記1回当りの複写量を小さく再設定する付記1記載の外部メモリの等価性回復プログラム。
(付記3) 前記再設定手段は、前記等価性回復処理の完了時に前記等価性回復処理と並行動作している他の処理群が完了している場合には、前記複写間隔時間を短く、完了していない場合には、前記複写間隔時間を長く再設定する付記1、または付記2記載の外部メモリの等価性回復処理プログラム。
【0033】
(付記4) 複数回に分けて主系の外部メモリの内容を従系の外部メモリへ複写することにより、多重化された外部メモリの等価性回復処理を行うプログラムを記録した記録媒体であって、
1回当たりの複写量と複写間隔時間とを対応付けた複写設定値を記憶装置に記憶させる設定値記憶手段と、
前記複写設定値に基づいて、主系の外部メモリの内容を従系の外部メモリへ複写する複写手段と、
前記等価性回復処理が完了すると、前記等価性回復処理と並行動作している他の処理群の処理が完了している場合には前記等価性回復処理を、完了していない場合には前記等価性回復処理と並行動作している他の処理群の実行優先度を上げるように前記複写設定値を再設定する再設定手段と
してコンピュータを機能させる外部メモリの等価性回復プログラムを記録したコンピュータ読み取り可能な記録媒体。
【0034】
(付記5) 複数回に分けて主系の外部メモリの内容を従系の外部メモリへ複写することにより、多重化された外部メモリの等価性回復処理を行う装置であって、
1回当たりの複写量と複写間隔時間とを対応付けた複写設定値を記憶装置に記憶させる設定値記憶手段と、
前記複写設定値に基づいて、主系の外部メモリの内容を従系の外部メモリへ複写する複写手段と、
前記等価性回復処理が完了すると、前記等価性回復処理と並行動作している他の処理群の処理が完了している場合には前記等価性回復処理を、完了していない場合には前記等価性回復処理と並行動作している他の処理群の実行優先度を上げるように前記複写設定値を再設定する再設定手段と
を有することを特徴とする外部メモリの等価性回復装置。
(付記6) 複数回に分けて主系の外部メモリの内容を従系の外部メモリへ複写することにより、多重化された外部メモリの等価性回復処理を行う方法であって、
1回当たりの複写量と複写間隔時間とを対応付けた複写設定値を記憶装置に記憶させるステップと、
前記複写設定値に基づいて、主系の外部メモリの内容を従系の外部メモリへ複写するステップと、
前記等価性回復処理が完了すると、前記等価性回復処理と並行動作している他の処理群の処理が完了している場合には前記等価性回復処理を、完了していない場合には前記等価性回復処理と並行動作している他の処理群の実行優先度を上げるように前記複写設定値を再設定するステップと
を有する外部メモリの等価性回復処理方法。
【0035】
【発明の効果】
多重化されている外部メモリの等価性回復処理と前記外部メモリの等価性回復処理と並行動作している他の処理群とのコンピュータシステム全体のスループットを外部メモリの等価性回復処理を行う度に最短時間に近づけていくことが可能となる。
【図面の簡単な説明】
【図1】本発明の実施の形態1の全体構成図
【図2】本発明に係る複写制御テーブル
【図3】本発明に係る実施の形態1における多重化された外部メモリの等価性回復処理
【符号の説明】
1 コンピュータ
2 外部メモリ0
3 外部メモリ1
4 外部記憶装置
5 メインメモリ
10 初期化プログラム群
11 等価性回復プログラム
12 IPLプログラム
13 核の初期化プログラム
14 MSの初期化プログラム
15 サブシステムの起動プログラム
41 複写設定値
42 システムパラメタ
43 プログラムファイル
51 複写制御テーブル
111 設定値記憶手段
112 複写手段
113 再設定手段
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a resynchronization process for multiplexed external memories, and more particularly to a technique for improving the throughput of the entire computer system during the resynchronization process for multiplexed external memories.
[0002]
[Prior art]
In social systems, such as banking systems, in which computer system problems develop into social issues beyond just corporate activities or specific internal problems, the form of a load-sharing system using multiple computer systems is often used. Therefore, not only high processing capacity but also high reliability are strongly demanded. In such a social system, a plurality of computer systems share a large-capacity external memory that can be accessed at a high speed without issuing an I / O command for the purpose of constructing a hot standby system with higher speed and higher reliability. May be configured for use.
[0003]
The external memory has a high-speed data transfer capability, a large storage capacity (for example, 128 GB), a data protection function equivalent to that of the main memory, high reliability with a duplexing or quadrupling mechanism, a battery backup function, and the like. It is suitable for storage of a database, use of a paging area of a paging supervisor, a work area of a sort merge, a shared area between programs, and the like. The same data is stored in each of the multiplexed external memories, and this state is called equivalence of the external memories.
[0004]
When external memories are multiplexed, equivalence must always be guaranteed. If the equivalence is guaranteed, if any of the multiplexed external memories fails, the failed external memory is disconnected from the computer system and the operation continues using the remaining external memory. It becomes possible. If a hardware failure occurs in the external memory or the computer (CPU) during writing to the external memory, the equivalence of the external memory may be lost. In this case, the program that controls the external memory disconnects the failed external memory, but if the computer system stops before the external memory disconnection process is completed, the external memory remains lost in equivalence. It is possible that
[0005]
When the computer system starts up, the contents of the external memory (main system), which holds the correct contents as part of the initialization processing, are restored to the failed external memory (slave system) to restore the equivalence. This is called external memory equivalence restoration processing. However, when the computer system starts up, it is very difficult to determine whether a failure has occurred in the slave external memory and the equivalence has been lost.
[0006]
Various initializations, such as an IPL (Initial Program Loading) program, a nuclear initialization program, a master scheduler initialization program, and a subsystem startup program, are required to turn on the computer and use the computer system. The program group is executed. In a social system or the like that requires high reliability, the equivalence restoration program is executed each time the computer system is started up as one of the initialization programs in order to guarantee the equivalence of the external memory.
[0007]
In the resynchronization processing of the external memory, the CPU inquires whether the external memory was the main system or the sub system at the time of the previous operation via the CPU instruction to the external memory, and the contents of the main system external memory whose contents are guaranteed Is copied to a slave external memory. Since the external memory does not need to issue an I / O instruction unlike the case of accessing the external storage device, the data transfer speed is high, but the CPU is occupied during the resynchronization processing of the external memory, and other CPU processing is performed. There is a problem that parallel operation with is not possible.
[0008]
In order to solve this problem, when copying the contents of the main system external memory to the slave system external memory, the copying process is divided into a plurality of times and realized so as to operate in parallel with other initialization processes. As disclosed in "Method and Apparatus for Restoring Equivalence of Duplexed Shared Memory" in Japanese Unexamined Patent Publication No. Hei 8-202627, an external memory is divided into a plurality of areas, and a specific computer system is connected to another computer. An area to be copied is instructed to the system, and each computer system synchronously copies the allocated area of the external memory all at once.
[0009]
[Problems to be solved by the invention]
In a case where the restoration processing of the equivalence of the external memory is executed in parallel with other initialization processing at the time of starting the computer system, in order to minimize the start-up time of the computer system, the optimal one-time operation is performed for each computer system. It is necessary to set the copy amount per copy and the copy interval time. However, in order to estimate the optimal copying amount and copying interval time for each computer system, it is necessary to consider various factors such as the amount of resources of the computer system and system parameters, which is a very complicated and difficult task. It is.
[0010]
Japanese Patent Application Laid-Open No. 8-202627 discloses a "method and apparatus for restoring the equivalence of a duplicated shared memory". The system requires complicated program processing for simultaneously copying the areas of the external memory allocated synchronously. Also, since the restoration processing of the equivalence of the external memory and the other initialization processing are not controlled so as to operate in parallel, the processing time of the restoration processing of the external memory equivalence alone becomes faster, This does not minimize the throughput of the entire initialization process at the time of starting the computer system, including the process of restoring the equivalence of the external memory.
[0011]
In the future, it is expected that the number of operations for expanding all the files constituting the database to an external memory in order to further speed up the access to the database will be increased, and the size of the database will tend to increase year by year. Since the restoration processing time of the equivalence of the external memory becomes longer in proportion to the amount of the external memory, the time for the initialization processing at the time of starting the system is inevitably increased.
[0012]
The present invention has been proposed in view of the above-described circumstances, and the initialization process includes a LOAD process of a program from an external storage device, and expansion of information stored in the external storage device to a main memory. Of the I / O operation, the CPU restores the equivalence recovery processing of the external memory, which is mainly performed by the CPU instruction, and the other initialization processing in a well-balanced parallel operation, and sets the copy setting value every time the computer system is started. The goal is to minimize the overall system initialization throughput while automatically correcting.
[0013]
[Means for Solving the Problems]
FIG. 1 shows an overall configuration diagram of Embodiment 1 of the present invention. The multiplexed external memory equivalence restoration program 11 of the present invention uses the computer 1 based on a copy setting value 41 which associates a copy amount per copy with a copy interval time set by a system administrator. The contents of the external memory 0 (main system) 2 which was the main system at the time of the previous operation of the computer system are copied to the external memory 1 (sub system) 3, and the resynchronization processing of the multiplexed external memories is performed. is there.
[0014]
The equivalence restoration program 11 is positioned as one program of an initialization program group when the computer system is started, and stores a copy setting value in which a copy amount per copy is associated with a copy interval time, for example, a main memory. The setting value storage unit 111 stores the contents of the external memory 0 (main system) 2 to the external memory 1 (sub system) 3 based on the copy setting values using a CPU instruction. When the resynchronization processing is completed, the resynchronization processing is completed when the resynchronization processing is completed, for example, by referring to the completion message of the initialization program stored in the message log when the resynchronization processing is completed. If it is determined that another process group operating in parallel with the process has already been completed, the When it is determined that no is to function as a resetting means 113 for resetting the copy setting value so as to increase the execution priority of the other treatment groups are operated in parallel with the resynchronization process.
[0015]
In the present invention, in order to increase the execution priority of the equivalence restoration processing with respect to other processing groups operating in parallel with the equivalence restoration processing, the amount of one copy is increased, and the copy interval time is increased. This is realized by shortening or increasing the amount of one copy and shortening the copy interval time. Also, in order to increase the execution priority of another processing group operating in parallel with the equivalence restoration processing, the amount of copying at one time can be reduced, the copy interval time can be increased, or This is achieved by reducing the amount of copying each time and increasing the copying interval time.
[0016]
By configuring the present invention as described above, the initially set copy setting values are sequentially reset for the equivalence restoration processing at the time of starting the next computer system. Each time the computer is started up, the equivalence restoration processing centered on the CPU processing and the other initialization processing involving a large amount of I / O operations can be performed in parallel in a well-balanced manner. Throughput can be reduced to the shortest.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
FIG. 1 shows an overall configuration diagram of Embodiment 1 of the present invention. In the computer 1 according to the present invention, when the power is turned on, an IPL program 12, a nuclear initialization program 13, an MS (master scheduler) initialization program 14, a subsystem activation program 15, etc. A series of initialization processing programs 10 is executed.
[0018]
The equivalence restoration program 11 is positioned as one program of the initialization program group 10 when the computer system is started up, and a copy setting value that associates a copy amount per copy and a copy interval time set by a system administrator. Based on the copy control table 51, the contents of the external memory 0 (main system) 2 are transferred to the external memory 1 (sub system) 3 based on the copy control table 51. Copying means 112 for copying using instructions;
When the resynchronization processing is completed, another processing group that is operating in parallel with the resynchronization processing when the resynchronization processing is completed is referred to by referring to the completion message of the initialization program stored in the message log. If it is determined that the copying has been completed, the copying amount per copy is increased, and the copying interval time is shortened. If it is determined that the copying has not been completed, the copying amount per copy is reduced, and It functions as resetting means 113 for resetting the copy set value 41 so as to lengthen the copy interval time, and is recorded on a computer-readable recording medium.
[0019]
The external memory 0 (main system) 2 is used as a storage area of a database, a paging area of a paging supervisor, a work area of sort merge, and the like. Further, the same data as the external memory 0 (main system) 2 is stored in the external memory 1 (sub system) 3 and the equivalence is maintained. Although the first embodiment is an example in which the external memory is duplicated, the present invention can be applied to a case where the external memory is multiplexed.
[0020]
The external storage device 4 includes a system parameter 42 used by the initialization program group 10, a program file 43 storing an operating system (OS) program and the like, and an external device used by the equivalence restoration program 11 set by the system administrator. A copy setting value 41 including a copy amount per one time and a copy interval time for controlling memory copy is stored.
[0021]
In the main memory 5 of the computer 1, the set value storage unit 111 of the equivalence restoration program 11 stores a copy set value 41 set by a system administrator as a copy control table 51.
FIG. 2 stores copy setting values used by the equivalence restoration program 11 for copy control of the external memory. The copy amount per copy is the copy amount per copy, such as 5 megabytes, when the contents of the external memory 0 (main system) 2 are copied into the external memory of the sub system in a plurality of times. In the time, an interval time, for example, one second, until the next copy processing is stored.
[0022]
FIG. 3 is a flowchart showing the flow of the resynchronization processing of the multiplexed external memory according to the first embodiment of the present invention. START1 is an entry of this processing, and START2 sets a timer value at a copy interval time specified by a copy setting value for the next copy processing divided into a plurality of times, enters a WAIT state, and restores equivalence by a timer interrupt. This is the entry when control is passed to the program.
[0023]
When the resynchronization program 11 is given control when the computer system is started, first, a copy set value including a copy amount and a copy interval time set by the system administrator is stored (S301). The contents of the external memory 0 (main system) 2 are copied to the external memory 1 (sub system) 3 using a CPU instruction according to the amount of copying per time (S302). When one copy is completed, it is determined whether or not the copy of the entire area of the external memory is completed based on the final address of each of the plurality of divided areas (S303).
[0024]
If the copying of the entire area has not been completed yet, use the watchdog timer interrupt function of the hardware and set the timer value to the copy interval time and START2 as the entry address to branch to when the watchdog timer interrupt occurs. Then, control is passed to another initialization program that has given the execution right to the equivalence restoration program (S304).
[0025]
When the copying of the entire area of the external memory is completed, it is determined whether or not the processing of another initialization program has already been completed (S305). When the computer system is started up, an OS is still being formed, so that the processing of the OS is assumed to be unusable. Therefore, even if each initialization processing program is executed serially and performs a parallel operation, it must be a pseudo-parallel operation using a function of hardware. Since the OS function cannot be used to determine whether or not other initialization processing has been completed, for example, whether or not a message indicating that the initialization program to be executed last has been completed has been output to the message log. to decide.
[0026]
As another implementation method, a flag is provided on the main memory 5 to the effect that the processing of the initialization program to be executed last is completed, and when the processing of the initialization program to be executed last is completed, this flag is turned on. The resynchronization program may be able to determine whether or not the processing of the last initialization program has been completed.
[0027]
If it is determined that the processing of the other initialization programs has been completed, the processing of the resynchronization program has not been completed by the completion of the other initialization processing. For example, if the set values of the copy amount and the copy interval time are 5 megabytes and 1 second, respectively, as shown in FIG. 2A, the copy amount per time is set to 10 as shown in FIG. By increasing the copy interval to 0.7 megabytes and shortening the copy interval time to 0.7 seconds, the copy set value is reset so that the ratio of executing the resynchronization program per unit time increases at the next startup of the computer system. Settings are made (S306).
[0028]
Since the resynchronization program performs a pseudo two-way parallel operation using any one of the other initialization programs and the watchdog timer interrupt, if the copy amount per one time set previously is increased, Since the execution time increases as the copy amount increases, the ratio of executing the equivalence restoration program per unit time increases, and the time for completing the processing decreases. Similarly, if the previously set copy interval time is reduced, the frequency at which the resynchronization program interrupts the execution of the processing of other initialization programs increases, so that the ratio of execution of the resynchronization program per unit time increases. The time to complete is shorter. It is assumed that the copy interval time is a sufficiently large value as compared with the time required for copying the external memory at one time.
[0029]
If it is determined that all the processes of the other initialization programs have not been completed, it means that the processes of the equivalence recovery program have been completed before the completion of the other initialization processes. If the set values of the copy amount and the copy interval time are 5 megabytes and 1 second, respectively, as shown by, the copy amount per time as shown by c in FIG. 2 to lower the execution priority of the equivalence restoration program Is reduced to 4 megabytes and the copy interval time is increased to 2 seconds, so that the next time the computer system is started up, the copy set value is reset so that the ratio of executing the resynchronization program per unit time is reduced. The setting is performed (S307).
[0030]
When the present invention is applied, once the system administrator only sets the copy setting value based on experience, every time the computer system is started, the copy setting value is reset toward the optimum copy setting value for the computer system. As a result, the throughput of the initialization processing including the equivalence restoration processing at the time of starting the computer system can be made closer to the minimum time.
[0031]
(Supplementary Note 1) A program for performing equivalence restoration processing of a multiplexed external memory by copying the content of a main external memory into a plurality of subordinate external memories in a plurality of times,
Setting value storage means for storing, in a storage device, a copy set value in which a copy amount per one time and a copy interval time are associated;
Copying means for copying the contents of the main system external memory to the slave system external memory based on the copy setting value;
When the resynchronization processing is completed, the resynchronization processing is completed when the processing of another processing group operating in parallel with the resynchronization processing is completed, and when the processing is not completed, the equivalence recovery processing is completed. An external memory equivalence recovery program for causing a computer to function as resetting means for resetting the copy setting value so as to increase the execution priority of another processing group operating in parallel with the sex recovery processing.
[0032]
(Supplementary Note 2) If the other processing group operating in parallel with the equivalence restoration processing has been completed at the time of completion of the equivalence restoration processing, the resetting means may determine the copy amount per time. 2. The resynchronization program for an external memory according to claim 1, wherein if it is large and not completed, the copy amount per one time is reset to a small value.
(Supplementary Note 3) The resetting means shortens the copy interval time if the other processing group operating in parallel with the equivalence restoration processing is completed at the completion of the equivalence restoration processing. The resynchronization processing program for an external memory according to Supplementary note 1 or 2, wherein the copying interval time is reset to be longer if the copying has not been performed.
[0033]
(Supplementary Note 4) A recording medium which records a program for performing equivalence restoration processing of a multiplexed external memory by copying contents of a main external memory into a subordinate external memory in a plurality of times. ,
Setting value storage means for storing, in a storage device, a copy set value in which a copy amount per one time and a copy interval time are associated;
Copying means for copying the contents of the main system external memory to the slave system external memory based on the copy setting value;
When the resynchronization processing is completed, the resynchronization processing is completed when the processing of another processing group operating in parallel with the resynchronization processing is completed, and when the processing is not completed, the equivalence recovery processing is completed. A computer readable recording a resynchronization program of an external memory that causes a computer to function as resetting means for resetting the copy setting value so as to raise the execution priority of another processing group operating in parallel with the resilience processing Recording medium.
[0034]
(Supplementary Note 5) An apparatus for performing a resynchronization process on a multiplexed external memory by copying the content of a main external memory into a subordinate external memory in a plurality of times,
Setting value storage means for storing, in a storage device, a copy set value in which a copy amount per one time and a copy interval time are associated;
Copying means for copying the contents of the main system external memory to the slave system external memory based on the copy setting value;
When the resynchronization processing is completed, the resynchronization processing is completed when the processing of another processing group operating in parallel with the resynchronization processing is completed, and when the processing is not completed, the equivalence recovery processing is completed. Resetting means for resetting the copy setting value so as to increase the execution priority of another process group operating in parallel with the sex recovery process.
(Supplementary Note 6) A method of performing equivalence restoration processing of a multiplexed external memory by copying the contents of a main external memory into a plurality of subordinate external memories in a plurality of times,
Storing in a storage device a copy setting value in which a copy amount per copy and a copy interval time are associated;
Copying the contents of the master external memory to the slave external memory based on the copy setting value;
When the resynchronization processing is completed, the resynchronization processing is completed if the processing of another processing group operating in parallel with the resynchronization processing is completed, and if the processing is not completed, the equivalence recovery processing is completed. Resetting the copy setting value so as to increase the execution priority of another process group operating in parallel with the sex recovery process.
[0035]
【The invention's effect】
The throughput of the entire computer system with the resynchronization processing of the multiplexed external memory and the other processing groups operating in parallel with the resynchronization processing of the external memory is increased every time the resynchronization processing of the external memory is performed. It becomes possible to approach the shortest time.
[Brief description of the drawings]
FIG. 1 is an overall configuration diagram of a first embodiment of the present invention; FIG. 2 is a copy control table according to the present invention; FIG. [Explanation of symbols]
1 Computer 2 External memory 0
3 External memory 1
Reference Signs List 4 external storage device 5 main memory 10 initialization program group 11 resynchronization program 12 IPL program 13 nuclear initialization program 14 MS initialization program 15 subsystem startup program 41 copy setting value 42 system parameter 43 program file 51 copy Control table 111 setting value storage means 112 copying means 113 resetting means

Claims (3)

複数回に分けて主系の外部メモリの内容を従系の外部メモリへ複写することにより、多重化された外部メモリの等価性回復処理を行うプログラムであって、
1回当たりの複写量と複写間隔時間とを対応付けた複写設定値を記憶装置に記憶させる設定値記憶手段と、
前記複写設定値に基づいて、主系の外部メモリの内容を従系の外部メモリへ複写する複写手段と、
前記等価性回復処理が完了すると、前記等価性回復処理と並行動作している他の処理群の処理が完了している場合には前記等価性回復処理を、完了していない場合には前記等価性回復処理と並行動作している他の処理群の実行優先度を上げるように前記複写設定値を再設定する再設定手段と
してコンピュータを機能させる外部メモリの等価性回復プログラム。
A program for performing a resynchronization process of the multiplexed external memory by copying the contents of the main external memory into the subordinate external memory in a plurality of times,
Setting value storage means for storing, in a storage device, a copy setting value in which a copy amount per copy and a copy interval time are associated;
Copying means for copying the contents of the main system external memory to the slave system external memory based on the copy setting value;
When the resynchronization processing is completed, the resynchronization processing is completed if the processing of another processing group operating in parallel with the resynchronization processing is completed, and if the processing is not completed, the equivalence recovery processing is completed. An external memory equivalence recovery program for causing a computer to function as resetting means for resetting the copy setting value so as to increase the execution priority of another processing group operating in parallel with the sex recovery processing.
前記再設定手段は、前記等価性回復処理の完了時に前記等価性回復処理と並行動作している他の処理群が完了している場合には、前記1回当りの複写量を大きく、完了していない場合には、前記1回当りの複写量を小さく再設定する請求項1記載の外部メモリの等価性回復プログラム。The resetting means increases the amount of copy per one time when the other processing group operating in parallel with the equivalence recovery processing is completed at the time of completion of the equivalence recovery processing, and 2. The external memory equivalence restoration program according to claim 1, wherein if not, the copy amount per one time is reset to a small value. 前記再設定手段は、前記等価性回復処理の完了時に前記等価性回復処理と並行動作している他の処理群が完了している場合には、前記複写間隔時間を短く、完了していない場合には、前記複写間隔時間を長く再設定する請求項1、または請求項2記載の外部メモリの等価性回復プログラム。The resetting means shortens the copy interval time when another processing group operating in parallel with the equivalence recovery processing is completed when the equivalence recovery processing is completed, and 3. The resynchronization program for an external memory according to claim 1, wherein the copying interval time is reset long.
JP2002211436A 2002-07-19 2002-07-19 Program for restoring equivalence of multiplexed external memory Withdrawn JP2004054615A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002211436A JP2004054615A (en) 2002-07-19 2002-07-19 Program for restoring equivalence of multiplexed external memory

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002211436A JP2004054615A (en) 2002-07-19 2002-07-19 Program for restoring equivalence of multiplexed external memory

Publications (1)

Publication Number Publication Date
JP2004054615A true JP2004054615A (en) 2004-02-19

Family

ID=31934675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002211436A Withdrawn JP2004054615A (en) 2002-07-19 2002-07-19 Program for restoring equivalence of multiplexed external memory

Country Status (1)

Country Link
JP (1) JP2004054615A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102550A (en) * 2005-10-05 2007-04-19 Toshiba Corp Data backup system
JP2014130418A (en) * 2012-12-28 2014-07-10 Nec Computertechno Ltd Memory mirroring device, memory mirroring method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007102550A (en) * 2005-10-05 2007-04-19 Toshiba Corp Data backup system
JP2014130418A (en) * 2012-12-28 2014-07-10 Nec Computertechno Ltd Memory mirroring device, memory mirroring method and program

Similar Documents

Publication Publication Date Title
US8307363B2 (en) Virtual machine system, restarting method of virtual machine and system
CN100383739C (en) Mirror starting optimization of built-in operation system
JPH09138754A (en) Distributed check point generation method and computer system to which the method is applied
JPH03278126A (en) Computer system starting system
WO2016018262A1 (en) Storage transactions
CA2530013A1 (en) A fault tolerant computer system and a synchronization method for the same
JP4491482B2 (en) Failure recovery method, computer, cluster system, management computer, and failure recovery program
JPH07311749A (en) Multiprocessor system and kernel substituting method
WO2015043155A1 (en) Method and device for network element backup and recovery based on command set
JP6123388B2 (en) Fault tolerant server
US20130254446A1 (en) Memory Management Method and Device for Distributed Computer System
JP2004054615A (en) Program for restoring equivalence of multiplexed external memory
US9952941B2 (en) Elastic virtual multipath resource access using sequestered partitions
JP3253473B2 (en) Method and apparatus for resynchronization processing of duplicated shared memory
CN114756355A (en) Method and device for automatically and quickly recovering process of computer operating system
JP6146092B2 (en) Virtualization system, virtual server, virtual machine control method, and virtual machine control program
EP3293635B1 (en) Electronic device and method of controlling the same
US20190073128A1 (en) Computer system, data management method, and data management program
JPH09160773A (en) Microprogram exchanging method in multiprocessor system
JPH03265951A (en) Trouble recovery type computer
JP5703860B2 (en) Fault tolerant system, memory control method, and program
TWI763331B (en) Backup method and backup system for virtual machine
JP2003330737A (en) Computer system
JP6981098B2 (en) Recovery control device, recovery control system, recovery control method, and recovery control program
JP2013020566A (en) Duplex information processing system

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040610

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040610

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20051004