JPH09128258A - Resynchronization resetting processing method for computer system - Google Patents

Resynchronization resetting processing method for computer system

Info

Publication number
JPH09128258A
JPH09128258A JP7280270A JP28027095A JPH09128258A JP H09128258 A JPH09128258 A JP H09128258A JP 7280270 A JP7280270 A JP 7280270A JP 28027095 A JP28027095 A JP 28027095A JP H09128258 A JPH09128258 A JP H09128258A
Authority
JP
Japan
Prior art keywords
cache
cpu
way
reset
synchronous operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7280270A
Other languages
Japanese (ja)
Inventor
Nobuo Akeura
伸夫 明浦
Masayuki Kobayashi
正幸 小林
Kazuhiro Akata
一弘 赤田
Haruhiko Ohashi
晴彦 大橋
Mutsuhiro Yokoyama
睦裕 横山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP7280270A priority Critical patent/JPH09128258A/en
Publication of JPH09128258A publication Critical patent/JPH09128258A/en
Pending legal-status Critical Current

Links

Landscapes

  • Retry When Errors Occur (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Abstract

PROBLEM TO BE SOLVED: To eliminate the need to initialize a cache in a resynchronization resetting processing when a CPU part which has recovered from a fault is incorporated again. SOLUTION: When a system is restarted up, CPU parts 100 and 110 of both systems A and B inhibit, for example, the ways 1 of caches 103 and 113 to be used and enable ways 0 to be used, thereby starting synchronous operation. Then if, for example, the CPU part 110 gets out of order and recovers and an IPL processing is executed by temporarily resetting the CPUs 100 and 110 so as to incorporate it in the system again and perform the synchronous operation, the way use inhibition of the caches 103 and 113 is inverted into enable the ways to be used, and the synchronous operation is restarted. Here, the ways 1 are inhibited from being used so far, so the initialization is secured and they need not be initialized on purpose.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は複数のCPU部が同
期して運転する方式のコンピュータシステムにおいて、
障害などで一旦システムから切り離されたCPU部を再
びシステムに組み込み、同期運転を復活させるための再
同期リセット処理の高速化に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a computer system in which a plurality of CPU units operate in synchronization with each other.
The present invention relates to speeding up of resynchronization reset processing for resuming synchronous operation by incorporating a CPU unit once separated from the system due to a failure into the system again.

【0002】[0002]

【従来の技術】複数のCPU部によって同一処理を同期
して運転(デュアル動作)させることで、1つのCPU
部に障害が発生しても、これを切り離したあと、残るC
PU部によってオンライン業務等を継続することが可能
であり、フォールトトレラントコンピュータに広く応用
されている。
2. Description of the Related Art One CPU can be operated by synchronously operating (dual operation) the same processing by a plurality of CPU sections.
Even if a part fails, it will remain after the disconnection C
It is possible to continue online business by the PU unit, and is widely applied to fault tolerant computers.

【0003】この種のコンピュータシステムでは、障害
が発生したCPU部の修理・交換を、活線交換などによ
ってオンライン業務中に実施する。そして、修理等が終
了したCPU部は、システムからのパワーオンにより、
プロセッサ、キャッシュ及び主記憶として使用するメモ
リ(以下、これをMSと略す)を診断・初期化する。こ
の処理は、各CPU部のROM内に格納した、IPL処
理プログラムの一部が実施する方式が一般的である。こ
の診断・初期化処理が正常に終了すると、当該CPU部
は他のCPU部に組み込み準備完了であることを通知し
て組み込み待機となる。一方、これを検知した他のCP
U部は、オンライン業務等を継続しながら、このCPU
部を再びシステムに組み込む処理、即ち、再同期リセッ
ト処理を実行する。
In this type of computer system, repair / replacement of a faulty CPU portion is carried out during online work by hot line replacement or the like. Then, the CPU, which has been repaired, is powered on by the system,
A processor, a cache, and a memory used as a main memory (hereinafter, abbreviated as MS) are diagnosed and initialized. This processing is generally performed by a part of the IPL processing program stored in the ROM of each CPU unit. When the diagnosis / initialization process is completed normally, the CPU section notifies other CPU sections that the preparation for the installation is completed, and enters the stand-by status for the installation. On the other hand, another CP that detected this
Department U uses this CPU while continuing online operations.
The process of incorporating the unit into the system again, that is, the resynchronization reset process is executed.

【0004】再同期リセット処理とは、オンライン業務
等を継続している他のCPU部と組み込むCPU部の同
期を取り、デュアル動作を復旧させるための処理であ
る。ここで、複数のCPU部が同一処理を同期して実行
するためには、全CPU部が同一アドレスの命令を常に
実行することが必要である。このため、全CPU部のキ
ャッシュとMSの内容はすべて一致していることが必要
である。ところが、特にキャッシュは、そのエントリの
内容が動的に変化するため、診断・初期化を終了して再
度システムに組み込まれるのを待っているCPU部と、
オンライン業務等を継続しているCPU部では、全くキ
ャッシュ内部の状態が異なる。これを一致させ、再び同
期運転を復活させるためには、全CPUのキャッシュが
初期化される必要がある。
The resynchronization reset process is a process for synchronizing the CPU unit to be incorporated with another CPU unit that continues the online business etc. and restoring the dual operation. Here, in order for a plurality of CPU units to execute the same processing in synchronization, it is necessary that all the CPU units always execute the instruction of the same address. For this reason, it is necessary that the caches of all CPU parts and the contents of MS all match. However, especially in the cache, since the contents of the entry dynamically change, there is a CPU unit waiting for the diagnosis / initialization to be completed and to be installed in the system again.
In the CPU unit that continues online business, the internal state of the cache is completely different. The caches of all the CPUs need to be initialized in order to match them and restore synchronous operation again.

【0005】一般に再同期リセット処理では、オンライ
ン業務等を実施しているCPU部が、組み込むCPU部
の組み込み準備完了を検知すると、続行中の処理情報
(レジスタ、その他の情報)を退避し、系間制御部を介
して、一旦全CPU部にリセットを発行する方法が広く
取られている。全CPU部にリセットがかかると、各プ
ロセッサはIPL処理を実行する。これにより、全CP
U部がROM内のIPL処理を実行し始めるので、命令
実行の同期が取れたことになる。
Generally, in the resynchronization reset process, when the CPU unit performing an online operation or the like detects that the CPU unit to be incorporated is ready to be incorporated, the ongoing process information (register, other information) is saved, and the system A method of once issuing a reset to all the CPU units via the inter-controller is widely used. When all the CPU units are reset, each processor executes the IPL process. As a result, all CP
Since the U unit starts executing the IPL process in the ROM, the instruction execution is synchronized.

【0006】従来技術では、このIPL処理において、
プロセッサの診断・初期化を行った後、引き続いてキャ
ッシュの診断・初期化を実行していた。これにより、全
CPU部のキャッシュが初期化されることになるので、
すべてのエントリの内容が一致したことになる。ここ
で、各プロセッサはキャッシュ使用状態に切り替える。
その後、退避しておいた続行中の処理情報を復帰して、
中断していたオンライン業務を再開する。
In the prior art, in this IPL processing,
After diagnosing / initializing the processor, the cache was subsequently diagnosed / initialized. As a result, the caches of all CPU parts will be initialized.
The contents of all entries match. Here, each processor switches to the cache use state.
After that, restore the saved ongoing processing information,
Resume the suspended online business.

【0007】[0007]

【発明が解決しようとする課題】上記従来技術では、再
同期リセットを全CPU部に発行することによって、命
令実行についての同期とキャッシュ状態の一致は確かに
とれるが、プロセッサとキャッシュの診断・初期化は、
ROM内から直接命令をフェッチしながら実行している
ので処理時間がかかってしまう。特に近年キャッシュの
大容量化が進んで、キャッシュの診断・初期化にかかる
時間もこれに合わせて増加している。
In the above-mentioned prior art, by issuing a resynchronization reset to all CPU units, it is possible to surely synchronize the instruction execution with the cache state. Is
Since it is executed while fetching the instruction directly from the ROM, it takes processing time. Particularly in recent years, as the capacity of caches has increased, the time required for cache diagnosis / initialization has increased accordingly.

【0008】故障したCPU部を復帰させるため一旦オ
ンライン業務等を中断し、全CPUにリセットを発行し
て、各プロセッサにIPL処理を実行せしめることは、
同期動作を保証するうえで非常に有効である。しかし、
この再同期リセット処理期間をできるだけ短時間としな
ければ、処理の中断がオンライン業務に悪影響を与える
ことは明白である。
In order to restore the faulty CPU unit, it is possible to suspend the online work etc., issue a reset to all CPUs, and have each processor execute the IPL processing.
It is very effective in guaranteeing synchronous operation. But,
If this resynchronization reset processing period is not set as short as possible, it is obvious that interruption of processing adversely affects online business.

【0009】本発明は、キャッシュを持つプロセッサの
デュアル動作によるフォールトトレラントコンピュータ
のCPU部の再組み込み動作において、キャッシュの診
断・初期化を再同期リセット処理時に不要とする方法を
提供することにある。
It is an object of the present invention to provide a method for eliminating the cache diagnosis / initialization during the resynchronization reset process in the re-installation operation of the CPU part of the fault tolerant computer by the dual operation of the processor having the cache.

【0010】[0010]

【課題を解決するための手段】請求項1の発明では、シ
ステムの立ち上げ時、各CPUの全キャッシュウェイを
初期化した後、それぞれ特定のキャッシュウェイを使用
禁止にして同期運転を開始する。その後、あるCPU部
にて障害などが発生し、修理が終了して該CPU部をシ
ステムに再組み込みするため、全CPUを一旦リセット
して同期運転を復活させる際、キャッシュウェイの使用
禁止を反転し、それまで使用禁止にしていたキャッシュ
ウェイを使用可能にして同期運転を再開せしめる。この
キャッシュウェイは初期化されたままであるため、再同
期リセット処理時の診断・初期化は不要である。
According to the first aspect of the present invention, when all the cache ways of each CPU are initialized when the system is started up, a specific cache way is disabled and a synchronous operation is started. After that, when a failure occurs in a certain CPU unit and repair is completed and the CPU unit is re-installed in the system, when all CPUs are reset once and the synchronous operation is restored, the use prohibition of the cache way is reversed. Then, the cache way, which has been disabled until then, can be enabled and the synchronous operation can be restarted. Since this cache way remains initialized, it is not necessary to perform diagnosis / initialization during the resynchronization reset process.

【0011】請求項2の発明では、システムの立ち上げ
時、各CPUの全キャッシュウェイを初期化した後、そ
れぞれ全キャッシュウェイを使用可能にして同期運転を
開始する。そして、あるCPUにて障害などが発生し、
修理が終了して、該CPU部をシステムに再組み込みす
る際の準備段階において、他の処理中のCPU部は、そ
の特定のキャッシュウェイを使用禁止にして処理を続行
し、該処理の合間に周期的に前記特定のキャッシュウェ
イを所定エントリ数ずつ初期化する。そして、該処理中
のCPU部にて、前記特定のキャッシュウェイの初期化
がすべて終了した段階で、全CPU部を一旦リセット
し、再同期リセット処理においてキャッシュウェイの使
用禁止を反転して、前記初期化が終了した特定のキャッ
シュウェイを使用可能にして同期運転を再開する。この
同期運転の再開後、あらたに使用禁止となったキャッシ
ュウェイを、同期処理の合間に周期的に所定エントリ数
ずつ初期化し、該キャッシュウェイの初期化がすべて終
了した段階で、再び全キャッシュウェイを使用可能にし
て、同期運転を続行する。これにより、オンライン業務
等の中断を極力さけつつ、全ウェイのキャッシュエント
リが使用可能となる。
According to the second aspect of the present invention, when the system is started up, after all cache ways of each CPU are initialized, all cache ways are enabled and synchronous operation is started. Then, a failure occurs in a certain CPU,
At the preparatory stage when the repair is completed and the CPU unit is re-installed in the system, the CPU unit in the process of other processing disables the specific cache way and continues the process, and in between the processes. The specific cache way is periodically initialized by a predetermined number of entries. Then, in the CPU unit in the process, when all the initialization of the specific cache way is completed, all the CPU units are reset once, and the prohibition of use of the cache way is reversed in the resynchronization reset process, The specific cache way whose initialization has been completed is enabled and the synchronous operation is restarted. After this synchronous operation is restarted, the newly disabled cache ways are periodically initialized by a predetermined number of entries between synchronization processes, and when all the cache ways have been initialized, all cache ways are restarted. Enable to continue synchronous operation. As a result, the cache entries of all ways can be used while avoiding interruption of online business as much as possible.

【0012】[0012]

【発明の実施の形態】図1に、本発明で対象とするコン
ピュータシステムの構成例を示す。ここでは、CPU部
を100と110の2重化とし、この2つのCPU部1
00,110が同一処理を同期して実行するデュアル構
成を取っているとする。説明の便宜上、100をA系C
PU部、110をB系CPU部と呼ぶことにする。12
0は系間制御部であり、CPU部100と110が同一
処理を同期して実行しているか、また互いのCPU部が
どういう状態にあるかなどを管理/監視している。
1 shows an example of the configuration of a computer system to which the present invention is applied. Here, the CPU section is duplicated with 100 and 110, and these two CPU sections 1
It is assumed that 00 and 110 have a dual configuration in which the same processing is synchronously executed. For convenience of explanation, 100 is A system C
The PU unit 110 will be referred to as the B system CPU unit. 12
Reference numeral 0 denotes an inter-system control unit, which manages / monitors whether the CPU units 100 and 110 execute the same processing in synchronization with each other, and in what state the mutual CPU units are.

【0013】ここで、A系とB系の構成は対称であるの
で、各構成要素はA系CPU部100をもって説明す
る。101はプロセッサであり、キャッシュ制御部10
2を経由してキャッシュ103を接続している。本実施
例では、キャッシュ103は104と105を各ウェイ
(0ウェイ、1ウェイ)とする2ウェイセットアソシア
ティブキャッシュ構成を取っている。106はプロセッ
サ101が主記憶として使用するメモリ(MS)、10
7はIPL処理プログラムを格納するROMである。
Since the configurations of the A system and the B system are symmetrical, each component will be described by using the A system CPU section 100. Reference numeral 101 is a processor, and the cache control unit 10
The cache 103 is connected via 2. In this embodiment, the cache 103 has a 2-way set associative cache configuration in which 104 and 105 are each way (0 way, 1 way). Reference numeral 106 denotes a memory (MS) used by the processor 101 as a main memory, 10
A ROM 7 stores an IPL processing program.

【0014】図2は、キャッシュ制御部102の内部構
成を示すもので、201はプロセッサ101が実行する
プログラムにより、キャッシュ103のどのウェイ10
4,105を使用/禁止するかを設定するための制御レ
ジスタ、202は制御レジスタ201の設定にしたが
い、キャッシュエントリのヒット/ミスヒット及びMS
106からの命令・データの読み出し、データの書き込
み等を行う制御回路である。キャッシュ制御部112の
内部構成も、まったく同様である。
FIG. 2 shows an internal configuration of the cache control unit 102. 201 is a program executed by the processor 101.
4, 105 is a control register for setting whether to use / inhibit, and 202 is a cache entry hit / miss hit and MS according to the setting of the control register 201.
The control circuit 106 reads out instructions and data from 106 and writes data. The internal configuration of the cache control unit 112 is exactly the same.

【0015】次に、図1及び図2の構成を例に本発明の
各実施例の動作について説明する。
Next, the operation of each embodiment of the present invention will be described by taking the configuration of FIGS. 1 and 2 as an example.

【0016】〈実施例1〉これは、請求項1の発明に対
応するものである。本実施例のIPL処理のフローチャ
ートを図3に、再同期リセット処理のフローチャートを
図4に示す。図3のIPL処理のプログラムはROM1
07,117に保持され、システム立上げの際のシステ
ム全体のパワーオン時、故障復旧後、CPU部の再組み
込みのためのパワーオン時、及び再同期リセット処理
時、それぞれ起動される。また、図4の再同期リセット
処理のプログラムは、OSの一部としてMS106,1
16に保持され、OSのタスク切替え処理から周期的に
起動される。
<Embodiment 1> This corresponds to the invention of claim 1. FIG. 3 shows a flowchart of the IPL processing of this embodiment, and FIG. 4 shows a flowchart of the resynchronization reset processing. The program for the IPL processing in FIG. 3 is ROM1.
07 and 117, they are activated at power-on of the entire system at system startup, at power-on for re-installation of the CPU unit after failure recovery, and at resynchronization reset processing. In addition, the program for the resynchronization reset process in FIG.
16 and is activated periodically from the task switching process of the OS.

【0017】まず、システム立上げによりA及びB系の
CPU部100,110がIPL処理を開始し、オンラ
イン業務等を開始するまでの動作を説明する。
First, the operation from the start-up of the system to the start of the IPL processing by the CPU units 100 and 110 of the A and B systems to the start of online business will be described.

【0018】システム全体のパワーオンにより、系間制
御部120を通して、A/B両系の各CPU部100,
110にリセットが発行される。これにより、まず、図
3の処理301が実行され、プロセッサ101及び11
1がそれぞれ個別に診断・初期化される。次に、処理3
02で、このリセットが再同期リセット発行によるもの
かを判定する。いまはシステム全体のパワーオンによる
リセットなので、処理303にて、キャッシュ103,
113の全ウェイ(104と105および114と11
5)のエントリの診断・初期化を実施し、処理304に
てMS106,116の診断・初期化を行う。次に、処
理305にてシステム全体の立ち上げかを判定する。こ
の場合、その条件が成立するので、処理310を実施
し、キャッシュ制御部102,112の制御レジスタ2
01に、予め決められたウェイのキャッシュエントリの
み使用禁止と設定する。ここでは、A/B両系のCPU
部100,110ともウェイ1のキャッシュエントリを
使用禁止にすると仮定する。次に、処理311にてオペ
レーティングシステム(OS)のロードやその他の処理
を実行し、システム立ち上げ時のIPL処理が終了す
る。
When the power of the entire system is turned on, the CPU units 100 of both A / B systems are passed through the inter-system control unit 120.
A reset is issued to 110. As a result, first, the process 301 of FIG. 3 is executed, and the processors 101 and 11
1 is individually diagnosed and initialized. Next, process 3
In 02, it is determined whether or not this reset is caused by the resynchronization reset issuance. Since it is reset by power-on of the entire system now, in process 303, the cache 103,
All 113 ways (104 and 105 and 114 and 11
The entry 5) is diagnosed / initialized, and in step 304, the MS 106/116 is diagnosed / initialized. Next, in process 305, it is determined whether the entire system is started up. In this case, since the condition is satisfied, the process 310 is executed and the control registers 2 of the cache control units 102 and 112 are executed.
In 01, only the cache entry of the predetermined way is set to be prohibited. Here, both A / B CPUs
It is assumed that both units 100 and 110 disable the way 1 cache entry. Next, in process 311, the operating system (OS) is loaded and other processes are executed, and the IPL process at system startup is completed.

【0019】これにより、A/B両系の各CPU部10
0,110はオンライン業務等を開始し、同一処理を同
期して実行する。この間、キャッシュ103,113
は、キャッシュ制御部102,112の制御下で、ウェ
イ0のエントリのみ使用されるため、ウェイ1のエント
リは診断・初期化されたままである。
As a result, each CPU unit 10 of both A / B system
0 and 110 start online business and execute the same processing synchronously. During this time, the caches 103 and 113
Since only the entry of way 0 is used under the control of the cache control units 102 and 112, the entry of way 1 remains diagnosed and initialized.

【0020】次に、片系のCPU部にて障害が発生し
て、故障復旧後、当該CPU部の再組み込みを開始する
ときから再同期リセット処理を実行し、デュアル動作が
復活するまでの動作を説明する。
Next, after a failure occurs in one of the CPU parts and the failure is recovered, the re-synchronization reset process is executed from the time when the re-installation of the CPU part is started until the dual operation is restored. Will be explained.

【0021】片系のCPU部にて障害が発生すると、系
間制御部120は該障害の発生したCPU部を切り離
し、オンライン業務等を継続している系のCPU部に障
害発生を報告する。ここでは説明の便宜上、B系CPU
部110に障害が発生し、系間制御部120はこれを切
り離したものとする。
When a failure occurs in the CPU section of one system, the inter-system control section 120 disconnects the CPU section in which the failure has occurred and reports the occurrence of the failure to the CPU section of the system which continues the online business. Here, for convenience of explanation, a B CPU
It is assumed that a failure has occurred in the unit 110 and the inter-system control unit 120 has disconnected this.

【0022】活線交換などによって、B系のCPU部1
10の修理が終了すると、システム・コンソールなどか
らB系CPU部110にパワーオンが発行され、これは
系間制御部120を通してA系CPU部100にも通知
される。ここまでは、フォールトトレラントコンピュー
タの障害/回復処理の一般的な動作である。
The CPU section 1 of the B system, such as by hot line replacement
When the repair of 10 is completed, the system console or the like issues a power-on to the B system CPU unit 110, which is also notified to the A system CPU unit 100 through the intersystem control unit 120. Up to this point, the general operation of fault / recovery processing of a fault tolerant computer has been described.

【0023】B系CPU部110にパワーオンが発行さ
れると、該CPU部110は図3のIPL処理を開始す
る。これにより、まず、処理301にて、プロセッサ1
11が診断・初期化される。次の処理302では、故障
復旧後のパワーオンのため、再同期リセットではないと
判定され、処理303,304が実施される。この段階
で、B系CPU部110のキャッシュ113は、ウェイ
0および1の全エントリとも再び初期化される。次に、
処理305では、システム立ち上げによるパワーオンで
はないと判定されるので、処理306を実行する。この
処理306で、CPU部110の診断・初期化がすべて
終了し、組み込み準備が完了したことを、系間制御部1
20を経由してA系CPU部100に通知する。組み込
み準備完了の通知後、B系CPU部110は処理307
にて、再同期リセットにより再組み込みが実施されるの
を待機する。なお、系間制御部120は、システム全体
および個々のCPU部がどういう状態にあるか、状態レ
ジスタ等で管理しており、処理302,305では、例
えば該状態レジスタ等を見にいくことで、再同期リセッ
トやシステムの立上げ等を容易に判定できる。
When the power-on is issued to the B system CPU section 110, the CPU section 110 starts the IPL processing of FIG. As a result, first, in process 301, the processor 1
11 is diagnosed and initialized. In the next process 302, it is determined that the resynchronization reset is not performed because the power is turned on after the failure recovery, and the processes 303 and 304 are executed. At this stage, the cache 113 of the B system CPU unit 110 is initialized again with all entries of ways 0 and 1. next,
In process 305, since it is determined that the system is not powered on due to system startup, process 306 is executed. In this process 306, the diagnosis / initialization of the CPU section 110 is completed, and the completion of the installation preparation is confirmed by the inter-system control section 1
Notify the A system CPU unit 100 via 20. After the completion of installation preparation is notified, the B system CPU unit 110 performs processing 307.
Then, it waits for the re-installation by the re-synchronization reset. The inter-system control unit 120 manages the state of the entire system and individual CPU units with a status register or the like, and in the processes 302 and 305, for example, by looking at the status register or the like, Resynchronization reset and system startup can be easily determined.

【0024】一方、B系CPU部110へのパワーオン
発行後、A系CPU部100はオンライン業務を継続し
ながら、OSのタスク切替え処理により図4の動作を周
期的に実行している。
On the other hand, after the power-on issuance to the B system CPU unit 110, the A system CPU unit 100 periodically executes the operation of FIG. 4 by the task switching process of the OS while continuing the online work.

【0025】図4において、処理400は、系間制御部
120を経由して通知される他系CPU部の組み込み準
備完了を判定する処理である。B系CPU部110が図
3の処理306を実行するまで、該判定は成立しない。
この場合、A系CPU部100は処理411に行かず、
オンライン業務等に戻る。処理400での判定が成立す
ると、A系CPU部100のプロセッサ101は、処理
411により、続行中の処理情報を退避し、次に、処理
412にて、再同期リセットを系間制御部120へ発す
る。これによって、系間制御部120はA/B両系のC
PU部100,110に同時にリセットを発行する。
In FIG. 4, a process 400 is a process for judging the completion of installation preparation of another system CPU unit notified via the intersystem control unit 120. The determination is not established until the B system CPU unit 110 executes the process 306 of FIG.
In this case, the A system CPU unit 100 does not go to the processing 411,
Return to online business etc. When the determination in process 400 is established, the processor 101 of the A system CPU unit 100 saves the ongoing process information in process 411, and then, in process 412, a resynchronization reset is sent to the intersystem control unit 120. Emit. As a result, the inter-system control unit 120 causes the A / B system C
A reset is issued to the PU units 100 and 110 at the same time.

【0026】リセットされた各CPU部100,110
は、同時に図3のIPL処理の実行に入る。この場合、
各CPU部100,110は、処理301でプロセッサ
101を診断・初期化した後、処理302にて再同期リ
セットによるIPL処理開始と判定されるので、処理3
08を実行する。なお、B系CPU部110のプロセッ
サ111は、既に故障復旧後の再組み込みのためのIP
L処理で診断・初期化されているため、処理301は空
実行となる。処理308は、キャッシュ制御部102,
112の制御レジスタ201に設定してあったキャッシ
ュウェイの使用禁止を反転して再設定する処理である。
これにより、A系CPU部100では、それまでキャッ
シュ103のウェイ1を使用禁止としていたが、今度は
ウェイ0が使用禁止と設定されることになる。これが系
間制御部120の状態レジスタに反映されるので、この
時、B系CPU部110では、該状態レジスタを参照す
ることで、A系と対称的なキャッシュ113のウェイ1
が使用禁止と設定されることになる。次に、処理309
にて図4の処理413への復帰を行い、処理413にお
いて、A系CPU部110では、処理411で退避した
処理情報を復帰し、オンライン業務にもどる。また、B
系CPU部110でも、A系CPU部110が退避した
処理情報を取り込み、オンライン業務に復帰する。な
お、図1では省略したが、処理情報の退避先は、A/B
両系で共通にアクセスできれば、外部記憶装置あるいは
主記憶のいずれでもよく、これにより、A系CPU部1
00が退避した情報を、B系CPU部110でも、取り
込むことができる。
Each CPU unit 100, 110 that has been reset
Simultaneously enters execution of the IPL process of FIG. in this case,
After diagnosing and initializing the processor 101 in the process 301, the CPU units 100 and 110 determine in the process 302 that the IPL process is started by the resynchronization reset.
08 is executed. It should be noted that the processor 111 of the B system CPU unit 110 uses the IP for re-installation after the failure recovery.
Since the diagnosis / initialization is performed in the L process, the process 301 is an empty execution. The process 308 is performed by the cache control unit 102,
This is a process of reversing and resetting the use prohibition of the cache way set in the control register 201 of 112.
As a result, in the A system CPU unit 100, the way 1 of the cache 103 has been prohibited until then, but now the way 0 is set to be prohibited. Since this is reflected in the status register of the inter-system control unit 120, at this time, the B system CPU unit 110 refers to the status register to make the way 1 of the cache 113 symmetrical to the A system.
Will be set as prohibited. Next, processing 309
In step 413, the A system CPU unit 110 restores the processing information saved in step 411 and returns to the online operation. Also, B
The system CPU unit 110 also takes in the processing information saved by the A system CPU unit 110 and returns to the online work. Although omitted in FIG. 1, the processing information save destination is A / B.
Either the external storage device or the main memory may be used as long as it can be commonly accessed by both systems.
The information saved in 00 can also be taken in by the B system CPU unit 110.

【0027】このようにして、A/B両系のCPU部1
00,110は、再び同一処理を同期して実行すること
になり、且つ、キャッシュ103,113はいずれも、
診断・初期化の保証されたウェイ1のエントリを使用す
ることになる。したがって、再同期リセット処理にて従
来必要であった、キャッシュの診断・初期化を不要にす
ることができる。
In this way, the CPU unit 1 for both the A / B system
00 and 110 will again execute the same processing in synchronization, and both caches 103 and 113 will
The entry of way 1, which is guaranteed to be diagnosed and initialized, will be used. Therefore, it is possible to eliminate the need for cache diagnosis and initialization, which has been conventionally required in the resynchronization reset process.

【0028】なお、図3の処理308で使用禁止となっ
た、A系CPU部100におけるキャッシュ103のウ
ェイ0は、以後の再同期リセットにそなえて、オンライ
ン業務を継続しながら少しずつ診断・初期化しておけば
よい。この時、同期処理の観点から、B系CPU部11
0でも同様の処理を実行するが、B系CPU部110の
キャッシュ113のウェイ0は、図3の処理303で初
期化ずみであるため、B系CPU部110での処理は仮
の実行(空実行)となる。
Note that the way 0 of the cache 103 in the A system CPU unit 100, which has been prohibited from use in the process 308 of FIG. 3, is gradually diagnosed / initialized while continuing online work in preparation for the subsequent resynchronization reset. Just turn it into something. At this time, from the viewpoint of synchronization processing, the B system CPU unit 11
0 performs the same process, but the way 0 of the cache 113 of the B system CPU unit 110 has been initialized in the process 303 of FIG. 3, and therefore the process of the B system CPU unit 110 is temporarily executed (empty). Run).

【0029】〈実施例2〉これは、請求項2の発明に対
応するものである。実施例1では、キャッシュ103,
113のウェイ0あるいはウェイ1が必ず使用禁止と設
定されるため、常にキャッシュ全体の半分の容量しか使
用していないことになる。これは、性能を重視するコン
ピュータシステムには不向きである。実施例2は、通常
は全キャッシュ容量を使用可能とし、CPU部を再組み
込みする前後でのみ、一時的にウェイ0あるはウェイ1
を使用禁止とするものである。
<Embodiment 2> This corresponds to the invention of claim 2. In the first embodiment, the cache 103,
Since the way 0 or the way 1 of 113 is always set to be prohibited, it means that only half the capacity of the entire cache is always used. This is unsuitable for computer systems that emphasize performance. In the second embodiment, normally, the entire cache capacity can be used, and the way 0 or the way 1 is temporarily provided only before and after the CPU unit is re-installed.
Is prohibited.

【0030】本実施例のIPL処理のフローチャートを
図5に、再同期リセット処理のフローチャートを図6
に、さらに、使用禁止した特定キャッシュウェイの回復
処理のフローチャートを図7に示す。
FIG. 5 is a flowchart of the IPL process of this embodiment, and FIG. 6 is a flowchart of the resynchronization reset process.
Further, FIG. 7 shows a flowchart of the recovery processing of the prohibited specific cache way.

【0031】図5のIPL処理プログラムは、図3と同
様に、システム立上げの際のシステム全体のパワーオン
時、故障復旧後、CPU部の再組み込みのためのパワー
オン時及び再同期リセット発行時、それぞれ起動され
る。両者の相違は、本実施例ではシステム立上げ時にキ
ャッシュの全ウェイを使用可能にするため、図3の処理
310が図5にはないことである。
The IPL processing program shown in FIG. 5 is similar to that shown in FIG. 3, at the time of power-on of the entire system at the time of system startup, at the time of power-on for re-installation of the CPU unit after recovery from a failure, and resynchronization reset issue. Each time, it is activated. The difference between the two is that in this embodiment, all the ways of the cache are made available at the time of system startup, and therefore the processing 310 of FIG. 3 is not present in FIG.

【0032】図6の再同期リセット処理のプログラム及
び図7のキャッシュウェイ回復処理のプログラムは、そ
れぞれOSのタスク切替え処理から周期的に起動され
る。ここで、図4と図6の相違は、図6では、処理62
0としてCPU部の再組み込み処理を実行するときのみ
特定キャッシュウェイを使用禁止するステップが追加さ
れていることである。後述するように、図7のキャッシ
ュウェイ回復処理は、この処理620が済んでいること
を条件に周期的に起動されることになる。
The program for the resynchronization reset process in FIG. 6 and the program for the cache way recovery process in FIG. 7 are periodically activated from the task switching process of the OS. Here, the difference between FIG. 4 and FIG. 6 is that in FIG.
That is, a step of prohibiting the use of the specific cache way only when the re-installation process of the CPU unit is executed is set to 0. As will be described later, the cache way recovery process of FIG. 7 is periodically activated on condition that this process 620 has been completed.

【0033】まず、システム立ち上げによりA/B両系
のCPU部100,110がIPL処理を開始し、オン
ライン業務を開始するまでの動作を説明する。
First, the operation from the start-up of the system to the start of IPL processing by the CPU units 100 and 110 of both the A / B system and the start of online work will be described.

【0034】システム全体のパワーオンにより、系間制
御部120を通して、A/B両系の各CPU部100,
110にリセットが発行される。この場合の、動作は実
施例1と基本的に同じであり、CPU部100および1
10は、それぞれ図5の処理501→502→503→
504→505→510を実行して、オンライン業務を
開始することになる。ただし、図5のIPL処理では、
図3の処理310が実行されないため、A/B両系の各
CPU部100,110は、キャッシュ103,113
のウェイ0および1の両方を使用してオンライン業務を
実行する。
When the power of the entire system is turned on, the CPU units 100 of both A / B systems are passed through the inter-system control unit 120.
A reset is issued to 110. The operation in this case is basically the same as that of the first embodiment.
10 is processing 501 → 502 → 503 → of FIG. 5, respectively.
By executing 504 → 505 → 510, the online business is started. However, in the IPL processing of FIG.
Since the process 310 of FIG. 3 is not executed, the CPU units 100 and 110 of both the A and B systems have the caches 103 and 113.
Performs online operations using both ways 0 and 1.

【0035】次に、片系のCPU部にて障害が発生し
て、故障復旧後、当該CPU部の再組み込みを開始する
ときから再同期リセットを実行し、デュアル動作が復活
するまでの動作を説明する。ここでも、B系CPU部1
10に障害が発生し、システムから切り離されたとす
る。
Next, after a failure occurs in one of the CPU parts and the failure is recovered, the resynchronization reset is executed from the time when the re-installation of the CPU part is started, and the operation until the dual operation is restored. explain. Again, the B system CPU section 1
Assume that 10 has failed and has been disconnected from the system.

【0036】活線交換などによって、B系CPU110
の修理が終了すると、システム・コンソールなどから該
B系CPU部110にパワーオンが発行される。このパ
ワーオン発行により、B系CPU部110は、図5の処
理501→502→503→504→505→506→
507を実行する。これは実施例1の場合とまったく同
じである。このようにして、B系CPU部110は、各
部の診断・初期化がすべて終了すると、組み込み準備完
了をA系CPU部100に通知し(処理506)、再同
期リセット発行待ちとなる(処理507)。
The B system CPU 110 can be replaced by hot line replacement.
When the repair is completed, the system console or the like issues a power-on to the B system CPU section 110. By this power-on issuance, the B system CPU section 110 causes the processes 501 → 502 → 503 → 504 → 505 → 506 → of FIG.
507 is executed. This is exactly the same as in the first embodiment. In this way, when the diagnosis / initialization of each unit is completed, the B system CPU unit 110 notifies the A system CPU unit 100 of the preparation for installation (process 506) and waits for the resynchronization reset issuance (process 507). ).

【0037】一方、B系CPU部110へのパワーオン
発行後、A系CPU部100は、オンライン業務を継続
しながら、図6の動作を周期的に実行している。まず、
処理600においてB系CPU部110が組み込み準備
完了したか判定する。B系CPU部110が処理506
を実行するまで、処理600の判定は不成立であり、こ
の場合、A系CPU部100は、そのままオンライン業
務に戻る。処理600での判定が成立すると、A系CP
U部100は、処理620を実行し、キャッシュ103
の特定ウェイの使用禁止を、キャッシュ制御部102内
の制御レジスタ201に設定する。ここでは、キャッシ
ュ103のウェイ0のエントリを使用禁止と設定したと
する。
On the other hand, after the power-on issuance to the B system CPU unit 110, the A system CPU unit 100 periodically executes the operation of FIG. 6 while continuing the online business. First,
In process 600, it is determined whether the B system CPU unit 110 is ready for installation. The B system CPU unit 110 performs processing 506.
The determination of the process 600 is unsatisfied until the process is executed, and in this case, the A system CPU unit 100 returns to the online work as it is. When the determination in processing 600 is established, the A system CP
The U unit 100 executes the process 620, and the cache 103
The use prohibition of the specific way is set in the control register 201 in the cache control unit 102. Here, it is assumed that the entry of the way 0 of the cache 103 is set to be prohibited.

【0038】この段階で図6の処理が一旦中断し、A系
CPU部100では、キャッシュ103のウェイ1を使
用してオンライン業務を継続しながら、OSのタスク切
り替えにより、図7の処理を周期的に実行する。
At this stage, the processing of FIG. 6 is temporarily interrupted, and the A system CPU section 100 uses the way 1 of the cache 103 to continue online work, while the task switching of the OS causes the processing of FIG. To execute.

【0039】図7において、処理701では、図6の処
理620で使用禁止と設定したキャッシュウェイの診断
・初期化を適当なエントリ数分、実行する。ここでは、
キャッシュ103のウェイ0の診断・初期化を所定エン
トリ数だけ実行する。このエントリ数は、オンライン業
務に対してオーバヘッドを与えないように設定すればよ
い。次に、判定702にて、当該キャッシュウェイの診
断、初期化が終了しているかを判定する。終了していな
ければ、そのままオンライン業務の実行に戻り、その
後、OSのタスク切り替えにより、再び処理701を実
行する。これによって、図6の処理620にて使用禁止
となったキャッシュ103のウェイ0のエントリが、オ
ンライン業務を継続しながら少しづつ初期化されること
になる。処理702にてキャッシュ103のウェイ0の
全エントリの初期化が終了すると、A系CPU部100
は、処理703にて終了フラグをONする。次に、判定
704にて再同期リセットを実施した後かを判定する。
この段階では、まだ再同期リセット発行によるデュアル
動作の復旧を実施していないので、判定はNOである。
よって、図7の処理は、一旦終了となる。
In step 701 of FIG. 7, diagnosis and initialization of the cache way which is set to be prohibited in step 620 of FIG. 6 are executed for an appropriate number of entries. here,
The way 0 of the cache 103 is diagnosed and initialized by a predetermined number of entries. The number of entries may be set so as not to give overhead to the online business. Next, at decision 702, it is decided whether the diagnosis and initialization of the cache way have been completed. If it has not been completed, the process returns to the execution of the online work as it is, and then the process 701 is executed again by the task switching of the OS. As a result, the entry of the way 0 of the cache 103, which is prohibited in the process 620 of FIG. 6, is initialized little by little while continuing the online business. When the initialization of all the entries of the way 0 of the cache 103 is completed in processing 702, the A system CPU unit 100
Turns on the end flag in process 703. Next, in decision 704, it is determined whether or not the resynchronization reset is performed.
At this stage, since the dual operation has not been restored by issuing the resynchronization reset, the determination is NO.
Therefore, the process of FIG. 7 is once ended.

【0040】A系CPU部100は、図7の処理終了
後、OSのタスク切替えにより図6の処理に戻り、処理
611にて続行中の処理情報を退避した後、処理612
にて、再同期リセットを系間制御部120へ発する。
After the processing of FIG. 7 is completed, the A system CPU section 100 returns to the processing of FIG. 6 by the task switching of the OS, saves the processing information being processed in processing 611, and then executes processing 612.
Then, the resynchronization reset is issued to the inter-system control unit 120.

【0041】系間制御部120は、A系CPU部100
が再同期リセットを出すと、終了フラグONを確認し
て、A/B両系のCPU部100,110に同時にリセ
ットを発行する。リセットされた各CPU部100,1
10は、同時に図5のIPL処理の実行に入る。この場
合、各CPU部100,110は、処理501→502
→508→509を実行する。これにより、処理508
において、A系CPU部100では、図6の処理620
でキャッシュ103のウェイ0を使用禁止としていた
が、今後はキャッシュ103のウェイ1が使用禁止と設
定されることになる。この時、B系CPU部110で
も、系間制御部120の状態レジスタを参照することに
より、A系と対称的なキャッシュ113のウェイ1が使
用禁止と設定されることになる。
The inter-system control unit 120 is a system A CPU unit 100.
When the re-synchronization reset is issued, the end flag ON is confirmed, and the reset is issued simultaneously to the CPU units 100 and 110 of both the A / B system. Each CPU unit 100, 1 that has been reset
At the same time, 10 starts execution of the IPL process of FIG. In this case, the CPU units 100 and 110 process 501 → 502.
→ 508 → 509 is executed. Thereby, the processing 508
In the A system CPU section 100, the process 620 of FIG.
Although the way 0 of the cache 103 is prohibited, the way 1 of the cache 103 is set to be prohibited in the future. At this time, the B system CPU unit 110 also sets the way 1 of the cache 113, which is symmetrical to the A system, to be prohibited by referring to the status register of the intersystem control unit 120.

【0042】次に、処理509で図6の処理613への
復帰を行い、A系/B系のCPU部100,110は、
該処理613にて、退避してある処理情報を復帰し、オ
ンライン業務にもどる。この時、A/B両系のCPU部
100,110は、とりあえず、キャッシュ103,1
13中のウェイ0のみを使用してオンライン業務を再開
することになる。ここで、A系のキャッシュ・ウェイ0
は、図7の処理701〜703により、診断・初期化が
保証されている。また、B系のキャッシュ・ウェイ0
は、図5の処理503で診断・初期化がすんでいる。
Next, in step 509, the process returns to step 613 in FIG. 6, and the A / B system CPU units 100 and 110
In the processing 613, the saved processing information is restored to return to the online business. At this time, the CPU units 100 and 110 of both the A / B system temporarily store the caches 103 and 1 for the time being.
Only way 0 out of 13 will be used to restart the online business. Here, A system cash way 0
, The diagnosis / initialization is guaranteed by the processes 701 to 703 of FIG. 7. Also, B system cash way 0
Has been diagnosed and initialized in the process 503 of FIG.

【0043】次に、A/B両系のCPU部100,11
0が、キャッシュ103,113の一部のウェイのみを
使用して、オンライン業務を再開した後、該キャッシュ
103,113の全ウェイを再び使用可能とするまでの
動作を説明する。
Next, CPU units 100 and 11 for both A and B systems
An operation will be described in which 0 uses only a part of the ways of the caches 103 and 113 and then restarts the online business, and then makes all the ways of the caches 103 and 113 available again.

【0044】再同期リセット処理が終了して、デュアル
動作を復旧しているA/B各系のCPU部100,11
0は、OSタスク切替えにより、図7の処理をオンライ
ン業務の合間をぬって周期的に実行する。ここでは、オ
ンライン業務の再開時、A/B各系のキャッシュ10
3,112はウェイ1が使用禁止となっている。このキ
ャッシュ103,113のウェイ0のエントリが、処理
701にて同時に少しづつ初期化されていくことにな
る。なお、B系のキャッシュ113は図5の処理503
で既に診断・初期化ずみであるため、B系CPU部11
0の処理701では、仮の診断・初期化(空処理)が実
行されるだけである。即ち、B系CPU部110は、単
にA系CPU部100との同期化のため、図7を実行す
る。処理702,703にて、キャッシュ103,11
3のウェイ0の初期化が終了すると、判定704が成立
するため、処理705を実行する。処理705ではA/
B両系の制御レジスタ201に、再びキャッシュ10
3、113ウェイ0の使用許可を設定する。これによっ
て、A/B各系のCPU部100,110は、キャッシ
ュ103,113の全ウェイを使用し始めることにな
る。
After the resynchronization reset process is completed, the dual operation is restored, and the CPU units 100 and 11 of the respective A / B systems are restored.
0 executes the processing of FIG. 7 periodically between online tasks by switching the OS task. Here, when restarting the online business, the cache 10 of each A / B system
Ways 1 to 3 and 3 are prohibited. The entries of the way 0 of the caches 103 and 113 are simultaneously initialized little by little in the processing 701. It should be noted that the B-system cache 113 performs the processing 503 of FIG.
Since it has already been diagnosed and initialized, the B system CPU unit 11
In the processing 701 of 0, only temporary diagnosis / initialization (empty processing) is executed. That is, the B-system CPU unit 110 executes FIG. 7 simply for synchronization with the A-system CPU unit 100. In the processes 702 and 703, the caches 103 and 11
When the initialization of the way 0 of 3 is completed, the determination 704 is satisfied, and thus the processing 705 is executed. A / in process 705
The cache 10 is again stored in the control registers 201 of both systems.
Set permission to use 3, 113 ways 0. As a result, the CPU units 100 and 110 of the respective A / B systems start using all the ways of the caches 103 and 113.

【0045】[0045]

【発明の効果】請求項1の発明によれば、使用禁止のキ
ャッシュウェイは初期化状態のままであるため、デュア
ル動作を復旧させるための再同期リセットによるIPL
処理にて、キャッシュの初期化が不要となるので、オン
ライン業務等の中断時間を劇的に短縮することができ
る。
According to the first aspect of the invention, since the cache way whose use is prohibited remains in the initialized state, the IPL by the resynchronization reset for restoring the dual operation is performed.
Since the cache does not need to be initialized in the processing, the interruption time of online business etc. can be dramatically shortened.

【0046】また、請求項2の発明によれば、プロセッ
サが持つキャッシュ容量についてもCPU部を再組み込
みするときだけ、使用する容量を減らすだけなので、シ
ステム性能向上に効果を発揮する。
According to the second aspect of the invention, as for the cache capacity of the processor, the capacity to be used is reduced only when the CPU section is re-installed, so that the system performance is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明で対象とするコンピュータシステムの一
実施例の構成図である。
FIG. 1 is a configuration diagram of an embodiment of a computer system targeted by the present invention.

【図2】図1におけるキャッシュ制御部の内部構成図で
ある。
FIG. 2 is an internal configuration diagram of a cache control unit in FIG.

【図3】本発明の第1実施例のIPL処理のフローチャ
ートである。
FIG. 3 is a flowchart of an IPL process according to the first embodiment of this invention.

【図4】本発明の第1実施例の再同期リセット処理のフ
ローチャートである。
FIG. 4 is a flowchart of a resynchronization reset process according to the first embodiment of this invention.

【図5】本発明の第2実施例のIPL処理のフローチャ
ートである。
FIG. 5 is a flowchart of IPL processing according to the second embodiment of this invention.

【図6】本発明の第2実施例の再同期リセット処理のフ
ローチャートである。
FIG. 6 is a flowchart of resynchronization reset processing according to the second embodiment of this invention.

【図7】本発明の第2実施例のキャッシュウェイ使用許
可処理のフローチャートである。
FIG. 7 is a flowchart of a cache way use permission process according to the second embodiment of this invention.

【符号の説明】[Explanation of symbols]

101,111 プロセッサ 102,112 キャッシュ制御部 103,113 キャッシュ 104,114 キャッシュのウェイ0 105,115 キャッシュのウェイ1 106,116 主記憶 107,117 IPL処理を格納するROM 120 系間制御部 101, 111 Processor 102, 112 Cache control unit 103, 113 Cache 104, 114 Cache way 0 105, 115 Cache way 1 106, 116 Main memory 107, 117 ROM 120 for storing IPL processing Inter-system control unit

───────────────────────────────────────────────────── フロントページの続き (72)発明者 大橋 晴彦 東京都江東区福住1丁目13番2号 株式会 社日立東サービスエンジニアリング内 (72)発明者 横山 睦裕 神奈川県秦野市堀山下1番地 株式会社日 立コンピュータエレクトロニクス内 ─────────────────────────────────────────────────── ─── Continuation of front page (72) Inventor Haruhiko Ohashi 1-13-2 Fukuzumi, Koto-ku, Tokyo Within Hitachi East Service Engineering Co., Ltd. (72) Inventor Mutsuhiro Yokoyama 1 Horiyamashita, Hadano, Kanagawa Stock Company Ritu Computer Electronics

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 各々キャッシュを持つ複数のCPU部が
同一処理を同期して実行するコンピュータシステムにお
いて、故障などでシステムから切り離されたCPU部を
再びシステムに組み込み、同期運転を復活させるための
再同期リセット処理方法であって、 システムの立ち上げ時、各CPUの全キャッシュウェイ
を初期化した後、特定のキャッシュウェイを使用禁止に
して同期運転を開始し、 あるCPU部をシステムに再組み込みするため、全CP
Uを一旦リセットして同期運転を復活させる際、キャッ
シュウェイの使用禁止を反転し、それまで使用禁止にし
て初期化が終了しているキャッシュウェイを使用可能に
して同期運転を再開せしめることを特徴とする再同期リ
セット処理方法。
1. In a computer system in which a plurality of CPU units each having a cache execute the same processing in synchronization, a CPU unit separated from the system due to a failure or the like is re-installed in the system to restore synchronous operation. This is a synchronous reset processing method. At system startup, after initializing all cache ways of each CPU, disable a specific cache way, start synchronous operation, and re-install a certain CPU part in the system. For all CP
When U is reset and synchronous operation is restored, the use prohibition of the cache way is reversed, and the cache way that has been disabled and initialized so far can be used to restart the synchronous operation. Resynchronization reset processing method.
【請求項2】 各々キャッシュを持つ複数のCPU部が
同一処理を同期して実行するコンピュータシステムにお
いて、障害などでシステムから切り離されたCPU部を
再びシステムに組み込み、同期運転を復活させるための
再同期リセット処理方法であって、 システムの立ち上げ時、各CPUの全キャッシュウェイ
を使用可能にして同期運転を開始し、 あるCPU部をシステムに再組み込みする際の準備段階
において、処理中のCPU部は特定のキャッシュウェイ
を使用禁止にして処理を続行し、該処理の合間に周期的
に前記特定のキャッシュウェイを所定エントリ数ずつ初
期化し、 前記処理中のCPU部にて、前記特定のキャッシュウェ
イの初期化がすべて終了した段階で、全CPU部を一旦
リセットし、キャッシュウェイの使用禁止を反転して、
前記初期化が終了した特定のキャッシュウェイを使用可
能にして同期運転を再開し、 前記同期運転の再開後、あらたに使用禁止となったキャ
ッシュウェイを、処理の合間に周期的に所定エントリ数
ずつ初期化し、該キャッシュウェイの初期化がすべて終
了した段階で再び全キャッシュウェイを使用可能とする
ことを特徴とする再同期リセット処理方法。
2. In a computer system in which a plurality of CPU units each having a cache execute the same processing in synchronization, a CPU unit separated from the system due to a failure or the like is re-installed in the system to restore synchronous operation. A method of synchronous reset processing, in which at the time of system startup, all cache ways of each CPU are enabled to start synchronous operation, and a CPU that is being processed in the preparation stage when a certain CPU unit is re-installed in the system The unit disables a specific cache way and continues the process, and periodically initializes the specific cache way by a predetermined number of entries between the processes, and the CPU unit in process processes the specific cache way. When the initialization of all ways is completed, all CPUs are temporarily reset to prevent the use of the cache way. Turn around,
After the initialization is completed, the specific cache way is enabled to restart the synchronous operation, and after the synchronous operation is restarted, the cache way that has been newly prohibited is periodically re-registered by a predetermined number of entries between processings. A resynchronization reset processing method characterized by initializing and reusing all cache ways when the initialization of all the cache ways is completed.
JP7280270A 1995-10-27 1995-10-27 Resynchronization resetting processing method for computer system Pending JPH09128258A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7280270A JPH09128258A (en) 1995-10-27 1995-10-27 Resynchronization resetting processing method for computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7280270A JPH09128258A (en) 1995-10-27 1995-10-27 Resynchronization resetting processing method for computer system

Publications (1)

Publication Number Publication Date
JPH09128258A true JPH09128258A (en) 1997-05-16

Family

ID=17622657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7280270A Pending JPH09128258A (en) 1995-10-27 1995-10-27 Resynchronization resetting processing method for computer system

Country Status (1)

Country Link
JP (1) JPH09128258A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041995B2 (en) 2004-12-20 2011-10-18 Nec Corporation Method and system for resetting fault tolerant computer system
CN109828945A (en) * 2019-02-20 2019-05-31 杭州迪普科技股份有限公司 A kind of service message processing method and system
WO2021100624A1 (en) * 2019-11-19 2021-05-27 三菱パワー株式会社 Computing device, redundant system and program, and method for constructing redundant configuration

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8041995B2 (en) 2004-12-20 2011-10-18 Nec Corporation Method and system for resetting fault tolerant computer system
CN109828945A (en) * 2019-02-20 2019-05-31 杭州迪普科技股份有限公司 A kind of service message processing method and system
CN109828945B (en) * 2019-02-20 2021-01-26 杭州迪普科技股份有限公司 Service message processing method and system
WO2021100624A1 (en) * 2019-11-19 2021-05-27 三菱パワー株式会社 Computing device, redundant system and program, and method for constructing redundant configuration
US11829266B2 (en) 2019-11-19 2023-11-28 Mitsubishi Heavy Industries, Ltd. Computing device, redundant system, program, and method for constructing redundant configuration

Similar Documents

Publication Publication Date Title
US6684396B1 (en) Method for upgrading running software processes without compromising fault-tolerance
JP3844621B2 (en) Application realization method and application realization apparatus
KR100238926B1 (en) Method and apparatus for recovering from faults in distributed memory type multiprocessor computing system
JP2009516277A (en) Apparatus and method for eliminating errors in a system having at least two registered processing units
JP2010092105A (en) Synchronization control apparatus, information processing apparatus, and synchronization management method
CA2530013A1 (en) A fault tolerant computer system and a synchronization method for the same
JP5287974B2 (en) Arithmetic processing system, resynchronization method, and farm program
JP3774826B2 (en) Information processing device
KR101038464B1 (en) Information processing device and control method
JPH09128258A (en) Resynchronization resetting processing method for computer system
JP2002049509A (en) Data processing system
JP2000066913A (en) Program/data non-interruption updating system for optional processor
EP1125204B1 (en) Explicit state copy in a fault tolerant system using a remote write operation
JP6364773B2 (en) Information processing apparatus, information processing system, memory replication method, and computer program
JPH0764930A (en) Mutual monitoring method between cpus
JPH07282022A (en) Multiprocessor system
JP2968484B2 (en) Multiprocessor computer and fault recovery method in multiprocessor computer
JPH09288590A (en) Virtual computer system
JP3185446B2 (en) Computer system
JPH07219802A (en) Duplex control system
JPH05216855A (en) Multi-cpu control system
JPH0695974A (en) Memory protecting system
JPH07200334A (en) Duplicate synchronization operation system
JPS62296264A (en) Control system for structure of data processing system
JP3346670B2 (en) Central processing unit switching method and switching system