JP2000148525A - Method for reducing load of active system in service processor duplex system - Google Patents

Method for reducing load of active system in service processor duplex system

Info

Publication number
JP2000148525A
JP2000148525A JP10327979A JP32797998A JP2000148525A JP 2000148525 A JP2000148525 A JP 2000148525A JP 10327979 A JP10327979 A JP 10327979A JP 32797998 A JP32797998 A JP 32797998A JP 2000148525 A JP2000148525 A JP 2000148525A
Authority
JP
Japan
Prior art keywords
service processor
processing
active
standby
request
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10327979A
Other languages
Japanese (ja)
Inventor
Takehito Masuda
健仁 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information Technology Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Information Technology Co Ltd filed Critical Hitachi Ltd
Priority to JP10327979A priority Critical patent/JP2000148525A/en
Publication of JP2000148525A publication Critical patent/JP2000148525A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To prevent processing performance from being deteriorated at the time of high load by reducing the load of an active system service processor(SVP) in a hot stand-by type duplex SVP. SOLUTION: Instruction-sorted performance request discriminating tables 114, 124 respectively defining devices taking charge of the processing of an active system and a stand-by system in each instruction are included in respective SVPs 110, 120. When a processing request is issued from a computer system (CPU) 100, the active SVP (defined as 110) refers to the table 114, and when the device taking charge of processing is the active system, it executes the request and reports the processing result to the CPU 100, but when the device taking charge of processing is a stand-by system, it requests the stand-by SVP (defined as 120) to execute the processing of the request. The stand-by SVP 120 executes process-ing requested from the active SVP 110 and reports its processing result to the active SVP 110, which outputs the received process-ing result to the CPU 100.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はサービスプロセッサ
二重化システムに係り、特にホットスタンバイ方式での
サービスプロセッサ二重化システムにおける現用系の負
荷軽減方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a redundant service processor system, and more particularly to a method for reducing a load on an active system in a redundant service processor system in a hot standby system.

【0002】[0002]

【従来の技術】計算機システムの電源制御や障害監視等
のサービスを行うサービスプロセッサをホットスタンバ
イ方式で二重化したシステムにおける従来の処理方式を
図5により説明する。図5において、100が計算機シ
ステム(CPU)であり、これにサービスプロセッサ1
10、120が芋づる式に接続されている。サービスプ
ロセッサ110、120の間は、別にサービスプロセッ
サ間インタフェース線130で接続されている。いま、
サービスプロセッサ110を現用系、サービスプロセッ
サ120を待機系とする。
2. Description of the Related Art A conventional processing method in a system in which service processors for performing services such as power control and failure monitoring of a computer system are duplicated by a hot standby method will be described with reference to FIG. In FIG. 5, a computer system (CPU) 100 includes a service processor 1
10, 120 are connected in a potato style. The service processors 110 and 120 are separately connected by a service processor interface line 130. Now
The service processor 110 is an active system, and the service processor 120 is a standby system.

【0003】通常は現用系サービスプロセッサ110
が、計算機システム100からの要求(命令)を処理し
て(500)、処理結果を計算機システム100へ報告
し、一方の待機系サービスプロセッサ120は、サービ
スプロセッサ間インタフェース線130により、ポーリ
ング形式及び現用系からの障害割込みにより現用系サー
ビスプロセッサ120を監視している。現用系サービス
プロセッサ110で障害が発生し、それを待機用サービ
スプロセッサ120で検出(501)した場合、サービ
スプロセッサ交替(502)により、現用系サービスプ
ロセッサ110が待機系となり(503)、待機系サー
ビスプロセッサ120が現用系となり(504)、以降
の計算機システム100からの要求(命令)をサービス
プロセッサ120が処理して(505)処理結果を計算
機システム100へ報告する。
Usually, the active service processor 110
Processes the request (instruction) from the computer system 100 (500), and reports the processing result to the computer system 100. One of the standby service processors 120 uses the inter-service processor interface line 130 to perform polling and current operation. The active service processor 120 is monitored by a failure interrupt from the system. When a failure occurs in the active service processor 110 and the failure is detected by the standby service processor 120 (501), the active service processor 110 becomes the standby system by the service processor replacement (502) (503), and the standby service The processor 120 becomes the active system (504), and the service processor 120 processes subsequent requests (commands) from the computer system 100 (505) and reports the processing result to the computer system 100.

【0004】[0004]

【発明が解決しようとする課題】ホットスタンバイ方式
は、シングルポイントを撲滅し、高信頼性を目的とした
方式であるが、従来技術では性能に関しては考慮されて
おらず、性能は単一サービスプロセッサ並みが限界であ
った。即ち、計算機システムからの処理要求はすべて現
用系サービスプロセッサが受け持つため、計算機システ
ムからの現用系サービスプロセッサへの処理依頼が集中
した場合には、各処理共に通常よりも処理性能が低下す
る問題があった。
The hot standby system is a system for eliminating a single point and aiming at high reliability. However, the prior art does not consider the performance and the performance is a single service processor. Average was the limit. That is, since all the processing requests from the computer system are handled by the active service processor, when processing requests from the computer system to the active service processor are concentrated, the processing performance of each processing is lower than usual. there were.

【0005】本発明の目的は、計算機システムの電源制
御や障害監視等のサービスを行うサービスプロセッサを
ホットスタンバイ方式で二重化したシステムにおいて、
現用系サービスプロセッサの負荷を軽減し、高負荷時の
現用系サービスプロセッサの処理性能低下を防ぐことに
なる。
An object of the present invention is to provide a system in which service processors for performing services such as power control and fault monitoring of a computer system are duplicated by a hot standby system.
This reduces the load on the active service processor and prevents the processing performance of the active service processor from decreasing when the load is high.

【0006】[0006]

【課題を解決するための手段】上記目的を達成するため
に、本発明では、現用系サービスプロセッサの処理の一
部を待機系サービスプロセッサで処理させるようにす
る。具体的には、あらかじめ現用系での処理と待機系で
の処理を定義しておき、現用系サービスプロセッサは、
計算機システムからの処理要求を判別し、現用系の処理
は自サービスプロセッサで実行してその処理結果を計算
機システムへ報告し、待機系の処理は待機系サービスプ
ロセッサへ処理を依頼して次の処理要求を受け付け可能
とし、待機系サービスプロセッサは、現用系サービスプ
ロセッサから依頼された処理を実行して、その処理結果
を現用系サービスプロセッサへ報告し、現用系サービス
プロセッサは、該待機系サービスプロセッサから報告さ
れた処理結果を計算機システムへ上げるようにする。
In order to achieve the above object, in the present invention, a part of the processing of the active service processor is processed by the standby service processor. Specifically, processing in the active system and processing in the standby system are defined in advance, and the active service processor
Determines the processing request from the computer system, executes the processing of the active system by its own service processor, reports the processing result to the computer system, and requests the processing of the standby system to the processing processor of the standby system to perform the next processing. The standby service processor executes the process requested by the active service processor and reports the processing result to the active service processor.The active service processor receives the request from the standby service processor. The reported processing result is sent to the computer system.

【0007】[0007]

【発明の実施の形態】以下、本発明の一実施の形態につ
いて図面を用いて説明する。図1は本発明によるサービ
スプロセッサ二重化システムの一実施の形態を示すブロ
ック図である。図において、計算機システム(CPU)
100に、サービスプロセッサ(SVP)110、12
0が芋づる式に接続されている。サービスプロセッサ1
10は、CPU送受信制御モジュール111、メインモ
ジュール112、通信制御モジュール113及び命令別
性能要求判別テーブル114からなり、CPU送受信制
御モジュール111には割込みマスク111−1があ
り、メインモジュール112には現用/待機フラグ11
2−1、待機側状態フラグ112−2がある。サービス
プロセッサ120の構成は、サービスプロセッサ110
と同じである。両サービスプロセッサ110、120の
通信制御モジュール113、123の間は、サービスプ
ロセッサ間インタフェース線130を通して接続されて
いる。更に、サービスプロセッサ110、120は共有
するハードディスク140等の外部記憶装置を具備す
る。他に、サービスプロセッサ110、120は一般に
キーボード・ディスクプレイ等のコンソール装置を具備
するが、図1では省略してある。なお、サービスプロセ
ッサ110、120は、1台のコンソール装置等を共用
することでもよい。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of a duplicated service processor system according to the present invention. In the figure, a computer system (CPU)
100, service processors (SVP) 110, 12
0 is connected in the form of a potato. Service processor 1
10 includes a CPU transmission / reception control module 111, a main module 112, a communication control module 113, and a performance requirement determination table 114 for each instruction. The CPU transmission / reception control module 111 has an interrupt mask 111-1. Wait flag 11
2-1. There is a standby state flag 112-2. The configuration of the service processor 120 is as follows.
Is the same as The communication control modules 113 and 123 of both service processors 110 and 120 are connected through an inter-service-processor interface line 130. Further, the service processors 110 and 120 include an external storage device such as a shared hard disk 140. In addition, the service processors 110 and 120 generally include a console device such as a keyboard and a display, but are omitted in FIG. The service processors 110 and 120 may share one console device or the like.

【0008】割込みマスク111−1、121−1は、
計算機システム100からの割込み許可/禁止を示し、
現用系では割込み許可状態、待機系では割込み禁止状態
をとる。現用/待機フラグ112−1、122−1は、
自サービスプロセッサが現用系であるか待機系であるか
を示す。この現用/待機フラグ112−1、122−1
は割込みマスク111−1、121−1の状態がそのま
ま反映される。待機側状態フラグ112−2、122−
2は、自サービスプロセッサが現用系の場合、相手の待
機系プロセッサが正常か故障かを示す。
[0008] The interrupt masks 111-1 and 121-1 are:
Indicates permission / prohibition of interruption from the computer system 100,
The active system takes an interrupt enabled state, and the standby system takes an interrupt disabled state. The active / standby flags 112-1, 122-1 are
Indicates whether the own service processor is an active system or a standby system. The current / standby flags 112-1, 122-1
Reflects the state of the interrupt masks 111-1 and 121-1 as they are. Standby state flags 112-2, 122-
Reference numeral 2 indicates whether the standby processor of the partner is normal or faulty when the own service processor is the active system.

【0009】命令別性能要求判別テーブル114、12
4は、現用系での処理と待機系での処理を定義した情報
を格納しているテーブルであり、図2に具体例を示す。
図2は、命令毎に、その処理担当装置が現用系サービス
プロセッサか待機系サービスプロセッサかを示してい
る。この命令別性能要求判別テーブル114、124に
格納する情報(処理SVP定義情報)は、計算機システ
ムの処理プログラム作成の際に、例えばサービスプロセ
ッサへの負荷を予測して一緒に作成しておく。
[0011] Instruction-specific performance requirement determination tables 114 and 12
Reference numeral 4 denotes a table storing information defining processing in the active system and processing in the standby system. FIG. 2 shows a specific example.
FIG. 2 shows, for each instruction, whether the device in charge of processing is an active service processor or a standby service processor. The information (processing SVP definition information) stored in the instruction-specific performance requirement determination tables 114 and 124 is created together with, for example, predicting the load on the service processor when creating the processing program of the computer system.

【0010】最初にサービスプロセッサ110、120
のいずれを現用系/待機系とするかは、オペレータなど
が定め、割込みマスク情報としてハードディスク140
に格納されている。また、ハードディスク140には、
命令別性能要求判別テーブル114、124用の処理S
VP定義情報も格納されている。システム立ち上げ時、
ハードディスク140の割込みマスク情報がサービスプ
ロセッサ110、120の割込みマスク111−1、1
21−1に設定され、それが現用/待機フラグ112−
1、122−1にも反映される。同時に、ハードディス
ク140の処理SVP定義情報が命令別性能要求判別テ
ーブル114、124にロードされる。これら命令別性
能要求判別テーブル114、124の内容は同じであ
る。
First, the service processors 110, 120
Is determined by the operator or the like as the active / standby system, and the hard disk 140 is used as interrupt mask information.
Is stored in Also, the hard disk 140 has
Processing S for instruction-specific performance requirement determination tables 114 and 124
VP definition information is also stored. When starting the system,
The interrupt mask information of the hard disk 140 corresponds to the interrupt masks 111-1 and 111-1 of the service processors 110 and 120.
21-1 which is the active / standby flag 112-
1, 122-1. At the same time, the processing SVP definition information of the hard disk 140 is loaded into the per-instruction performance requirement determination tables 114 and 124. The contents of the instruction-specific performance requirement determination tables 114 and 124 are the same.

【0011】まず、図1の全体的動作を説明する。ここ
で、サービスプロセッサ110が現用系サービスプロセ
ッサ、サービスプロセッサ120が待機系サービスプロ
セッサとする。この場合、現用系サービスプロセッサ1
10では、CPU送受信制御モジュール111の割込み
マスク111−1が計算機システム100からの割込み
許可状態を示し、メインモジュール112の現用/待機
フラグ112−1は自サービスプロセッサ110が現用
系であることを示す。一方、待機系サービスプロセッサ
120では、CPU送受信制御モジュール121の割込
みマスク121−1が計算機システム100からの割込
み禁止状態を示し、メインモジュール122の現用/待
機フラグ122−1は自サービスプロセッサ120が待
機系であることを示す。
First, the overall operation of FIG. 1 will be described. Here, the service processor 110 is an active service processor, and the service processor 120 is a standby service processor. In this case, the active service processor 1
In 10, the interrupt mask 111-1 of the CPU transmission / reception control module 111 indicates a state in which an interrupt from the computer system 100 is permitted, and the active / standby flag 112-1 of the main module 112 indicates that the own service processor 110 is the active system. . On the other hand, in the standby service processor 120, the interrupt mask 121-1 of the CPU transmission / reception control module 121 indicates a state in which the interrupt from the computer system 100 is prohibited, and the active / standby flag 122-1 of the main module 122 indicates that the own service processor 120 is in the standby state. Indicates a system.

【0012】計算機システム100は、サービスプロセ
ッサ110、120に対して、割込みにより処理を要求
する。現用系サービスプロセッサ110のCPU送受信
制御モジュール111は、割込みマスク111−1が割
込み許可状態を示しているため、計算機システム100
からの割込みを受け付け、処理要求をメインモジュール
112に渡す。一方、待機系サービスプロセッサ120
のCPU送受信制御モジュール121は、割込みマスク
121−1が割込み禁止状態を示しているため、計算機
システム100からの割込みを禁止し、処理要求を破棄
する。
The computer system 100 requests the service processors 110 and 120 to perform processing by interruption. The CPU transmission / reception control module 111 of the active service processor 110 determines that the interrupt mask 111-1 indicates that the interrupt is permitted.
, And passes a processing request to the main module 112. On the other hand, the standby service processor 120
The CPU transmission / reception control module 121 prohibits the interruption from the computer system 100 and discards the processing request because the interruption mask 121-1 indicates the interruption prohibition state.

【0013】現用系サービスプロセッサ110のメイン
モジュール112は、CPU送受信制御モジュール11
1から処理要求(命令)を渡されると、命令別性能要求
判別テーブル114を参照して、当該要求が現用系の担
当であれば、該要求を処理し、処理結果をCPU送受信
制御モジュール111を通して計算機システム100へ
報告するが、当該要求が待機系の担当であれば、待機側
状態フラグ112−2を参照し、相手の待機系サービス
プロセッサ120が正常の場合、該要求を通信制御モジ
ュール113、サービスプロセッサ間インタフェース線
130を通して待機系サービスプロセッサ120へ送信
する。待機系サービスプロセッサ120のメインモジュ
ール122は、現用系サービスプロセッサ110からの
処理要求を通信制御モジュール123を通して受け取る
と、それを処理し、処理結果を、通信制御モジュール1
23、サービスプロセッサ間インタフェース線130を
通して現用系サービスプロセッサ110へ報告(処理終
了報告)する。通信制御モジュール113、123間の
情報の送受信は、例えばパケット形式で行う。現用系サ
ービスプロセッサ110のメインモジュール112は、
待機系サービスプロセッサ120からの処理結果を通信
制御モジュール113を通して受け取ると、それをCP
U送受信制御モジュール111を通して計算機システム
100へ報告する。もし、待機系サービスプロセッサ1
20が、現用系サービスプロセッサ110より依頼され
た処理中に障害が発生した場合、現用系サービスプロセ
ッサ110の通信制御モジュール113が各処理毎にタ
イムアウト監視をしており、一定時間内に処理結果が報
告されない場合には、メインモジュール112に対して
処理失敗を報告する。これをメインモジュール112
は、タイムアウトによる処理失敗を報告された場合、自
系内で処理を行う。
The main module 112 of the active service processor 110 includes a CPU transmission / reception control module 11
When a processing request (instruction) is passed from 1, the request is processed by referring to the per-instruction performance requirement determination table 114 and if the request is in charge of the active system, and the processing result is passed through the CPU transmission / reception control module 111. The request is reported to the computer system 100. If the request is assigned to the standby system, the request refers to the standby state flag 112-2. If the standby service processor 120 of the other party is normal, the request is transmitted to the communication control module 113. The data is transmitted to the standby service processor 120 through the service processor interface line 130. When receiving the processing request from the active service processor 110 through the communication control module 123, the main module 122 of the standby service processor 120 processes the request and transmits the processing result to the communication control module 1
23. Report to the active service processor 110 through the service processor interface line 130 (processing end report). Transmission and reception of information between the communication control modules 113 and 123 are performed, for example, in a packet format. The main module 112 of the active service processor 110 includes:
When the processing result from the standby service processor 120 is received through the communication control module 113, it is transmitted to the CP.
A report is sent to the computer system 100 through the U transmission / reception control module 111. If the standby service processor 1
If a failure occurs during the processing requested by the active service processor 110, the communication control module 113 of the active service processor 110 monitors the timeout for each processing, and the processing result is not returned within a certain time. If not, a processing failure is reported to the main module 112. This is called the main module 112
Performs processing in its own system when a processing failure due to timeout is reported.

【0014】一方、待機系サービスプロセッサ120の
通信制御モジュール123では、一定時間毎に、サービ
スプロセッサ間インタフェース線130を通して相手通
信制御モジュール113へポーリングを発行して、現用
系サービスプロセッサ110を監視しており、現用系サ
ービスプロセッサ110の障害を検出した場合、それを
メインモジュール122へ報告する。又、現用系サービ
スプロセッサ110は自分自身に障害が発生すると、サ
ービスプロセッサ間インタフェース線130を通して、
待機系サービスプロセッサ120へ障害割込みを上げ、
この障害割込みを待機系サービスプロセッサ120の通
信制御モジュール123が検出し、それをメインモジュ
ール112へ報告する。メインモジュール122は、通
信制御モジュール123から現用系サービスプロセッサ
110の障害報告を受け取ると、自CPU送受信制御モ
ジュール121の割込みマスク121−1を割込み許可
状態に変更し、自メインモジュール122の現用/待機
フラグ122−1を現用系に、待機側状態フラグ122
−2を故障中とする。障害の発生した現用系サービスプ
ロセッサ110では、メインモジュール112が自律的
に、あるいは待機系サービスプロセッサ120が現用系
サービスプロセッサ110を強制的に再立ち上げするこ
とにより、CPU送受信制御モジュール111の割込み
マスク111−1が割込み禁止状態となり、メインモジ
ュール112の現用/待機フラグ112−1が待機系と
なる。この結果、以後の計算機システム100からの要
求は、新現用系サービスプロセッサ120で受け付けら
れることになる。
On the other hand, the communication control module 123 of the standby service processor 120 issues polling to the partner communication control module 113 through the service processor interface line 130 at regular intervals to monitor the active service processor 110. When a failure of the active service processor 110 is detected, the failure is reported to the main module 122. When a failure occurs in the active service processor 110, the active service processor 110 passes through the service processor interface line 130.
Raises a fault interrupt to the standby service processor 120,
This failure interrupt is detected by the communication control module 123 of the standby service processor 120 and is reported to the main module 112. Upon receiving the failure report of the active service processor 110 from the communication control module 123, the main module 122 changes the interrupt mask 121-1 of the own CPU transmission / reception control module 121 to the interrupt enabled state, and the active / standby state of the own main module 122 is changed. The flag 122-1 is set to the active system, and the standby state flag 122 is set.
-2 is assumed to be faulty. In the active service processor 110 in which a failure has occurred, the main module 112 autonomously or the standby service processor 120 forcibly restarts the active service processor 110 so that the interrupt mask of the CPU transmission / reception control module 111 is interrupted. 111-1 is in the interrupt disabled state, and the active / standby flag 112-1 of the main module 112 is set to the standby system. As a result, subsequent requests from the computer system 100 are accepted by the new active service processor 120.

【0015】その後、サービスプロセッサ110の障害
が回復した場合、引き続きサービスプロセッサ120を
現用系とするか、サービスプロセッサ110を現用系に
戻すかは任意である。
Thereafter, when the failure of the service processor 110 is recovered, it is optional whether the service processor 120 is continuously used or the service processor 110 is returned to the active system.

【0016】図3は、サービスプロセッサ(SVP)1
10、120のメインモジュール112、122での特
に本願発明に関係する処理フローの一例を示したもので
ある。ここでは、サービスプロセッサ110のメインモ
ジュール112の場合について説明する。
FIG. 3 shows a service processor (SVP) 1
It shows an example of a processing flow particularly related to the present invention in the main modules 112 and 122 of the modules 10 and 120. Here, the case of the main module 112 of the service processor 110 will be described.

【0017】メインモジュール112は、何らかの処理
要求を受け取ると(ステップ301)、自装置が現用系
サービスプロセッサか否か判定する(ステップ30
2)。自装置が現用系サービスプロセッサの場合、通信
制御モジュール113を通しての待機系サービスプロセ
ッサからの処理終了報告か否か判定する(ステップ30
3)。相手待機系サービスプロセッサからの処理終了報
告の場合、該待機系サービスプロセッサの処理結果を、
CPU送受信制御モジュール111を通して計算機シス
テム100へ報告し(ステップ304)、ステップ30
1へ戻る。
When the main module 112 receives any processing request (step 301), it determines whether or not its own device is an active service processor (step 30).
2). If the own device is the active service processor, it is determined whether or not the processing is a process completion report from the standby service processor through the communication control module 113 (step 30).
3). In the case of a processing end report from the partner standby service processor, the processing result of the standby service processor is
A report is sent to the computer system 100 through the CPU transmission / reception control module 111 (step 304), and
Return to 1.

【0018】待機系サービスプロセッサからの処理終了
報告でない場合、即ち、CPU送受信制御モジュール1
11を通しての計算機システム100からの処理要求の
場合、命令別性能要求判別テーブル114を参照して、
当該要求(命令)の処理担当装置が現用系か待機系か判
定する(ステップ305)。現用系であれば、当該要求
をそのまま処理し(ステップ306)、処理結果をCP
U送受信制御モジュール111を通して計算機システム
100へ報告し(ステップ304)、ステップ301へ
戻る。一方、処理担当装置が待機系であった場合、相手
待機系サービスプロセッサが正常か否か判定し(ステッ
プ307)、もしも正常でない場合(故障中)には、当
該要求をそのまま処理し、処理結果を計算機システム1
00へ報告し(ステップ304)、ステップ301へ戻
る。相手待機系サービスプロセッサが正常であることを
確認すると、当該要求を通信制御モジュール113を通
して相手待機系サービスプロセッサへ送付し、処理を依
頼して(ステップ308)、ステップ301へ戻る。
If it is not a processing end report from the standby service processor, that is, the CPU transmission / reception control module 1
In the case of a processing request from the computer system 100 through No. 11, referring to the instruction-specific performance request determination table 114,
It is determined whether the device in charge of processing the request (command) is an active system or a standby system (step 305). If it is an active system, the request is processed as it is (step 306), and the processing result is
A report is sent to the computer system 100 through the U transmission / reception control module 111 (step 304), and the process returns to step 301. On the other hand, if the device in charge of processing is the standby system, it is determined whether the partner standby system service processor is normal (step 307). If not (in the event of a failure), the request is processed as it is, and the processing result is obtained. Computer system 1
00 (step 304), and returns to step 301. When it is confirmed that the partner standby service processor is normal, the request is sent to the partner standby service processor through the communication control module 113 to request processing (step 308), and the process returns to step 301.

【0019】一方、自装置が待機系サービスプロセッサ
の場合、メインモジュール112は、受け取った処理を
実行する(ステップ309)。そして、当該処理要求が
現用系サービスプロセッサから依頼されたものか否か判
定し(ステップ310)、現用系サービスプロセッサか
らの処理依頼であれば、処理結果を通信制御モジュール
113を通して相手現用系サービスプロセッサへ報告し
(ステップ311)、ステップ301へ戻る。現用系サ
ービスプロセッサからの処理依頼でなかった場合は(例
えば、オペレータによる保守依頼等)、当該処理を実行
後、ステップ310をスキップしてステップ301へ戻
る。
On the other hand, if the own device is a standby service processor, the main module 112 executes the received processing (step 309). Then, it is determined whether the processing request is a request from the active service processor (step 310). If the processing request is a processing request from the active service processor, the processing result is transmitted through the communication control module 113 to the other active service processor. (Step 311), and returns to step 301. If the request is not a processing request from the active service processor (for example, a maintenance request by an operator), after executing the processing, the process skips step 310 and returns to step 301.

【0020】図4は、命令別性能要求判別テーブル11
4、124に図2の内容を適用して、計算機システム1
00から処理要求(命令)が発行された場合の各サービ
スプロセッサ110、120内での具体的な処理の流れ
を示した図である。なお、図4ではCPU送受信制御モ
ジュール111、121は省略してある。
FIG. 4 is a table showing the performance requirement discrimination table 11 for each instruction.
4 and 124 by applying the contents of FIG.
FIG. 9 is a diagram showing a specific processing flow in each service processor 110 and 120 when a processing request (instruction) is issued from 00. In FIG. 4, the CPU transmission / reception control modules 111 and 121 are omitted.

【0021】以下、図4に従い、各サービスプロセッサ
110、120が計算機システム100からの命令をど
のように処理して、本発明を実現しているかを説明す
る。ここでも、サービスプロセッサ110を現用系サー
ビスプロセッサ、サービスプロセッサ120を待機系サ
ービスプロセッサとする。
Hereinafter, how the service processors 110 and 120 process instructions from the computer system 100 to realize the present invention will be described with reference to FIG. Also in this case, the service processor 110 is an active service processor, and the service processor 120 is a standby service processor.

【0022】計算機システム100より命令1が発行さ
れる(400)と、現用系サービスプロセッサ110の
メインモジュール112は処理受付け待ち(410)か
ら処理受付け(411)となり、処理を開始する。ま
ず、メインモジュール112は、命令別性能要求判別テ
ーブル114を参照して、命令1は待機系サービスプロ
セッサ120にて処理すると判断(412)し、相手の
待機系サービスプロセッサ120の正常を確認して、該
待機系サービスプロセッサ120への処理依頼を通信制
御モジュール113へ通知(413)し、処理受付け待
ち(414)に戻る。通知を受け取った通信制御モジュ
ール113は、通信パケットに処理依頼内容を設定し、
待機系サービスプロセッサへ送信(430)する。
When the instruction 1 is issued from the computer system 100 (400), the main module 112 of the active service processor 110 changes from a processing reception waiting (410) to a processing reception (411) and starts processing. First, the main module 112 refers to the per-instruction performance requirement determination table 114, judges that the instruction 1 is to be processed by the standby service processor 120 (412), and confirms that the other standby service processor 120 is normal. Then, the processing request to the standby service processor 120 is notified to the communication control module 113 (413), and the process returns to the processing reception waiting (414). The communication control module 113 that has received the notification sets the processing request content in the communication packet,
The data is sent to the standby service processor (430).

【0023】待機系サービスプロセッサ120の通信制
御モジュール123は、現用系サービスプロセッサ11
0からの通信パケットを受信すると、メインモジュール
122へ通知(440)する。待機系サービスプロセッ
サ120のメインモジュール122は、処理受付け待ち
(450)から処理受付け(451)となり、依頼され
た処理を実行(452)し、現用系サービスプロセッサ
110へ結果報告依頼を通信制御モジュール123へ通
知(453)し、処理受付け待ち(454)に戻る。通
知を受け取った通信制御モジュール123は、通信パケ
ットに処理結果を設定し、現用系サービスプロセッサへ
送信(441)する。
The communication control module 123 of the standby service processor 120 includes the active service processor 11
When the communication packet from 0 is received, the main module 122 is notified (440). The main module 122 of the standby service processor 120 changes from the processing reception waiting (450) to the processing reception (451), executes the requested processing (452), and sends a result report request to the active service processor 110 to the communication control module 123. (453), and returns to waiting for processing (454). The communication control module 123 that has received the notification sets the processing result in the communication packet and transmits it to the active service processor (441).

【0024】現用系サービスプロセッサ110の通信制
御モジュール113は、待機系サービスプロセッサ12
0からの通信パケットを受信すると、メインモジュール
へ通知(431)する。現用系サービスプロセッサ11
0のメインモジュール112は、処理受付け待ち(41
9)から処理受付け(421)となり、処理要求内容が
待機系サービスプロセッサ120からの処理結果と判断
すると、CPU送受信制御モジュール111を通して計
算機システムヘ処理結果を報告(421)し、処理受付
け待ち(422)となる。
The communication control module 113 of the active service processor 110
When the communication packet from 0 is received, it notifies the main module (431). Active service processor 11
0, the main module 112 waits for processing to be accepted (41
From 9), the process is accepted (421), and if the content of the process request is determined to be the process result from the standby service processor 120, the process result is reported (421) to the computer system through the CPU transmission / reception control module 111, and the process is waited for (422). ).

【0025】一方、計算機システム100は命令1の発
行後に、命令2を続けて発行(401)すると、現用系
サービスプロセッサ110のメインモジュール112
は、処理受付け待ち(414)から処理受付け(41
5)となり、処理を開始する。メインモジュール112
は、命令別性能要求判別テーブル114を参照して、命
令2は現用系サービスプロセッサ110にて処理すると
判断(416)し、そのまま処理を実行(417)し、
CPU送受信制御モジュール111を通して計算機シス
テム100ヘ処理結果を報告(418)し、再び処理受
付け待ち(419)に戻る。
On the other hand, when the computer system 100 issues the instruction 1 after issuing the instruction 1 (401), the main module 112 of the active service processor 110
Are waiting for processing (414) and then receiving processing (41).
5), and the process starts. Main module 112
Determines with reference to the instruction-specific performance requirement determination table 114 that the instruction 2 is to be processed by the active service processor 110 (416), and executes the processing as it is (417).
The processing result is reported to the computer system 100 via the CPU transmission / reception control module 111 (418), and the process returns to waiting for processing (419).

【0026】以上のように、ホットスタンバイ方式を利
用して、命令1と命令2を別々のサービスプロセッサ1
10、120で処理する事により、現用系サービスプロ
セッサの負荷軽減が可能となる。
As described above, the instruction 1 and the instruction 2 are separated from each other by using the hot standby system.
By performing the processing in steps 10 and 120, the load on the active service processor can be reduced.

【0027】[0027]

【発明の効果】本発明によれば、計算機システムのサー
ビスプロセッサをホットスタンバイ方式で二重化してい
るシステムにおいて、ホットスタンバイ方式による高信
頼性を確保しつつ、高負荷時の現用系サービスプロセッ
サの処理性能低下を防ぐ事が可能となり、従来以上の性
能向上が見込め、顕著な効果を発揮する。
According to the present invention, in a system in which service processors of a computer system are duplicated by a hot standby system, processing of the active service processor under a heavy load while ensuring high reliability by the hot standby system. It is possible to prevent the performance from dropping, and the performance can be improved more than before.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明によるサービスプロセッサ二重化システ
ムの一実施の形態を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a redundant service processor system according to the present invention.

【図2】命令別性能要求判別テーブルの具体例を示す図
である。
FIG. 2 is a diagram illustrating a specific example of a performance requirement determination table for each instruction.

【図3】現用系サービスプロセッサと待機系サービスプ
ロセッサ共通のメインモジュールの処理フローの一例で
ある。
FIG. 3 is an example of a processing flow of a main module common to an active service processor and a standby service processor.

【図4】計算機システムからの処理要求に対する各サー
ビスプロセッサでの具体的処理の流れを示す図である。
FIG. 4 is a diagram showing a specific processing flow in each service processor in response to a processing request from a computer system.

【図5】ホットスタンバイ方式による障害発生時の処理
引き継ぎを説明する図である。
FIG. 5 is a diagram illustrating a process takeover at the time of occurrence of a failure by the hot standby method.

【符号の説明】[Explanation of symbols]

100 計算機システム 110、120 サービスプロセッサ 111、121 CPU送受信制御モジュール 112、122 メインモジュール 113、123 通信制御モジュール 114、124 命令別性能要求判別テーブル 130 サービスプロセッサ間インタフェース線 REFERENCE SIGNS LIST 100 computer system 110, 120 service processor 111, 121 CPU transmission / reception control module 112, 122 main module 113, 123 communication control module 114, 124 per-instruction performance requirement determination table 130 interface line between service processors

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 計算機システムの各種サービス処理を実
行するサービスプロセッサを現用系と待機系で二重化し
ているシステムにおいて、 あらかじめ現用系での処理と待機系での処理を定義して
おき、 現用系サービスプロセッサは、計算機システムからの処
理要求を判別し、現用系の処理は自サービスプロセッサ
で実行してその処理結果を計算機システムへ報告し、待
機系の処理は待機系サービスプロセッサへ処理を依頼し
て、該待機系サービスプロセッサでの処理結果を計算機
システムへ報告し、 待機系サービスプロセッサは、現用系サービスプロセッ
サから依頼された処理を実行して、その処理結果を現用
系サービスプロセッサへ報告する、ことを特徴とするサ
ービスプロセッサ二重化システムの現用系負荷軽減方
法。
In a system in which a service processor for executing various service processes of a computer system is duplicated between an active system and a standby system, processing in the active system and processing in the standby system are defined in advance, and the active system is defined in the active system. The service processor determines the processing request from the computer system, executes the processing of the active system by its own service processor, reports the processing result to the computer system, and requests the processing of the standby system to the processing system of the standby system. Reporting the processing result of the standby service processor to the computer system, executing the processing requested by the active service processor, and reporting the processing result to the active service processor; A method for reducing the load on an active system of a redundant service processor system.
JP10327979A 1998-11-18 1998-11-18 Method for reducing load of active system in service processor duplex system Pending JP2000148525A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10327979A JP2000148525A (en) 1998-11-18 1998-11-18 Method for reducing load of active system in service processor duplex system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10327979A JP2000148525A (en) 1998-11-18 1998-11-18 Method for reducing load of active system in service processor duplex system

Publications (1)

Publication Number Publication Date
JP2000148525A true JP2000148525A (en) 2000-05-30

Family

ID=18205158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10327979A Pending JP2000148525A (en) 1998-11-18 1998-11-18 Method for reducing load of active system in service processor duplex system

Country Status (1)

Country Link
JP (1) JP2000148525A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100438555B1 (en) * 2001-12-05 2004-07-03 엘지전자 주식회사 Dual processor system using a hard disk and control method thereof
JP2007122439A (en) * 2005-10-28 2007-05-17 Kyocera Corp Communication apparatus and communication method
JP2013092956A (en) * 2011-10-27 2013-05-16 Hitachi Ltd Computer system and information storage method for computer system
JP2014170308A (en) * 2013-03-01 2014-09-18 Nec Computertechno Ltd Information processor, bmc switching method, and bmc switching program
US11113134B2 (en) 2018-03-29 2021-09-07 Nec Platforms, Ltd. Computer system, communications system, control method by computer system, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100438555B1 (en) * 2001-12-05 2004-07-03 엘지전자 주식회사 Dual processor system using a hard disk and control method thereof
JP2007122439A (en) * 2005-10-28 2007-05-17 Kyocera Corp Communication apparatus and communication method
JP4619925B2 (en) * 2005-10-28 2011-01-26 京セラ株式会社 Communication apparatus and communication method
JP2013092956A (en) * 2011-10-27 2013-05-16 Hitachi Ltd Computer system and information storage method for computer system
US9158666B2 (en) 2011-10-27 2015-10-13 Hitachi, Ltd. Computer system and computer system information storage method
JP2014170308A (en) * 2013-03-01 2014-09-18 Nec Computertechno Ltd Information processor, bmc switching method, and bmc switching program
US11113134B2 (en) 2018-03-29 2021-09-07 Nec Platforms, Ltd. Computer system, communications system, control method by computer system, and program

Similar Documents

Publication Publication Date Title
KR100557399B1 (en) A method of improving the availability of a computer clustering system through the use of a network medium link state function
US6859889B2 (en) Backup system and method for distributed systems
US20080288812A1 (en) Cluster system and an error recovery method thereof
EP0398649B1 (en) Remote interrupt processing
CN101442437B (en) Method, system and equipment for implementing high availability
JP2000148525A (en) Method for reducing load of active system in service processor duplex system
JPH09293059A (en) Decentralized system and its operation management method
US6651185B1 (en) High availability platform with fast recovery from failure by reducing non-response time-outs
JP2003345638A (en) Method for controlling storage controller, the storage controller, and program
JPH10116261A (en) Check point restarting method for parallel computer system
JP5691248B2 (en) Task takeover program, processing device, and computer system
JP3008887B2 (en) Computer system having active / standby switching function for each application program and machine-readable recording medium recording the program
KR101883251B1 (en) Apparatus and method for determining failover in virtual system
JP2002116920A (en) Cluster system, monitoring method in cluster system, and computer program
KR100622620B1 (en) System and method for detecting error state which occurs in internet protocol communication system replicated in active-standby mode
CN116204502B (en) NAS storage service method and system with high availability
JP2003256399A (en) Control method for switching in hot standby system
JP2591334B2 (en) Mutual standby system
JPH02310755A (en) Health check system
JP2001175545A (en) Server system, fault diagnosing method, and recording medium
JP2513122B2 (en) Hot standby switching system
JP2001290670A (en) Cluster system
CN115879561A (en) Quantum circuit task timeout reason determining method, device, equipment and storage medium
JPH11184814A (en) Terminal switch device
JPH07152701A (en) Method for distributing load