JP2002149622A - Information processing system - Google Patents

Information processing system

Info

Publication number
JP2002149622A
JP2002149622A JP2000348893A JP2000348893A JP2002149622A JP 2002149622 A JP2002149622 A JP 2002149622A JP 2000348893 A JP2000348893 A JP 2000348893A JP 2000348893 A JP2000348893 A JP 2000348893A JP 2002149622 A JP2002149622 A JP 2002149622A
Authority
JP
Japan
Prior art keywords
communication
cluster
inter
timer
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000348893A
Other languages
Japanese (ja)
Inventor
Hisashi Shiraishi
久 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP2000348893A priority Critical patent/JP2002149622A/en
Publication of JP2002149622A publication Critical patent/JP2002149622A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an information processing system which reduces burden on a CPU and remarkably improves communication performance between clusters by carrying out communication between the clusters continuously. SOLUTION: The information processing system for communication between clusters is provided with management tables 46-1 to 46-n obtained by adding a timer value for monitoring time to a cluster number and a communication instruction unit, and timer count control parts 43-1 to 43-n for updating all the timer values of the tables 46-1 to 46-n and performs time monitoring of the communication between consecutive clusters by each cluster number and communication instruction.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は情報処理システムに
関し、特にクラスタ間通信を行う情報処理システムにお
けるクラスタ間通信命令制御方式に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to an information processing system, and more particularly to an inter-cluster communication command control method in an information processing system for performing inter-cluster communication.

【0002】[0002]

【従来の技術】従来、情報処理システムとしては、図6
に示すように、CPU(中央処理装置)2−1〜2−n
と、装置間の通信等の通信情報を記憶している記憶装置
3−1〜3−nとを備える情報処理装置の構成単位を1
つのクラスタとし、該クラスタを複数個有することとも
に、これらのクラスタ(#1〜#n)5−1〜5−nが
伝送路100で接続されているシステムがある。
2. Description of the Related Art Conventionally, as an information processing system, FIG.
, CPUs (central processing units) 2-1 to 2-n
And a storage unit 3-1 to 3-n that stores communication information such as communication between the devices.
There is a system in which a plurality of clusters are provided, and these clusters (# 1 to #n) 5-1 to 5-n are connected by a transmission line 100.

【0003】上記のシステムにおいて、これらのクラス
タ5−1〜5−nはCPU2−1〜2−n及び記憶装置
3−1〜3−nに接続される通信命令制御部6−1〜6
−nを備えており、通信命令制御部6−1〜6−nには
タイマ部61−1〜61−nと、通信管理部62−1〜
62−nと、応答監視部63−1〜63−nとが配設さ
れている。
In the above-mentioned system, these clusters 5-1 to 5-n are communication command controllers 6-1 to 6 connected to CPUs 2-1 to 2-n and storage devices 3-1 to 3-n.
-N, the communication command control units 6-1 to 6-n have timer units 61-1 to 61-n and communication management units 62-1 to 6-n.
62-n and response monitoring units 63-1 to 63-n are provided.

【0004】タイマ部61−1〜61−nは任意の監視
時間が設定可能であり、その監視時間が経過するとタイ
マ割込みを発生させる。通信管理部62−1〜62−n
はCPU2−1〜2−nの指示でクラスタ間通信処理を
起動し、応答クラスタ間通信がないことを想定して時間
監視を行うためにタイマ部61−1〜61−nを起動
し、タイマ部61−1〜61−nからのタイマ割込みに
よってタイムアウト処理を行う。
The timer sections 61-1 to 61-n can set an arbitrary monitoring time, and generate a timer interrupt when the monitoring time elapses. Communication management units 62-1 to 62-n
Starts the inter-cluster communication process in accordance with the instructions of the CPUs 2-1 to 2-n, starts the timer units 61-1 to 61-n in order to perform time monitoring assuming that there is no response inter-cluster communication, Time-out processing is performed by a timer interrupt from the units 61-1 to 61-n.

【0005】応答監視部63−1〜63−nはクラスタ
間通信で送信先から応答クラスタ間通信が返ってくる
と、その応答データから正常終了か異常終了かを識別し
てCPU2−1〜2−nに通知を行い、また伝送路10
0で異常が発生して応答クラスタ間通信がなくてタイム
アウトした場合、リトライ処理を行って再度クラスタ間
通信を実行後、その結果をCPU2−1〜2−nに通知
する。
When the response inter-cluster communication is returned from the transmission destination in the inter-cluster communication, the response monitoring units 63-1 to 63-n identify the normal end or the abnormal end based on the response data and identify the CPUs 2-1 to CPU-2. -N and the transmission path 10
When an error occurs in 0 and there is no response inter-cluster communication and a timeout occurs, retry processing is performed and inter-cluster communication is executed again, and the result is notified to the CPUs 2-1 to 2-n.

【0006】上記のシステムの処理動作について図7を
参照して説明する。CPU2−1からクラスタ#2への
クラスタ間通信処理が要求されると、通信命令制御部6
−1の通信管理部62−1が起動され、クラスタ#2か
らの応答クラスタ間通信がないことを想定して時間監視
を行うためにタイマ部61−1を起動する。この時、タ
イマ部61−1は任意の時間で時間監視を始める。
The processing operation of the above system will be described with reference to FIG. When an inter-cluster communication process is requested from the CPU 2-1 to the cluster # 2, the communication command control unit 6
-1 is started, and the timer unit 61-1 is started to perform time monitoring assuming that there is no response cluster communication from the cluster # 2. At this time, the timer unit 61-1 starts time monitoring at an arbitrary time.

【0007】その後、通信管理部62−1はクラスタ#
2に対してクラスタ通信を行う。クラスタ#2はクラス
タ#1からのクラスタ間通信を受取って終了すると、ク
ラスタ#1へのクラスタ間処理を行い、応答クラスタ間
通信をクラスタ#1へと送る。この時、クラスタ#1で
は応答クラスタ間通信がくるまで時間監視を実行してい
るので、クラスタ#2からの応答クラスタ間通信がない
限り、他のクラスタ#3〜#nへのクラスタ間通信を行
うことができない。
[0007] Thereafter, the communication management unit 62-1 sets the cluster #
2 and perform cluster communication. When the cluster # 2 receives the inter-cluster communication from the cluster # 1 and ends, the cluster # 2 performs the inter-cluster processing for the cluster # 1, and sends the response inter-cluster communication to the cluster # 1. At this time, the cluster # 1 performs time monitoring until the response inter-cluster communication comes. Therefore, unless there is a response inter-cluster communication from the cluster # 2, the inter-cluster communication to the other clusters # 3 to #n is not performed. Can't do it.

【0008】これは図7に示す後続のクラスタ間通信の
実行が不可能な区間である。上記のシステムは同時期に
複数のクラスタ間通信命令を処理することがないことが
前提にあるため、このようなクラスタ間通信命令制御方
式をとっている。
This is a section in which the subsequent inter-cluster communication shown in FIG. 7 cannot be executed. The above system is based on the premise that it does not process a plurality of inter-cluster communication commands at the same time, and thus adopts such an inter-cluster communication command control method.

【0009】上記のようなクラスタ間通信命令制御方式
では、命令単位に監視することができるように、図8に
示すような管理テーブル7を具備する方法もある。図8
において、管理テーブル7にはクラスタ番号71と、通
信命令72と、データ部73とが互いに対応して蓄積さ
れている。
In the inter-cluster communication command control method as described above, there is also a method of providing a management table 7 as shown in FIG. 8 so that monitoring can be performed on a command basis. FIG.
In the management table 7, a cluster number 71, a communication command 72, and a data section 73 are stored in correspondence with each other.

【0010】従来のクラスタ間通信命令制御方式として
は、特開平7−262110号公報に開示された技術
(第1の技術)がある。第1の技術では同時期に複数の
クラスタ間通信命令を処理することがないことを前提と
しており、送信側クラスタ:受信側クラスタが1:1の
クラスタ間通信命令制御方式である。
As a conventional inter-cluster communication command control method, there is a technique (first technique) disclosed in Japanese Patent Application Laid-Open No. 7-262110. The first technique is based on the premise that a plurality of inter-cluster communication commands are not processed at the same time, and is a 1: 1 inter-cluster communication command control method in which a transmission-side cluster and a reception-side cluster are processed.

【0011】また、上記の通信命令処理の中断を検出す
るには記憶制御装置にて通信が何らかの障害か、受信待
ちタイムアウトが発生した時である。これは1つのクラ
スタにクラスタ間通信を送信して応答クラスタ間通信が
返ってくるか、伝送路で異常が発生してクラスタ間通信
が中断するまでは他のホストに通信ができない方式であ
る。
The interruption of the above-mentioned communication command processing is detected when a communication failure occurs in the storage controller or when a reception wait timeout occurs. This is a method in which communication between other clusters is not possible until the inter-cluster communication is transmitted to one cluster and a response inter-cluster communication is returned or an inter-cluster communication is interrupted due to an abnormality in a transmission path.

【0012】さらに、従来のクラスタ間通信命令制御方
式としては、特開平8−190536号公報に開示され
た技術(第2の技術)がある。第2の技術では、その構
成にクラスタ間のデータ転送を制御する複数のシステム
記憶装置を有している。
Further, as a conventional inter-cluster communication command control method, there is a technique (second technique) disclosed in Japanese Patent Application Laid-Open No. Hei 8-190536. In the second technique, the configuration includes a plurality of system storage devices for controlling data transfer between clusters.

【0013】これは伝送路100を制御するためにシス
テム記憶装置を複数持ち、伝送路100で異常が発生し
た場合、システム記憶装置を動的に切替えることで、シ
ステム記憶装置を動的に変更する場合にCPUによって
動的変更を指示し、クラスタ間通信命令に使用するシス
テム記憶装置を別のものに設定するためである。また、
クラスタ間通信命令のリトライを実行する場合にもCP
Uの指示によって実行している。
The system has a plurality of system storage devices for controlling the transmission line 100. When an abnormality occurs in the transmission line 100, the system storage device is dynamically switched to dynamically change the system storage device. In this case, the dynamic change is instructed by the CPU, and another system storage device used for the inter-cluster communication command is set. Also,
CP when retrying inter-cluster communication command
It is executed according to the instruction of U.

【0014】さらにまた、従来のクラスタ間通信命令制
御方式としては、特開平9−101921号公報に開示
された技術(第3の技術)がある。第3の技術では伝送
路で異常が発生した場合、瞬間的にデータの送受信を停
止して伝送路100の異常が復旧した時、オペレータ操
作作業を行うことなく、データ通信を続行することがで
きるようにしている。第3の技術ではEPUでの負荷の
軽減を図ることができる情報処理装置を提供することを
目的としている。
Further, as a conventional inter-cluster communication command control method, there is a technique (third technique) disclosed in Japanese Patent Application Laid-Open No. 9-101921. According to the third technique, when an abnormality occurs in the transmission line, data transmission and reception is momentarily stopped, and when the abnormality in the transmission line 100 is recovered, data communication can be continued without performing an operator operation operation. Like that. The third technique aims at providing an information processing apparatus capable of reducing the load on the EPU.

【0015】第3の技術では一定時間タイマを起動し、
そのタイマが起動されている間に繰り返しリトライを行
い、伝送路100が復旧するか、タイムオーバするまで
送受信処理を停止することで、瞬間的にデータの送受信
を停止している。
In the third technique, a timer is started for a fixed time,
Retry is repeatedly performed while the timer is running, and transmission / reception processing is stopped until the transmission line 100 is restored or the time is over, thereby instantaneously stopping data transmission / reception.

【0016】一方、従来のクラスタ間通信命令制御方式
としては、特開平8−179969号公報に開示された
技術(第4の技術)がある。第4の技術では命令単位に
監視することができるように管理テーブルを持ってい
る。この管理テーブルはジョブ名、通知条件、通知情報
及び通知先が登録されている。この方式ではシステム上
で動作するジョブ(業務)が障害になった時の障害の通
知方法を上記の管理テーブルで管理している。
On the other hand, as a conventional inter-cluster communication command control method, there is a technique (fourth technique) disclosed in Japanese Patent Application Laid-Open No. 8-179969. In the fourth technique, a management table is provided so that monitoring can be performed for each instruction. In this management table, a job name, a notification condition, notification information, and a notification destination are registered. In this method, a method of notifying a failure when a job (business) running on the system has failed is managed by the management table.

【0017】また、従来のクラスタ間通信命令制御方式
としては、特開平4−301945号公報に開示された
技術(第5の技術)がある。第5の技術ではマルチキャ
スト通信不可能な通信網で接続されたコンピュータ・シ
ステムにおいて、マルチキャスト通信を行っている。管
理テーブルはデータ送信を指示する際の宛先と、終了報
告の受取りとの確認を行うことに使われている。
As a conventional inter-cluster communication command control method, there is a technique (fifth technique) disclosed in Japanese Patent Laid-Open No. Hei 4-301945. In the fifth technique, multicast communication is performed in a computer system connected by a communication network that cannot perform multicast communication. The management table is used for confirming the destination when instructing data transmission and receiving the end report.

【0018】[0018]

【発明が解決しようとする課題】上述した従来のクラス
タ間通信命令制御方式では、第1の技術の場合、複数の
クラスタが伝送路で接続されているシステムにおいて、
接続されているクラスタが増えてしまうと、論理分割構
成等では複数のクラスタに対して非同期のクラスタ間通
信が頻繁に行われる。
In the above-mentioned conventional inter-cluster communication command control system, in the case of the first technique, in a system in which a plurality of clusters are connected by a transmission line,
When the number of connected clusters increases, asynchronous inter-cluster communication is frequently performed for a plurality of clusters in a logically divided configuration or the like.

【0019】この構成で複数のクラスタ間通信がないと
いうことはあり得ない。これは送信側クラスタ:受信側
クラスタが1:nというクラスタ間通信になりえる。ま
た、クラスタ間通信はどうしても伝送路の性能等から応
答が非常に遅いために、送信側は伝送路の性能も考慮し
た待ち時間を設定している。この時に二つ以上のクラス
タに順次クラスタ間通信を行う場合、前のクラスタ間通
信が終了していないと、後続のクラスタ間通信が待たさ
れてしまう。
With this configuration, it is impossible that there is no communication between a plurality of clusters. This can be an inter-cluster communication where the transmitting cluster and the receiving cluster are 1: n. In addition, since the response of the inter-cluster communication is extremely slow due to the performance of the transmission path and the like, the transmitting side sets the waiting time in consideration of the performance of the transmission path. At this time, when inter-cluster communication is sequentially performed on two or more clusters, if the previous inter-cluster communication is not completed, the subsequent inter-cluster communication is waited.

【0020】これではクラスタ間通信を複数のクラスタ
に対して連続的に発行すると、後続のクラスタ間通信が
保留される。よって、送信路で異常が検出されていなく
とも、クラスタ通信処理が保留されて遅くなり、クラス
タ間通信性能が低下し、システムの処理性能にも影響が
でる可能性が高い。
In this case, when the inter-cluster communication is continuously issued to a plurality of clusters, the subsequent inter-cluster communication is suspended. Therefore, even if no abnormality is detected in the transmission path, the cluster communication processing is suspended and slowed down, the inter-cluster communication performance is reduced, and the processing performance of the system is likely to be affected.

【0021】第2の技術の場合には、システム記憶装置
を動的に変更する時やクラスタ間通信のリトライ処理を
行う時にCPUの起動で実行している。これではクラス
タ間通信処理で異常が発生するたびにCPUにかかる負
担が増加するという問題がある。
In the case of the second technique, when the system storage device is dynamically changed or when retry processing of inter-cluster communication is performed, the processing is executed by starting the CPU. This causes a problem that the load on the CPU increases each time an abnormality occurs in the inter-cluster communication processing.

【0022】第3の技術の場合には、一定時間タイマを
起動し、そのタイマが起動されている間に繰り返しリト
ライを行って伝送路が復旧するか、タイムオーバするま
で送受信を停止することで、瞬間的にデータの送受信を
停止している。これでは上記の第1の技術と同様に、ク
ラスタ間通信の発行が連続すると、クラスタ間通信を発
行する度に保留していき、クラスタ通信処理が遅くなっ
てシステムの処理性能にも影響がでるという問題が発生
する。
In the case of the third technique, a timer is started for a fixed time, and while the timer is running, retry is repeatedly performed to restore the transmission path or stop transmission / reception until the time is over. , The transmission and reception of data is momentarily stopped. In this case, as in the first technique described above, if the inter-cluster communication is continuously issued, the inter-cluster communication is suspended every time the inter-cluster communication is issued, and the cluster communication processing is slowed down, thereby affecting the processing performance of the system. The problem occurs.

【0023】第4の技術の場合には、テーブルを管理す
るのが、ジョブ(業務)の障害が発生した時に障害の通
知方法を参照する時のみで、ジョブで行う通信等や命令
の時間監視機能がないため、細かい命令単位の時間監視
ができない。
In the case of the fourth technique, the table is managed only when a failure of a job (business) is referred to when a failure notification method is referred to. Because there is no function, it is not possible to monitor the time in fine instruction units.

【0024】第5の技術の場合には、複数の装置にマル
チキャスト通信を出すが、その完了応答通知が全て終了
するか、時間監視でタイムアウトにならない限り終了し
ない。これは複数の装置に同じ通信を実行する場合に効
率が良いが、1つの装置でも違う通信を実行しようとす
ると、効率が低下する。また、違う通信を連続的に実行
することを迅速に行うことができない。
In the case of the fifth technique, a multicast communication is issued to a plurality of devices, but the communication is not terminated unless all the completion response notifications are completed or a timeout occurs in time monitoring. This is efficient when the same communication is performed for a plurality of devices, but if one device attempts to perform different communication, the efficiency is reduced. Further, it is not possible to quickly execute different communication continuously.

【0025】そこで、本発明の目的は上記の問題点を解
消し、連続的にクラスタ間通信を実行することができ、
CPUにかける負担を軽減させることができるととも
に、クラスタ間通信性能を飛躍的に向上させることがで
きる情報処理システムを提供することにある。
Therefore, an object of the present invention is to solve the above-mentioned problems and to execute inter-cluster communication continuously,
An object of the present invention is to provide an information processing system capable of reducing a load on a CPU and dramatically improving inter-cluster communication performance.

【0026】また、本発明の他の目的は、システムの運
用上の問題でタイムアウト時間を通信命令の優先順位に
伴って設定する必要がある場合に、その設定を容易に変
更することができる情報処理システムを提供することに
ある。
Another object of the present invention is to provide a method for easily changing the setting when the timeout time needs to be set in accordance with the priority of a communication command due to a problem in system operation. It is to provide a processing system.

【0027】[0027]

【課題を解決するための手段】本発明による情報処理シ
ステムは、中央処理装置と、装置間の通信等の通信情報
を記憶している記憶装置とを備える情報処理装置の構成
単位を1つのクラスタとし、そのクラスタを複数個有
し、これらのクラスタが伝送路で接続され、クラスタ間
通信を実行して応答クラスタ間通信がない時に時間監視
によってタイムアウトを検出するタイマ手段と、前記タ
イマ手段によってタイムアウトや通信異常が発生した時
にリトライを行わせるために前記クラスタ間通信の処理
の通信相手クラスタ番号とクラスタ間通信命令とデータ
部とを管理テーブルに設定する通信管理手段と、前記ク
ラスタ間通信の通信異常を監視して前記タイマ手段から
タイムアウトが通知された時に前記クラスタ間通信命令
をリトライする応答監視手段とを前記複数のクラスタ各
々に含む情報処理システムであって、前記時間監視用の
タイマ値を相手先クラスタ番号及び通信命令単位に追加
した管理テーブルと、前記管理テーブルの全てのタイマ
値を更新してタイムアウトした通信命令を前記応答監視
手段に通知するタイマカウント制御手段とを前記複数の
クラスタ各々に備えている。
An information processing system according to the present invention comprises a central processing unit and a storage unit for storing communication information such as communication between the units, wherein the constituent units of the information processing unit are one cluster. Timer means for detecting a time-out by monitoring the time when there is no response inter-cluster communication when these clusters are connected by a transmission line and performing inter-cluster communication; Communication means for setting a communication partner cluster number, an inter-cluster communication command, and a data part of the inter-cluster communication process in a management table in order to cause a retry when a communication error occurs, and communication of the inter-cluster communication. A response for retrying the inter-cluster communication command when a timeout is notified from the timer means while monitoring an abnormality. And a management table in which the timer value for monitoring the time is added to the destination cluster number and the communication command unit, and all the timer values of the management table. Timer count control means for notifying the response monitoring means of a communication instruction that has been updated and timed out is provided for each of the plurality of clusters.

【0028】本発明による他の情報処理システムは、上
記の構成の他に、前記通信命令単位に変更が可能な初期
タイマ値の情報を格納するテーブルを持つ時間設定手段
と、前記通信命令を参照して前記管理テーブルのタイマ
値に前記時間設定手段の初期タイマ値を設定する通信管
理手段とを前記複数のクラスタ各々に具備している。
In another information processing system according to the present invention, in addition to the above-described configuration, time setting means having a table for storing information of an initial timer value which can be changed in units of the communication command, and refer to the communication command. The communication management means for setting the initial timer value of the time setting means to the timer value of the management table is provided for each of the plurality of clusters.

【0029】すなわち、本発明の情報処理システムは、
複数個設定自在としかつ各々時間監視用のタイマ値を相
手先クラスタ番号及び通信命令単位に追加した管理テー
ブルと、管理テーブルの全てのタイマ値を更新するタイ
マカウント制御部とを有している。
That is, the information processing system of the present invention comprises:
It has a management table in which a plurality of timer values can be set freely, and a timer value for time monitoring is added to each other's cluster number and communication command unit, and a timer count control unit that updates all timer values in the management table.

【0030】これによって、連続したクラスタ間通信を
クラスタ、通信命令毎にタイマ監視することが可能とな
るため、クラスタ間通信処理が通信を出せずに保留され
ることもなくなり、クラスタ間通信性能が低下すること
もなく、システムの処理性能にも影響がなく、クラスタ
間通信性能が飛躍的に向上する。
Thus, continuous inter-cluster communication can be monitored by a timer for each cluster and communication command, so that inter-cluster communication processing is not suspended without issuing communication, and inter-cluster communication performance is improved. There is no decrease, and there is no effect on the processing performance of the system, and the inter-cluster communication performance is dramatically improved.

【0031】また、本発明のクラスタ間通信命令制御方
式は、通信命令単位に変更が可能な初期タイマ値の情報
をテーブルで持つ時間設定部を設けることで、システム
の運用上の問題で、タイムアウト時間を通信命令の優先
順位に伴って設定する必要がある場合に、その設定を容
易に変更することが可能となる。
Further, the inter-cluster communication command control method of the present invention has a time setting unit having a table of information on an initial timer value which can be changed in communication command units. When the time needs to be set according to the priority of the communication command, the setting can be easily changed.

【0032】したがって、通信相手のクラスタによって
はシステム性能が著しく遅く、クラスタ間通信の応答が
遅くなる場合や、クラスタ間通信時に伝送路に異常が発
生した場合があるが、その場合でも次のクラスタ間通信
が保留されず、クラスタ間通信が連続的に実行可能とな
るので、CPUにかける負担を軽減させることが可能と
なる。
Therefore, depending on the cluster of the communication partner, the system performance may be extremely slow, and the response of the inter-cluster communication may be slow. In some cases, an abnormality may occur in the transmission path during the inter-cluster communication. Since the inter-communication is not suspended and the inter-cluster communication can be continuously executed, the load on the CPU can be reduced.

【0033】また、受信側クラスタの応答クラスタ間通
信がなく、タイムアウトして伝送路で異常が発生した場
合、CPUの起動なしに通信命令制御部の応答監視部が
判断してリトライ処理を行い、再度実行後、その最終的
な結果のみをCPUに送信するので、CPUに負荷をか
けることがなくなる。
If there is no communication between the response clusters of the receiving side cluster and a timeout occurs and an error occurs in the transmission line, the response monitoring unit of the communication command control unit makes a decision without starting the CPU and performs a retry process. After the execution again, only the final result is transmitted to the CPU, so that no load is imposed on the CPU.

【0034】さらに、クラスタ間通信を実行した時に、
通信相手のクラスタによってはクラスタ間通信の伝送路
の性能等から応答が非常に遅い場合や、伝送路で異常が
発生した場合でも、連続的なクラスタ間通信が実行可能
となり、クラスタ通信処理が保留することなく、クラス
タ間通信性能が飛躍的に向上する。
Further, when the inter-cluster communication is executed,
Depending on the cluster of the communication partner, if the response is extremely slow due to the performance of the transmission path of inter-cluster communication, or if an error occurs on the transmission path, continuous inter-cluster communication can be executed and the cluster communication processing is suspended Without this, the inter-cluster communication performance is dramatically improved.

【0035】[0035]

【発明の実施の形態】次に、本発明の一実施例について
図面を参照して説明する。図1は本発明の一実施例によ
る情報処理システムの構成を示すブロック図である。図
1において、本発明の一実施例による情報処理システム
はCPU(中央処理装置)2−1〜2−nと、装置間の
通信等の通信情報を記憶している記憶装置3−1〜3−
nとを備える情報処理装置の構成単位を1つのクラスタ
とし、該クラスタを複数個有することともに、これらの
クラスタ(#1〜#n)1−1〜1−nが伝送路100
で接続されているシステムである。
Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of an information processing system according to one embodiment of the present invention. In FIG. 1, an information processing system according to an embodiment of the present invention includes CPUs (Central Processing Units) 2-1 to 2-n and storage devices 3-1 to 3 for storing communication information such as communication between the devices. −
n as a single cluster, and a plurality of such clusters (# 1 to #n) 1-1 to 1-n are connected to the transmission line 100.
The system is connected by.

【0036】上記のシステムにおいて、これらのクラス
タ1−1〜1−nはCPU2−1〜2−n及び記憶装置
3−1〜3−nに接続される通信命令制御部4−1〜4
−nを備えており、通信命令制御部4−1〜4−nには
タイマ部41−1〜41−nと、時間設定部42−1〜
42−nと、タイマカウンタ制御部43−1〜43−n
と、通信管理部44−1〜44−nと、応答監視部45
−1〜45−nと、管理テーブル46−1〜46−nと
が配設されている。
In the above system, these clusters 1-1 to 1-n are communication command controllers 4-1 to 4 connected to the CPUs 2-1 to 2-n and the storage devices 3-1 to 3-n.
-N, and the communication command control units 4-1 to 4-n have timer units 41-1 to 41-n and time setting units 42-1 to 4-1-n.
42-n and timer / counter control units 43-1 to 43-n
Communication management units 44-1 to 44-n and a response monitoring unit 45
-1 to 45-n and management tables 46-1 to 46-n are provided.

【0037】タイマ部41−1〜41−nは任意の監視
時間が設定自在となっており、監視時間が経過するとタ
イマ割込みを発生させる。時間設定部42−1〜42−
nは通信命令単位に変更可能なタイムアウト時間の初期
タイマ値を持つ。
The timer sections 41-1 to 41-n can set an arbitrary monitoring time, and generate a timer interrupt when the monitoring time elapses. Time setting units 42-1 to 42-
n has an initial timer value of a timeout time that can be changed for each communication command.

【0038】タイマカウンタ制御部43−1〜43−n
は管理テーブル46−1〜46−nの全てのタイマ値を
更新し、タイムアウトした通信命令を応答監視部45−
1〜45−nに通知する。通信管理部44−1〜44−
nは管理テーブル46−1〜46−nのタイマ値に時間
設定部42−1〜42−nからの通信命令を参照し、初
期タイマ値を基にタイマ値を設定する。
Timer / counter control units 43-1 to 43-n
Updates all the timer values in the management tables 46-1 to 46-n, and sends a communication command that has timed out to the response monitoring unit 45-n.
1-45-n. Communication management units 44-1 to 44-
“n” refers to the communication commands from the time setting units 42-1 to 42-n to the timer values in the management tables 46-1 to 46-n, and sets the timer values based on the initial timer values.

【0039】応答監視部45−1〜45−nは通信管理
部44−1〜44−n及びCPU2−1〜2−nの指示
でクラスタ間通信処理を起動し、応答クラスタ間通信が
ないことを想定して時間監視を行うためにタイマ部41
−1〜41−nを起動し、タイマ部41−1〜41−n
からのタイマ割込みによってタイムアウト処理を行う。
The response monitoring units 45-1 to 45-n start the inter-cluster communication process according to the instructions of the communication management units 44-1 to 44-n and the CPUs 2-1 to 2-n, and there is no response inter-cluster communication. Timer section 41 to monitor time assuming
-1 to 41-n are activated, and the timer units 41-1 to 41-n are activated.
Timeout processing is performed by a timer interrupt from.

【0040】また、応答監視部45−1〜45−nはク
ラスタ間通信で送信先クラスタから応答クラスタ間通信
が返ってくると、その応答データから正常終了か異常終
了かを識別してCPU2−1〜2−nに通知を行い、ま
た伝送路100で異常が発生して応答クラスタ間通信が
なく、タイムアウトした場合にリトライ処理を行い、再
度クラスタ間通信を実行後、その結果をCPU2−1〜
2−nに通知する。
When the inter-cluster communication returns a response inter-cluster communication from the transmission destination cluster in the inter-cluster communication, the response monitoring units 45-1 to 45-n identify the normal end or the abnormal end based on the response data, and determine whether the CPU 2 1 to 2-n, retry processing is performed when there is no response inter-cluster communication due to the occurrence of an abnormality in the transmission path 100 and a timeout occurs, and inter-cluster communication is executed again, and the result is transmitted to the CPU 2-1. ~
2-n is notified.

【0041】管理テーブル46−1〜46−nは同時に
複数のクラスタ間通信が実行されても、相手先クラスタ
番号及び通信命令単位に時間監視を行うことができるよ
うに時間監視用のタイマ値を追加している。
The management tables 46-1 to 46-n store timer values for time monitoring so that time monitoring can be performed in units of communication partner clusters and communication instructions even when a plurality of inter-cluster communications are executed simultaneously. Has been added.

【0042】図2は図1の時間設定部42のテーブルの
構成を示す図である。図2において、時間設定部42の
テーブルにはその格納位置T1〜Tn毎に、通信命令4
2aと、通信命令42a毎に優先順位を考慮した待ち時
間の初期タイマ値42bとが格納されている。尚、図1
に示す時間設定部42−1〜42−nのテーブルの構成
は図2に示す時間設定部42のテーブルと同様の構成と
なっている。
FIG. 2 is a diagram showing the configuration of the table of the time setting unit 42 in FIG. In FIG. 2, the table of the time setting unit 42 includes a communication command 4 for each of the storage positions T1 to Tn.
2a and an initial timer value 42b of the waiting time in consideration of the priority for each communication command 42a are stored. FIG.
Has the same configuration as the table of the time setting unit 42 shown in FIG.

【0043】図3は図1の管理テーブル46の構成を示
す図である。図3において、管理テーブル46には格納
位置K1〜Kn毎に、クラスタ番号46aと、通信命令
46bと、タイマ値46cと、データ部46dとが格納
されている。尚、図1に示す管理テーブル46−1〜4
6−nの構成は図3に示す管理テーブル46と同様の構
成となっている。
FIG. 3 is a diagram showing the configuration of the management table 46 of FIG. 3, the management table 46 stores a cluster number 46a, a communication command 46b, a timer value 46c, and a data section 46d for each of the storage locations K1 to Kn. The management tables 46-1 to 46-4 shown in FIG.
6-n has the same configuration as the management table 46 shown in FIG.

【0044】図4は本発明の一実施例による情報処理シ
ステムにおけるクラスタ間通信の簡易動作を示す図であ
り、図5は本発明の一実施例によるクラスタ間通信命令
制御方式のクラスタ間通信の詳細な動作を示す図であ
る。これら図1〜図5を参照して本発明の一実施例によ
る情報処理システムにおけるクラスタ間通信命令制御に
ついて説明する。
FIG. 4 is a diagram showing a simplified operation of the inter-cluster communication in the information processing system according to one embodiment of the present invention, and FIG. 5 is a diagram showing the inter-cluster communication of the inter-cluster communication command control system according to one embodiment of the present invention. It is a figure showing detailed operation. The inter-cluster communication command control in the information processing system according to the embodiment of the present invention will be described with reference to FIGS.

【0045】クラスタ1−1のCPU2−1はクラスタ
間通信用のデータを記憶装置3−1に設定し(図5ステ
ップS11)、その後に通信命令制御部4−1の通信管
理部44−1へクラスタ間通信の要求を行う(図5ステ
ップS1)。通信管理部44−1はCPU2−1からク
ラスタ間通信の要求を受取ると、管理テーブル46−1
を作成する(図5ステップS52)。
The CPU 2-1 of the cluster 1-1 sets data for inter-cluster communication in the storage device 3-1 (step S11 in FIG. 5), and thereafter, the communication management unit 44-1 of the communication command control unit 4-1. Request for inter-cluster communication (step S1 in FIG. 5). Upon receiving the request for inter-cluster communication from the CPU 2-1, the communication management unit 44-1 receives the management table 46-1.
Is created (step S52 in FIG. 5).

【0046】通信管理部44−1はまず管理テーブル4
6−1を参照して空いている格納位置(図3のK1〜K
nの一カ所)を検索する(図5ステップS53)。管理
テーブル46−1の格納位置が決定すると、管理テーブ
ル46−1にある4つの項目、クラスタ番号46a、通
信命令46b、タイマ値46c、データ部46dを設定
する(図5ステップS54)。
The communication management unit 44-1 starts with the management table 4
Referring to 6-1, the empty storage position (K1 to K in FIG. 3)
n) (step S53 in FIG. 5). When the storage position of the management table 46-1 is determined, the four items in the management table 46-1, the cluster number 46a, the communication command 46b, the timer value 46c, and the data section 46d are set (step S54 in FIG. 5).

【0047】この場合、クラスタ番号46a、通信命令
46bの情報は既にわかっているので即座に設定する。
タイマ値46cについては時間設定部44−1の通信命
令42aと管理テーブル46bとを参照し、それらが同
じ値であれば、時間設定部42の初期タイマ値42bを
読出して設定する。データ部46dについてはCPU2
−1が記憶装置3−1に書込んだデータを読出して設定
する。
In this case, since the information of the cluster number 46a and the communication command 46b is already known, they are set immediately.
For the timer value 46c, the communication command 42a of the time setting unit 44-1 and the management table 46b are referred to, and if they are the same value, the initial timer value 42b of the time setting unit 42 is read and set. CPU 2 is used for data section 46d.
-1 reads and sets the data written in the storage device 3-1.

【0048】通信管理部44−1は管理テーブル46−
1に情報を設定し終えると、タイマ部41−1に対して
任意の時間を設定後、タイマ起動を指示する(図5ステ
ップS55,S21)。通信管理部44−1はクラスタ
1−2(図示せず)へ伝送路100を使い、クラスタ間
通信処理を通信命令付きで発行する(図5ステップS5
6)。この時、クラスタ間通信が成功したならば、通信
管理部44−1は処理を終了する。この時点で他のクラ
スタ#3〜#n[クラスタ#3〜#(n−1)は図示せ
ず]へのクラスタ間通信があれば、再度、上記と同じ処
理を行う。
The communication management section 44-1 has a management table 46-
When the information has been set to 1, the timer section 41-1 sets an arbitrary time and then instructs the timer to start (steps S55 and S21 in FIG. 5). The communication management unit 44-1 issues an inter-cluster communication process with a communication command to the cluster 1-2 (not shown) using the transmission path 100 (step S5 in FIG. 5).
6). At this time, if the inter-cluster communication is successful, the communication management unit 44-1 ends the process. At this time, if there is inter-cluster communication to other clusters # 3 to #n (clusters # 3 to # (n-1) are not shown), the same processing as above is performed again.

【0049】通信管理部44−1から起動されたタイマ
部41−1は設定された任意の時間経過すると(図5ス
テップS22)、タイマカウント制御部43−1へタイ
マ割込みを発生させる。タイマカウント制御部43−1
は管理テーブル46−1のタイマ値46cをタイマ部4
1−1に設定された任意の時間分だけ減算する。
The timer section 41-1 activated by the communication management section 44-1 generates a timer interrupt to the timer count control section 43-1 after a set time elapses (step S22 in FIG. 5). Timer count control unit 43-1
Stores the timer value 46c of the management table 46-1 in the timer unit 4
Subtraction is performed for an arbitrary time set in 1-1.

【0050】その後に、タイマカウント制御部43−1
は任意の時間をタイマ部41−1に設定し、再度、タイ
マ起動を指示する(図5ステップS41)。その結果、
タイマカウント制御部43−1は管理テーブル46−1
のタイマ値46cと同じ時間かかってタイムアウトであ
るかどうかを判定する(図5ステップS42)。その結
果が‘0’でない場合、タイマカウント制御部43−1
は管理テーブル46−1で登録されている全てのタイマ
値を減算したかどうかを判定する(図5ステップS4
3)。
Thereafter, the timer count control section 43-1
Sets an arbitrary time in the timer section 41-1 and instructs the timer to start again (step S41 in FIG. 5). as a result,
The timer count control unit 43-1 includes a management table 46-1.
It is determined whether or not a timeout has occurred due to the same time as the timer value 46c (step S42 in FIG. 5). If the result is not '0', the timer count control unit 43-1
Determines whether all timer values registered in the management table 46-1 have been subtracted (step S4 in FIG. 5).
3).

【0051】タイマカウント制御部43−1は管理テー
ブル46−1で登録されているものがあれば、まだタイ
マ割込みが発生してから1回も減算されていないテーブ
ルがなくなるまで、上記の処理が繰り返される。タイマ
カウント制御部43−1は登録されているものがないな
らば、処理を終了する。また、タイマカウント制御部4
3−1は減算した結果が‘0’である場合、応答監視部
45−1にタイムアウトを通知する。
If there is a table registered in the management table 46-1, the timer count control unit 43-1 performs the above processing until there is no table that has not been decremented even after the timer interrupt has occurred. Repeated. If there is no registered one, timer count control section 43-1 ends the process. The timer count control unit 4
If the result of the subtraction is “0”, 3-1 notifies the response monitoring unit 45-1 of the timeout.

【0052】応答監視部45−1はタイムアウト通知を
受取ると、管理テーブル46−1の中のタイマ値46c
が‘0’になっているテーブルをゼロクリアして削除す
る(図5ステップS61)。その後、応答監視部45−
1はリトライ処理を実行する(図5ステップS62)。
応答監視部45−1はリトライ処理を実行する時に、既
にリトライ処理を実行したかどうかを確認する(図5ス
テップS63)。
When the response monitor 45-1 receives the timeout notification, the timer value 46c in the management table 46-1 is received.
Is cleared to zero and deleted (step S61 in FIG. 5). Thereafter, the response monitoring unit 45-
1 executes a retry process (step S62 in FIG. 5).
When executing the retry processing, the response monitoring unit 45-1 checks whether the retry processing has already been executed (Step S63 in FIG. 5).

【0053】応答監視部45−1は既に、リトライ処理
を行っていないならば、通信管理部44−1にリトライ
起動通知を行い、通信管理部44−1によってリトライ
処理を行う(図5ステップS57)。応答監視部45−
1は既に、リトライ処理を行っていたならば、通信管理
部44−1へ異常終了通知を行い、CPU2−1へ異常
終了通知を行う(図5ステップS58)。
If the response monitoring unit 45-1 has not already performed the retry process, the response monitoring unit 45-1 notifies the communication management unit 44-1 of the retry activation, and the communication management unit 44-1 performs the retry process (step S57 in FIG. 5). ). Response monitoring unit 45-
If the retry processing has already been performed, the communication control unit 1 notifies the communication management unit 44-1 of the abnormal end, and notifies the CPU 2-1 of the abnormal end (step S58 in FIG. 5).

【0054】CPU2−1は異常終了通知を受取ると、
異常終了処理を行って(図5ステップS3)、処理を終
了する。CPU2−1は通信管理部44−1からのクラ
スタ間通信発行時に、伝送路100になんらかの異常が
発生した場合、応答監視部45−1に失敗通知を行う
(図5ステップS81)。失敗通知を受取った応答監視
部45−1はタイムアウト通知を受けた時と同じ動作を
行う(図5ステップS61)。
When the CPU 2-1 receives the abnormal end notification,
An abnormal end process is performed (step S3 in FIG. 5), and the process ends. When any abnormality occurs in the transmission path 100 at the time of issuing the inter-cluster communication from the communication management unit 44-1, the CPU 2-1 notifies the response monitoring unit 45-1 of a failure (step S81 in FIG. 5). Upon receiving the failure notification, the response monitoring unit 45-1 performs the same operation as when receiving the timeout notification (step S61 in FIG. 5).

【0055】CPU2−1からクラスタ1−2へのクラ
スタ間通信処理が終了した場合、クラスタ1−2からは
応答監視部45−1へ応答クラスタ間通信が発行する。
応答監視部45−1は応答クラスタ間通信を受取ると、
応答クラスタ間通信の情報からクラスタ番号及び通信命
令を取得する。応答監視部45−1は取得したクラスタ
番号及び通信命令を、管理テーブル46−1のクラスタ
番号46a及び通信命令46bと比較し、一致したテー
ブルを削除する(図5ステップS64)。
When the inter-cluster communication processing from the CPU 2-1 to the cluster 1-2 is completed, the inter-cluster communication is issued from the cluster 1-2 to the response monitoring unit 45-1.
When the response monitoring unit 45-1 receives the response cluster communication,
The cluster number and the communication command are acquired from the information of the response cluster communication. The response monitoring unit 45-1 compares the acquired cluster number and communication command with the cluster number 46a and communication command 46b of the management table 46-1, and deletes the matched table (step S64 in FIG. 5).

【0056】その後、応答監視部45−1では応答クラ
スタ間通信のデータを基に、通信管理部44−1へ正常
終了通知または異常終了通知を行う。通信管理部44−
1は正常終了通知または異常終了通知を受取ると、CP
U2−1へ正常終了通知または異常終了通知を行い(図
5ステップS59,S60)、CPU2−1で正常終了
処理または異常終了処理を行う(図5ステップS4,S
5)。
Thereafter, the response monitoring unit 45-1 sends a normal end notification or an abnormal end notification to the communication management unit 44-1 based on the data of the response inter-cluster communication. Communication management unit 44-
1 receives a normal end notification or an abnormal end notification,
A normal end notification or an abnormal end notification is sent to U2-1 (steps S59 and S60 in FIG. 5), and a normal end process or an abnormal end process is executed by the CPU 2-1 (steps S4 and S in FIG. 5).
5).

【0057】複数のクラスタ1−1〜1−nが伝送路1
00で接続される情報処理システムにおいて、時間設定
部42,42−1〜42−nのテーブルに、通信命令4
2a毎に優先順位を考慮した待ち時間の初期タイマ値4
2bを設定し、クラスタ間通信を実行すると同時に、初
期タイマ値42bの値が設定されているタイマ値46c
を持つ管理テーブル46,46−1〜46−nを複数
個、設定管理することで、クラスタ間通信処理(CPU
2−1→通信管理部44−1→管理テーブル46−1、
通信管理部44−1→タイマ部41−1、通信管理部4
4−1→クラスタ1−2)と、タイマ部41−1での時
間監視処理と、応答クラスタ間通信を受信後の処理(ク
ラスタ1−2→応答監視部45−1→CPU2−1)と
を独立に動作させることが可能となる。
A plurality of clusters 1-1 to 1-n are connected to the transmission line 1
00, the communication command 4 is stored in the table of the time setting units 42, 42-1 to 42-n.
Initial timer value of waiting time considering priority for each 2a 4
2b to execute the inter-cluster communication, and at the same time, the timer value 46c in which the value of the initial timer value 42b is set.
By setting and managing a plurality of management tables 46, 46-1 to 46-n having
2-1 → communication management unit 44-1 → management table 46-1,
Communication management unit 44-1 → timer unit 41-1; communication management unit 4
4-1 → cluster 1-2), a time monitoring process in the timer unit 41-1 and a process after receiving the response inter-cluster communication (cluster 1-2 → response monitoring unit 45-1 → CPU 2-1). Can be operated independently.

【0058】これによって、新たにクラスタが追加さ
れ、クラスタ間通信が可能になり、クラスタが増えて
も、クラスタ間通信の伝送路100の性能等で、応答ク
ラスタ通信に時間がかかったり、伝送路100が異常に
なっても問題なく連続的なクラスタ間通信を実行するこ
とができる。
As a result, a new cluster is added, and inter-cluster communication becomes possible. Even if the number of clusters increases, it takes time for response cluster communication due to the performance of the transmission path 100 for inter-cluster communication or the like. Even if 100 becomes abnormal, continuous inter-cluster communication can be executed without any problem.

【0059】上記の監視方式によって、全ての連続した
クラスタ間通信をクラスタ、通信命令毎にタイマ監視す
ることができるため、クラスタ間通信処理が通信を出せ
ずに保留されることもなくなり、クラスタ間通信性能が
低下することもなく、システムの処理性能にも影響がな
く、クラスタ間通信性能を飛躍的に向上させることがで
きる。
According to the above monitoring method, all continuous inter-cluster communication can be monitored by a timer for each cluster and communication command. Therefore, the inter-cluster communication processing is not suspended without issuing a communication, and the inter-cluster communication processing is not suspended. The communication performance does not decrease, and the processing performance of the system is not affected, and the inter-cluster communication performance can be dramatically improved.

【0060】[0060]

【発明の効果】以上説明したように本発明の情報処理シ
ステムによれば、時間監視用のタイマ値を相手先クラス
タ番号及び通信命令単位に管理テーブルに追加し、管理
テーブルの全てのタイマ値を更新してタイムアウトした
通信命令を応答監視手段に通知することによって、連続
的にクラスタ間通信を実行することができ、CPUにか
ける負担を軽減させることができるとともに、クラスタ
間通信性能を飛躍的に向上させることができるという効
果がある。
As described above, according to the information processing system of the present invention, a timer value for time monitoring is added to the management table for each destination cluster number and communication command unit, and all timer values in the management table are added. By notifying the response monitoring means of the updated and timed-out communication instruction, the inter-cluster communication can be executed continuously, the load on the CPU can be reduced, and the inter-cluster communication performance can be dramatically improved. There is an effect that it can be improved.

【0061】また、本発明の他の情報処理システムによ
れば、通信命令を参照して管理テーブルのタイマ値に、
通信命令単位に変更が可能な初期タイマ値の情報を格納
するテーブルを持つ時間設定手段の初期タイマ値を設定
することによって、システムの運用上の問題でタイムア
ウト時間を通信命令の優先順位に伴って設定する必要が
ある場合に、その設定を容易に変更することができると
いう効果がある。
According to another information processing system of the present invention, the timer value of the management table is set by referring to the communication command.
By setting the initial timer value of the time setting means having a table for storing the information of the initial timer value that can be changed in communication instruction units, the timeout time is set in accordance with the priority of the communication instruction due to a problem in system operation. When setting is required, there is an effect that the setting can be easily changed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例による情報処理システムの構
成を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an information processing system according to an embodiment of the present invention.

【図2】図1の時間設定部のテーブルの構成を示す図で
ある。
FIG. 2 is a diagram showing a configuration of a table of a time setting unit in FIG. 1;

【図3】図1の管理テーブルの構成を示す図である。FIG. 3 is a diagram showing a configuration of a management table in FIG. 1;

【図4】本発明の一実施例による情報処理システムにお
けるクラスタ間通信の簡易動作を示す図である。
FIG. 4 is a diagram showing a simplified operation of inter-cluster communication in the information processing system according to one embodiment of the present invention.

【図5】本発明の一実施例によるクラスタ間通信命令制
御方式のクラスタ間通信の詳細な動作を示す図である。
FIG. 5 is a diagram showing a detailed operation of the inter-cluster communication of the inter-cluster communication command control method according to one embodiment of the present invention.

【図6】従来例による情報処理システムの構成を示すブ
ロック図である。
FIG. 6 is a block diagram illustrating a configuration of an information processing system according to a conventional example.

【図7】従来例による情報処理システムにおけるクラス
タ間通信の簡易動作を示す図である。
FIG. 7 is a diagram showing a simplified operation of inter-cluster communication in an information processing system according to a conventional example.

【図8】従来のクラスタ間通信命令制御方式の管理テー
ブルの構成を示す図である。
FIG. 8 is a diagram showing a configuration of a management table of a conventional inter-cluster communication command control method.

【符号の説明】[Explanation of symbols]

1−1〜1−n クラスタ(#1〜#n) 2−1〜2−n 中央処理装置 3−1〜3−n 記憶装置 4−1〜4−n 通信命令制御部 41−1〜41−n タイマ部 42,42−1〜42−n 時間設定部 43−1〜43−n タイマカウント制御部 44−1〜44−n 通信管理部 45−1〜45−n 応答監視部 46,46−1〜46−n 管理テーブル 42a,46b クラスタ間通信命令 42b 初期タイマ値 46a クラスタ番号 46c タイマ値 46d データ部 100 伝送路 1-1 to 1-n cluster (# 1 to #n) 2-1 to 2-n Central processing unit 3-1 to 3-n Storage device 4-1 to 4-n Communication command control unit 41-1 to 41 -N timer unit 42, 42-1 to 42-n time setting unit 43-1 to 43-n timer count control unit 44-1 to 44-n communication management unit 45-1 to 45-n response monitoring unit 46, 46 -1 to 46-n Management table 42a, 46b Inter-cluster communication command 42b Initial timer value 46a Cluster number 46c Timer value 46d Data section 100 Transmission path

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 中央処理装置と、装置間の通信等の通信
情報を記憶している記憶装置とを備える情報処理装置の
構成単位を1つのクラスタとし、そのクラスタを複数個
有し、これらのクラスタが伝送路で接続され、クラスタ
間通信を実行して応答クラスタ間通信がない時に時間監
視によってタイムアウトを検出するタイマ手段と、前記
タイマ手段によってタイムアウトや通信異常が発生した
時にリトライを行わせるために前記クラスタ間通信の処
理の通信相手クラスタ番号とクラスタ間通信命令とデー
タ部とを管理テーブルに設定する通信管理手段と、前記
クラスタ間通信の通信異常を監視して前記タイマ手段か
らタイムアウトが通知された時に前記クラスタ間通信命
令をリトライする応答監視手段とを前記複数のクラスタ
各々に含む情報処理システムであって、 前記時間監視用のタイマ値を相手先クラスタ番号及び通
信命令単位に追加した管理テーブルと、 前記管理テーブルの全てのタイマ値を更新してタイムア
ウトした通信命令を前記応答監視手段に通知するタイマ
カウント制御手段とを前記複数のクラスタ各々に有する
ことを特徴とする情報処理システム。
An information processing apparatus including a central processing unit and a storage device that stores communication information such as communication between the devices is defined as one cluster, and a plurality of clusters are provided. A timer means for detecting a timeout by time monitoring when a cluster is connected by a transmission path and executing inter-cluster communication and there is no response inter-cluster communication, and a retry is performed by the timer means when a timeout or communication error occurs. A communication management means for setting a communication partner cluster number, an inter-cluster communication instruction, and a data part in the inter-cluster communication processing in a management table; and monitoring a communication abnormality of the inter-cluster communication and notifying a timeout from the timer means. And a response monitoring means for retrying the inter-cluster communication command when the plurality of clusters are executed. A management table in which the timer value for time monitoring is added to a destination cluster number and a communication command unit; and a communication command that has timed out by updating all timer values in the management table to the response monitoring unit. An information processing system comprising: a timer count control unit for notifying each of the plurality of clusters.
【請求項2】 前記通信命令単位に変更が可能な初期タ
イマ値の情報を格納するテーブルを持つ時間設定手段
と、前記通信命令を参照して前記管理テーブルのタイマ
値に前記時間設定手段の初期タイマ値を設定する通信管
理手段とを前記複数のクラスタ各々に含むことを特徴と
する請求項1記載の情報処理システム。
2. A time setting means having a table for storing information of an initial timer value which can be changed in units of said communication command, and an initial value of said time setting means in a timer value of said management table with reference to said communication command. 2. The information processing system according to claim 1, wherein communication management means for setting a timer value is included in each of the plurality of clusters.
JP2000348893A 2000-11-16 2000-11-16 Information processing system Pending JP2002149622A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000348893A JP2002149622A (en) 2000-11-16 2000-11-16 Information processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000348893A JP2002149622A (en) 2000-11-16 2000-11-16 Information processing system

Publications (1)

Publication Number Publication Date
JP2002149622A true JP2002149622A (en) 2002-05-24

Family

ID=18822388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000348893A Pending JP2002149622A (en) 2000-11-16 2000-11-16 Information processing system

Country Status (1)

Country Link
JP (1) JP2002149622A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013140445A (en) * 2011-12-28 2013-07-18 Fujitsu Ltd Information processing apparatus, control method and control program
JP2014197402A (en) * 2014-05-26 2014-10-16 富士通株式会社 Information processor, control method and control program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013140445A (en) * 2011-12-28 2013-07-18 Fujitsu Ltd Information processing apparatus, control method and control program
US9065706B2 (en) 2011-12-28 2015-06-23 Fujitsu Limited Information processing apparatus, computer-readable recording medium, and control method
JP2014197402A (en) * 2014-05-26 2014-10-16 富士通株式会社 Information processor, control method and control program

Similar Documents

Publication Publication Date Title
US4975914A (en) Non-disruptive session recovery
US20020107966A1 (en) Method and system for maintaining connections in a network
JP4387970B2 (en) Data I / O program, device, and method
JPH0619743B2 (en) Storing method, control method, and storage device for application session in computer network
WO2006125392A1 (en) A computer processing system for realizing data updating and a data updating method
JP2006504186A (en) System with multiple transmission line failover, failback and load balancing
JP2004021556A (en) Memory control device and control process thereof
EP0175170B1 (en) Off-line notification in communication networks
JP3748232B2 (en) Data transmission device, display device, and control system
JP2002149622A (en) Information processing system
JPH1031562A (en) Information processing system
JP5529596B2 (en) Processing method, processing device, communication device, and program
JPH09305558A (en) Data base server for duplex system
JP2003345638A (en) Method for controlling storage controller, the storage controller, and program
JP2002116920A (en) Cluster system, monitoring method in cluster system, and computer program
JP2007053878A (en) Uninterruptible power supply management system
JP2000148525A (en) Method for reducing load of active system in service processor duplex system
JPH0769882B2 (en) Input / output control system having cross-call function and dynamic configuration change method in the system
JP2764836B2 (en) Event priority transfer method
JPH08329023A (en) Parallel electronic computer system
JP2580970B2 (en) Control method of calling process by schedule start
JP2570134B2 (en) Data broadcast transfer method
JP3105025B2 (en) Redundant controller
JP3708602B2 (en) Connection management method
JP2000115168A (en) Fault management system applied to network and network management system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050816

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060110