JPH0281157A - Distributed processing system - Google Patents

Distributed processing system

Info

Publication number
JPH0281157A
JPH0281157A JP23236188A JP23236188A JPH0281157A JP H0281157 A JPH0281157 A JP H0281157A JP 23236188 A JP23236188 A JP 23236188A JP 23236188 A JP23236188 A JP 23236188A JP H0281157 A JPH0281157 A JP H0281157A
Authority
JP
Japan
Prior art keywords
processor
message
network
file
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP23236188A
Other languages
Japanese (ja)
Other versions
JP2749074B2 (en
Inventor
Masayuki Orimo
織茂 昌之
Kinji Mori
森 欣司
Yasuo Suzuki
靖雄 鈴木
Katsumi Kono
河野 克已
Yuko Teranishi
寺西 優子
Masuyuki Takeuchi
竹内 増幸
Yoshihiko Higuchi
善彦 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63232361A priority Critical patent/JP2749074B2/en
Publication of JPH0281157A publication Critical patent/JPH0281157A/en
Application granted granted Critical
Publication of JP2749074B2 publication Critical patent/JP2749074B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

PURPOSE:To ensure the matching properties between the multiplexed files despite the occurrence of a network fault by making each processor itself detect whether it is isolated from a system or not. CONSTITUTION:A process unit 103 of a processor 10 produces a message to store this in a transmission buffer 104 and then sets a timer. In the case the set timer has a time-out state, the unit 103 checks a network fault flag 110 and a circuit fault flag 115. If one or both of these flags 110 and 115 are set in the fault state, the process is interrupted and the isolated state of its own processor is displayed on a terminal connected to its own processor. Then the propriety for continuation of the process is inquired to an operator. Thus it is possible to avoid such a case where a processor isolated from a network locally updates its own file related to the file of another processor within its own processor only.

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、ネットワークにより結合された複数のプロセ
サからなる分散処理システムにおいて、異なるプロセサ
に多重に配置されたファイル間での内容の整合性をネッ
トワーク障害発生/回復時にも保証するための分散処理
方式に関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention provides consistency of content between files multiplexed on different processors in a distributed processing system consisting of a plurality of processors connected by a network. This invention relates to a distributed processing method that guarantees security even in the event of network failure/recovery.

[従来の技術] 複数のプロセサにより、一連の処理を分散して実行する
分散処理システムにおいて、同一処理を実行するプログ
ラムを複数のプロセサに配置し、これらプログラムを非
同期に走らせることにより、処理のノンストップ化を図
るための方式が、例えば、特願昭61−173642号
明細書に示すものが考えられている。ここでは、同一処
理を実行するプログラムが非同期に出力する多重データ
を識別し、一つにしぼるためのボーティング方式が示さ
れている。
[Prior Art] In a distributed processing system that executes a series of processes in a distributed manner using multiple processors, programs that execute the same process are placed on multiple processors, and these programs are run asynchronously to speed up the processing. A method for achieving non-stop operation has been proposed, for example, as shown in Japanese Patent Application No. 173642/1983. Here, a voting method is shown for identifying multiple pieces of data asynchronously output by programs executing the same process and consolidating them into one piece of data.

[発明が解決しようとする課題] 上記従来技術では、同一処理を実行する各プログラムが
各々のファイルを扱っていた場合、各プログラムにより
非同期に更新されるファイル間での内容の整合性を保つ
ための考慮がなされておらず、ネットワーク障害発生時
、上記ファイル間で不整合が発生するという問題があっ
た。
[Problem to be Solved by the Invention] In the above-mentioned conventional technology, when each program that executes the same process handles each file, it is necessary to maintain consistency of content between files that are updated asynchronously by each program. However, there was a problem in that when a network failure occurred, inconsistencies would occur between the above files.

本発明の目的は、分散処理システムにおいて、ネットワ
ーク障害発生時にも、多重化されたファイル間での整合
性を保証するための分散処理方式を提供することにある
An object of the present invention is to provide a distributed processing method for guaranteeing consistency between multiplexed files even when a network failure occurs in a distributed processing system.

[課題を解決するための手段] 上記目的を達成するために、本発明は、各プロセサに、
(1)自内ファイルが多重化されているファイルである
か否かを検出する手段、(2)ネットワーク障害発生を
検出し、その内容を分析する手段をもたせることに特徴
がある。
[Means for Solving the Problems] In order to achieve the above object, the present invention provides each processor with:
It is characterized by having (1) means for detecting whether or not an internal file is a multiplexed file, and (2) means for detecting the occurrence of a network failure and analyzing its contents.

[作用] 上記(1)、(2)手段により、各プロセサは、ネット
ワーク障害発生時に、白肉の多重化ファイルの更新を抑
制することが可能となるため、多重化ファイル間の整合
性を保証することが可能となる。
[Operation] By means of (1) and (2) above, each processor can suppress updates of white multiplexed files when a network failure occurs, thereby ensuring consistency between multiplexed files. becomes possible.

[実施例] 以下1本発明を実施例により詳細半に説明する。[Example] The present invention will be explained in detail below using examples.

第2図は本発明が適用されるシステムの全体構成を示す
図である。10,20.30・・・・・・は処理を実行
するプロセサであり、それぞれ、CRT端末11.21
.31・・・・・・及びディスク12,22゜32・・
・・・・が接続されている。また、これら各プロセサは
各々、ネットワーク接続用のトランシーバ15.25.
35を介してネットワーク1に接続されている。なお1
本実施例では、ネットワークとしてパス型を適用した例
を示すが、これはリング型ネットワークであってもがま
、わない。第2図(b)にネットワーク1上を流れるメ
ツセージのフォーマットを示す、F310,308はメ
ツセージの始めと終了を示すフラグである。CC302
は内容コードでデータの内容や機能に対応したコードで
ある。各プロセサは本内容コードに基づき、ネットワー
クからの受信データが自らに必要なものであるか否かを
判断する。5A303はメツセージを発生したプロセサ
の番号(発生源アドレス)であり、C304は伝導上必
要となる通番である。データD306は、本メツセージ
により転送されるべき情報を格納するりエアであり、F
e2307は誤り検知用のデータである。また、EN3
05は、処理レベルの通番であり、イベント番号を呼ぶ
、イベント番号はプロセサ番号エリアPN30511及
びメツセージ発生通番エリアMN30512とから成る
。なお、本エリアには前もって定められた個数のプロセ
サ番号とメツセージ番号通番の対を格納できるだけのエ
リアがとられている。
FIG. 2 is a diagram showing the overall configuration of a system to which the present invention is applied. 10, 20, 30... are processors that execute processing, and CRT terminals 11, 21, respectively.
.. 31...and disks 12, 22゜32...
... is connected. Each of these processors also has transceivers 15, 25, . . . for network connection.
It is connected to network 1 via 35. Note 1
In this embodiment, an example in which a path type network is applied is shown, but this may also be a ring type network. FIG. 2(b) shows the format of a message flowing on the network 1. F310, 308 are flags indicating the beginning and end of a message. CC302
is a content code that corresponds to the content and function of the data. Based on this content code, each processor determines whether the data received from the network is necessary for itself. 5A303 is the number (source address) of the processor that generated the message, and C304 is a serial number necessary for transmission. Data D306 is an airframe that stores information to be transferred by this message.
e2307 is data for error detection. Also, EN3
05 is a processing level serial number and calls an event number. The event number consists of a processor number area PN30511 and a message generation serial number area MN30512. Note that this area is large enough to store a predetermined number of pairs of processor numbers and message number serial numbers.

第1図(a)はプロセサ10の内部構成を示す図である
。なお、プロセサ20.30・・・・・・も同じ構成で
ある。伝送制御ユニット101は、プロセサ10とネッ
トワーク1間でのデータ転送を行うためのユニットであ
る。また、この伝送制御ユニット101内には、トラン
シーバ15とプロセサ10間の回線1010の障害をメ
ツセージ送受信時に検出するテストユニット1011が
組み込まれている。伝送制御ユニット101は、ネット
ワークより受信したメツセージのうち、自らに必要なメ
ツセージを内容コードテーブル108に基づき選択し受
信バッファ102に格納する。また。
FIG. 1(a) is a diagram showing the internal configuration of the processor 10. Note that the processors 20, 30, . . . have the same configuration. The transmission control unit 101 is a unit for transferring data between the processor 10 and the network 1. Further, a test unit 1011 is incorporated in the transmission control unit 101 to detect a failure in the line 1010 between the transceiver 15 and the processor 10 during message transmission/reception. The transmission control unit 101 selects messages necessary for itself from among the messages received from the network based on the content code table 108 and stores them in the reception buffer 102. Also.

送信バッファ104内のメツセージをネットワークに送
出すると同時に、そのメツセージが自プロセサ内アプリ
ケーションプログラムで必要とする場合は、受信バッフ
ァ102にも格納する。処理ユニット103は、受信バ
ッファ102内のメツセージを入出力データ格納エリア
105内に格納するとともに、この入出力データ格納エ
リア105内のデータにより実行可能となったプログラ
ムを実行する。プログラム実行エリア106は、ディス
ク102内よりプログラムをローディングし実行するた
めのエリアである。また、本システムでは、プログラム
を多重化し複数のプロセサに配置し、各プロセサで非同
期に実行することを可能としており、この場合、同一内
容をもつ複数のメツセージ(すなわち、多重化されたプ
ログラムからの出力メッセージ:以後多重メツセージと
呼ぶ)ガネットワーク上を流れることになる。処理ユ二
ット103は、これら多重メツセージを受信メツセージ
内のイベント番号EN(第2図(b)305)に基づき
識別し、それらのうちから一つを選択する機能をもつ。
When the message in the transmission buffer 104 is sent to the network, it is also stored in the reception buffer 102 if the message is required by the application program within its own processor. The processing unit 103 stores the message in the reception buffer 102 in the input/output data storage area 105 and executes the program made executable by the data in the input/output data storage area 105. The program execution area 106 is an area for loading and executing programs from the disk 102. Additionally, this system allows programs to be multiplexed, placed on multiple processors, and executed asynchronously on each processor. Output message (hereinafter referred to as multiple message) will flow on the network. The processing unit 103 has the function of identifying these multiple messages based on the event number EN (305 in FIG. 2(b)) in the received message and selecting one of them.

ディスク制御ユニット107゜端末制御ユニット114
は、それぞれ、ディスク12とプロセサ10.端末11
とプロセサ10間でのデータ転送を行うためのユニット
である。端末処理ユニツl−113は、端末11からの
入力データを端末制御ユニット114を介して取り込み
、ネットワーク上を流れるメツセージのフォーマットに
変換した後、送信バッファ104に格納する。
Disk control unit 107゜terminal control unit 114
are disk 12 and processor 10., respectively. Terminal 11
This is a unit for transferring data between the processor 10 and the processor 10. The terminal processing unit l-113 takes in input data from the terminal 11 via the terminal control unit 114, converts it into a format of a message flowing on the network, and stores it in the transmission buffer 104.

送信バッファに格納されたこのメツセージは伝送制御ユ
ニットによりネットワークに送出されるとともに、この
メツセージ用いるプログラムが自内に存在する場合は、
受信バッファ102に格納される。また、入出力データ
格納エリア内の端末出力データを端末に出力する。ネッ
トワーク接続フラグ109は、自プロセサがイ也プロセ
サとネットワークを介して互いにメツセージ交換を行え
るか否かを示すフラグであり、ネットワーク障害フラグ
110は、ネットワーク1上に障害が発生しているか否
かを示すフラグであり、回線障害フラグ115はネット
ワークとプロセサ間の回線に障害が発生しているか否か
を示すフラグである。なお、このフラグ110,115
はプロセサ立ち上げ時は障害検知状態がセットされてい
るものとする。
This message stored in the transmission buffer is sent out to the network by the transmission control unit, and if a program that uses this message exists within the device,
It is stored in the reception buffer 102. It also outputs the terminal output data in the input/output data storage area to the terminal. The network connection flag 109 is a flag indicating whether or not the own processor can exchange messages with the input processor via the network, and the network failure flag 110 is a flag indicating whether or not a failure has occurred on the network 1. The line failure flag 115 is a flag indicating whether or not a failure has occurred in the line between the network and the processor. Note that these flags 110, 115
It is assumed that the fault detection state is set when the processor is started up.

また、テストユニット1011はネットワークとの送受
信時にプロセサとネットワーク間の回線異常を検出する
とフラグ115に障害状態をセットする。逆に障害回復
を検出するとフラグ115をリセットする。自プロセサ
番号格納エリア111は、自プロセサにユニークに割り
当てられた番号を格納するエリアであり、通番エリア1
12は、端末処理ユニット113が送信バッファに格納
するメツセージにつける通番を格納しておくエリアであ
る。また、プロセサ10に接続されているディスク12
内には、自プロセサで実行するアプリケーションプログ
ラム1000.2000・・・・・・及びこれらアプリ
ケーションプログラムが用いるファイル1500.25
00・・・・・・が格納されている。
Further, when the test unit 1011 detects a line abnormality between the processor and the network during transmission/reception with the network, it sets a failure state in the flag 115. Conversely, when failure recovery is detected, the flag 115 is reset. The own processor number storage area 111 is an area for storing a number uniquely assigned to the own processor, and the serial number area 1
12 is an area in which the terminal processing unit 113 stores a serial number assigned to a message stored in the transmission buffer. Also, a disk 12 connected to the processor 10
Inside are application programs 1000.2000 executed on the own processor and files 1500.25 used by these application programs.
00... is stored.

また、これら各プログラム、ファイルごとに、多重化さ
れたものであるか否が、すなわち、システム内に同一プ
ログラム、ファイルが存在するか否か、また、存在する
場合には、それらに関する情報を格納しておくための多
重情報テーブル(プログラム=1001,2001・・
・・・・、ファイル:1501.2501.・・・・・
・)も格納されている。
In addition, for each of these programs and files, whether or not they are multiplexed, that is, whether or not the same programs and files exist in the system, and if they exist, information about them is stored. Multiple information table (program = 1001, 2001...
..., File: 1501.2501.・・・・・・
) are also stored.

次に、この多重情報テーブルの内容を第1図(b)に示
す。多重情報テーブルは、システム内に存在する同一プ
ログラム又は、ファイルの数を示すエリア10011、
及び、多重プログラム、又は。
Next, the contents of this multiplex information table are shown in FIG. 1(b). The multiplex information table includes an area 10011 indicating the number of identical programs or files existing in the system;
and multiple programs, or.

ファイルが格納されているプロセサのプロセサ番号で格
納するエリア10012より構成される。
It is composed of an area 10012 in which the processor number of the processor in which the file is stored is stored.

次に、入出力データ格納エリア105の内容を第1図(
c)に示す。エリア1行目1051は。
Next, the contents of the input/output data storage area 105 are shown in FIG.
Shown in c). Area 1 line 1051 is.

アプリケーションプログラム1000に対する入出力デ
ータ格納エリアである。10511には入力データが、
10512には出力データが格納される。プログラムエ
リア10513には、10511に格納された入力デー
タを用いて処理を実行するプログラム(すなわち、10
00)を示すエリアである。ファイルエリア10514
は10513に示されているプログラムがアクセスする
ファイルを示すエリアである。エリア10513゜10
514の内容はあらかじめ設定されているものとする。
This is an input/output data storage area for the application program 1000. 10511 has input data,
Output data is stored in 10512. Program area 10513 contains a program that executes processing using input data stored in 10511 (i.e., 10
00). File area 10514
is an area indicating a file accessed by the program shown at 10513. Area 10513°10
It is assumed that the contents of 514 are set in advance.

フラグエリア10515は、10513に示されている
プログラムの実行可否を示すフラグである。2行目10
52はアプリケーションプログラム2000の入出力デ
ータを格納するエリアである。以下、同様に各アプリケ
ーションプログラムごとに入出力データを格納するエリ
アがとらえられる。なお、端末に出力されるデータの場
合は、プログラムエリア10513に端末処理ユニット
を示す情報が設定される。第1図(d)は入力データ格
納エリア10511のフォーマットを示す図である。エ
リア105111には入力データの内容コードがあらか
じめ設定されている。
Flag area 10515 is a flag indicating whether the program shown in 10513 can be executed. 2nd line 10
52 is an area for storing input/output data of the application program 2000. Below, areas for storing input/output data are similarly captured for each application program. Note that in the case of data to be output to a terminal, information indicating the terminal processing unit is set in the program area 10513. FIG. 1(d) is a diagram showing the format of the input data storage area 10511. In area 105111, the content code of input data is set in advance.

エリア105112は入力データが格納されているか否
かを示すフラグのためのエリアであり、エリア1051
13はイベント番号を格納するためのエリア、エリア1
05114は、ネットワークより受信したメツセージ内
のデータ部内容を格納するためのエリアである。アプリ
ケーションプログラムが複数の入力データを用いる場合
は、上記各エリア105111〜105114が各入力
データごとにとらえる。なお、出力データ格納エリアも
同一フォーマットである。
Area 105112 is an area for a flag indicating whether or not input data is stored.
13 is an area for storing event numbers, area 1
05114 is an area for storing the contents of the data part in the message received from the network. When the application program uses a plurality of input data, each of the areas 105111 to 105114 captures each input data. Note that the output data storage area also has the same format.

次に、各プロセサにおける多重メツセージの処理方式に
ついて簡単に示す、なお、以下に示す多重メツセージ処
理方式については、例えば、特願昭61−173642
号明細書に詳しく示されている。
Next, the multiple message processing method in each processor will be briefly described.
Details are shown in the specification.

(1)端末処理ユニット113 端末より入力されたデータにより、第2図(b)に示し
たフォーマットのメツセージを生成する。
(1) Terminal processing unit 113 Generates a message in the format shown in FIG. 2(b) based on data input from the terminal.

この際、メツセージ内イベント番号エリアのPN部(第
2図(b)30511)に自プロセサ番号格納エリア(
第1図(a)111)内容を、MN部(第2図(b)3
0512)に通番エリア内容(第1図(a)112)を
設定する。また、通番エリア内容を1増加させる。
At this time, the own processor number storage area (
Figure 1 (a) 111) contents in the MN part (Figure 2 (b) 3
0512), the contents of the serial number area (112 in FIG. 1(a)) are set. Also, the contents of the serial number area are increased by 1.

(2)処理ユニット103 (i)イベント番号中継 プログラム実行エリア(第1図(a)106)内で実行
されているアプリケーションプログラムが出力するデー
タから第2図(b)に示したフォーマットのメツセージ
を生成する。この際、メツセージ内イベント番号エリア
に、そのプログラムの入力メツセージ内のイベント番号
エリア内容をコピーする。
(2) Processing unit 103 (i) Converts a message in the format shown in FIG. 2(b) from the data output by the application program running in the event number relay program execution area (106 in FIG. 1(a)). generate. At this time, the contents of the event number area in the input message of the program are copied to the event number area in the message.

(n)多重メツセージ識別 処理ユニット103は、ネットワークより受信したメツ
セージのうちから、同一内容コード及び同一イベント番
号をもつメツセージ(すなわち、多重メツセージ)を識
別し、これらのうちから1つのメツセージを選択する。
(n) The multiple message identification processing unit 103 identifies messages with the same content code and the same event number (i.e., multiple messages) from among the messages received from the network, and selects one message from among these messages. .

第3図は、第2図で示したシステt1構成において、ネ
ットワーク障害が発生した場合にファイル間で不整合が
発生する場合の一例で示したものである。第3図(a)
は、障害が発生していない場合の状態を示したものであ
る。プロセサ1O220で同一のアプリケージ滋ンプロ
グラムP工を実行しており、これら各プログラムはそれ
ぞれ自プロセサディスク内のファイルF工をアクセスし
ている。また、プロセサ10.20内の両プログラムと
もプロセサ10に接続されている端末11とデータ交換
を行っている。ここで、プロセサ10には、自内プログ
ラムからの端末11への出力データのみでなく、プロセ
サ20からの端末11への出力データもネットワークよ
り到達するが、これらのデータは前述した多重メツセー
ジ処理方式により1つの選択され端末11に出力される
FIG. 3 shows an example of a case where inconsistency occurs between files when a network failure occurs in the system t1 configuration shown in FIG. 2. Figure 3(a)
shows the state when no failure has occurred. The same application program P is executed on the processor 10220, and each of these programs accesses the file F in its own processor disk. Both programs in the processor 10 and 20 also exchange data with the terminal 11 connected to the processor 10. Here, not only the output data from the internal program to the terminal 11 but also the output data from the processor 20 to the terminal 11 reach the processor 10 from the network, but these data are processed by the multiple message processing method described above. One is selected and output to the terminal 11.

第3図(b)、(0)はそれぞれ、ネットワーク障害、
プロセサ10とネットワーク間回線障害が発生した場合
を示す、いずれの場合も、従来方式ではプロセサ10は
自内のみで処理を続行してしまうため、プロセサ10の
ファイルF8とプロセサ20のファイルF2の間に不整
合が発生する。
Figures 3(b) and (0) show network failure,
This shows a case where a line failure occurs between the processor 10 and the network. In either case, in the conventional method, the processor 10 continues processing only within itself, so the file F8 of the processor 10 and the file F2 of the processor 20 Inconsistency occurs.

以下、本発明方式を第4図以降を用いて詳細に説明する
Hereinafter, the system of the present invention will be explained in detail using FIG. 4 and subsequent figures.

第4図は、各プロセサの立ち上げ時の処理を示すフロー
である。処理ユニット(第1図(a)103)は自プロ
セサ立ち上げ時、ます、入出力データ格納エリアのプロ
グラム部(第1図(C)10513)、ファイル部(第
1図(c)10514)より、自内のアプリケーション
プログラム及び、それらがアクセスファイルを示す情報
をデータ部(第2図(b)306)にもつメツセージを
作成しく処理401)、送信バッファに格納(処理40
2)した後、前もって設定された時間T、のタイマをセ
ットする(処理403)。本メツセージには、立ち上げ
情報であることを示す内容コードがつけられている。本
メツセージは伝送制御ユニットによりネットワークに送
出される。
FIG. 4 is a flowchart showing processing when starting up each processor. When the processing unit (Fig. 1 (a) 103) starts up its own processor, the program part (Fig. 1 (C) 10513) and file part (Fig. 1 (c) 10514) of the input/output data storage area are read. , create a message with information indicating the internal application programs and the files they access in the data section (306 in FIG. 2(b)) (process 401), and store it in the transmission buffer (process 40).
2) After that, a timer for a preset time T is set (process 403). This message is attached with a content code indicating that it is startup information. This message is sent to the network by the transmission control unit.

第5図は、ネットワークよりメツセージ受信時の処理ユ
ニット103の処理フローを示す図である。処理ユニッ
トはまず、受信バッファ(第1図(a)102)より自
内にメツセージを取り込み、その内容コードを判定する
(処理501)。この内容コードが、第4図で示したプ
ロセサ立ち上げ時のメツセージの内容コードである場合
は、そのデータ部に示されているファイルと同一ファイ
ルが自内に存在するか否かを判定する(処理504)。
FIG. 5 is a diagram showing the processing flow of the processing unit 103 when receiving a message from the network. The processing unit first receives a message from the reception buffer (102 in FIG. 1(a)) and determines its content code (processing 501). If this content code is the content code of the message when starting up the processor shown in Figure 4, it is determined whether or not the same file as the file shown in the data section exists within the device ( Processing 504).

自内に存在しない場合はデータ部内に受信メツセージの
発生源プロセサ番号をセットした確認応答メツセージを
生成し、送信バッファにセットする(処理507))。
If it does not exist within itself, it generates an acknowledgment message in which the source processor number of the received message is set in the data field, and sets it in the transmission buffer (process 507).

存在する場合は、そのファイルに対応する自ディスク内
の多重情報テーブル(第1図(a)1501,2501
.=iのN。
If the file exists, the multiplex information table (1501, 2501 in Fig. 1(a)) in the own disk corresponding to the file is
.. =N of i.

部(第1図(b)10011)を1増加させるとトモニ
、PH1部(第1図(b)10012) に、受信メツ
セージ内SA部の内容(すなわち、発生源プロセサ番号
)を登録する(処理505)。次に、ファイル応答メツ
セージを生成し送信バッファにセットする(処理506
)、ここで、ファイル応答メツセージとは、データ部に
、受信した立ち上げ時メツセージの発生源プロセサ番号
と、処理505で検出した自内同−フアイルの情報をも
つメツセージのことである。
When the PH1 section (10011 in FIG. 1(b)) is incremented by 1, the content of the SA section (i.e., the source processor number) in the received message is registered in the PH1 section (10012 in FIG. 1(b)). 505). Next, a file response message is generated and set in the transmission buffer (process 506).
), here, the file response message is a message that has the source processor number of the received start-up message in the data section and information about the same file within the same file detected in process 505.

次に、第4図の示した立ち上げ情報メツセージを送出し
たプロセサの立ち上げ情報メツセージ送出後の処理につ
いて、同じく、第5図を用いて説明する。立ち上げプロ
セサは、システム内に同一ファイルをプロセサが存在す
る場合は、上述したファイル応答情報をネットワークよ
り受(iする。
Next, the processing after sending the start-up information message by the processor that sent the start-up information message shown in FIG. 4 will be explained with reference to FIG. 5 as well. If there are processors with the same file in the system, the startup processor receives the above-mentioned file response information from the network.

このときの処理を以下に示す。まず、処理ユニットは、
受信バッファ内のメツセージを自内にとりこみ、その内
容コードを判定する(処理501)。
The processing at this time is shown below. First, the processing unit
The message in the reception buffer is taken in and its content code is determined (processing 501).

内容コードが、ファイル応答メツセージであることを示
すものである場合、まず、そのメツセージのデータ部内
に自プロセサ番号が設定されているか否かを判定する(
処理508)。自プロセサ番号が設定されていない場合
はそのまま処理を終了する。自プロセサ番号が設定され
ている場合は、メツセージ内データ部に設定されている
ファイルと同一の自ディスク内のファイルに対応する多
重情報テーブルを更新する(処理509)(更新方法は
処理505と同一)。
If the content code indicates that it is a file response message, first determine whether or not the own processor number is set in the data section of the message (
Processing 508). If the own processor number is not set, the process ends immediately. If the own processor number is set, update the multiplex information table corresponding to the file in the own disk that is the same as the file set in the data part of the message (process 509) (the update method is the same as process 505). ).

次に、第4図403でセットしたタイマがT1経過によ
りタイムアウトとなった場合の処理を以下に示す。この
場合、処理ユニットは第1図(a)に示したネットワー
ク障害フラグ110及び@線障害フラグ115をチエツ
クし、両方とも障害状態がセットされていなければ、そ
のまま処理を続行する。逆に、どちらか、あるいは両方
の障害状態が設定されている場合は、そこで処理を中断
し、自プロセサに接続されている端末に自プロセサが孤
立状態にあることを表示し、処理継続の可否をオペレー
タに問う。
Next, the processing when the timer set at 403 in FIG. 4 times out due to the elapse of T1 will be described below. In this case, the processing unit checks the network fault flag 110 and the @ line fault flag 115 shown in FIG. 1(a), and if both are not set to a fault state, the processing continues. On the other hand, if one or both of them are set to a failure state, processing will be interrupted, a message indicating that the own processor is in an isolated state will be displayed on the terminal connected to the own processor, and a check will be made as to whether processing can be continued. Ask the operator.

次に、確認応答メツセージ受信時の処理ユニットの処理
について同じく第5図を用いて示す。受信メツセージの
内容コードが確認応答メツセージを示すものである場合
(処理501)は、第1図(a)110のネットワーク
障害フラグをリセット(すなわち、無障害状態を示す)
する(処理511)。
Next, the processing of the processing unit when receiving the confirmation response message will be described using FIG. 5 as well. If the content code of the received message indicates an acknowledgment message (processing 501), the network failure flag 110 in FIG.
(processing 511).

次に、各プロセサにおけるネットワーク障害発生検出方
法を以下の2ケースに分けて示す。
Next, the method for detecting the occurrence of a network failure in each processor will be explained in the following two cases.

(1)自プロセサ接続端末からのプログラム実行時(第
3図プロセサ10) (i)他プロセサからの端末出力メツセージを受信しな
いことにより障害を検出する、(n)回線障害フラグ(
第1図(a)1.15)がセットされたことにより、自
プロセサとネットワーク間の回線障害を検出する。
(1) When executing a program from a terminal connected to its own processor (processor 10 in Figure 3) (i) Detects a failure by not receiving a terminal output message from another processor, (n) Line failure flag (
By setting 1.15) in FIG. 1(a), a line fault between the own processor and the network is detected.

(2)ネットワークデータによるプログラム実行時 (i)端末からのデータ読み込み時に、端末からの応答
無しにより障害を検出する。
(2) When executing a program using network data (i) When reading data from a terminal, a failure is detected by no response from the terminal.

(ii)上述した(i)−(ii)と同様にして回線障
害を検出する。
(ii) Line faults are detected in the same manner as in (i) to (ii) above.

上記で(1)−(i)で障害を検出したプロセサは、デ
ータ部に自プロセサ番号を設定した確認メツセージを出
力する。この処理を第6図に示す。
The processor that detected the failure in (1)-(i) above outputs a confirmation message with its own processor number set in the data section. This process is shown in FIG.

まず、ネットワーク障害フラグ(第1図(a)110)
を障害状態に設定(処1!i!601)した後、現在ア
クセスファイルのうち、多重情報テーブル内NO(第1
図(b)10111)の値が2以−Fのファイルの更新
を抑止する(処理602)。吹に確認メツセージを生成
し、送信バッファに設定することによりネットワークに
送出しく処理603)、前もって設定された時間T2の
タイマセットする(処理6o4)。この確認データを受
信した各プロセサは第5図の処理502により確認応答
メツセージ(処理507と同一)をネットワークに送出
する。ネットワークより、この確認応答メツセージを受
信した上記障害検出プロセサは。
First, the network failure flag (110 in FIG. 1(a))
After setting the file to failure state (processing 1!i!601), among the currently accessed files, the number (first
The update of files with a value of 2 or more -F in FIG. 10111) is suppressed (processing 602). A confirmation message is immediately generated and sent to the network by setting it in the transmission buffer (process 603), and a timer for a preset time T2 is set (process 6o4). Each processor that has received this confirmation data sends an acknowledgment message (same as process 507) to the network in process 502 of FIG. The failure detection processor receives this acknowledgment message from the network.

第5図の処理511を行い、ネットワーク障害フラグを
リセットする。次に、第6図の処理604でセットした
タイマのタイムアウトを検出した上記障害検出プロセサ
は、自内ネットワーク障害フラグをチエツクし、フラグ
がリセットされていればファイル更新抑止を解除し、そ
のまま処理で続行する。リセットされていない場合は第
7図処理を行う。
Process 511 in FIG. 5 is performed to reset the network failure flag. Next, the failure detection processor that detected the timeout of the timer set in process 604 in FIG. continue. If it has not been reset, the process shown in FIG. 7 is performed.

また、(1) −(ii)で自プロセサとネットワーク
間の回線の障害を検出したプロセサも、山内多重ファイ
ル更新を抑止状態とした後、第7図処理を行う。まず、
抑止状態となっているファイルをアクセスするアプリケ
ーションプログラムを、入出力データ格納エリアのプロ
グラム部(第1図(c)10513)、ファイル部(第
1図(c)10514)の情報により検出しく処理70
1)検出したプログラムが実行中である場合は(処理7
02)、ファイル内容をユーザプログラムUP実行前に
回復する(処理704)。次々検出したプログラムに対
応する入出力データ格納エリアのフラグエリア1051
5に実行不可をセットする(処理703)。
Furthermore, the processor that has detected a fault in the line between its own processor and the network in (1) to (ii) also performs the process shown in FIG. 7 after setting Yamauchi multiple file update to a inhibited state. first,
Process 70 to detect an application program that accesses a file that is in a inhibited state based on the information in the program section (FIG. 1(c) 10513) and file section (FIG. 1(c) 10514) of the input/output data storage area.
1) If the detected program is running (process 7)
02), the file contents are recovered before the user program UP is executed (processing 704). Flag area 1051 of the input/output data storage area corresponding to programs detected one after another
5 is set to "impossible to execute" (processing 703).

以上の処理により、ネットワーク障害によりシステム内
で孤立状態となったプロセサは、多重化されているファ
イル、すなわち、他プロセサに同一内容のファイルが存
在するファイルに関しては、自プロセサ内のみで勝手に
更新してしまうことがなくなる。このため、ネットワー
ク障害を回復して、孤立したプロセサをネットワークに
復帰させる際は、−旦、システムを止め、復帰プロセサ
内の多重化ファイルに対してはシステム内の同一内容フ
ァイルをコピーするのみでファイル回復が可能となる。
Through the above processing, a processor that becomes isolated in the system due to a network failure will automatically update files that are multiplexed, that is, files that have the same content on other processors, only within its own processor. You won't have to do anything like that. Therefore, when recovering from a network failure and returning an isolated processor to the network, it is necessary to first stop the system and then copy the same file in the system to the multiplexed file in the restored processor. File recovery is possible.

また、この、ファイル回復をシステムを止めることな(
自動的に行うことも可能である。これは、孤立プロセサ
に、孤立状態解消を検出し、解消検出時に、第4図で示
した立ち上げ情報メツセージを発生することにより達成
される。ここで、立ち上げ情報メツセージは次のタイミ
ングで発生する。
Also, this file recovery can be done without stopping the system (
It is also possible to do this automatically. This is accomplished by detecting the cancellation of the isolated state and generating the start-up information message shown in FIG. 4 upon detection of the cancellation of the isolated state. Here, the start-up information message is generated at the following timing.

■ネットワーク障害フラグセラト時:ネットワークより
メツセージ受信時 ■回線障害フラグセット時:テストユニット(第1図(
a)lort)により回線障害回復検出時 立ち上げ情報メツセージを受信した各プロセサは第5図
処理506の後に、立ち上げ情報メツセージ内のファイ
ルと同一の自内ファイルの内容をネットワークに送出す
る(ファイルコピーメツセージ)、一方、立ち上げ情報
メツセージを発生したプロセサは、ネットワークよりフ
ァイルコピーメツセージを受信するとそれを自ディスク
内に格納する。また、ネットワーク障害回復検出からフ
ァイルコピーメツセージ受信までに、ネットワークから
受信したファイル更新メツセージを自内バッファにバッ
ファリングしておき、このバッファリングメツセージと
、ファイルコピーメツセージに基づき自内ファイル内容
を回復する。なお、この障害回復検出後のファイル回復
方式については、例えば特開昭62−102342号公
報に詳細に示されている。
■When the network failure flag is set: When a message is received from the network ■When the line failure flag is set: Test unit (see Figure 1)
After processing 506 in FIG. 5, each processor that has received the start-up information message upon detection of line failure recovery by (a) lort) sends the contents of its own internal file, which is the same as the file in the start-up information message, to the network (file On the other hand, when the processor that generated the start-up information message receives the file copy message from the network, it stores it in its own disk. Also, from the time network failure recovery is detected until the file copy message is received, the file update message received from the network is buffered in the internal buffer, and the internal file contents are recovered based on this buffering message and the file copy message. . The file recovery method after failure recovery detection is described in detail in, for example, Japanese Patent Laid-Open No. 102342/1983.

[発明の効果] 本発明によれば、分散処理システムにおいて、ネットワ
ークから孤立したプロセサが、他プロセサ内ファイルと
関連する自内ファイルを自プロセサ内のみでローカルに
更新してしまうことがなくなるため、ファイル間での整
合性を保証することが容易になる。また、孤立したプロ
セサがシステムに復帰する場合、このプロセサ内のファ
イル回列をオンラインで自動的に行うことが可能となる
[Effects of the Invention] According to the present invention, in a distributed processing system, a processor isolated from a network does not locally update internal files related to files in other processors only within its own processor. It becomes easier to guarantee consistency between files. Furthermore, when an isolated processor returns to the system, it becomes possible to automatically perform file rotation within this processor online.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、プロセサ内構成を示す図、第2図はシステム
全体構成を示す図、第3図はシステム運用状態を示す図
、第4図〜第7図は本発明方式の処理フローを示す図で
ある。 CC・・・内容コード EN・・・イベント番号 D ata・・・データ部 第7目 Cb) (c) Cd) 第2目 (IL) υ) (A) 茅/;を目 第乙目
FIG. 1 is a diagram showing the internal configuration of the processor, FIG. 2 is a diagram showing the overall system configuration, FIG. 3 is a diagram showing the system operation status, and FIGS. 4 to 7 are diagrams showing the processing flow of the method of the present invention. It is a diagram. CC...Contents code EN...Event number D ata...Data part 7th item Cb) (c) Cd) 2nd item (IL) υ) (A) Kaya/; wo item 2nd item

Claims (1)

【特許請求の範囲】 1、複数のプロセサをネットワークで統合した分散処理
システムにおいて、各プロセサが、自らがシステムから
孤立した状態であるか否かを検出することで特徴とする
分散処理方式。 2、各プロセサが、自内フィルムが他プロセサ内ファイ
ルと関連するものであるか否かを検出することを特徴と
する請求項1記載の分散処理方式。 3、各プロセサは、自らがシステムから孤立したことを
検出した時に、自内のプログラムの実行の可否を判定す
ることを特徴とする請求項1記載の分散処理方式。 4、各プロセサは、自らが、孤立状態から回復したこと
を検出することを特徴とする請求項3記載の分散処理方
式。
[Scope of Claims] 1. A distributed processing system characterized by detecting whether each processor is isolated from the system in a distributed processing system in which a plurality of processors are integrated in a network. 2. The distributed processing system according to claim 1, wherein each processor detects whether or not its own film is related to a file in another processor. 3. The distributed processing system according to claim 1, wherein each processor determines whether or not its own program can be executed when it detects that it is isolated from the system. 4. The distributed processing system according to claim 3, wherein each processor detects that it has recovered from its isolated state.
JP63232361A 1988-09-19 1988-09-19 Distributed processing method Expired - Lifetime JP2749074B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63232361A JP2749074B2 (en) 1988-09-19 1988-09-19 Distributed processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63232361A JP2749074B2 (en) 1988-09-19 1988-09-19 Distributed processing method

Publications (2)

Publication Number Publication Date
JPH0281157A true JPH0281157A (en) 1990-03-22
JP2749074B2 JP2749074B2 (en) 1998-05-13

Family

ID=16938008

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63232361A Expired - Lifetime JP2749074B2 (en) 1988-09-19 1988-09-19 Distributed processing method

Country Status (1)

Country Link
JP (1) JP2749074B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58182778A (en) * 1982-04-19 1983-10-25 Nec Corp Decentralized processing system
JPS6298445A (en) * 1985-10-25 1987-05-07 Hitachi Ltd Network fault bracketing system
JPS62169266A (en) * 1986-01-22 1987-07-25 Fujitsu Ltd Data transmission and reception terminal equipment

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58182778A (en) * 1982-04-19 1983-10-25 Nec Corp Decentralized processing system
JPS6298445A (en) * 1985-10-25 1987-05-07 Hitachi Ltd Network fault bracketing system
JPS62169266A (en) * 1986-01-22 1987-07-25 Fujitsu Ltd Data transmission and reception terminal equipment

Also Published As

Publication number Publication date
JP2749074B2 (en) 1998-05-13

Similar Documents

Publication Publication Date Title
JP2541933B2 (en) Multiprocessor communication method
US5488723A (en) Software system having replicated objects and using dynamic messaging, in particular for a monitoring/control installation of redundant architecture
JP3481737B2 (en) Dump collection device and dump collection method
US20030149970A1 (en) Portable software for rolling upgrades
JP2709705B2 (en) Program management method in multi-computer system
EP0409604A2 (en) Processing method by which continuous operation of communication control program is obtained
JPH1127342A (en) Method and system for matching network information
JPH0341522A (en) Message missing detecting and processing system
JPH0281157A (en) Distributed processing system
JP2004310514A (en) Information processing terminal and history information saving method
JPH0895614A (en) Controller
JPH0962626A (en) On-line testing method of decentralized processing system
JPH06259274A (en) Duplex system
JP3055507B2 (en) Simple alarm log system for telephone exchange and recording medium storing control program for realizing the system
JP3439365B2 (en) Node failure detection method for transfer control system and node failure detection method during file transfer
JPS6380347A (en) Retransmission system for file transfer
JP3830558B2 (en) Online system and communication control method thereof
JPS62284440A (en) Software resource maintenance system for terminal equipment
JPH01113851A (en) Start-up test system for program
CN117407460A (en) Cross-environment data synchronization method and device, storage medium and electronic equipment
JP3110124B2 (en) Failure detection method in multi-computer system
JP3316739B2 (en) Device interface control method
JPH01318337A (en) Communication method in duplicate equipment
JPH0997237A (en) Input telegraphic message guaranteeing method for on-line transaction processing system
JPH05158839A (en) Terminal communication controller and its method

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080220

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 11