JPS6385859A - Intersystem exclusive control system in case of generating abnormality - Google Patents

Intersystem exclusive control system in case of generating abnormality

Info

Publication number
JPS6385859A
JPS6385859A JP61230943A JP23094386A JPS6385859A JP S6385859 A JPS6385859 A JP S6385859A JP 61230943 A JP61230943 A JP 61230943A JP 23094386 A JP23094386 A JP 23094386A JP S6385859 A JPS6385859 A JP S6385859A
Authority
JP
Japan
Prior art keywords
status
communication
systems
shared
shared database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61230943A
Other languages
Japanese (ja)
Inventor
Toru Nihei
仁平 亨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61230943A priority Critical patent/JPS6385859A/en
Publication of JPS6385859A publication Critical patent/JPS6385859A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To allow a normal system to maintain an access right to a shared data base and to attain the continuous operation of a data base by recording the system status at every system on a shared system file, and analyzing the cause of an intersystem communication interruption in case of generating system abnormality. CONSTITUTION:In case of detecting communication interruption, a status setting part 15 writes a sound mark indicating that respective systems are normal in a system status storing part 18. After a prescribed time lapses, the system status of the other system is read out and whether the cause of the communication interruption is the system down of the opposite system or a fault in a communication line between system can be recognized by checking whether the read system status if kept at the initial mark or turned to a sound mark. Consequently, the reconstitution (reassignment of access right) of a control network preventing access to the shared data base from being disabled can be attained.

Description

【発明の詳細な説明】 〔概要〕 共用データベースを有する疎結合計算機システムにおい
て、共用システムファイル上に各システム毎のシステム
状態を記録しておき、システム異常発生時にシステム間
の通信途絶の原因を自動的に解析することにより、正常
なシステムが共用データベースに対するアクセス権を維
持して、データベースの継続運用を可能とする。
[Detailed Description of the Invention] [Summary] In a loosely coupled computer system having a shared database, the system status of each system is recorded in a shared system file, and the cause of communication interruption between systems can be automatically detected when a system abnormality occurs. By analyzing the information in detail, a normal system can maintain access rights to the shared database, allowing continued operation of the database.

〔産業上の利用分野〕[Industrial application field]

本発明は、疎結合計算機システムにおけるシステム異常
発生時のシステム間排他制御方式に係り。
The present invention relates to an inter-system exclusive control method when a system abnormality occurs in a loosely coupled computer system.

特にシステムに異常が発生した場合における共用データ
ベースに対する可用性を向上させた異常発生時システム
間排他制御方式に関するものである。
In particular, the present invention relates to an exclusive control method between systems when an abnormality occurs, which improves the availability of a shared database when an abnormality occurs in the system.

共用データベースを有する疎結合計算機システムにおい
て、システム間通信路の障害や、システムダウンなどの
異常事態が発生し、システム間の通信が途絶した場合、
共用データベースに対するアクセス権を持つシステムを
限定することが不可決となる。この場合、システム間の
通信途絶の原因に応じて、31も効率的にデータベース
を!I続して運用できるように、使用できるシステムを
決定することが必要となる。
In a loosely coupled computer system that has a shared database, if an abnormal situation occurs such as a failure in the communication path between the systems or a system down, and communication between the systems is interrupted,
Limiting the systems that have access rights to the shared database becomes untenable. In this case, depending on the cause of the communication breakdown between the systems, 31 databases can be efficiently used! It is necessary to determine which systems can be used so that they can continue to operate.

〔従来の技術〕[Conventional technology]

第5図は従来方式を説明するための図である。 FIG. 5 is a diagram for explaining the conventional method.

第5図において、10−1ないし10−4はそれぞれ独
立したプロセッサを持つシステム、11は通信路、30
は共用データベースを表す。
In FIG. 5, 10-1 to 10-4 are systems each having an independent processor, 11 is a communication path, and 30
represents a shared database.

疎結合計算機システムにおいて、共用データベース30
の排他制御を行うためには、システム間通信により、シ
ステム間で排他制御情報のやりとりを行う、共用データ
ベース30の排他制御を行うために、システム間通信路
11で結合された計算機群(以下、制御網という)では
、システム間通信路の障害や、一部計算機システムのシ
ステムダウンなどにより、所定時間の通信途絶を検出す
ると1通信途絶の対象となったシステムを制御網から除
外する(以下、切り離しという)。
In a loosely coupled computer system, a shared database 30
In order to perform exclusive control of the shared database 30, exclusive control information is exchanged between systems through intersystem communication.In order to perform exclusive control of the shared database 30, a group of computers (hereinafter referred to as In the control network, when a communication interruption is detected for a predetermined period of time due to a failure in the communication path between systems or a system down of some computer systems, the system subject to the communication interruption is excluded from the control network (hereinafter referred to as the control network). (referred to as separation).

切り離しの際には、各々の計算機システムでは。When disconnecting, each computer system.

自システムを含む通信可能な計算機群が構成する制御網
と1通信途絶となった計算機群が構成する制御網の2つ
の制御網に分裂したと認識する。
It is recognized that the control network has been split into two control networks: a control network composed of a group of computers that can communicate, including the own system, and a control network composed of a group of computers that have lost one communication.

制御網の分裂後に、共用データベースの完全性を保証す
るためには、アクセス権を持つ制?[Mを唯一に限定す
る必要がある。例えば従来方式によれば、制御網分裂の
原因に関わらず1分裂後の各制御網のシステム台数と、
システム毎に予め定めた共用データベース30に対する
アクセスの優先順位(以下、システムプライオリティと
いう)により、アクセス権を持つ制′4B網を決定する
Is there a system for having access rights to guarantee the integrity of a shared database after a control network splits? [It is necessary to limit M to be unique. For example, according to the conventional method, regardless of the cause of control network splitting, the number of systems in each control network after one split is
Based on the priority order of access to the shared database 30 (hereinafter referred to as system priority) predetermined for each system, the 4B network that has access rights is determined.

例えば、第5図(イ)図示のように、システム#lとシ
ステム#2問およびシステム#2とシステム#4間で通
信途絶が発生したとする。制御網は、制御!i1Aと制
御I網Bとに分裂するが、制御網Aのシステム台数が多
いため、制御網Aに属するシステムが、共用データベー
ス30に対するアクセス権を維持する。
For example, as shown in FIG. 5(a), it is assumed that a communication breakdown occurs between system #1 and system #2 and between system #2 and system #4. Control network is control! Although it is divided into i1A and control I network B, since the number of systems in control network A is large, the systems belonging to control network A maintain access rights to the shared database 30.

例えば、第5図(ロ)図示のように、システム#1とシ
ステム#2問およびシステム#3とシステム#4間で通
信途絶が発生したとする。この場合、同数のシステムか
らなる制?[MA、制御M4Bに分裂する。ここで、共
用データベース30に対するシステムプライオリティが
、#1>#2>93〉#4であったとすると、一番高い
優先順位を持つシステム#lを含む制御mAが、共用デ
ータベースに対するアクセス権を維持し、制御網Bのシ
ステムは、共用データベース30に対するアクセス権を
喪失する。
For example, as shown in FIG. 5(b), it is assumed that communication is interrupted between system #1 and system #2 and between system #3 and system #4. In this case, a system consisting of the same number of systems? [MA splits into control M4B. Here, if the system priorities for the shared database 30 are #1>#2>93>#4, the control mA that includes system #l with the highest priority maintains access rights to the shared database. , the control network B system loses access rights to the shared database 30.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

通信路を利用したシステム間通信が途絶した場合、その
原因としては5以下の2つが考えられる。
When inter-system communication using a communication channel is interrupted, there are two possible causes:

■ システム間通信路の障害 ■ 通信相手システムのシステムダウンところで、シス
テム異常が発生して、第5図(ロ)に示すような2つの
制J1i1A、制御yJBに分裂した場合9通信途絶の
原因によって、共用データベース30に対するアクセス
可否は次のようになる。
■ Failure in the communication path between systems ■ System down of the communication partner system By the way, if a system abnormality occurs and the system is divided into two control J1i1A and control YJB as shown in Figure 5 (b), 9. , access permission to the shared database 30 is determined as follows.

i)通信途絶の原因がシステム間通信路の障害である場
合、制1BH4Aは共用データベース30にアクセスで
きる。制御!iBはアクセス権を喪失する。
i) If the cause of communication disruption is a failure in the intersystem communication path, controller 1BH4A can access the shared database 30. control! iB loses access rights.

ii)通信途絶の原因が制[4Aのシステムダウンであ
る場合、制御14Aはアクセス権を有するが。
ii) If the cause of communication loss is a system down of Control 4A, Control 14A has access rights.

システムダウンのため継続運用できない。制御網Bはア
クセス権を持たない。
Unable to continue operation due to system down. Control network B has no access rights.

iii )通信途絶の原因が制御mBのシステムダウン
である場合、制?H4Aは共用データベース30にアク
セスできる。制御mBはアクセスできない。     
    −゛ 以上のように従来方式によれば、上記i;)のケースで
は、実際には制?111Bが共用データベース30を使
用できるにもかかわらず、共用データベース30に対す
るアクセス権を持つシステムが存在しなくなり、共用デ
ータベース30の運用を継続できなくなるという問題が
ある。
iii) If the cause of the communication disruption is the control mB system down, what is the control? H4A can access the shared database 30. Control mB cannot be accessed.
−゛As described above, according to the conventional method, in case i;) above, is there actually a control? 111B can use the shared database 30, there is no longer a system that has access rights to the shared database 30, and there is a problem that the operation of the shared database 30 cannot be continued.

本発明は上記問題点の解決を図り、制御網内の計算機シ
ステム間に通信途絶というシステム異常が発生した場合
、各計算機システムが自動的に異常事態の解析を行い、
正常な計算機システムを特定して、異常発注後も共用デ
ータベースの継続運用を保証する方式を提供することを
目的としている。
The present invention aims to solve the above problems, and when a system abnormality such as a communication breakdown occurs between computer systems in a control network, each computer system automatically analyzes the abnormal situation.
The purpose is to identify a normal computer system and provide a method to guarantee continued operation of a shared database even after an abnormal order is placed.

〔問題点を解決するための手段〕[Means for solving problems]

第1図は本発明の基本構成例を示す。 FIG. 1 shows an example of the basic configuration of the present invention.

第1図において、10−1.10−2はそれぞれCPU
およびメモリを持ち共用データベースを有する疎結合さ
れたシステム、11はシステム間通信路、12は1シス
テム監視電文を他のシステムと送受信するシステム監視
電文送受信部、13はシステムにおける時間管理を行う
タイマ、14は相手システムとの通信途絶を検出する通
信途絶検出部、15は自システムの状態情報を共用シス
テムファイル上に設定する状態設定部、16は異常原因
に応じて制御網の再構成(アクセス権の決定を含む)を
行う網再構成部、17は各システムに共通に接続されて
いる共用システムファイル、1日は各システム毎のシス
テム状態が記録されるシステム状態記憶部、19はシス
テム診断ブロックを表す。
In Figure 1, 10-1 and 10-2 are CPUs, respectively.
and a loosely coupled system having memory and a shared database; 11 is an inter-system communication path; 12 is a system monitoring message transmitting/receiving unit that sends and receives one system monitoring message to and from another system; 13 is a timer for managing time in the system; 14 is a communication loss detection unit that detects communication loss with the other system; 15 is a status setting unit that sets the status information of the own system on the shared system file; and 16 is a control network reconfiguration unit (access rights control) according to the cause of the abnormality. 17 is a shared system file commonly connected to each system; 1 is a system status storage unit in which the system status of each system is recorded; 19 is a system diagnosis block; represents.

本発明では、共用システムファイル17上に。In the present invention, on the shared system file 17.

システム状態記憶部1日の領域が設けられ、その中のシ
ステム診断ブロック19に、各システムの状態情報が設
定されるようになっている。システム状態を示す情報と
して1例えばシステムが制御網への参入時に設定し、初
期状態であることを示す初期マークと、異常発生時に自
システムが正常状態であることを示す健全マークと、自
システムが共用データベースに対するアクセス権を維持
することを示す維持マークなどがある。
A system status storage section is provided with an area for one day, in which the status information of each system is set in a system diagnosis block 19. Information indicating the system status includes: 1. For example, an initial mark that is set when the system enters the control network and indicates that it is in the initial state, a healthy mark that indicates that the system is in a normal state when an abnormality occurs, and a health mark that indicates that the system is in a normal state when an error occurs. There is a maintenance mark that indicates that access rights to the shared database are maintained.

制御網内の各システムは、システム監視電文送受信部1
2により9通信路11を介して、相互に所定の時間間隔
でシステム監視電文を送受信する。
Each system in the control network has a system monitoring message transmitting/receiving unit 1.
2 sends and receives system monitoring messages to and from each other at predetermined time intervals via the 9 communication path 11.

これにより、互いに相手システムが正常に動作している
ことを確認する0通信途絶検出部14が。
As a result, the communication interruption detection unit 14 mutually confirms that the partner systems are operating normally.

所定時間の通信途絶を検出すると、状態設定部15が呼
び出される。状態設定部15は、共用システムファイル
17のシステム状態記憶部1日に。
When a communication interruption for a predetermined period of time is detected, the status setting unit 15 is called. The status setting section 15 stores the system status storage section of the shared system file 17 on the first day.

自システムが正常状態であることを示す健全マークを書
き込む。
Writes a healthy mark indicating that the local system is in a normal state.

その後、′iI4再構成部16は、相手システムのシス
テム状態を、システム状態記憶部18から読み出し、こ
れにより1通信途絶の原因が通信路11の障害であるの
か、相手システムのシステムダウンであるのかを判別す
る。
Thereafter, the iI4 reconfiguration unit 16 reads the system status of the other system from the system status storage unit 18, and determines whether the cause of the communication interruption is a failure in the communication path 11 or a system down of the other system. Determine.

網再構成部16は1通信途絶の原因が相手システムのシ
ステムダウンであると認識した場合には。
When the network reconfiguration unit 16 recognizes that the cause of the communication interruption is a system down of the other party's system.

自システムの共用データベースに対するアクセス権を維
持する処理を行う、相手システムが正常に動作しており
9通信途絶の原因が通信路障害であると認識した場合に
は、システムプライオリティの高いシステムが共用デー
タベースに対するアクセス権を維持し、低いシステムは
アクセス権を自ら喪失するよう、制′awf4の再構成
を行う。
Performs processing to maintain access rights to the shared database of its own system.If the other system is operating normally and recognizes that the cause of communication interruption is a communication path failure, the system with higher system priority accesses the shared database. awf4 is reconfigured so that the lower system loses the access right by itself.

〔作用〕[Effect]

従来技術では、最も高いシステムプライオリティを持つ
システムを含む半数のシステムが同時にシステムダウン
した場合、正常に動作している他の半数のシステム群は
、自ら共用データベースに対するアクセス権を放棄する
ため、共用データベースの運用が以後不可能になる。
In conventional technology, if half of the systems including the system with the highest system priority go down at the same time, the other half of the systems that are operating normally give up access rights to the shared database. operation will no longer be possible.

本発明の場合1通信途絶が検出された場合、状態設定部
15によって、それぞれのシステムが正常であることを
示す健全マークを、システム状態記憶部18に書き込む
。所定時間後に、他システムのシステム状態を読み出し
、それが初期マークのままであるか、健全マークになっ
ているかを調べることにより1通信途絶の原因が相手シ
ステムのシステムダウンであるか、システム間通信路の
障害であるかを認識できる。
In the case of the present invention, when a communication interruption is detected, the status setting unit 15 writes a health mark indicating that each system is normal in the system status storage unit 18. After a predetermined period of time, the system status of the other system is read and checked to see if it remains at the initial mark or has become a healthy mark to determine whether the cause of the communication interruption is the system down of the other system, and to determine if the communication between the systems is It is possible to recognize obstacles on the road.

これによって、共用データベースに対するアクセスが不
可能とならないような制′4B網の再構成(アクセス権
の再割当て)ができることとなる。
This makes it possible to reconfigure the 4B network (reassign access rights) so that access to the shared database is not disabled.

なお、1ffi信路障害については、システム間通信路
が片方向のバスにより構成され、送信側または受信側の
一方だけに障害が発生して、システム間通信が途絶した
場合にも、システム状態によって。
Regarding 1ffi signal path failure, even if the communication path between systems is configured with a unidirectional bus and a failure occurs on only one of the sending or receiving sides and intersystem communication is interrupted, depending on the system status, .

システム間の排他制御を行うことができる。Exclusive control between systems can be performed.

〔実施例〕〔Example〕

第2図は本発明の一実施例におけるシステムダウン発生
時の処理例、第3図は本発明の一実施例における通信路
障害発生時の処理例、第4図は本発明の一実施例におけ
る片方向パス障害発生時の処理例を示す。
FIG. 2 is an example of processing when a system failure occurs in an embodiment of the present invention, FIG. 3 is an example of processing when a communication path failure occurs in an embodiment of the present invention, and FIG. 4 is an example of processing in an embodiment of the present invention. An example of processing when a unidirectional path failure occurs is shown.

以下、説明を簡単にするために、2台の計算機システム
(システム#1.システム#2)により。
Hereinafter, in order to simplify the explanation, two computer systems (system #1 and system #2) will be used.

制御網を構成する例について説明する。3台以上の場合
も同様である。システム#lとシステム#2とは、シス
テム#1のほうがシステムプライオリティが高いものと
する。
An example of configuring a control network will be explained. The same applies to the case of three or more units. It is assumed that between system #1 and system #2, system #1 has a higher system priority.

第2図はシステム#1がシステムダウンした場合の例を
示している0両システム#1.#2は。
Figure 2 shows an example where system #1 goes down. #2 is.

参入時TOに、共用システムファイル17に、初期状態
を示す「初期マーク(#1)J、r初期マーク(#2)
Jをそれぞれ記録する。ここで「参入」とは、制御網の
1システムとなること、即ち。
At the time of entry, "initial mark (#1) J, r initial mark (#2)" indicating the initial state is placed in the shared system file 17 in the TO.
Record each J. Here, "participating" means becoming part of a control network system.

共用データベースに対する排他制御を受ける対象となる
ことを意味する。
This means that the shared database is subject to exclusive control.

時刻ToからT1までは、システム#1. #2の2シ
ステムで制御網が構成され、それぞれ共用データベース
に対するアクセス権を持つ。
From time To to T1, system #1. A control network is made up of the two systems #2, each having access rights to the shared database.

時刻T1に、システム#lにシステムダウンが発生する
と、システム#2では、システム監視電文または応答電
文が到着しないことから2時刻T1から所定時間後(T
2)に通信途絶を検出する。
When a system down occurs in system #l at time T1, system #2 does not receive the system monitoring message or the response message, so the system #1 returns after a predetermined period of time from time T1 (T
2) Detect communication disruption.

システム#2は9通信途絶の検出時に、自システムは正
常である旨の「健全マーク(#2)Jを。
When system #2 detects a loss of communication, it displays a "healthy mark (#2) J" indicating that the system is normal.

共用システムファイル17に記録する。It is recorded in the shared system file 17.

その後、所定の時間が経過してから(T3)。Then, after a predetermined time has passed (T3).

システム#2は、システム#lのシステム状態を読み出
す、このとき、システム状態は「初期マーク(#1)J
のままであるので、異常原因がシステム#1のシステム
ダウンであることを認識し。
System #2 reads the system status of system #l. At this time, the system status is "Initial mark (#1) J
Since it remains the same, we recognize that the cause of the abnormality is system #1 going down.

システム#1の切り離し処理を行う、自システム#2は
、共用データベースに対するアクセス権を維持して、ア
クセス権を維持することを示す「維持マーク(#2)J
を共用システムファイル17に記録する。システムダウ
ンが発生したシステム#1が、システムプライオリティ
が高くても、正常なシステム#2によって、共用データ
ベースの運用を継続できることとなる。
System #2, which performs the separation process for system #1, maintains access rights to the shared database and displays a "maintenance mark (#2) J" indicating that the access rights are maintained.
is recorded in the shared system file 17. Even if system #1, which has experienced a system failure, has a high system priority, the normal system #2 can continue to operate the shared database.

次に、第3図に従って1通信路障害発生時の例を説明す
る。
Next, an example when a failure occurs in one communication path will be described with reference to FIG.

第2図の場合と同様に、システム#1. #2は。As in the case of FIG. 2, system #1. #2 is.

参入時TOに、共用システムファイル17にそれぞれ初
期状態を示す「初期マーク(#1)J。
At the time of entry, an "initial mark (#1) J" is placed in the shared system file 17 to indicate the initial state.

「初期マーク(#2)Jを記録する。“Record initial mark (#2) J.

時刻T1に通信路障害が発生すると1時刻TIから所定
の時間経過後(T2)に、システム#1゜システム#2
は、それぞれ通信途絶を検出する。
When a communication path failure occurs at time T1, after a predetermined time has elapsed (T2) from time TI, system #1 and system #2
detect communication loss.

このとき、各システム#1.#2は、それぞれ自システ
ムが正常であることを示す「健全マーク(#1)J、r
健全マーク(#2)Jを記録する。
At this time, each system #1. #2 indicates the “healthy mark (#1) J, r” indicating that the respective systems are normal.
Record the healthy mark (#2) J.

その後、さらに所定の時間経過してから(T3)9両シ
ステム#1.12は、互いに相手システムのシステム状
態を読み出す、ここで、相手システムの「健全マーク」
によって、どちらのシステムも正常に動作していること
を認識する。この場合、システム#1は、相手システム
#2よりもシステムプライオリティが高いため、共用デ
ータベースに対するアクセス権を維持し、アクセス権維
持を示す「維持マーク(#1)Jを記録する。
After that, after a further predetermined period of time has elapsed (T3), both systems #1 and 12 read out the system status of the other system.
This confirms that both systems are working properly. In this case, since the system #1 has a higher system priority than the partner system #2, it maintains the access right to the shared database and records a "maintenance mark (#1) J" indicating that the access right is maintained.

一方、システム#2は、自システムのシステムフ。On the other hand, system #2 is the system file of its own system.

ライオリティが低いので、共用データベースに対するア
クセス権を自ら放棄する。それぞれ、切り離し処理を行
い、制御網を再構成する。
Since the priority is low, it voluntarily relinquishes access to the shared database. Perform separation processing and reconfigure the control network.

第4図は、システム間通信路に片方向パスを使用し、送
信側または受信側の一方のパスにだけ障害が発生した場
合の例を示している。 。
FIG. 4 shows an example in which a unidirectional path is used for the intersystem communication path and a failure occurs in only one path on the transmitting side or the receiving side. .

両システム#1.#2は、参入時(TO)に。Both systems #1. #2 is at the time of entry (TO).

「初期マーク(#1)J、r初期マーク(#2)」を記
録する。
Record "initial mark (#1) J, r initial mark (#2)".

その後(TI)、 システム#lの送信側パスに通信路
障害が発生したとする。システム#lでは。
After that (TI), assume that a communication path failure occurs on the transmission side path of system #l. In system #l.

システム#2からのシステム監視電文を受f@シ。Receive system monitoring message from system #2.

システム#2に対する応答電文も送信できていると認識
するので、この時点では、異常を検出できない、システ
ム#2では、システム#lからの応答電文が届かないた
め、所定の時間経過後(T2)に9通信途絶を検出する
。そこで、システム#2は、自システムは正常であるこ
とを示す「健全マーク(#2)Jを共用システムファイ
ル17に記録する。
Since it recognizes that the response message to system #2 has also been sent, no abnormality can be detected at this point. System #2 does not receive the response message from system #l, so after a predetermined period of time (T2) 9 communication loss was detected. Therefore, system #2 records a "healthy mark (#2) J" in the shared system file 17, indicating that the system is normal.

その後、所定の時間経過してから(T3)、  システ
ム#2は、相手システム#lのシステム状態を読み出す
、その結果、「初期マーク(#1)Jのままであること
がわかり、これにより、システム状態側の異常を検出し
て切り離し処理を行う。
After that, after a predetermined time has elapsed (T3), system #2 reads the system status of partner system #l, and as a result, it is found that the "initial mark (#1) J" remains. Detects an abnormality in the system status and performs disconnection processing.

システム#2は、共用データヘースに対するアクセス権
を維持し、「維持マーク(#2)Jを記録し、運用を継
続する。
System #2 maintains the access right to the shared data cache, records the "maintenance mark (#2) J," and continues operation.

システム#1では、システム#2が切り離し処理を行っ
たので、それから所定の時間経過後(T4)に9通信途
絶を検出する。そこで、自システムは正常であることを
示す「健全マーク(#1)」を記録する。その後(T5
)に、相手システム#2のシステム状態を調べると、「
維持マーク(#2)Jが記録されていることを認識する
。この場合、システム#1は、システム#2が先に網の
再構成を行った結果、アクセス権を維持していると認識
し、自らは共用データベースに対するアクセス権を喪失
する。
In system #1, since system #2 has performed the disconnection process, 9 communication interruptions are detected after a predetermined time has elapsed (T4). Therefore, a "healthy mark (#1)" indicating that the own system is normal is recorded. After that (T5
), when I check the system status of the other system #2, I get "
Recognize that maintenance mark (#2) J is recorded. In this case, system #1 recognizes that system #2 maintains the access right as a result of the network reconfiguration first, and loses the access right to the shared database.

このように1片方向パスの障害により、システム間の通
信途絶を検出する時刻に差異が生じても。
In this way, even if a failure in one unidirectional path causes a difference in the time at which communication interruption between systems is detected.

共用データベースに対するシステム間の排他制御を行う
ことができる。
It is possible to perform exclusive control between systems over a shared database.

以上、2台の計算機システムによって制御網が構成され
ている場合の例について説明したが1例えば4台の計算
機システムで、2台ずつの同数分裂が生じるような場合
にも1例えば各側myにおけるシステムプライオリティ
が高いシステムが。
Above, we have explained an example in which a control network is configured by two computer systems.1 For example, when there are four computer systems and an equal number division of two computers occurs, for example, on each side my, A system with high system priority.

代表して相手システムのシステム状態を調べるなどして
、同様に排他制御を行うことが可能である。
It is also possible to perform exclusive control in the same way by checking the system status of the other system as a representative.

〔発明の効果〕〔Effect of the invention〕

以上説明したように1本発明によれば、共用データベー
スを有する疎結合計算機システムにおいて、システム間
通信路の障害や、一部計算機システムのシステ、ムダウ
ン等の異常事態が発生しても。
As explained above, according to one aspect of the present invention, in a loosely coupled computer system having a shared database, even if an abnormal situation occurs such as a failure in a communication path between systems or a system failure of some computer systems.

正常なシステムで共用データベースの運用をII!lr
、1することが可能となり、疎結合計算機システム全体
としての高信輔性を実現することができるようになる。
Operate a shared database with a normal system! lr
, 1, and it becomes possible to realize high reliability of the entire loosely coupled computer system.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の基本構成例、第2図は本発明の一実施
例におけるシステムダウン発生時の処理例、第3図は本
発明の一実施例における通信路障害発生時の処理例、第
4図は本発明の一実施例における片方向パス障害発生時
の処理例、第5図は従来方式を説明するための図を示す
。 図中、10−1.10−2はシステム、11は通信路、
12はシステム監視電文送受信部、13はタイマ、14
は通信途絶検出部、15は状態設定部、16は網再構成
部、17は共用システムファイル、18はシステム状態
記憶部、19はシステム診断ブロックを表す。
FIG. 1 is an example of the basic configuration of the present invention, FIG. 2 is an example of processing when a system down occurs in an embodiment of the present invention, and FIG. 3 is an example of processing when a communication path failure occurs in an embodiment of the present invention. FIG. 4 shows an example of processing when a unidirectional path failure occurs in an embodiment of the present invention, and FIG. 5 shows a diagram for explaining a conventional method. In the figure, 10-1 and 10-2 are the system, 11 is the communication path,
12 is a system monitoring message transmission/reception unit, 13 is a timer, 14
15 is a communication interruption detection unit, 15 is a status setting unit, 16 is a network reconfiguration unit, 17 is a shared system file, 18 is a system status storage unit, and 19 is a system diagnosis block.

Claims (1)

【特許請求の範囲】 共用データベースを有し、システム間通信によって、該
共用データベースに対するアクセスの排他制御を行う疎
結合計算機システムにおいて、共用システムファイル(
17)上に、各システム毎のシステム状態を記録してお
くシステム状態記憶手段(18)と、 通信路(11)を介してシステム監視電文を他のシステ
ムと送受信するシステム監視電文送受信手段(12)と
、 システム監視電文を所定の時間以上受信しないことによ
り、通信途絶を検出する通信途絶検出手段(14)と、 通信途絶を検出した場合に、上記システム状態記憶手段
(18)における自システム用領域に、自システムが正
常であることを示す状態情報を設定する状態設定手段(
15)と、 通信途絶を検出してから所定の時間経過後に、上記シス
テム状態記憶手段(18)における他システムの状態を
チェックし、その状態によって、制御網を再構成する網
再構成手段(16)とを備えたことを特徴とする異常発
生時システム間排他制御方式。
[Claims] In a loosely coupled computer system that has a shared database and performs exclusive control of access to the shared database through intersystem communication, a shared system file (
17) A system status storage means (18) for recording the system status of each system, and a system monitoring message transmitting/receiving means (12) for transmitting and receiving system monitoring messages to and from other systems via the communication path (11). ), communication interruption detection means (14) for detecting communication interruption by not receiving a system monitoring message for a predetermined period of time or more; A status setting means (
15), and network reconfiguration means (16) that checks the status of other systems in the system status storage means (18) after a predetermined period of time has elapsed since the communication interruption is detected, and reconfigures the control network based on the status. ). A method for exclusive control between systems when an abnormality occurs.
JP61230943A 1986-09-29 1986-09-29 Intersystem exclusive control system in case of generating abnormality Pending JPS6385859A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61230943A JPS6385859A (en) 1986-09-29 1986-09-29 Intersystem exclusive control system in case of generating abnormality

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61230943A JPS6385859A (en) 1986-09-29 1986-09-29 Intersystem exclusive control system in case of generating abnormality

Publications (1)

Publication Number Publication Date
JPS6385859A true JPS6385859A (en) 1988-04-16

Family

ID=16915737

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61230943A Pending JPS6385859A (en) 1986-09-29 1986-09-29 Intersystem exclusive control system in case of generating abnormality

Country Status (1)

Country Link
JP (1) JPS6385859A (en)

Similar Documents

Publication Publication Date Title
JP4107083B2 (en) High-availability disk controller, its failure handling method, and high-availability disk subsystem
JP2567922B2 (en) Path control method
JP2002063063A (en) Storage area network managing system
JPH08227344A (en) Communication control equipment between duplex disk controllers
US20040081179A1 (en) Method and system for selecting between serial storage buses using data signals of the buses
JP2004094774A (en) Looped interface failure analyzing method and system with failure analyzing function
JP2007122583A (en) Wide area alarm monitoring system
JP2001346181A (en) Data storage section common share system and program recording medium
JPS6385859A (en) Intersystem exclusive control system in case of generating abnormality
KR19990078536A (en) Database duplication method for intelligent service system
JP2019125075A (en) Storage device and storage system and program
JP4511455B2 (en) Fiber channel switch and computer system using the same
JPH05225161A (en) Network monitoring system
JP2004007930A (en) System and program for controlling power system monitoring
JP2946541B2 (en) Redundant control system
JP3439365B2 (en) Node failure detection method for transfer control system and node failure detection method during file transfer
JP3573092B2 (en) Exclusive use of shared resources in computer systems
JP2829040B2 (en) Information distribution system
JPH03194601A (en) Coordinate distributed control system
JPH0427239A (en) Control method for lan connecting device
JPS59135554A (en) Communication system between computer systems
JP2511305B2 (en) Information collection method
JPH0553938A (en) System for switching duplex central processing units
JPH0614331B2 (en) Online processing system switching method for multiple computer systems
KR100450399B1 (en) A method for supervising status of dual processors in order to overcome temporary dual channel trouble in atm switch