JPH05191388A - 通信処理システム - Google Patents

通信処理システム

Info

Publication number
JPH05191388A
JPH05191388A JP4004426A JP442692A JPH05191388A JP H05191388 A JPH05191388 A JP H05191388A JP 4004426 A JP4004426 A JP 4004426A JP 442692 A JP442692 A JP 442692A JP H05191388 A JPH05191388 A JP H05191388A
Authority
JP
Japan
Prior art keywords
processing
data
overload
monitoring
communication processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP4004426A
Other languages
English (en)
Inventor
Hirokatsu Kaneko
弘勝 金子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP4004426A priority Critical patent/JPH05191388A/ja
Priority to US08/004,514 priority patent/US5448721A/en
Publication of JPH05191388A publication Critical patent/JPH05191388A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0796Safety measures, i.e. ensuring safe condition in the event of error, e.g. for controlling element
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2005Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

(57)【要約】 【目的】 二重化構成の通信処理装置を有する通信処理
システムに関し、処理すべきデータ量の増大により処理
装置が過負荷状態になった場合に、装置の両系同時停止
を防止することを目的とする。 【構成】 第一の装置が過負荷となったことを検出して
第二の装置へ通知する過負荷検出処理部11g,12g と、第
一の装置がシステムダウンとなったことを検出して第二
の装置へ通知するシステムダウン監視処理部11d,12d
と、第一の装置がデータ過負荷になったことを知ると該
第一の装置の監視を開始し、該第一の装置がデータ過負
荷のままシステムダウンとなったことを検出する他系動
作監視部11e,12e とをそれぞれの通信処理装置11,12 に
設ける。他系動作監視部12e が、第一の装置11がデータ
過負荷のままシステムダウンとなったことを検出した場
合には、第二の装置12が行うべき全ての処理のうちの一
部の処理のみを行い他の処理の実行を停止して、該第二
の装置12の負荷を軽減させるように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、二重化構成の通信処理
装置を有する通信処理システムに関する。
【0002】
【従来の技術】図6は、本発明が対象とする二重化通信
システムを示す図である。図において、1-1、1-2 、1-
3 は通信処理システムであり、二重化された通信回線2-
1 、2-2 を介して接続されており、他ノードの処理シス
テムから送られてくる同一内容のデータ3を順次処理し
て別のノードの処理システムへ送信する。それぞれの通
信処理装置は、二重化された回線からのデータを処理し
たり、その他の複数の処理を行うための、二重化された
通信処理装置11、12を有する。それぞれの装置は他ノー
ドから同一のデータを受信し、独立して処理して別のノ
ードへ独立に送出する。
【0003】このような装置では、受信したデータ量が
その装置で処理できなくなる程増大すると、優先度の低
い下位レベルの処理を実行しなくなり、実質的な装置の
システムダウンの状態になってしまう。
【0004】通常ではこのような安易なシステムダウン
を避けるために、処理可能となるまで受信データを一時
蓄えておくバッファが枯渇した時にはデータの受信を規
制したり、同一処理を行う完全二重化処理を一時停止し
て他方の装置との間で処理を分担して行うことにより負
荷分散したりして、装置が過負荷になることを防止して
いる。
【0005】しかし、このような対策を施しても、過負
荷の発生を全て防ぐことはできず、動作不能状態になっ
てしまうことが多い。このような装置過負荷によるシス
テムダウン状態を、速やかに復旧させる最終的な方法と
して、ウオッチドッグタイマ監視機能を各装置に持た
せ、システムダウン状態に陥ったら、全てのデータをク
リアして最初からやり直すイニシャル処理(IPL)が
必要となる。
【0006】
【発明が解決しようとする課題】ところが、データ量の
増加による負荷増大の場合には、両系の装置ともほぼ同
時に過負荷状態となることが多く、一方の装置がシステ
ムダウンした場合に、殆ど同時に他方の装置でもシステ
ムダウンとなり、両系装置同時停止状態となることが多
い。
【0007】この両系装置同時停止状態では、自ノード
におけるデータ処理は全く行えなくなり、二重化システ
ムとしての信頼性が著しく低下するとういう問題があっ
た。本発明は、上記問題に鑑みて創出されたもので、二
重化構成の通信処理装置を有する通信処理システムに関
する。二重化された処理装置を有する通信処理システム
において、データ量の増大により装置が過負荷状態にな
った場合に、装置の両系同時停止を防止することを目的
とする。
【0008】
【課題を解決するための手段】図1は、本発明の通信処
理システムの原理構成図である。上記課題は図1に示す
如く、二重化構成の第一、第二の通信処理装置11、12の
それぞれが、送られてくる同一内容のデータ3を順次処
理する通信処理システム1において、第一の装置が受信
データ量の増大により過負荷となったことを検出して二
重化構成の他方の装置へ通知する過負荷検出処理部11g,
12g と、第一の装置がシステムダウンとなったことを検
出して二重化構成の第二の装置へ通知するシステムダウ
ン監視処理部11d,12d と、二重化構成の第一の装置から
通知を受け、該第一の装置がデータ過負荷になったこと
を知ると該第一の装置の監視を開始し、該第一の装置が
データ過負荷のままシステムダウンとなったことを検出
する他系動作監視部11e,12e とを、それぞれの通信処理
装置11,12 に設け、該他系動作監視部12e が、第一の装
置11がデータ過負荷のままシステムダウンとなったこと
を検出した場合には、第二の装置12が行うべき全ての処
理のうちから予め定められている一部の処理のみを行い
他の処理の実行を停止して、第二の装置12の負荷を軽減
させるようにしたことを特徴とする本発明の通信処理シ
ステムにより解決される。
【0009】
【作用】二重化システムを構成する第一の装置がデータ
過負荷でシステムダウンしたことを検出すると、第二の
装置は過負荷にならないように処理機能を縮小させるの
で、第二の装置はデータ過負荷によるシステムダウンを
防止することができ、二重化装置の両系統同時システム
ダウンが発生することがなく通信処理システムの信頼性
を向上させることができる。
【0010】
【実施例】以下添付図面により本発明の実施例を説明す
る。図2は本発明の通信処理システムの構成図、図3は
処理停止フラグテーブルの一例を示す図、図4は過負荷
監視処理部の動作フローチャート、図5は処理機能制限
動作のフローチャートである。
【0011】図2において、1は二重化された通信処理
システムで、二つの通信処理装置11、12を有し、それぞ
れは二重化された受信通信回線21、22からの同一内容の
データを受信して、該受信データに所定の処理を行った
のち、二重化された送信回線23,24 から送出する。各装
置が行う処理には、受信処理、送信処理、交換処理、パ
ケット分解、パケット再編成などのデータに関する処理
や、ユーテリテイ処理、装置監視制御処理等の装置の運
用に関する処理がある。
【0012】11a,12a は受信データに対して通常処理A
を行うA処理部、11b,12b は通常処理Bを行うB処理
部,11c,12cは通常処理Cを行うC処理部である。11d,12
d はウオッチドッグタイマ監視処理部( 以下WDT監視
処理部と称する)、11e,12e は他系動作監視処理部、11
f,12f は過負荷検出処理部、11g,12g は処理停止フラグ
テーブルである。
【0013】WDT監視処理部11d,12dは、図1におけ
るシステムダウン監視処理部に相当するもので、実行の
優先度が低い低レベルの処理機能として設けられ、装置
が正常に動作し全ての処理を実行している間は、所定の
周期で起動されてタイムアウト情報が出ないようにリセ
ットされているが、プログラムの実行時間が所定時間以
上になるとタイムアウト信号を発生して装置に実質的な
システムダウンが生じたことを知らせるものである。
【0014】処理停止フラグテーブル11g,12g は、シス
テムの状態に対応して自装置で制限する処理を決定する
ために予め設定されているフラグを保持するテーブル
で、図3に一例を示すように、例えば、通常時である状
態1ではA,B,Cの全ての処理を行うが、他系が過負
荷状態である状態2では、自装置が行う処理を処理Aだ
けに制限し、処理B,Cを停止するように、予めシステ
ム運用者により設定されている。
【0015】以上の構成を有する通信処理システムにお
いて、データ過負荷により第一の装置11が先にシステム
ダウンした場合の第二の装置12のシステムダウンを防止
する動作を説明する。
【0016】まず図4を共に用いて、処理装置11の過負
荷検出処理部の動作を説明する。第一の装置の過負荷検
出処理部11g は、単位時間に自装置を通過するデータ量
およびバッファの空数の監視を行い(S1) 、監視中に、
予め指定された量以上のデータが流入した場合には、自
装置は過負荷状態であると判断する(S2)。そして、デー
タ過負荷と判定した場合には、第二の装置12の動作状態
監視処理部12e にビット信号にて過負荷の発生を通知す
る(S3)。
【0017】次に、第一の装置11が過負荷発生となった
場合の、第二の装置12の処理機能制限動作を図5により
説明する。第二の装置12では、他系動作監視処理部12e
が、S4にて第一の装置の動作を監視しており、S5にてビ
ット信号にて第一の装置11がデータ過負荷となったこと
を検出すると、S6にて第一の装置のシステムダウンの監
視を開始する。監視処理中に、S7にて第一の装置のウオ
ッチドッグタイマのタイムアウトにより、該第一の装置
11のシステムダウンを検出すると、該第一の装置11はデ
ータ過負荷によりシステムダウンしたものと判断する。
なお監視処理中に該第一の装置11におけるデータ過負荷
が解除となっ場合には監視処理を終了する。
【0018】この判断により、S8にて処理停止フラグテ
ーブル(図3)の指示に従って、第二の装置で行う処理
B,Cを停止する。以上のフローにより、第二の装置12
がデータに対して行う処理は、処理Aのみに機能縮小さ
れるので、その後に第一の装置11と同様にデータ流入量
が増大しても過負荷となることはなく、従って第二の装
置12のシステムダウンが回避される。
【0019】指定処理機能の停止解除は以下の如く行わ
れる。その後も、他系動作監視部はS9により第一の装置
の動作を監視し、システムダウンした第一の装置がイニ
シャル処理を完了して、通常のオンライン運転状態に復
旧した場合には、そのことをS10 で検出して、処理機能
の停止を解除して通常の処理に移行する(S12) 。また第
一の装置が復旧しない場合には、処理機能の停止期間が
運用者により予め設定されいる時間を経過したことをS1
1 で検出し、上記処理機能の停止を解除し通常の処理に
移行する(S12) 。
【0020】上記のうち、S11 の条件は、他系装置がイ
ニシャル処理不良により、オンラインに立ち上がれない
状態となった場合を考慮して、他系装置の復旧を待たず
に制限解除して自装置のみで通常処理を行わせるもので
ある。
【0021】
【発明の効果】以上説明したように、本発明によれば、
二重化された通信処理装置において、他系装置のデータ
過負荷によるシステムダウンを監視することにより、自
系装置にて発生すると予想されるシステムダウンを、処
理機能の一部停止によって未然に防ぐことができ、両系
装置の同時システムダウンという最悪の事態を防止する
ことが可能になる。また、これによってシステム全体と
しての機能停止を防ぐことができるため、必要最低限の
処理を行うことができ、データの欠損を最小限に止める
ことができる等の効果がある。
【図面の簡単な説明】
【図1】 本発明の通信処理システムの原理構成図
【図2】 本発明の通信処理システムの構成図
【図3】 処理停止フラグテーブルの一例を示す図
【図4】 過負荷監視処理部の動作フローチャート
【図5】 処理機能制限動作のフローチャート
【図6】 本発明が対象とする二重化通信システムを示
す図
【符号の説明】
1,1-1,1-2,1-3 …通信処理システム、11、12…通信処理
装置、11d,12d …システムダウン監視処理部(ウオッチ
ドッグタイマ監視処理部)、11e,12e …他系監視処理
部、11f,12f …処理停止フラグテーブル、11g,12g …過
負荷監視処理部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 二重化構成の第一、第二の通信処理装置
    (11,12) のそれぞれが、送られてくる同一内容のデータ
    (3) を順次処理する通信処理システム(1) において、 第一の装置が受信データ量の増大により過負荷となった
    ことを検出して二重化構成の第二の装置へ通知する過負
    荷検出処理部(11g,12g) と、 第一の装置がシステムダウンとなったことを検出して二
    重化構成の第二の装置へ通知するシステムダウン監視処
    理部(11d,12d) と、 二重化構成の第一の装置から通知を受け該第一の装置が
    データ過負荷になったことを知ると該第一の装置の監視
    を開始し、該第一の装置がデータ過負荷のままシステム
    ダウンとなったことを検出する他系動作監視処理部(11
    e,12e) とを、 それぞれの通信処理装置(11,12) に設け、 該他系動作監視部(12e) が、第一の装置(11)がデータ過
    負荷のままシステムダウンとなったことを検出した場合
    には、第二の装置(12)が行うべき全ての処理のうちから
    予め定められている一部の処理のみを行い他の処理の実
    行を停止して、第二の装置(12)の負荷を軽減させるよう
    にしたことを特徴とする通信処理システム。
JP4004426A 1992-01-14 1992-01-14 通信処理システム Withdrawn JPH05191388A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP4004426A JPH05191388A (ja) 1992-01-14 1992-01-14 通信処理システム
US08/004,514 US5448721A (en) 1992-01-14 1993-01-14 Duplicated communications processing system and communications system including the duplicated communications processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4004426A JPH05191388A (ja) 1992-01-14 1992-01-14 通信処理システム

Publications (1)

Publication Number Publication Date
JPH05191388A true JPH05191388A (ja) 1993-07-30

Family

ID=11583930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4004426A Withdrawn JPH05191388A (ja) 1992-01-14 1992-01-14 通信処理システム

Country Status (2)

Country Link
US (1) US5448721A (ja)
JP (1) JPH05191388A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5870540A (en) * 1995-11-20 1999-02-09 Ncr Corporation Low overhead method for detecting communication failures on a network
US7908520B2 (en) * 2000-06-23 2011-03-15 A. Avizienis And Associates, Inc. Self-testing and -repairing fault-tolerance infrastructure for computer systems
US6915450B2 (en) 2001-11-01 2005-07-05 Sun Microsystems, Inc. Method and apparatus for arbitrating transactions between domains in a computer system
JP4759373B2 (ja) * 2005-11-21 2011-08-31 キヤノン株式会社 通信装置及び通信方法、並びにコンピュータプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5819960A (ja) * 1981-07-29 1983-02-05 Mitsubishi Electric Corp 負荷分散システムの縮退運転方法
US4823256A (en) * 1984-06-22 1989-04-18 American Telephone And Telegraph Company, At&T Bell Laboratories Reconfigurable dual processor system
US4774709A (en) * 1986-10-02 1988-09-27 United Technologies Corporation Symmetrization for redundant channels
JPS63158636A (ja) * 1986-12-22 1988-07-01 Fujitsu Ltd プロセツサ障害検出方式
US5008805A (en) * 1989-08-03 1991-04-16 International Business Machines Corporation Real time, fail safe process control system and method
JPH04120837A (ja) * 1990-09-12 1992-04-21 Hitachi Ltd 蓄積交換装置縮退運転方式
US5157663A (en) * 1990-09-24 1992-10-20 Novell, Inc. Fault tolerant computer system

Also Published As

Publication number Publication date
US5448721A (en) 1995-09-05

Similar Documents

Publication Publication Date Title
US5386512A (en) System for deriving and testing mutual capability set after receiving updated capability from other processors and before requesting service information
JP2002259155A (ja) 多重系計算機システム
JPH05191388A (ja) 通信処理システム
JPH07210472A (ja) I/oインタフェース制御方法および計算機システム
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JP2001022718A (ja) 並列処理装置
JP2633351B2 (ja) 制御装置の故障検出機構
JP2000148525A (ja) サービスプロセッサ二重化システムの現用系負荷軽減方法
JP2918297B2 (ja) 割込規制方式
JPH05224964A (ja) バス異常通知方式
JPH03292554A (ja) 通信処理装置
JP2744113B2 (ja) 計算機システム
JP2583169B2 (ja) 通信処理装置の運用プログラム切替方法
JP2778328B2 (ja) 回線切換え装置の同時制御システム
JPH06152570A (ja) 二重化データ処理装置における系切替え処理方式
JP2541686B2 (ja) 入出力制御方法
JPS5962967A (ja) マルチ計算機システムにおけるコントロ−ルステ−シヨン構成制御方式
JPS62105243A (ja) システム障害の復旧装置
JPH08161277A (ja) 並列計算機システム
JPH01269152A (ja) 分散処理システムにおけるプロセッサ障害検出方式
JPH06295268A (ja) バスインタフェース回路
JPS62264796A (ja) 情報監視システム
JPH04362835A (ja) データ転送方法
JPH09265441A (ja) 分散型cpu通信処理装置
JPS63163566A (ja) 並列計算機

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19990408