JPH0120465B2 - - Google Patents

Info

Publication number
JPH0120465B2
JPH0120465B2 JP59028944A JP2894484A JPH0120465B2 JP H0120465 B2 JPH0120465 B2 JP H0120465B2 JP 59028944 A JP59028944 A JP 59028944A JP 2894484 A JP2894484 A JP 2894484A JP H0120465 B2 JPH0120465 B2 JP H0120465B2
Authority
JP
Japan
Prior art keywords
processor
physical
logical
processor number
processors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP59028944A
Other languages
Japanese (ja)
Other versions
JPS60173654A (en
Inventor
Kenichi Ueda
Atsushi Sugano
Kunio Pponda
Yoshimi Okamura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP59028944A priority Critical patent/JPS60173654A/en
Publication of JPS60173654A publication Critical patent/JPS60173654A/en
Publication of JPH0120465B2 publication Critical patent/JPH0120465B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は複数のプロセツサから構成されるマル
チプロセツサシステムに関するもので、とりわけ
プロセツサ障害発生時のオンライン障害処理を行
なうものである。
DETAILED DESCRIPTION OF THE INVENTION FIELD OF INDUSTRIAL APPLICATION The present invention relates to a multiprocessor system composed of a plurality of processors, and particularly to a system that performs online fault processing when a processor fault occurs.

従来例の構成とその問題点 近年、処理能力の向上を計るため、複数のマイ
クロプロセツサを用いて計算処理を行なうマルチ
プロセツサシステムが種々の装置に利用されるよ
うになつてきた。
Conventional Structures and Their Problems In recent years, multiprocessor systems that perform calculation processing using a plurality of microprocessors have come into use in various devices in order to improve processing performance.

このようなシステムにおいてはシステム内のた
とえば1つのプロセツサに障害が生じた際、この
障害プロセツサの障害状況を把握するために、シ
ステム制御プロセツサはオンラインによりこの障
害プロセツサと通信を行ない、障害プロセツサの
診断・試験処理を実施する必要がある。
In such a system, when a failure occurs in, for example, one processor in the system, the system control processor communicates with the failure processor online in order to understand the failure status of the failure processor, and diagnoses the failure processor.・It is necessary to carry out test processing.

しかしながら従来のマルチプロセツサシステム
は、複数のプロセツサにおける各プロセツサの論
理プロセツサ番号は1種類しかなく、そのシステ
ム内のプロセツサに障害が発生した場合その障害
プロセツサが実行していた計算処理を他のあいて
いるプロセツサに実行させるため、その論理プロ
セツサ番号を切り替えてしまうことにより、以降
その障害プロセツサとの通信を行なうことができ
ず、システム制御プロセツサによる障害プロセツ
サの診断・試験処理ができないという欠点を有し
ていた。
However, in conventional multiprocessor systems, each processor in multiple processors has only one type of logical processor number, and if a processor in the system fails, the calculation processing that was being executed by the failed processor is transferred to another processor. Since the logical processor number is switched in order to be executed by the faulty processor, it is no longer possible to communicate with the faulty processor, which has the disadvantage that the system control processor cannot diagnose or test the faulty processor. Was.

発明の目的 本発明は上記欠点に鑑み、データ処理を実施す
るプロセツサに障害が生じた際、その障害プロセ
ツサが実施していたデータ処理を代替プロセツサ
に行なわせても、前記障害プロセツサと診断・試
験処理の通信が行なうことができるようにしたマ
ルチプロセツサシステムを提供するものである。
Purpose of the Invention In view of the above-mentioned drawbacks, the present invention provides a processor that, when a fault occurs in a processor that performs data processing, can perform diagnosis and testing with the faulty processor, even if an alternative processor performs the data processing that was being performed by the faulty processor. The present invention provides a multiprocessor system that enables communication of processing.

発明の構成 本発明は、データ処理を実行するn個のプロセ
ツサと、これらn個のプロセツサの代替をする1
個の予備プロセツサと、データバスを介し、前記
n+1個のプロセツサの制御を行うシステム制御
プロセツサとを具備し、システム制御プロセツサ
には前記n個のプロセツサのデータ処理時及び診
断試験処理時に応じた第1、第2の論理プロセツ
サ番号が付された論理プロセツサ番号テーブルを
設けるとともに、前記第1、第2の論理プロセツ
サ番号に応じた物理プロセツサ番号が付された物
理プロセツサ番号テーブルを設け、前記n個のプ
ロセツサのうちの1個に障害が発生した時には、
前記物理プロセツサ番号テーブルの前記第1の論
理プロセツサ番号に応じた物理プロセツサ番号を
前記予備プロセツサの物理プロセツサ番号に書き
替え、前記システム制御プロセツサが、データ処
理時には前記第1の論理プロセツサ番号に応じた
物理プロセツサ番号を選択することにより、障害
発生時には予備プロセツサにデータ処理を実行さ
せるとともに、前記第2の論理プロセツサ番号に
応じた物理プロセツサ番号を選択することによ
り、障害が発生したプロセツサの診断・試験を実
行することにより、上記目的を達するものであ
る。
Structure of the Invention The present invention comprises n processors that execute data processing, and one processor that replaces these n processors.
and a system control processor that controls the n+1 processors via a data bus. 1. Provide a logical processor number table in which a second logical processor number is assigned, and also provide a physical processor number table in which physical processor numbers are assigned according to the first and second logical processor numbers, and When one of the processors fails,
A physical processor number corresponding to the first logical processor number in the physical processor number table is rewritten to a physical processor number of the spare processor, so that the system control processor processes data according to the first logical processor number. By selecting a physical processor number, a backup processor is made to execute data processing in the event of a failure, and by selecting a physical processor number corresponding to the second logical processor number, diagnosis and testing of a failed processor can be performed. By carrying out the above, the above purpose is achieved.

実施例の説明 以下図面を参照しながら、本発明の一実施例に
ついて説明する。
DESCRIPTION OF EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.

第1図は本発明の一実施例におけるマルチプロ
セツサシステムのブロツク結線図である。
FIG. 1 is a block diagram of a multiprocessor system according to an embodiment of the present invention.

第1図において、11〜1oはデータ処理を実行
するプロセツサ、1o+1はプロセツサ11〜1o
中で障害が生じた際に代替となるプロセツサ、2
はプロセツサ11〜1o+1の制御をバス3を介して
実行するシステム制御プロセツサである。
In FIG. 1, 1 1 to 1 o are processors that execute data processing, 1 o+1 is a substitute processor when a failure occurs among processors 1 1 to 1 o , and 2
is a system control processor that controls processors 1 1 to 1 o+1 via bus 3.

次に第2図を参照して、システム制御プロセツ
サ2の構成をさらに詳細に説明する。
Next, the configuration of the system control processor 2 will be explained in more detail with reference to FIG.

第2図において、10はデータ及びデータ処理
プログラムをどのプロセツサ11〜1oに送信する
かを指示する送信先論理プロセツサ番号指示回路
である。12はプロセツサ11〜1oに対応する論
理プロセツサ番号及び物理プロセツサ番号を保持
するテーブルで、論理プロセツサ番号はテーブル
12aに、物理プロセツサ番号はテーブル12b
に保持される。プロセツサ11〜1oに対応するデ
ータ処理時の論理及び物理プロセツサ番号はA1
〜Aoと11〜1oである。また診断・試験時の論理
及び物理プロセツサ番号はB1〜Boと11〜1o
ある。11は送信先論理プロセツサ番号指示回路
10が指示する論理プロセツサ番号に対応する物
理プロセツサ番号をテーブル12内から検索する
検索回路で、たとえば送信先論理プロセツサ番号
指示回路10がデータ処理時にA1を指示すると、
そのA1に対応する物理プロセツサ番号11を検出
する。一方、必要に応じて送信先論理プロセツサ
番号指示回路10が診断・試験時にB1を指示す
ると、そのB1に対応する物理プロセツサ番号11
を検出する。13は検索回路11が検索した物理
プロセツサ番号1n(但し、mは1≦m≦nを満
足する整数)を一時保持するバツフア、14はバ
ツフア13に保持されている物理プロセツサ番号
nをもとにして自己プログラム番号、データ長
及びデータ等をプロセツサ1nに送出する出力部
である。15はプロセツサ1(但し、は1≦
≦nを満足する整数)に障害が生じると、論理
プロセツサ番号Aに対応する物理プロセツサ番
号1を1o+1に書き換える書き換え回路である。
In FIG. 2, reference numeral 10 denotes a destination logical processor number indicating circuit which instructs which processors 1 1 to 1 o data and data processing programs are to be sent to. 12 is a table holding logical processor numbers and physical processor numbers corresponding to processors 1 1 to 1 o ; the logical processor numbers are stored in table 12a, and the physical processor numbers are stored in table 12b.
is maintained. The logical and physical processor number during data processing corresponding to processor 1 1 to 1 o is A 1
~A o and 1 1 ~1 o . The logical and physical processor numbers during diagnosis and testing are B 1 to Bo and 1 1 to 1 o . 11 is a search circuit that searches the table 12 for the physical processor number corresponding to the logical processor number specified by the destination logical processor number instruction circuit 10; for example, when the destination logical processor number instruction circuit 10 specifies A1 during data processing; Then,
The physical processor number 11 corresponding to A1 is detected. On the other hand, if the destination logical processor number instruction circuit 10 instructs B 1 during diagnosis/testing as necessary, the physical processor number 1 corresponding to B 1
Detect. 13 is a buffer that temporarily holds the physical processor number 1 n (where m is an integer satisfying 1≦m≦n) searched by the search circuit 11; 14 also holds the physical processor number 1 n held in the buffer 13; This is an output section that sends the own program number, data length, data, etc. to the processor 1n . 15 is processor 1 (however, 1≦
This is a rewrite circuit that rewrites the physical processor number 1 corresponding to the logical processor number A to 1 o+1 when a failure occurs in the processor (an integer satisfying ≦n).

上記構成において、以下その動作を説明する。 The operation of the above configuration will be explained below.

まず、データ処理時において、各プロセツサ1
,1oに障害が生じていない場合は、送信先論理
プロセツサ番号指示回路10が指示する論理プロ
セツサ番号Aに対応する物理プロセツサ番号1
がテーブル12により、検索回路11を介して
検索される。検索された物理プロセツサ番号1
はバツフア13を介して出力部14によりプロセ
ツサ1に送出され、プロセツサ1でデータ処
理が実行される。
First, during data processing, each processor 1
1 , 1o , the physical processor number 1 corresponding to the logical processor number A specified by the destination logical processor number instruction circuit 10
is searched by the table 12 via the search circuit 11. Searched physical processor number 1
is sent to the processor 1 by the output unit 14 via the buffer 13, and the processor 1 executes data processing.

ところが、たとえばプロセツサ1でデータ処
理の障害が発生すると、書き換え回路15はプロ
セツサ1に対応するテーブル12内の物理プロ
セツサ番号1を第3図に示すように1o+1に書
き換える。そしてプロセツサ1で処理させたに
もかかわらず障害発生のため処理できなかつたデ
ータ処理を、プロセツサ1o+1に処理させるよう
にする。すなわち送信先論理プロセツサ番号指示
回路10が指示する論理プロセツサ番号Aに対
応する、テーブル12内の物理プロセツサ番号は
o+1となつていることにより、障害発生のため
再処理を行なわせると、プロセツサ1o+1により
データ処理が実行される。
However, if a data processing failure occurs in processor 1, for example, rewriting circuit 15 rewrites physical processor number 1 in table 12 corresponding to processor 1 to 1 o+1 as shown in FIG. Processor 1 o+1 is then made to process data that could not be processed due to the occurrence of a failure despite being processed by processor 1. In other words, since the physical processor number in the table 12 corresponding to the logical processor number A specified by the destination logical processor number instruction circuit 10 is 1 o+1 , if reprocessing is performed due to a failure, Data processing is executed by processor 1 o+1 .

一方、プロセツサ1に対する診断・試験を行
なう必要がある。そこで送信先論理プロセツサ番
号指示回路10が障害・試験のために論理プロセ
ツサ番号Bを指示すると、検索回路11により
テーブル12から物理プロセツサ番号1が検索
される。検索された物理プロセツサ番号1はバ
ツフア13を介して出力部14に送出され、出力
部14から診断・試験のためのデータとともにプ
ロセツサ1に送出されてシステム制御プロセツ
サ間で診断・試験が開始される。
On the other hand, it is necessary to diagnose and test the processor 1. When the destination logical processor number designation circuit 10 designates the logical processor number B for failure/testing, the search circuit 11 searches the table 12 for the physical processor number 1. The retrieved physical processor number 1 is sent to the output unit 14 via the buffer 13, and from the output unit 14 is sent to the processor 1 together with data for diagnosis and testing, and diagnosis and testing between the system control processors is started. .

以上本実施例によれば、テーブル12をシステ
ム制御プロセツサ2内に設け、このテーブル12
にデータ処理時及び診断・試験時における各プロ
セツサ11〜1oの論理プロセツサ番号、及びそれ
に対応する物理プロセツサ番号を与えることによ
り、障害の発生したプロセツサ1に対し予備と
してのプロセツサ1o+1が代替プロセツサとして
データ処理を実行させることができ、その間にシ
ステム制御プロセツサ2はプロセツサ1に対す
る診断・試験を行なうことができる。
As described above, according to this embodiment, the table 12 is provided in the system control processor 2, and the table 12 is
By giving the logical processor numbers of each processor 1 1 to 1 o and the corresponding physical processor numbers during data processing and diagnosis/testing, processor 1 o+1 can be set up as a backup for the failed processor 1. The system control processor 2 can perform data processing as an alternative processor, while the system control processor 2 can diagnose and test the processor 1.

なお本実施例ではシステム制御プロセツサ2が
プログラム及びデータ等をロードするよう構成し
たが、これらのロードはプログラムロードプロセ
ツサを別に用いることもある。
In this embodiment, the system control processor 2 is configured to load programs, data, etc., but a separate program load processor may be used for loading these.

発明の効果 以上のように本発明は、データ処理を実行する
各プロセツサに2種類の論理プロセツサ番号を付
与しているテーブルを設けることにより、データ
処理を実施するプロセツサに障害が生じた際、そ
の障害プロセツサが実施していたデータ処理を代
替プロセツサに行なわせても、前記障害プロセツ
サと診断・試験処理の通信が行なうことができ、
その効果は大きい。
Effects of the Invention As described above, the present invention provides a table in which two types of logical processor numbers are assigned to each processor that executes data processing. Even if an alternative processor performs the data processing that was being performed by the faulty processor, communication can be performed with the faulty processor for diagnosis and test processing;
The effect is great.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例におけるマルチプロ
セツサシステムのブロツク結線図、第2図は同マ
ルチプロセツサシステムのシステム制御プロセツ
サの要部ブロツク結線図、第3図はテーブル内の
書き換え状態を示す概念図である。 11〜1o+1……プロセツサ、2……システム制
御プロセツサ、3……バス、10……送信先論理
プロセツサ番号指示回路、11……検索回路、1
2……テーブル、13……バツフア、14……出
力部。
Fig. 1 is a block wiring diagram of a multiprocessor system according to an embodiment of the present invention, Fig. 2 is a block wiring diagram of main parts of the system control processor of the multiprocessor system, and Fig. 3 shows the rewriting state in the table. FIG. 1 1 to 1 o+1 ... Processor, 2 ... System control processor, 3 ... Bus, 10 ... Destination logical processor number instruction circuit, 11 ... Search circuit, 1
2...table, 13...buffer, 14...output section.

Claims (1)

【特許請求の範囲】[Claims] 1 データ処理を実行するn個のプロセツサと、
これらn個のプロセツサの代替をする1個の予備
プロセツサと、データバスを介し前記n+1個の
プロセツサの制御を行なうシステム制御プロセツ
サとを具備し、システム制御プロセツサには、前
記n個のプロセツサのデータ処理時及び診断試験
処理時に応じた第1、第2の論理プロセツサ番号
が付された論理プロセツサ番号テーブルを設ける
とともに、前記第1、第2の論理プロセツサ番号
に応じた、物理プロセツサ番号が付された物理プ
ロセツサ番号テーブルを設け、前記n個のプロセ
ツサのうちの1個に障害が発生した時には、前記
物理プロセツサ番号テーブルの前記第1の論理プ
ロセツサ番号に応じた物理プロセツサ番号を前記
予備プロセツサの物理プロセツサ番号に書き替
え、前記システム制御プロセツサがデータ処理時
には前記第1の論理プロセツサ番号に応じた物理
プロセツサ番号を選択することにより、障害発生
時には予備のプロセツサにデータ処理を実行させ
るとともに、前記第2の論理プロセツサ番号に応
じた物理プロセツサ番号を選択することにより、
障害が発生したプロセツサの診断・試験を実行す
るマルチプロセツサシステム。
1 n processors that execute data processing;
The processor is equipped with one standby processor that replaces these n processors, and a system control processor that controls the n+1 processors via a data bus. A logical processor number table is provided in which first and second logical processor numbers are assigned according to processing and diagnostic test processing, and physical processor numbers are assigned according to the first and second logical processor numbers. A physical processor number table is provided, and when a failure occurs in one of the n processors, the physical processor number corresponding to the first logical processor number in the physical processor number table is set to the physical processor number of the spare processor. By rewriting the processor number and selecting a physical processor number corresponding to the first logical processor number when processing data, the system control processor allows the backup processor to execute data processing in the event of a failure, and By selecting the physical processor number according to the logical processor number of
A multiprocessor system that diagnoses and tests faulty processors.
JP59028944A 1984-02-17 1984-02-17 Multiprocessor system Granted JPS60173654A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59028944A JPS60173654A (en) 1984-02-17 1984-02-17 Multiprocessor system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59028944A JPS60173654A (en) 1984-02-17 1984-02-17 Multiprocessor system

Publications (2)

Publication Number Publication Date
JPS60173654A JPS60173654A (en) 1985-09-07
JPH0120465B2 true JPH0120465B2 (en) 1989-04-17

Family

ID=12262512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59028944A Granted JPS60173654A (en) 1984-02-17 1984-02-17 Multiprocessor system

Country Status (1)

Country Link
JP (1) JPS60173654A (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62286131A (en) * 1986-06-05 1987-12-12 Nec Corp Automatic selfdiagnosing system for information processor
JPH04216155A (en) * 1990-12-17 1992-08-06 Nec Aerospace Syst Ltd Message transfer control system
US7206966B2 (en) * 2003-10-22 2007-04-17 Hewlett-Packard Development Company, L.P. Fault-tolerant multi-core microprocessing

Also Published As

Publication number Publication date
JPS60173654A (en) 1985-09-07

Similar Documents

Publication Publication Date Title
US7941810B2 (en) Extensible and flexible firmware architecture for reliability, availability, serviceability features
JP3481737B2 (en) Dump collection device and dump collection method
JPH0120465B2 (en)
JPS6113626B2 (en)
JP3210527B2 (en) Redundant computer system
JPH0196752A (en) Multi-processor device
JPH0744413A (en) Computer backup system
Dieterich et al. A compatible airborne multiprocessor
JP2643526B2 (en) Peripheral equipment testing equipment
JPH03219360A (en) Multiprocessor control system
JPS63100563A (en) Faulty processor detecting system
JPH01158539A (en) On-line test system for multiprocessor
JPH08235016A (en) Fault diagnostic system
JPH01286049A (en) Information processing system
JPH10124338A (en) Parallel processor
JPS60189542A (en) Runaway detecting system of processor
JPS6398764A (en) File recovery system for multi-computer system
JPH07170265A (en) Plural-node system
JPS6231386B2 (en)
JPS5855529B2 (en) Error processing method of data processing equipment
JPH0341528A (en) Diagnostic device in computer
JPS63192141A (en) Log-out system for fault information of multi-processor system
JPH04142632A (en) Logging system for duplex data holding device
JPH0295065A (en) Resource control method for electronic switching system
JPH0730651A (en) Diagnostic system

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term