JP2000082052A - Multiprocessor system, its diagnostic method, and recording medium recorded with its control program - Google Patents

Multiprocessor system, its diagnostic method, and recording medium recorded with its control program

Info

Publication number
JP2000082052A
JP2000082052A JP10250635A JP25063598A JP2000082052A JP 2000082052 A JP2000082052 A JP 2000082052A JP 10250635 A JP10250635 A JP 10250635A JP 25063598 A JP25063598 A JP 25063598A JP 2000082052 A JP2000082052 A JP 2000082052A
Authority
JP
Japan
Prior art keywords
calculation
processor
calculation result
content
calculation processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10250635A
Other languages
Japanese (ja)
Inventor
Osamu Shimadachi
道 嶋立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP10250635A priority Critical patent/JP2000082052A/en
Publication of JP2000082052A publication Critical patent/JP2000082052A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To obtain an error detection system which does not lower the reliability of diagnostic processes of individual processors in a multiprocessor system. SOLUTION: When an IOP(input/output processor) 1 performs a normal process and reaches a diagnostic point, the IOP 1 starts a process for diagnosis. Namely, the IOP 1 stores the last calculation contents and its current calculation result in a storage means and refers to flags in an idle flag function part showing that no other IOP is performing a process. The last calculation contents are set to, for example, an IOP 2 whose flat is set. The IOP 2 having received them performs calculation according to the received calculation contents and sends the calculation result back to the IOP 1. The IOP 1 stores the sent-back calculation result in the storage means 19 and compares it with the calculation result in the storage means. When both the calculation results are equal to each other, it is considered that neither processor is malfunctioning and the diagnosing process is ended.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明はマルチプロセッサシ
ステム及びそのエラー検出方法並びにその制御プログラ
ムを記録した記録媒体に関し、特に診断処理におけるマ
ルチプロセッサシステムにおけるエラー検出方式に関す
るものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multiprocessor system, an error detection method therefor, and a recording medium storing a control program therefor, and more particularly to an error detection method in a multiprocessor system in diagnostic processing.

【0002】[0002]

【従来の技術】スーパコンピュータ、大型汎用機等の複
数個の汎用プロセッサを有するシステムにおいて、プロ
セッサ自身のエラーの検出を行う技術として、主に多重
化方式とパトロール方式とがある。前者の多重化方式と
は、複数のプロセッサに同じ処理を行わせ、随時、処理
結果を照合し、不一致であった場合に、システムから切
り離し障害処理を行うものである。この方式において
は、信頼度は増すが、プロセッサの利用効率が悪く、ハ
ード量が増す。
2. Description of the Related Art In a system having a plurality of general-purpose processors such as a supercomputer and a large general-purpose machine, there are mainly a multiplexing method and a patrol method as a technique for detecting an error of the processor itself. The former multiplexing method is to make a plurality of processors perform the same processing, collate the processing results as needed, and perform disconnection failure processing from the system if they do not match. In this method, the reliability increases, but the utilization efficiency of the processor is poor, and the amount of hardware increases.

【0003】後者のパトロール方式とは、プロセッサの
プログラム内にいくつかの診断ポイントを設定してお
き、診断結果を上位のプロセッサに報告し、上位のプロ
セッサによって照合するものである。この方式において
は、診断処理が固定されて診断の信頼度が低くなる。従
来のこの2つの方式には、それぞれハード量、信頼度の
面にて一長一短がある。
In the latter patrol system, several diagnostic points are set in a program of a processor, a diagnosis result is reported to an upper processor, and collation is performed by the upper processor. In this method, the diagnosis processing is fixed, and the reliability of the diagnosis decreases. These two conventional methods have advantages and disadvantages in terms of the amount of hardware and reliability.

【0004】特開平6−28328号公報には、図5に
示すようなマルチプロセッサの自己診断方式が提案され
ている。図5において、このマルチプロセッサシステム
は、システムの主体をなす中央処理装置(CPU)1
1、付加処理装置(ADP)41、周辺制御装置(PC
L)42,43、これらの装置(プロセッサ)11,4
1,42,43間を接続するインタフェースバス(BU
S)10にて構成される。
Japanese Patent Laid-Open Publication No. Hei 6-28328 proposes a multiprocessor self-diagnosis system as shown in FIG. In FIG. 5, the multiprocessor system includes a central processing unit (CPU) 1 which is a main component of the system.
1. Additional processing unit (ADP) 41, peripheral control unit (PC)
L) 42, 43, these devices (processors) 11, 4
Interface bus (BU) connecting between
S) 10.

【0005】CPU11は、自己診断を行うための診断
結果の期待値を予め格納した期待値レジスタ(DRR)
56、診断結果を保持する結果保持レジスタ(RSR)
58、DRR56に格納されている期待値とRSR58
に保持されている診断結果とを比較解析する比較解析回
路(CMP)57を有する。また、通常のマイクロ命令
を格納する書き込み可能なマイクロプログラム制御記憶
装置(WOS)60、自己診断マイクロプログラム記憶
装置(DME)61、通常のプログラムを実行する通常
モードと、自己診断用マイクロプログラムが実行される
自己診断モードとを切り替えるモード切り替え回路(M
DS)53を有する。
The CPU 11 has an expected value register (DRR) in which an expected value of a diagnosis result for performing self-diagnosis is stored in advance.
56, a result holding register (RSR) for holding a diagnosis result
58, expected value stored in DRR 56 and RSR 58
And a comparison analysis circuit (CMP) 57 for comparing and analyzing the diagnosis result stored in the memory. Also, a writable microprogram control storage device (WOS) 60 for storing a normal microinstruction, a self-diagnosis microprogram storage device (DME) 61, a normal mode for executing a normal program, and a self-diagnosis microprogram are executed. Mode switching circuit (M
DS) 53.

【0006】更に、MDS53の指示によりWOS6
0、DME61のいずれかのデータを読み出して、デー
タレジスタ(DTR)51に出力するマルチプレクサ
(MPX)54、MPX54の出力を一時格納するデー
タレジスタ(DTR)55、DTR55の出力データを
実行するデータ処理装置(DTP)51を有する。更に
はまた、DTP51の指示によりMDS53を制御する
マイクロプログラム制御装置(MPC)52、MDS5
3、DTR55からの指示によりWOS60、DME6
1にネクストアドレス情報を与えるネクストアドレスレ
ジスタ(ADE)62、BUS10とインタフェースす
るバスインタフェース回路(BIF)59を有して構成
される。
Further, according to the instruction of the MDS 53, the WOS6
0, any one of the data of the DME 61 and a multiplexer (MPX) 54 for outputting to the data register (DTR) 51, a data register (DTR) 55 for temporarily storing the output of the MPX 54, and a data processing for executing the output data of the DTR 55 The device (DTP) 51 is provided. Furthermore, a microprogram controller (MPC) 52 for controlling the MDS 53 in accordance with an instruction from the DTP 51,
3. WOS60, DME6 by instruction from DTR55
1 is provided with a next address register (ADE) 62 for giving next address information, and a bus interface circuit (BIF) 59 for interfacing with the BUS 10.

【0007】自己診断実行時には、MPC52はMDS
53を制御してMPX54を切り替えるとともに、MD
S53からのネクストアドレス情報をADR62を介し
てDME61に与え、DME61の自己診断マイクロプ
ログラムはMPX54、DTR55を介してDTP51
に入力され、DTP51は診断命令を実行する。DTP
51の故障状態にて診断演算を行ったときは、自己診断
の結果情報をRSR58に格納し、DTP51により予
め設定しておいたDRR56の内容とRSR58の内容
とをCMP57により比較解析する。
At the time of executing the self-diagnosis, the MPC 52
Controls the MPX 54 by controlling the
The next address information from S53 is provided to the DME 61 via the ADR 62, and the self-diagnosis microprogram of the DME 61 is transmitted to the DTP 51 via the MPX 54 and the DTR 55.
And the DTP 51 executes the diagnostic instruction. DTP
When the diagnostic calculation is performed in the failure state of 51, the result information of the self-diagnosis is stored in the RSR 58, and the contents of the DRR 56 preset by the DTP 51 and the contents of the RSR 58 are compared and analyzed by the CMP 57.

【0008】[0008]

【発明が解決しようとする課題】図5に示す特開平5−
28328号公報記載に提案の技術の場合、診断処理の
信頼度が低くなる問題がある。すなわち、この提案にお
いては、診断処理の期待値がDMEに格納された診断用
のマイクロプログラムによって固定されるからである。
診断の内容は毎回同じとなるために、診断の際の計算に
て使用される部分以外の診断は行われないことになる。
また、システム全体としての性能が低下する問題があ
る。すなわち、診断の実行時には、診断の対象となるプ
ロセッサの本来の作業を行う通常モードを完全に停止
し、モード切り替え回路によって診断モードに切り替え
て診断処理を行うからである。診断処理の開始から終了
までの間は、通常の処理は一切行われない。
SUMMARY OF THE INVENTION FIG.
In the case of the technique proposed in Japanese Patent No. 28328, there is a problem that the reliability of the diagnostic processing is reduced. That is, in this proposal, the expected value of the diagnostic processing is fixed by the diagnostic microprogram stored in the DME.
Since the content of the diagnosis is the same every time, the diagnosis other than the portion used in the calculation at the time of the diagnosis is not performed.
In addition, there is a problem that the performance of the entire system is reduced. That is, when the diagnosis is performed, the normal mode of performing the original work of the processor to be diagnosed is completely stopped, and the diagnosis processing is performed by switching to the diagnosis mode by the mode switching circuit. No normal processing is performed from the start to the end of the diagnostic processing.

【0009】本発明の目的は、診断処理の信頼度を低下
させないマルチプロセッサシステム及びそのエラー検出
方法並びにその方法の制御プログラムを記録した記録媒
体を提供することである。
An object of the present invention is to provide a multiprocessor system which does not reduce the reliability of diagnostic processing, an error detection method thereof, and a recording medium on which a control program for the method is recorded.

【0010】[0010]

【課題を解決するための手段】本発明によれば、互いに
バスを介して相互接続され各々が計算処理を行う複数の
プロセッサにより構成されるマルチプロセッサシステム
であって、前記プロセッサの各々は、前記計算処理の空
き時間を表示する空き時間表示手段と、前記計算処理の
過程中の予め定められた診断ポイントに達したときにそ
の直前の自己の計算処理内容とその計算結果とを格納す
る格納手段と、前記診断ポイントに達したときに他のプ
ロセッサの空き時間表示手段を参照して空きを示してい
るプロセッサを送信先プロセッサとして前記格納手段の
計算処理内容を送出する送信手段と、送信元プロセッサ
の送信手段からの送信内容である前記計算処理内容を受
信して当該計算処理内容に従って計算処理を行う手段
と、この計算結果を前記送信元プロセッサへ返送する手
段と、前記送信先プロセッサから返送されてきた計算結
果と前記格納手段の計算結果とを比較する比較手段と、
を有することを特徴とするマルチプロセッサシステムが
得られる。
According to the present invention, there is provided a multiprocessor system comprising a plurality of processors interconnected via a bus and each performing a calculation process, wherein each of the processors is Free time display means for displaying the free time of the calculation processing, and storage means for storing the contents of the calculation processing immediately before the predetermined diagnosis point in the course of the calculation processing and the calculation result thereof Transmitting means for transmitting the calculation processing content of the storage means as a destination processor by referring to the free time display means of another processor when the diagnosis point is reached, and a transmission source processor Means for receiving the calculation processing content, which is the transmission content from the transmission means, and performing calculation processing according to the calculation processing content; Means for returning to the serial transmitting processor, and comparing means for comparing the calculation result of the calculation result and said storage means has been returned from the destination processor,
And a multiprocessor system characterized by having the following.

【0011】そして、前記プロセッサの各々は、前記送
信先プロセッサに対して前記計算処理内容を送信した
後、通常処理へ移行するようにしたことを特徴とする。
また、上位の診断手段を含み、前記プロセッサの各々
は、前記比較手段が不一致を検知した場合に、前記計算
処理内容及びその計算結果並びに前記送信先プロセッサ
からの計算結果を前記診断プロセッサへ報告する手段を
有することを特徴とし、また前記診断手段は、前記計算
処理内容に従って計算処理を行ってその計算結果と前記
プロセッサの計算結果とを照合するようにしたことを特
徴とする。
Each of the processors transmits the calculation processing contents to the transmission destination processor, and then shifts to a normal processing.
The processor further includes an upper-level diagnosis unit, and each of the processors reports the calculation processing content and the calculation result thereof and the calculation result from the transmission destination processor to the diagnosis processor when the comparison unit detects a mismatch. The diagnostic means is characterized in that the diagnostic means performs a calculation process in accordance with the content of the calculation process, and compares the calculation result with the calculation result of the processor.

【0012】また本発明によれば、互いにバスを介して
相互接続され各々が計算処理を行う複数のプロセッサに
より構成されるマルチプロセッサシステムの診断方法で
あって、 前記計算処理の空き時間を表示する表示ステ
ップと、前記計算処理の過程中の予め定められた診断ポ
イントに達したときにその直前の自己の計算処理内容と
その計算結果とを格納する格納ステップと、前記診断ポ
イントに達したときに他のプロセッサの空き時間表示を
参照して空きを示しているプロセッサを送信先プロセッ
サとして前記格納ステップの計算処理内容を送出する送
信ステップと、送信元プロセッサの前記送信ステップに
よる送信内容である前記計算処理内容を受信して当該計
算処理内容に従って計算処理を行うステップと、この計
算結果を前記送信元プロセッサに返送するステップと、
前記送信先プロセッサから返送されてきた計算結果と前
記格納ステップの計算結果とを比較する比較ステップ
と、を有することを特徴とする診断方法が得られる。
Further, according to the present invention, there is provided a method for diagnosing a multiprocessor system comprising a plurality of processors interconnected via a bus and each performing a calculation process, wherein the idle time of the calculation process is displayed. A display step, a storage step of storing the content of its own calculation processing immediately before reaching a predetermined diagnosis point in the course of the calculation processing and the calculation result, and A transmitting step of transmitting the calculation processing content of the storing step with the processor indicating the vacancy by referring to the vacant time display of another processor as a destination processor, and the calculation being the transmission content of the transmitting step of the transmitting processor Receiving the processing content and performing a calculation process in accordance with the calculation content; and transmitting the calculation result to the transmission source. Returning to the processor;
A diagnostic method is provided, comprising: a comparison step of comparing the calculation result returned from the transmission destination processor with the calculation result of the storage step.

【0013】更に本発明によれば、互いにバスを介して
相互接続され各々が計算処理を行う複数のプロセッサに
より構成されるマルチプロセッサシステムの診断方法の
制御プログラムを格納した記録媒体であって、前記プロ
グラムは、前記計算処理の空き時間を表示する表示ステ
ップと、前記計算処理の過程中の予め定められた診断ポ
イントに達したときにその直前の自己の計算処理内容と
その計算結果とを格納する格納ステップと、前記診断ポ
イントに達したときに他のプロセッサの空き時間表示を
参照して空きを示しているプロセッサを送信先プロセッ
サとして前記格納ステップの計算処理内容を送出する送
信ステップと、送信元プロセッサの送信ステップによる
送信内容である前記計算処理内容を受信して当該計算処
理内容に従って計算処理を行うステップと、この計算結
果を前記送信元プロセッサから返送されてきた計算結果
と前記格納ステップの計算結果とを比較する比較ステッ
プと、を有することを特徴とする記録媒体が得られる。
Further, according to the present invention, there is provided a recording medium storing a control program of a diagnostic method for a multiprocessor system which includes a plurality of processors which are interconnected via a bus and each perform a calculation process. The program stores a display step of displaying a free time of the calculation processing, and, when reaching a predetermined diagnostic point in the course of the calculation processing, the content of its own calculation processing immediately before the diagnosis point and the calculation result. A storage step, a transmission step of sending the calculation processing content of the storage step as a destination processor by referring to the idle time display of another processor when the diagnostic point is reached, The content of the calculation process, which is the content of the transmission by the transmission step of the processor, is received, and the content is calculated according to the content of the calculation process Performing a process, the recording medium is obtained which is characterized by having, a comparison step of comparing a calculation result of the calculation result and said storing step the calculation result sent back from the transmitting processor.

【0014】本発明の作用を述べる。まず、期待値が固
定されることによって信頼度が低下する問題を、プロセ
ッサが直前に行った処理を流用することによって解決す
る。すなわち、診断処理の対象となるプロセッサは、通
常はマルチプロセッサシステムにおいて、何らかの処理
を行っている。診断に使う出題内容として、プロセッサ
が診断の直前に行っていた例えばアドレス計算等を利用
する。自己が既に行った計算をマルチプロセッサシステ
ム内の他のプロセッサに行わせ、自己の計算結果と他の
プロセッサの計算結果とを比較することにより診断を行
う。これを可能とするため、図5に示した従来例の期待
値レジスタと結果保持レジスタの代わりに自己の行って
いた直前の計算を保持するための出題内容の保持手段
と、自己をも含めた各プロセッサの計算結果を保持する
手段を持つ。
The operation of the present invention will be described. First, the problem that the reliability is reduced by fixing the expected value is solved by diverting the processing performed immediately before by the processor. That is, the processor to be subjected to the diagnosis processing usually performs some processing in a multiprocessor system. As the content of the question to be used for the diagnosis, for example, an address calculation or the like performed by the processor immediately before the diagnosis is used. The other processor in the multiprocessor system performs the calculation that the user has already performed, and diagnoses by comparing the calculation result of the user with the calculation result of the other processor. In order to enable this, instead of the expected value register and the result holding register of the conventional example shown in FIG. 5, a question content holding means for holding the immediately preceding calculation performed by the user and the self are included. It has means for holding the calculation results of each processor.

【0015】さらに診断の信頼度を上げるために、シス
テムに診断処理を専門に行う診断プロセッサを持つ。診
断の対象となるプロセッサ自身による診断にて誤動作が
検出された場合に、この診断プロセッサによって再計算
することにより、誤動作が発生しているプロセッサを特
定する。
In order to further increase the reliability of diagnosis, the system has a diagnosis processor that specializes in diagnosis processing. If a malfunction is detected by the diagnosis of the processor itself to be diagnosed, the malfunctioning processor is identified by re-calculating the malfunction by the diagnosis processor.

【0016】次に、診断処理による性能の低下を避ける
ために、プロセッサの空き時間を利用して診断処理を行
う。マルチプロセッサシステムにおいて、各プロセッサ
は常に作業を行っているわけではない。例えば、入出力
プロセッサの場合、上位システムと下位の補助記憶装置
との間のデータ入出力が行われない時間は通常は空き時
間となる。このような時間を利用して診断処理を行い、
システムとしての性能の低下を避ける。これを可能とす
るために、診断の対象となる各プロセッサの利用状態を
示すアイドルフラグを新たに備える。アイドルフラグが
上がっているとき、プロセッサは次の命令を待っている
空き時間であることを示す。
Next, in order to avoid a decrease in performance due to the diagnosis processing, the diagnosis processing is performed using the idle time of the processor. In a multiprocessor system, each processor is not always working. For example, in the case of an input / output processor, the time during which data input / output between the upper system and the lower auxiliary storage device is not performed is usually idle time. Diagnosis processing is performed using such time,
Avoid degradation of system performance. In order to make this possible, an idle flag indicating a use state of each processor to be diagnosed is newly provided. When the idle flag is raised, it indicates that the processor is idle time waiting for the next instruction.

【0017】各プロセッサは、処理を行おうとするとき
に、自己のアイドルフラグを下げてから処理を開始す
る。処理を終了するときはアイドルフラグを上げて終了
する。これにより、アイドルフラグを見ることによって
各プロセッサの利用状態を知ることが可能となり、空き
時間である診断処理が可能なプロセッサを知ることがで
きる。
Each processor starts processing after lowering its own idle flag when trying to perform processing. To end the processing, the idle flag is raised and the processing ends. As a result, it is possible to know the use state of each processor by looking at the idle flag, and it is possible to know the processor that can perform the diagnostic processing that is the idle time.

【0018】図5に示す従来例においては、各プロセッ
サがそれぞれ自己の診断を制御し、自己の持つ期待値を
基に診断を行うのに対し、マルチプロセッサシステムで
あることを利用して、各プロセッサが相互に診断を制御
し、診断の期待値を固定せずに、一度の診断にて複数個
のプロセッサの診断を行う。また、システム内に上位の
プロセッサとして診断用のプロセッサを持ち、誤動作を
検出したときに、診断プロセッサによって誤動作の発生
しているプロセッサを特定することによって、診断の信
頼度を向上させている。
In the conventional example shown in FIG. 5, each processor controls its own diagnosis and makes a diagnosis on the basis of its own expected value. The processors mutually control the diagnosis, and diagnose a plurality of processors in one diagnosis without fixing the expected value of the diagnosis. In addition, a diagnostic processor is provided as an upper processor in the system, and when a malfunction is detected, the diagnostic processor identifies the processor in which the malfunction has occurred, thereby improving the reliability of diagnosis.

【0019】[0019]

【発明の実施の形態】以下に、本発明の実施例について
図面を参照して説明する。図1は本発明によるマルチプ
ロセッサシステムの実施例の構成を示すブロック図であ
り、図5と同等部分は同一符号にて示している。図1に
おいて、本発明によるマルチプロセッサシステムは、シ
ステム全体を制御する中央処理装置(CPU)11、シ
ステムの制御プログラム等を格納する主記憶装置(MM
U)12、障害処理用の診断処理装置(DGP)13、
周辺・端末装置等との間の入出力動作を制御する入出力
プロセッサ(IOP)1〜n、これらの各装置1〜n,
11〜13相互間を接続するバスライン(BUS)10
にて構成される。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the configuration of an embodiment of a multiprocessor system according to the present invention, and the same parts as those in FIG. 5 are denoted by the same reference numerals. In FIG. 1, a multiprocessor system according to the present invention includes a central processing unit (CPU) 11 for controlling the entire system, and a main storage device (MM) for storing system control programs and the like.
U) 12, a diagnostic processing device (DGP) 13 for failure processing,
Input / output processors (IOPs) 1 to n for controlling input / output operations with peripherals and terminal devices, etc .;
Bus line (BUS) 10 for connecting between 11 and 13
It is composed of

【0020】本発明によるマルチプロセッサシステムに
おけるエラー検出(診断)の対象となるプロセッサは、
入出力プロセッサ(IOP)1〜nである。IOP1〜
nはCPU11やMMU12等と、ディスク装置、テー
プ装置等の周辺端末装置及び外部のネットワーク等(い
ずれも図示せず)との間の入出力動作を制御するもので
ある。DGP(DiaGnostic Processing unit)13はシ
ステム全体の障害処理を行うものであり、IOP1〜n
が誤動作を検出した場合に障害処理を行う。これら各プ
ロセッサ、装置1〜n,11〜13はバス10を介し
て、プロセッサ間通信を行うことができる。
The processor to be subjected to error detection (diagnosis) in the multiprocessor system according to the present invention is:
Input / output processors (IOPs) 1 to n. IOP1
n controls input / output operations between the CPU 11, the MMU 12, and the like, a peripheral terminal device such as a disk device and a tape device, and an external network or the like (neither is shown). A DGP (DiaGnostic Processing unit) 13 performs fault processing for the entire system, and includes IOPs 1 to n.
Performs fault processing when detects a malfunction. These processors and devices 1 to n and 11 to 13 can perform interprocessor communication via the bus 10.

【0021】図2は実際に診断の対象となる入出力プロ
セッサ(IOP)1〜nの詳細機能ブロック図である。
通常処理機能部分15は、入出力プロセッサ(IOP)
1〜nの本来の機能であるシステムの入出力制御を行
い、また、他のプロセッサとのプロセッサ間通信やアド
レス計算等の演算処理を行う。本発明によるマルチプロ
セッサシステムにおいては、通常処理機能部分15の持
つ機能を利用して診断処理を行う。
FIG. 2 is a detailed functional block diagram of input / output processors (IOPs) 1 to n to be actually diagnosed.
The normal processing function part 15 includes an input / output processor (IOP).
It controls the input / output of the system, which is the primary function of 1 to n, and performs arithmetic processing such as interprocessor communication with other processors and address calculation. In the multiprocessor system according to the present invention, the diagnostic processing is performed using the function of the normal processing function part 15.

【0022】アイドルフラグ機能部分16はプロセッサ
の利用状態を示す。アイドルフラグ部分16は、通常処
理機能部分15によってセットされる。他のプロセッサ
はバス10を介してアイドルフラグ部分16を読み出す
ことにより、そのプロセッサの現在の利用状態を知るこ
とができる。出題内容の保存手段17は、診断処理時に
使用するために自己が行った計算の内容を診断用出題と
して保存しておくものであり、通常処理機能部分15に
よって読み書きされる。その計算を行ったときの計算結
果は、自己の計算結果保持手段18に通常処理機能部分
15によって保存される。他のプロセッサの計算結果保
持手段19は、出題内容の保存手段17によって保存さ
れている計算を他のプロセッサが行ったときの結果が、
バス10及び通常処理機能部分15の持つプロセッサ間
通信機能を介して、通常処理機能部分15によって保存
される。
The idle flag function part 16 indicates the use state of the processor. The idle flag portion 16 is set by the normal processing function portion 15. The other processor can read the idle flag portion 16 via the bus 10 to know the current use state of the processor. The question content storage unit 17 stores the content of the calculation performed by itself for use in the diagnostic processing as a diagnostic question, and is read and written by the normal processing function unit 15. The calculation result at the time of performing the calculation is stored in its own calculation result holding unit 18 by the normal processing function unit 15. The calculation result holding means 19 of the other processor stores the result obtained when the other processor performs the calculation stored by the question content storage means 17.
The data is stored by the normal processing function unit 15 via the inter-processor communication function of the bus 10 and the normal processing function unit 15.

【0023】本発明の実施例の動作を図3及び図4のフ
ローチャートを参照しつつ説明する。これら図3,4は
本実施例における入出力プロセッサ1〜nの動作フロー
を示すフローチャートである。本実施例においてエラー
検出の対象となる入出力プロセッサ1〜nは、通常動作
としてマイクロプログラムによって制御されている。本
実施例においては、このマイクロプログラム内に複数個
の診断ポイントを設定し、入出力プロセッサの動作が診
断ポイントに達した場合に診断を行う。本実施例におい
ては、通常動作の終了時点に診断ポイントを設定する。
The operation of the embodiment of the present invention will be described with reference to the flowcharts of FIGS. 3 and 4 are flowcharts showing the operation flow of the input / output processors 1 to n in the present embodiment. In the present embodiment, the input / output processors 1 to n to be subjected to error detection are controlled by a microprogram as a normal operation. In this embodiment, a plurality of diagnostic points are set in the microprogram, and a diagnosis is performed when the operation of the input / output processor reaches the diagnostic point. In this embodiment, a diagnostic point is set at the end of the normal operation.

【0024】診断ポイントの直前に行った計算を、診断
用出題として出題内容の保存手段17によって保存して
おき、計算結果を自己の計算結果保存手段18によって
保存する。入出力プロセッサ1〜nは、通常動作として
システムのCPU11からのプロセッサ間通信による入
出力動作の命令を待ち、自己の持つマイクロプログラム
に沿って動作を行う。
The calculation performed immediately before the diagnosis point is stored as a diagnosis question by the question content storage unit 17, and the calculation result is stored by its own calculation result storage unit 18. Each of the input / output processors 1 to n waits for an input / output operation command by inter-processor communication from the CPU 11 of the system as a normal operation, and operates in accordance with its own microprogram.

【0025】図3において、マイクロプログラムによっ
て何らかの動作が開始される場合、まず通常処理機能部
分15を用い、アイドルフラグ16を下げて自分が空き
時間ではなくなったことを示す(ステップ31)。次
に、開始される動作が何であるかを通常処理機能部分1
5を用いて判断する(ステップ32)。開始される動作
がCPU11からの命令による通常処理である場合、入
出力プロセッサ1〜nは通常処理機能部分15によって
受け取った処理を行う(ステップ33)。
In FIG. 3, when any operation is started by the microprogram, first, the normal processing function part 15 is used to lower the idle flag 16 to indicate that the user is no longer idle (step 31). Next, the normal processing function part 1 describes what operation is to be started.
5 is determined (step 32). When the operation to be started is the normal processing by the instruction from the CPU 11, the input / output processors 1 to n perform the processing received by the normal processing function part 15 (step 33).

【0026】通常処理を行って、自己のマイクロプログ
ラムが診断ポイントに達した(ステップ34がYES)
場合、入出力プロセッサ1〜nは診断のための処理(処
理A、図4参照)を開始する(ステップ35)。図4に
おいて、診断を開始するプロセッサは例えばIOP1と
し、IOP1は直前の通常処理にて行った計算の内容と
結果とを、出題内容の保存手段17、自己の計算結果の
保存手段18によって保存する(ステップ21)。
The normal processing is performed, and the own micro program reaches the diagnosis point (YES in step 34).
In this case, the input / output processors 1 to n start a process for diagnosis (process A, see FIG. 4) (step 35). In FIG. 4, the processor that starts the diagnosis is, for example, IOP1, and the IOP1 stores the contents and results of the calculation performed in the immediately preceding normal processing by the question content storage unit 17 and its own calculation result storage unit 18. (Step 21).

【0027】次に、他のマイクロプロセッサIOP2〜
nのアイドルフラグをバス10を介して順に読み出し、
状態が空き時間であるプロセッサを探す(ステップ2
2)。他のすべてのプロセッサIOP2〜nのアイドル
フラグの状態が空き時間ではなかった(ステップ22が
NO)場合は、診断処理をあきらめて終了する。例え
ば、IOP2の状態が作業中の場合、IOP1はIOP
2による診断をあきらめる。次に、例えばIOP3のア
イドルフラグを見て、空き時間であった(ステップ22
がYES)場合はIOP3を診断の相手として診断処理
を開始する。
Next, the other microprocessors IOP2
n idle flags are sequentially read out via the bus 10,
Search for a processor whose state is idle time (step 2
2). If the idle flags of all the other processors IOP2 to IOPn are not idle time (NO in step 22), the diagnostic processing is abandoned and terminated. For example, if the status of IOP2 is working, IOP1 is
Give up the diagnosis by 2. Next, for example, the idle time of IOP3 was checked, and the idle time was found (step 22).
If the answer is YES), the diagnosis process is started with the IOP3 as a diagnosis partner.

【0028】診断を開始するプロセッサIOP1は、診
断の相手となるプロセッサIOP3にバス10を介して
診断の開始を伝える。そして、出題内容の保存手段17
に保存されている出題内容をバス10を介して伝える
(ステップ23)。IOP3に出題内容を伝えた後、I
OP1は診断の出題処理を終えて診断を中断する。ここ
で一旦診断処理を中断することにより、IOP3からの
回答の受信待ちによるIOP1の利用効率の低下を避け
る。出題内容を受け取ったIOP3は同じ計算を行い、
計算の結果をバス10を介して診断を開始したIOP1
に回答する。
The processor IOP1 which starts the diagnosis notifies the processor IOP3 to be diagnosed of the start of the diagnosis via the bus 10. Then, the question content storage means 17
Is transmitted via the bus 10 (step 23). After telling IOP3 the content of the questions, I
OP1 terminates the diagnosis questioning process and suspends the diagnosis. Here, by temporarily interrupting the diagnosis processing, a decrease in the utilization efficiency of the IOP1 due to waiting for the reception of a response from the IOP3 is avoided. IOP3 which received the contents of the question performs the same calculation,
IOP1 which started the diagnosis via the bus 10 based on the calculation result
To answer.

【0029】図3に戻り、IOP1はIOP3からのプ
ロセッサ間の通信を受信し、内容が計算結果の受信であ
る(ステップ32が計算結果の受信)ので、IOP1の
通常動作機能部分15によって、他のプロセッサの計算
結果の保存手段19にセットされる(ステップ36)。
IOP1は、自己の計算結果の保存手段18と他のプロ
セッサの計算結果の保存手段19の内容とを、通常機能
部分15によって読み出して比較演算する(ステップ3
7)。比較の結果、双方の計算結果が同一である(ステ
ップ37がYES)場合は、双方のプロセッサに誤動作
は発生していないと診断して、アイドルフラグを上げて
(ステップ39)診断処理を終了する。
Returning to FIG. 3, since the IOP 1 receives the communication between the processors from the IOP 3 and the content is the reception of the calculation result (step 32 is the reception of the calculation result), the normal operation function part 15 of the IOP 1 (Step 36).
The IOP 1 reads out the contents of its own calculation result storage means 18 and the contents of the calculation result storage means 19 of another processor by the normal function part 15 and performs a comparison operation (step 3).
7). As a result of the comparison, if both calculation results are the same (YES in step 37), it is diagnosed that no malfunction has occurred in both processors, the idle flag is raised (step 39), and the diagnosis process is terminated. .

【0030】双方の計算結果に相違があった(ステップ
37がNO)場合は、いずれかのプロセッサに誤動作が
発生していると判断できる。その場合には、上位のシス
テムの持つ診断プロセッサ(DGP)13によって障害
処理を行うため、バス10を介してDGP13に障害発
生を通知し、出題内容の保存手段17、各プロセッサの
計算結果の保存手段18,19の内容もDGP13に通
知する(ステップ38)。DGP13は、障害が発生し
た場合にのみ診断の出題内容と各プロセッサの計算結果
を受け取り、出題内容を同じ計算を行う。
If there is a difference between the two calculation results (NO in step 37), it can be determined that a malfunction has occurred in any of the processors. In this case, the diagnostic processor (DGP) 13 of the higher-level system performs the fault processing. Therefore, the occurrence of the fault is notified to the DGP 13 via the bus 10, the question content storage unit 17, and the calculation result of each processor is stored. The contents of the means 18 and 19 are also notified to the DGP 13 (step 38). The DGP 13 receives the diagnosis content and the calculation result of each processor only when a failure occurs, and performs the same calculation on the content.

【0031】DGP13による診断は、受け取った各プ
ロセッサの計算結果をDGP13の計算結果と照合し、
一致したものについては正常な動作を行っていると判断
し、不一致であるものについて、誤動作が発生している
とすることにより、誤動作の発生しているプロセッサを
特定する。誤動作の発生しているプロセッサに対し、D
GP13はシステムから切り離す等の障害処理を行い、
プロセッサの誤動作による障害がシステム全体に及ぶこ
とを避ける。
The diagnosis by the DGP 13 is performed by comparing the received calculation result of each processor with the calculation result of the DGP 13,
It is determined that the matched processor is performing a normal operation, and the mismatched processor is determined to have a malfunction, thereby identifying the processor in which the malfunction has occurred. D for the malfunctioning processor
GP13 performs failure processing such as disconnecting from the system,
Avoid failures due to processor malfunctions affecting the entire system.

【0032】[0032]

【発明の効果】以上説明したように本発明では、演算プ
ロセッサ(CPU)とは別に、システムへの入出力を制
御する入出力プロセッサ(IOP)、システムの診断処
理を制御する診断プロセッサ(DGP)等を持つシステ
ムにおいて、処理内容に応じてそれぞれ専用の機能を持
ったプロセッサが処理を行い、また同様の機能を持った
プロセッサを複数個設けることができるので同時に複数
の動作が可能となり、それによってシステム全体の高速
化を図るものである。
As described above, in the present invention, an input / output processor (IOP) for controlling input / output to a system and a diagnostic processor (DGP) for controlling system diagnostic processing are provided separately from an arithmetic processor (CPU). In such a system, processors with dedicated functions perform processing according to the processing contents, and multiple processors with similar functions can be provided, so that multiple operations can be performed at the same time. This aims to speed up the entire system.

【0033】本発明では、同様の動作を行う複数個のプ
ロセッサ相互の空き時間を利用した効率的な診断を可能
とする効果がある。また本発明では、マルチプロセッサ
システムの診断処理において、診断プロセッサにかかる
負荷を軽減したプロセッサ自身の故障による誤動作の検
出を可能とする効果がある。
According to the present invention, there is an effect that it is possible to perform an efficient diagnosis using the idle time between a plurality of processors performing the same operation. Further, according to the present invention, in the diagnostic processing of the multiprocessor system, there is an effect that a load on the diagnostic processor is reduced and a malfunction due to a failure of the processor itself can be detected.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施例のブロック図である。FIG. 1 is a block diagram of an embodiment of the present invention.

【図2】本発明の実施例における入出力プロセッサの詳
細ブロック図である。
FIG. 2 is a detailed block diagram of an input / output processor according to the embodiment of the present invention.

【図3】本発明の実施例の動作フローチャートである。FIG. 3 is an operation flowchart of the embodiment of the present invention.

【図4】本発明の実施例の動作フローチャートである。FIG. 4 is an operation flowchart of the embodiment of the present invention.

【図5】従来のマルチプロセッサシステムの自己診断方
式の一例のブロック図である。
FIG. 5 is a block diagram showing an example of a conventional self-diagnosis method of a multiprocessor system.

【符号の説明】[Explanation of symbols]

1〜n 入出力プロセッサ 10 バス 11 CPU 12 主記憶装置 13 診断処理装置 1 to n input / output processor 10 bus 11 CPU 12 main storage device 13 diagnostic processing device

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 互いにバスを介して相互接続され各々が
計算処理を行う複数のプロセッサにより構成されるマル
チプロセッサシステムであって、 前記プロセッサの各々は、 前記計算処理の空き時間を表示する空き時間表示手段
と、 前記計算処理の過程中の予め定められた診断ポイントに
達したときにその直前の自己の計算処理内容とその計算
結果とを格納する格納手段と、 前記診断ポイントに達したときに他のプロセッサの空き
時間表示手段を参照して空きを示しているプロセッサを
送信先プロセッサとして前記格納手段の計算処理内容を
送出する送信手段と、 送信元プロセッサの送信手段からの送信内容である前記
計算処理内容を受信して当該計算処理内容に従って計算
処理を行う手段と、 この計算結果を前記送信元プロセッサへ返送する手段
と、 前記送信先プロセッサから返送されてきた計算結果と前
記格納手段の計算結果とを比較する比較手段と、を有す
ることを特徴とするマルチプロセッサシステム。
1. A multiprocessor system comprising a plurality of processors interconnected via a bus and each performing a calculation process, wherein each of said processors displays a free time of said calculation process. Display means, storage means for storing the contents of its own calculation processing immediately before reaching a predetermined diagnosis point in the course of the calculation processing and the calculation result, and when the diagnosis point is reached Transmitting means for transmitting the calculation processing contents of the storage means with the processor indicating the vacancy by referring to the vacant time display means of the other processor as the destination processor; and the transmission contents from the transmitting means of the transmission source processor. Means for receiving the calculation processing content and performing the calculation processing according to the calculation processing content; and returning the calculation result to the transmission source processor. And a comparing means for comparing the calculation result returned from the transmission destination processor with the calculation result of the storage means.
【請求項2】 前記プロセッサの各々は、前記送信先プ
ロセッサに対して前記計算処理内容を送信した後、通常
処理へ移行するようにしたことを特徴とする請求項1記
載のマルチプロセッサシステム。
2. The multiprocessor system according to claim 1, wherein each of the processors shifts to a normal process after transmitting the calculation processing content to the transmission destination processor.
【請求項3】 上位の診断手段を含み、前記プロセッサ
の各々は、前記比較手段が不一致を検知した場合に、前
記計算処理内容及びその計算結果並びに前記送信先プロ
セッサからの計算結果を前記診断プロセッサへ報告する
手段を有することを特徴とする請求項1または2記載の
マルチプロセッサシステム。
3. The diagnostic processor, wherein each of the processors includes, when the comparing means detects a mismatch, the content of the calculation processing, the calculation result thereof, and the calculation result from the transmission destination processor. 3. A multiprocessor system according to claim 1, further comprising means for reporting to the multiprocessor.
【請求項4】 前記診断手段は、前記計算処理内容に従
って計算処理を行ってその計算結果と前記プロセッサの
計算結果とを照合するようにしたことを特徴とする請求
項3記載のマルチプロセッサシステム。
4. The multiprocessor system according to claim 3, wherein said diagnosis means performs calculation processing according to said calculation processing contents, and compares the calculation result with the calculation result of said processor.
【請求項5】 互いにバスを介して相互接続され各々が
計算処理を行う複数のプロセッサにより構成されるマル
チプロセッサシステムの診断方法であって、 前記計算処理の空き時間を表示する表示ステップと、 前記計算処理の過程中の予め定められた診断ポイントに
達したときにその直前の自己の計算処理内容とその計算
結果とを格納する格納ステップと、 前記診断ポイントに達したときに他のプロセッサの空き
時間表示を参照して空きを示しているプロセッサを送信
先プロセッサとして前記格納ステップの計算処理内容を
送出する送信ステップと、 送信元プロセッサの前記送信ステップによる送信内容で
ある前記計算処理内容を受信して当該計算処理内容に従
って計算処理を行うステップと、 この計算結果を前記送信元プロセッサに返送するステッ
プと、 前記送信先プロセッサから返送されてきた計算結果と前
記格納ステップの計算結果とを比較する比較ステップ
と、を有することを特徴とする診断方法。
5. A method for diagnosing a multiprocessor system comprising a plurality of processors interconnected via a bus and each performing a calculation process, wherein: a display step of displaying an idle time of the calculation process; A storage step of storing its own calculation processing content and its calculation result immediately before reaching a predetermined diagnosis point in the course of calculation processing; and A transmitting step of transmitting the calculation processing content of the storing step with the processor indicating the vacancy by referring to the time display as a transmission destination processor; and receiving the calculation processing content being the transmission content of the transmission step of the transmission source processor. Performing a calculation process in accordance with the content of the calculation process, and returning the calculation result to the transmission source processor. Step a diagnostic method characterized by having, a comparison step of comparing a calculation result of said storing step calculation results that have been returned from the destination processor that.
【請求項6】 前記送信先プロセッサに対して前記計算
処理内容を送信した後、通常処理へ移行するステップを
有することを特徴とする請求項5記載の診断方法。
6. The diagnostic method according to claim 5, further comprising a step of, after transmitting the calculation processing content to the transmission destination processor, shifting to normal processing.
【請求項7】 前記比較ステップにて不一致が検知され
た場合に、前記計算処理内容及びその計算結果並びに前
記送信先プロセッサからの計算結果を診断プロセッサへ
報告するステップを有することを特徴とする請求項5ま
たは6記載の診断方法。
7. The method according to claim 1, further comprising the step of, when a mismatch is detected in said comparing step, reporting the calculation processing contents, the calculation result thereof, and the calculation result from said transmission destination processor to a diagnosis processor. Item 7. The diagnostic method according to item 5 or 6.
【請求項8】 前記診断プロセッサが前記計算処理内容
に従って計算処理を行ってその計算結果と前記プロセッ
サの計算結果とを照合するステップを有することを特徴
とする請求項7記載の診断方法。
8. The diagnostic method according to claim 7, further comprising the step of the diagnostic processor performing a calculation process according to the content of the calculation process, and comparing the calculation result with the calculation result of the processor.
【請求項9】 互いにバスを介して相互接続され各々が
計算処理を行う複数のプロセッサにより構成されるマル
チプロセッサシステムの診断方法の制御プログラムを格
納した記録媒体であって、 前記プログラムは、 前記計算処理の空き時間を表示する表示ステップと、 前記計算処理の過程中の予め定められた診断ポイントに
達したときにその直前の自己の計算処理内容とその計算
結果とを格納する格納ステップと、 前記診断ポイントに達したときに他のプロセッサの空き
時間表示を参照して空きを示しているプロセッサを送信
先プロセッサとして前記格納ステップの計算処理内容を
送出する送信ステップと、 送信元プロセッサの送信ステップによる送信内容である
前記計算処理内容を受信して当該計算処理内容に従って
計算処理を行うステップと、 この計算結果を前記送信元プロセッサから返送されてき
た計算結果と前記格納ステップの計算結果とを比較する
比較ステップと、を有することを特徴とする記録媒体。
9. A recording medium storing a control program of a diagnostic method for a multiprocessor system, which is connected to each other via a bus and each performs a calculation process, wherein the program stores the control program. A display step of displaying a free time of processing; and a storage step of storing the content of its own calculation processing immediately before reaching a predetermined diagnostic point in the course of the calculation processing and the calculation result; A transmission step of sending the calculation processing content of the storing step as a destination processor by referring to the idle time display of another processor when the diagnosis point is reached, and a transmission step of the source processor. A step of receiving the calculation processing content that is the transmission content and performing a calculation process in accordance with the calculation processing content; Flop and, a recording medium, characterized in that the calculation result having a comparison step of comparing the calculation result of the storing step calculation results that have been returned from the transmitting processor.
JP10250635A 1998-09-04 1998-09-04 Multiprocessor system, its diagnostic method, and recording medium recorded with its control program Withdrawn JP2000082052A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10250635A JP2000082052A (en) 1998-09-04 1998-09-04 Multiprocessor system, its diagnostic method, and recording medium recorded with its control program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10250635A JP2000082052A (en) 1998-09-04 1998-09-04 Multiprocessor system, its diagnostic method, and recording medium recorded with its control program

Publications (1)

Publication Number Publication Date
JP2000082052A true JP2000082052A (en) 2000-03-21

Family

ID=17210796

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10250635A Withdrawn JP2000082052A (en) 1998-09-04 1998-09-04 Multiprocessor system, its diagnostic method, and recording medium recorded with its control program

Country Status (1)

Country Link
JP (1) JP2000082052A (en)

Similar Documents

Publication Publication Date Title
US6742139B1 (en) Service processor reset/reload
US4392208A (en) Data processing system and diagnostic unit
JPH08161279A (en) Multiprocessor system
CN100375960C (en) Method and apparatus for regulating input/output fault
CN105183575A (en) Processor fault diagnosis method, device and system
JPH0950424A (en) Dump sampling device and dump sampling method
JPH02294739A (en) Fault detecting system
JP2000082052A (en) Multiprocessor system, its diagnostic method, and recording medium recorded with its control program
JPH10254738A (en) Emulator device and emulation method
JPS6113626B2 (en)
WO2024016864A1 (en) Processor, information acquisition method, single board and network device
JP2868114B2 (en) Computer with monitoring and diagnostic function
JPH08227406A (en) Parallel computer
JPH1115661A (en) Self-diagnosis method for cpu
JP2679575B2 (en) I / O channel fault handling system
JPS58149529A (en) Turning-back and diagnosing system of channel status word
TW424178B (en) Device and method for control power arbitration of data process system
JPH05165737A (en) Memory test system
JPH01205245A (en) Automatic trace system for peripheral system and line system devices for electronic computer
KR890003489B1 (en) Programed inspection and control system
CN114090181A (en) Controller diagnosis method and system based on virtualization technology
JPS61160156A (en) Fault detecting system of processor
JPS60195649A (en) Error reporting system of microprogram-controlled type data processor
JPS5918741B2 (en) Automatic diagnosis method
JPS6111855A (en) Function diagnosing method of data processor

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060110