JPH02304652A - Error address collecting system - Google Patents

Error address collecting system

Info

Publication number
JPH02304652A
JPH02304652A JP1126321A JP12632189A JPH02304652A JP H02304652 A JPH02304652 A JP H02304652A JP 1126321 A JP1126321 A JP 1126321A JP 12632189 A JP12632189 A JP 12632189A JP H02304652 A JPH02304652 A JP H02304652A
Authority
JP
Japan
Prior art keywords
error
address
fsa
processor
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1126321A
Other languages
Japanese (ja)
Other versions
JP2688368B2 (en
Inventor
Nobuhiko Kuribayashi
栗林 暢彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1126321A priority Critical patent/JP2688368B2/en
Publication of JPH02304652A publication Critical patent/JPH02304652A/en
Application granted granted Critical
Publication of JP2688368B2 publication Critical patent/JP2688368B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PURPOSE:To omit or miniaturize a part related to sending out an error address of a storage controller and to miniaturize the scale of a device by providing an access origin processor consisting of an actuating means for actuating a service processor, etc. CONSTITUTION:An actuating means 131 in an access origin processor 117 realizes an operation for actuating a service processor 115 by a firmware in accordance with a notice from a fault informing means 125 in a storage control ler 113. In this state, an error address of a main storage device 111 to be reported to the processor 117 is collected by the processor 115 through a firm ware executed on the processor 117. Also, a fact that a fault is generated and a part of the error address held in an error address holding means 123 are informed the processor 117 from the means 125, and in the processor 115, a part of the error address and the contents of plural means 123 are compared, and the error address is specified. In such a way, an error address sending-out part of the device 113 is omitted or miniaturized, and the scale of a device can be miniaturized.

Description

【発明の詳細な説明】 〔目 次〕 概要 産業上の利用分野 従来の技術 発明が解決しようとする課題 課題を解決するための手段 作用 実施例 ■、実施例と第1図との対応関係 ■、第1実施例 ■、第2実施例 ■0発明の変形態様 発明の効果 〔概 要〕 記憶制御装置内のアクセスパイプラインに保持されてい
る主記憶装置のアドレスを収集するようにしたエラーア
ドレス収集方式に関し、記憶制御装置の装置規模の小型
化を目的とし、複数のアクセスパイプラインと、エラー
アドレスを保持する複数のエラーアドレス保持手段と、
障害発生の旨の通知を行う障害通知手段とを有する記憶
制御装置と、エラーアドレス保持手段の保持内容の収集
を行うサービスプロセッサと、主記憶装置のアクセス元
であって、障害通知手段からの通知に応じてサービスプ
ロセッサを起動する起動手段と、サービスプロセッサに
よって収集したエラーアドレスを主記憶装置に格納する
格納制御手段とを有するアクセス元プロセッサとを備え
、主記憶装置のエラーアドレスをサービスプロセッサに
よって収集するように構成する。
[Detailed Description of the Invention] [Table of Contents] Overview Industrial Application Fields Conventional Technology Problems to be Solved by the Invention Means for Solving the Problems Action Examples ■, Correspondence between the Examples and FIG. 1 ■ , First Example ■, Second Example ■0 Modifications of the Invention Effects of the Invention [Summary] Error address in which addresses of the main storage device held in the access pipeline in the storage control device are collected. Regarding the collection method, for the purpose of reducing the device scale of the storage control device, a plurality of access pipelines, a plurality of error address holding means for holding error addresses,
A storage control device having a failure notification means for notifying the occurrence of a failure; a service processor that collects the contents held in the error address holding means; and a main storage device that is an access source and receives notification from the failure notification means. an access source processor having a startup means for starting the service processor in response to an error, and a storage control means for storing error addresses collected by the service processor in a main memory, the service processor collecting error addresses in the main memory. Configure it to do so.

また、障害発生の旨とエラーアドレス保持手段に保持し
たエラーアドレスの一部とを障害通知手段からアクセス
元プロセッサに通知し、サービスプロセッサにおいてこ
のエラーアドレスの一部と収集した複数のエラーアドレ
ス保持手段のそれぞれの保持内容とを比較してエラーア
ドレスを特定するように構成する。
Furthermore, the fault notification means notifies the access source processor of the occurrence of a failure and a part of the error address held in the error address holding means, and the service processor sends a part of the error address and the collected error address holding means to the access source processor. The configuration is configured to identify an error address by comparing the contents held in each of the addresses.

〔産業上の利用分野〕[Industrial application field]

本発明は、記憶制御装置を介して主記憶装置のアクセス
を行う計算機システムにおいて、主記憶装置のエラー発
生時に、記憶制御装置内のアクセスパイプラインに保持
されている主記憶装置のアドレスを収集するようにした
エラーアドレス収集方式に関するものである。
The present invention collects addresses of the main memory held in an access pipeline in the storage controller when an error occurs in the main memory in a computer system that accesses the main memory via a storage controller. The present invention relates to an error address collection method.

〔従来の技術〕[Conventional technology]

記憶制御装置を有する計算機システムの全体構成を第9
図に示す。
The overall configuration of a computer system having a storage control device is described in the ninth section.
As shown in the figure.

図において、911は中央処理装置(cpu)であり、
プログラムの実行やデータの演算等の処理を行う。91
3は半導体メモリで構成された主記憶装置(MSU)で
あり、中央処理装置911が後述する記憶制御装置91
5を介して直接読み書きすることができる。
In the figure, 911 is a central processing unit (CPU),
Performs processing such as program execution and data calculations. 91
3 is a main storage unit (MSU) composed of semiconductor memory, and the central processing unit 911 is connected to a storage control unit 91 to be described later.
It can be directly read and written via 5.

また、917はチャネル制御装置(CHP)であり、図
示しないディスク装置、ディスプレイ等の入出力装置へ
のアクセスに対してチャネル装置(CH)919,92
1を制御するものである。
Further, 917 is a channel control device (CHP), and channel devices (CH) 919 and 92 are used for accessing input/output devices such as disk devices and displays (not shown).
1.

また、915は記憶制御装置(MCU)であり、中央処
理装置911.主記憶装置913.チャネル制御装置9
17の相互のデータや指示のやりとりはこの記憶制御装
置915を介して行われる。
Further, 915 is a storage control unit (MCU), and central processing units 911. Main storage device 913. Channel control device 9
Exchange of data and instructions between the 17 devices is performed via this storage control device 915.

更に、931はサービスプロセッサ(svp)であり、
構成各部に障害が発生したときに、この障害の解析に必
要な障害情報の収集を行う。このサービスプロセッサ9
31は、例えば中央処理装置911から障害発生の通知
を受け、この通知に基づいて中央処理装置911内部の
ハードウェアの内容をスキャンアウトによって収集して
障害情報を得る。
Furthermore, 931 is a service processor (SVP),
When a failure occurs in each component, the failure information necessary to analyze the failure is collected. This service processor 9
31 receives a notification of the occurrence of a failure from, for example, the central processing unit 911, and based on this notification, collects the contents of the hardware inside the central processing unit 911 by scanning out to obtain failure information.

ところで、主記憶装置913を構成する半導体メモリの
動作速度は、中央処理装置911等の動作速度に比べる
と非常に遅く、1つのアクセスが終了してから次のアク
セスを行っていたのでは主記憶装置913のアクセス効
率が悪くなってしまう。そこで、インタリーブあるいは
アクセスパイプライン等の技法を用いてアクセス効率を
上げる工夫が為されている。
By the way, the operating speed of the semiconductor memory that constitutes the main memory device 913 is very slow compared to the operating speed of the central processing unit 911, etc., and the main memory is slow because the next access is performed after one access is completed. The access efficiency of the device 913 will deteriorate. Therefore, attempts have been made to improve access efficiency by using techniques such as interleaving or access pipelines.

インタリーブは、主記憶装置913を複数個のバンクで
構成する技法であり、隣接するアドレスを異なるバンク
に対応させ、並行してこれらのバンクをアクセスするこ
とにより、主記憶装置913の全体のアクセス効率を上
げることができる。
Interleaving is a technique that configures the main memory device 913 into multiple banks. By associating adjacent addresses with different banks and accessing these banks in parallel, the overall access efficiency of the main memory device 913 is improved. can be raised.

1つのバンクは、複数個の(例えば数十個)のメモリ素
子から構成されている。
One bank is composed of a plurality (for example, several tens) of memory elements.

また、アクセスパイプラインは、動作速度の違いによる
プロセッサ(中央処理装置911.チ中ネル制御装置9
13)の待ち状態を回避するためのものである。プロセ
ッサから主記憶装置913に対するアクセス指示が記憶
制御装置915に供給されると、このアクセス指示が主
記憶装置911に直ちに送られると共に、記憶制御装置
915内のアクセスパイプラインに供給される。アクセ
スパイプラインに供給されたアクセス指示は、アクセス
パイプラインを構成する複数のレジスタ間で順次シフト
され、主記憶装置913のアクセス速度に対応した所定
時間経過後に取り出される。
In addition, the access pipeline is divided into processors (central processing unit 911, channel control unit 9) depending on the difference in operating speed.
This is to avoid the waiting state of 13). When an access instruction to the main storage device 913 is supplied from the processor to the storage control device 915, this access instruction is immediately sent to the main storage device 911 and is also supplied to an access pipeline within the storage control device 915. The access instruction supplied to the access pipeline is sequentially shifted between a plurality of registers constituting the access pipeline, and is taken out after a predetermined period of time corresponding to the access speed of main storage device 913 has elapsed.

記憶制御装置915は、このアクセスパイプラインから
取り出したアクセス指示に応じて、バス制御等を行って
アクセス結果に対する処理を行う。
The storage control device 915 performs bus control and the like in accordance with the access instruction taken out from the access pipeline and processes the access results.

ところで、主記憶装置913にビットエラー等のメモリ
エラーが生じた場合には、このエラー発生アドレスを特
定して、このアドレスを含むページを切り離す等の処理
を行う必要がある。そのために、アクセスパイプライン
の後段に接続され、エラー発生時にこのアクセスパイプ
ラインに保持されているアクセス指示に含まれるアドレ
スをエラーアドレス(以後、このエラーアドレスをFS
Aアドレスと称する)として取り出して、中央処理装置
911に送る必要がある。
By the way, when a memory error such as a bit error occurs in the main storage device 913, it is necessary to specify the address where the error has occurred and perform processing such as separating the page containing this address. For this purpose, it is connected to the later stage of the access pipeline, and when an error occurs, the address included in the access instruction held in this access pipeline is converted into an error address (hereinafter, this error address is called the FS).
It is necessary to take it out as an address (referred to as the A address) and send it to the central processing unit 911.

第10図に、FSAアドレス送出に着目した記憶制御装
置915の構成を示す。
FIG. 10 shows the configuration of a storage control device 915 focusing on FSA address transmission.

図において、941,943,945,947はアクセ
スパイプラインを、951,953,955.957は
FSAアドレスを一時保持するFSAレジスタ(FSA
−R)を、961はFSAアドレス送出回路をそれぞれ
示している。
In the figure, 941,943,945,947 are access pipelines, and 951,953,955,957 are FSA registers (FSA registers that temporarily hold FSA addresses).
-R) and 961 indicate an FSA address sending circuit, respectively.

例えば、4本のアクセスパイプラインの何れかに供給さ
れたアクセス指示は、アクセスパイプラインを構成する
複数のレジスタ間で順次シフトされ、主記憶装置913
の動作速度に対応した所定時間経過後に出力される。こ
のとき主記憶装置913の動作にエラー(例えばデータ
の読み出し時のビットエラー)が発生すると、対応する
FSAレジスタ951〜957は、アクセスパイプライ
ンから出力されたアクセス先のアドレス(主記憶装置9
13のアドレス)をFSAアドレスとして保持する。更
に、この保持されたFSAアドレスはFSAアドレス送
出回路961を介して中央処理装置911に送られ、中
央処理装置911は主記憶装置913の固定番地にFS
Aアドレスをストアし、オペレーティングシステム(O
5)に対してマシーンチェック割込みによりエラーの報
告をする。オペレーティングシステムは、主記憶装置9
13.の固定番地からFSAアドレスを取り出してペー
ジ切り離し等の処理が行われる。
For example, an access instruction supplied to any of the four access pipelines is sequentially shifted between multiple registers that make up the access pipeline, and
It is output after a predetermined period of time corresponding to the operating speed. At this time, if an error occurs in the operation of the main memory device 913 (for example, a bit error when reading data), the corresponding FSA registers 951 to 957 will be updated to the address of the access destination output from the access pipeline (main memory device 913).
13 address) is held as the FSA address. Furthermore, this held FSA address is sent to the central processing unit 911 via the FSA address sending circuit 961, and the central processing unit 911 stores the FS address at a fixed address in the main storage device 913.
A address is stored and the operating system (O
5), the error is reported by machine check interrupt. The operating system is stored in main memory 9
13. The FSA address is taken out from the fixed address and processing such as page separation is performed.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

ところで、上述した従来方式にあっては、アクセスパイ
プラインの本数の増加あるいは主記憶装置f913のア
ドレス長の増加に伴って、FSAアドレス送出回路96
1の回路規模すなわち記憶制御装置915の装置規模が
大きくなるという問題点があった。
By the way, in the conventional method described above, as the number of access pipelines increases or the address length of the main storage device f913 increases, the FSA address sending circuit 96
There is a problem in that the circuit scale of No. 1, that is, the device scale of the storage control device 915 becomes large.

FSAアドレス送出回路961では、FSAレジスタ9
51〜957のそれぞれから供給されたFSAアドレス
の1つを選択して主記憶装置911に送出するために、
FSAレジスタの個数とFSAアドレス長に対応したセ
レクタやFSAアドレスを保持するレジスタを内部に備
える必要があり、これらの規模がアクセスパイプライン
の本数やアドレスバスのビット数すなわちアドレス長に
比例して拡大する。
In the FSA address sending circuit 961, the FSA register 9
In order to select one of the FSA addresses supplied from each of 51 to 957 and send it to the main storage device 911,
It is necessary to provide internal selectors corresponding to the number of FSA registers and FSA address length, and registers that hold FSA addresses, and the scale of these increases in proportion to the number of access pipelines and the number of bits of the address bus, that is, the address length. do.

本発明は、このような点にかんがみて創作されたもので
あり、装置規模を小型化するようにしたエラーアドレス
収集方式を提供することを目的としている。
The present invention was created in view of these points, and an object of the present invention is to provide an error address collection method that reduces the size of the device.

〔課題を解決するための手段〕[Means to solve the problem]

第1図は、本発明のエラーアドレス収集方式の原理ブロ
ック図である。
FIG. 1 is a principle block diagram of the error address collection method of the present invention.

(i)請求工 1の発明 第1図において、記憶制御装置113は、主記憶装置1
11へのアクセス指示を順次格納する複数のアクセスパ
イプライン121と、このアクセスパイプライン121
のそれぞれに対応し、主記憶装置111に障害が発生し
たときにアクセス指示に含まれる主記憶装置111のア
ドレスをエラーアドレスとして保持する複数のエラーア
ドレス保持手段123と、障害発生の旨の通知を行う障
害通知手段125とを有する。
(i) Invention of claim 1 In FIG. 1, a storage control device 113 is a main storage device 1
A plurality of access pipelines 121 that sequentially store access instructions to 11, and this access pipeline 121
, a plurality of error address holding means 123 that hold the address of the main storage device 111 included in the access instruction as an error address when a failure occurs in the main storage device 111, and a plurality of error address holding means 123 that hold the address of the main storage device 111 included in the access instruction as an error address when a failure occurs in the main storage device 111; and a fault notification means 125 to notify the user of the problem.

サービスプロセッサ115は、エラーアドレス保持手段
123の保持内容の収集を行う。
The service processor 115 collects the contents held in the error address holding means 123.

アクセス元プロセッサ117は、主記憶装置111のア
クセス元であって、障害通知手段125からの通知に応
じてサービスプロセッサ115を起動する起動手段13
1と、サービスプロセッサ115によって収集したエラ
ーアドレスを主記憶装置111に格納する格納制御手段
133とを有する。
The access source processor 117 is the source of access to the main storage device 111 and is the activation unit 13 that activates the service processor 115 in response to a notification from the failure notification unit 125.
1, and a storage control means 133 for storing error addresses collected by the service processor 115 in the main storage device 111.

従って、アクセス元プロセッサ117に報告すべき主記
憶装置111のエラーアドレスを、アクセス元プロセッ
サ117上で実行するファームウェアを介してサービス
プロセッサ115によって収集するように構成されてい
る。
Therefore, the service processor 115 is configured to collect error addresses of the main storage device 111 to be reported to the accessing processor 117 via firmware executed on the accessing processor 117.

(ii )請求項2の発I (2)請求項2のエラーアドレス収集方式は、請求項1
のエラーアドレス収集方式において、障害発生の旨とエ
ラーアドレス保持手段123に保持したエラーアドレス
の一部とを障害通知手段125からアクセス元プロセッ
サ117に通知し、サービスプロセッサ115において
このエラーアドレスの一部と収集した複数のエラーアド
レス保持手段123のそれぞれの保持内容とを比較して
エラーアドレスを特定するように構成されてし、する。
(ii) I of claim 2 (2) The error address collection method of claim 2 is based on claim 1.
In the error address collection method, the failure notification means 125 notifies the access source processor 117 of the occurrence of a failure and a part of the error address held in the error address holding means 123, and the service processor 115 notifies the access source processor 117 of the occurrence of a failure and a part of the error address held in the error address holding means 123. The error address is identified by comparing the information stored in the error address storage unit 123 with the contents held in each of the collected error address storage means 123.

〔作 用〕[For production]

(i  ”;11の ■ 記憶制御装置113は、主記憶装置111へのアクセス
指示を順次格納する複数のアクセスパイプライン121
と、それぞれに対応する複数のエラーアドレス保持手段
123を有している。主記憶装置111に障害が発生す
ると、このアクセス指示に含まれる主記憶装置111の
アドレスがエラーアドレスとしてエラーアドレス保持手
段123に格納される。
(i ”; 11) The storage control device 113 has a plurality of access pipelines 121 that sequentially store access instructions to the main storage device 111.
and a plurality of error address holding means 123 corresponding thereto. When a failure occurs in the main storage device 111, the address of the main storage device 111 included in this access instruction is stored in the error address holding means 123 as an error address.

また、この障害発生に応じて、記憶制御装置113内の
障害通知手段125がらアクセス元プロセッサ117に
、障害発生の旨の通知が行われる。
Further, in response to the occurrence of the fault, the fault notification means 125 in the storage control device 113 notifies the access source processor 117 of the occurrence of the fault.

アクセス元プロセッサ117内の起動手段131は、こ
の記憶制御装置113がらの障害発生の通知に応じてサ
ービスプロセッサ115を起動す・る。起動されたサー
ビスプロセッサ115は、記憶制御装置113内のエラ
ーアドレス保持手段123の保持内容を収集してエラー
アドレスを得る。
The activation means 131 in the access source processor 117 activates the service processor 115 in response to the notification of the occurrence of a failure in the storage control device 113. The activated service processor 115 collects the contents held in the error address holding means 123 in the storage control device 113 and obtains the error address.

この収集したエラーアドレスはアクセス元プロセッサ1
17に送られ、アクセス元プロセッサ117内の格納制
御手段133によって主記憶装置111に格納される。
This collected error address is the access source processor 1
17, and is stored in the main storage device 111 by the storage control means 133 in the access source processor 117.

  。  .

請求項1の発明にあっては、障害発生の旨がアクセス元
プロセッサ117に通知され、エラーアドレスの収集は
サービスプロセッサ115によって行われる。
In the invention of claim 1, the access source processor 117 is notified of the occurrence of a failure, and the service processor 115 collects the error address.

ii )請求項2の I 請求項2のエラーアドレス収集方式では、障害通知手段
125によって、障害発生の旨、と共にエラーアドレス
保持手段123に保持したエラーアドレスの一部をアク
セス元プロセッサ117に通知する。
ii) I of Claim 2 In the error address collection method of Claim 2, the failure notification means 125 notifies the access source processor 117 of the occurrence of a failure and a part of the error address held in the error address holding means 123. .

この通知に応じて起動されたサービスプロセッサ115
は、収集したエラーアドレス保持手段123の保持内容
と、通知に含まれていたエラーアドレスの一部とを比較
して、収集すべきエラーアドレスを特徴する 請求項2の発明にあっては、障害発生の旨とエラーアド
レスの一部とがアクセス元プロセッサ117に通知され
、エラーアドレスの残り部分あるいは全体の収集はサー
ビスプロセッサ115によって行われる。
Service processor 115 activated in response to this notification
In the invention of claim 2, the error address to be collected is characterized by comparing the content held in the collected error address holding means 123 with a part of the error address included in the notification. The access source processor 117 is notified of the occurrence and part of the error address, and the service processor 115 collects the remaining part or the entire error address.

〔実施例〕〔Example〕

以下、図面に基づいて本発明の実施例について詳細に説
明する。
Hereinafter, embodiments of the present invention will be described in detail based on the drawings.

第2図は、本発明のエラーアドレス収集方式を通用した
第1実施例及び第2実施例における計算機システムの構
成を示す。また、第3図は第1実施例の記憶制御装置の
構成を、第6図は第2実施例の記憶制御装置の構成を示
す。
FIG. 2 shows the configuration of a computer system in a first embodiment and a second embodiment that utilize the error address collection method of the present invention. Further, FIG. 3 shows the configuration of the storage control device of the first embodiment, and FIG. 6 shows the configuration of the storage control device of the second embodiment.

■、実施例と第1図との対応関係 ここで、本発明の実施例と第1図との対応関係を示して
おく。
(2) Correspondence between the embodiment and FIG. 1 Here, the correspondence between the embodiment of the present invention and FIG. 1 will be shown.

主記憶装置111は、主記憶装置221に相当する。The main storage device 111 corresponds to the main storage device 221.

記憶制御装置113は、記憶制御装置231に相当する
The storage control device 113 corresponds to the storage control device 231.

サービスプロセッサ115は、サービスプロセッサ24
1に相当する。
The service processor 115 is the service processor 24
Corresponds to 1.

アクセス元プロセッサ117は、中央処理装置211に
相当する。
The access source processor 117 corresponds to the central processing unit 211.

アクセスパイプライン121は、アクセスパイプライン
ン311,313,315,317に相当する。
The access pipeline 121 corresponds to the access pipelines 311, 313, 315, and 317.

エラーアドレス保持手段123は、FSAレジスタ(F
SA−R)321,323,325,327に相当する
The error address holding means 123 stores the FSA register (F
SA-R) 321, 323, 325, 327.

障害通知手段125は、エラー報告回路331゜エラー
報告回路631に相当する。
The failure notification means 125 corresponds to the error reporting circuit 331 and the error reporting circuit 631.

起動手段131と格納制御手段133は、ファームウェ
ア213によって実現きれる。
The activation means 131 and the storage control means 133 can be realized by firmware 213.

以上のような対応関係があるものとして、以下本発明の
実施例について説明する。
Examples of the present invention will be described below assuming that the correspondence relationship as described above exists.

U口」も1桝 第2図に示した第1実施例の計算機システムは、中央処
理装置(CPtJ) 211.主記憶装置(MSU)2
21.記憶制御装置(MCU)231及びこれらの障害
監視、保守等を行うためのサービスプロセッサ(SVP
)241を備えている。
The computer system of the first embodiment shown in FIG. 2 has a central processing unit (CPtJ) 211. Main storage unit (MSU) 2
21. A storage control unit (MCU) 231 and a service processor (SVP) for monitoring failures, maintenance, etc.
)241.

サービスプロセッサ241はスキャンアウトによって各
構成部の内部状態(例えば内部レジスタの保持内容)を
収集して解析するものであり、一般の計算機システムに
備わっているものである。
The service processor 241 collects and analyzes the internal state of each component (for example, the contents held in internal registers) by scanning out, and is provided in a general computer system.

また、中央処理装置211は、障害発生時にサービスプ
ロセッサ241を起動するファームウェア213を備え
ている。このファームウェア213は、例えば中央処理
装置211内部の図示しないメモリ領域に格納されてい
るファームウェア用プログラムを実行することにより動
作するものである。また、オペレーティングシステム2
15は、例えば図示しない外部記憶装置から主記憶装置
221にローディングされているオペレーティングシス
テム用のプログラムを実行することにより動作するもの
である。
Further, the central processing unit 211 includes firmware 213 that starts the service processor 241 when a failure occurs. The firmware 213 operates, for example, by executing a firmware program stored in a memory area (not shown) inside the central processing unit 211. Also, operating system 2
15 operates by executing an operating system program loaded into the main storage device 221 from an external storage device (not shown), for example.

第3図に、記憶制御装置231の構成を示す。FIG. 3 shows the configuration of the storage control device 231.

図において、311,313,315,317はアクセ
スパイプラインを、321,323,325.327は
FSAアドレスを一時保持するFSAレジスタ(FSA
−R)を、331は主記憶装置221のアクセスに対す
るエラーの発生を中央処理装置211内のファームウェ
ア213に通知するエラー報告回路を、333はエラー
の種別を格納するレジスタを、351はエラーの発生を
検出するエラー検出回路をそれぞれ示している。
In the figure, 311, 313, 315, and 317 are access pipelines, and 321, 323, 325, and 327 are FSA registers (FSA registers that temporarily hold FSA addresses).
-R), 331 is an error reporting circuit that notifies the firmware 213 in the central processing unit 211 of the occurrence of an error in accessing the main storage device 221, 333 is a register that stores the type of error, and 351 is a register that stores the error occurrence. The error detection circuits that detect the error are shown in each figure.

記憶制御装置231は、例えば4本のアクセスパイプラ
イン311〜317を有しており、中央処理装置211
から出力された主記憶装置221へのアクセス指示は、
何れかのアクセスパイプラインに供給される。以後、こ
のアクセス指示は各アクセスパイプラインを構成する複
数のレジスタ間で順次シフトされ、主記憶装置221の
動作速度に対応した所定の時間経過後にアクセスパイプ
ラインから出力され、図示しないバス等の制御に使用さ
れる。
The storage control device 231 has, for example, four access pipelines 311 to 317, and the central processing unit 211
The access instruction to the main storage device 221 output from
Provided to either access pipeline. Thereafter, this access instruction is sequentially shifted between multiple registers configuring each access pipeline, and is output from the access pipeline after a predetermined time corresponding to the operating speed of the main storage device 221, and is used to control a bus (not shown), etc. used for.

エラー検出回路351は、アクセス指示に対応した主記
憶装置221の動作のエラーを検出した場合にエラー信
号を作成する。例えば、主記憶装置221から読み出し
たデータのビットエラーを、誤り訂正符号ECCに基づ
いて検出する。このエラー信号は、エラー発生に対応し
たアクセスパイプライン311〜317に接続されたF
SAレジスタ321〜327に供給される。該当するF
SAレジスタ321〜327では、エラー信号の供給に
応じて、アクセスパイプライン311〜317から出力
されるアクセス指示に含まれる主記憶装置221のアド
レスをFSAアドレスとして保持する。
The error detection circuit 351 generates an error signal when detecting an error in the operation of the main storage device 221 corresponding to the access instruction. For example, bit errors in data read from the main storage device 221 are detected based on the error correction code ECC. This error signal is transmitted to the F
It is supplied to SA registers 321-327. Applicable F
The SA registers 321 to 327 hold, as FSA addresses, the addresses of the main storage device 221 included in the access instructions output from the access pipelines 311 to 317 in response to the supply of the error signal.

また、エラー検出回路351は、エラー検出の際に、エ
ラー報告回路331内のレジスタ333にエラ一種別に
関する情報を格納する。例えばレジスタ333の容量を
3ビツトとし、読み出しデータの1ビツトエラー発生の
有無を示すビットデータと、2ビツトエラー発生の有無
を示すビットデータと、これらのエラー発生の有無を示
すピントデータとを格納する。
Further, the error detection circuit 351 stores information regarding the type of error in the register 333 in the error reporting circuit 331 when detecting an error. For example, the register 333 has a capacity of 3 bits, and stores bit data indicating whether a 1-bit error has occurred in read data, bit data indicating whether a 2-bit error has occurred, and focus data indicating whether these errors have occurred.

エラー報告回路331は、このようにしてレジスタ33
3に格納されたエラ一種別に関する情報を中央処理装置
211のファームウェア213に通知する。
In this way, the error reporting circuit 331
The firmware 213 of the central processing unit 211 is notified of the information regarding the error type stored in 3.

第4図に、第1実施例のFSAアドレス収集の動作手順
を示す。また、第5図にFSASドアドレス収集時−ビ
スプロセッサ241の動作手順を示す。
FIG. 4 shows the operational procedure for collecting FSA addresses in the first embodiment. Further, FIG. 5 shows the operating procedure of the FSAS address collection time-visual processor 241.

以下、第2図〜第5図を参照しながら第1実施例の動作
を説明する。尚、以下の■〜■の各符号は、第2図に示
した各符号に対応している。
The operation of the first embodiment will be described below with reference to FIGS. 2 to 5. It should be noted that each of the symbols ① to ① below corresponds to each symbol shown in FIG. 2.

■主記憶装置221から読み出したデータにシングルビ
ットエラーあるいはダブルビットエラーが発生すると(
ステップ411)、記憶制御装置231内のエラー検出
回路351はこのエラーを検出し、対応するFSAレジ
スタ321〜327にFSAアドレスを格納する(ステ
ップ412)。
■If a single bit error or double bit error occurs in the data read from the main memory device 221 (
Step 411), the error detection circuit 351 in the storage control device 231 detects this error and stores the FSA address in the corresponding FSA registers 321 to 327 (Step 412).

また、エラー検出回路351によってレジスタ333へ
のエラ一種別に関する情報が格納され、エラー報告回路
331から中央処理装置211のファームウェア213
に通知される(ステ・ノブ413)。例えばこの通知は
ファームウェア213への割り込みとして供給される。
Further, the error detection circuit 351 stores information regarding the type of error in the register 333, and the error reporting circuit 331 stores information regarding the type of error in the register 333.
is notified (Ste Nobu 413). For example, this notification may be provided as an interrupt to firmware 213.

■次に、ファームウェア213は、サービスプロセッサ
241に対してFSAアドレスの収集を依願する(ステ
ップ414)。
(2) Next, the firmware 213 requests the service processor 241 to collect FSA addresses (step 414).

■FSAアドレスの収集依願を受けたサービスプロセッ
サ241は、記憶制御装置231に対してスキャンアウ
トを行って、記憶制御装置231内部のFSAレジスタ
321〜327に格納されているFSAアドレスを収集
する(ステップ415)。
■The service processor 241 that has received the request to collect FSA addresses scans out the storage control device 231 and collects the FSA addresses stored in the FSA registers 321 to 327 inside the storage control device 231 (step 415).

例えば、アクセスパイプラインの本数に対応してアクセ
ス指示用の入力ボートが4つあり、それぞれをAポート
、Bポート Cボート Dポートとすると(アクセスパ
イプライン311〜317のそれぞれに対応)、サービ
スプロセッサ241は、先ずAポートでエラー発生か否
かを判定しくステップ511)、肯定判断のときにはA
ポートに対応したFSAレジスタ321からFSAアド
レスを収集する(ステップ515)。
For example, if there are four input ports for access instructions corresponding to the number of access pipelines, and they are respectively designated as A port, B port, C port, and D port (corresponding to access pipelines 311 to 317), the service processor 241 first determines whether an error has occurred at port A (step 511), and if the determination is affirmative, the
The FSA address is collected from the FSA register 321 corresponding to the port (step 515).

ステップ511で否定判断すると、以後同様にして、B
ボートでエラー発生か否かの判定(ステップ512)、
Cボートでエラー発生か否かの判定(ステップ513)
、Dボートでエラー発生か否かの判定(ステップ514
)を行い、それぞれで肯定判断すると、対応するFSA
レジスタからFSAアドレスの収集を行う(ステップ5
15)。
If a negative determination is made in step 511, B
Determining whether an error has occurred in the boat (step 512);
Determining whether an error has occurred in the C boat (step 513)
, Determine whether an error has occurred in the D boat (step 514)
), and if a positive judgment is made for each, the corresponding FSA
Collect FSA address from register (step 5)
15).

ステップ514で否定判断した場合には、エラーの検出
機構に障害が発生した旨のエラーメツセージを出力して
(ステップ516)、動作を終了する。
If a negative determination is made in step 514, an error message indicating that a failure has occurred in the error detection mechanism is output (step 516), and the operation ends.

■サービスプロセッサ241は、このようにして収集し
たFSAアドレスをファームウェア213に送る。
(2) The service processor 241 sends the FSA address thus collected to the firmware 213.

■次にファームウェア213は、主記憶装置221にサ
ービスプロセッサ241から受は取ったFSAアドレス
をFSAアドレスを格納すべき固定番地へ格納する(ス
テップ416)。
(2) Next, the firmware 213 stores the FSA address received from the service processor 241 in the main storage device 221 at the fixed address where the FSA address should be stored (step 416).

■主記憶装置221へのFSAアドレスの格納が終了す
ると、ファームウェア213はマシーンチェック割り込
みを発生させ、オペレーティングシステム215の動作
に割り込みを行い(ステップ417)、このマシーンチ
ェックエラーの発生を通知する。
(2) When the storage of the FSA address in the main storage device 221 is completed, the firmware 213 generates a machine check interrupt, interrupts the operation of the operating system 215 (step 417), and notifies the occurrence of this machine check error.

以後、オペレーティングシステム215は、マシーンチ
ェック割り込みによるエラー解析処理を行なう。エラー
解析処理の中で主記憶装置221の1ビツトエラー、2
ビツトエラーであることを検出すると、主記憶装置22
1の固定番地に格納されたFSAアドレスを読み出して
、1ビツトエラー、2ビツトエラーのFSAアドレスを
認識する。2ビツトエラーの場合は、ECCロードによ
る訂正ができないので、オペレーティングシステム21
5は、ページ切離し等の処理を行う。
Thereafter, the operating system 215 performs error analysis processing using a machine check interrupt. During the error analysis process, a 1-bit error in the main storage device 221, 2
When a bit error is detected, the main memory 22
The FSA address stored in the fixed address 1 is read out, and FSA addresses with 1-bit error or 2-bit error are recognized. In the case of a 2-bit error, it cannot be corrected by ECC loading, so the operating system 21
5 performs processing such as page separation.

このように、記憶制御装置231でエラーを検出すると
、FSAアドレスを対応するFSAレジスタ321〜3
27に保持すると共に、このエラー発生の旨を中央処理
装置211に通知する。中央処理装置211のファーム
ウェア213は、この通知に応じてサービスプロセッサ
241を起動し、サービスプロセッサ241によるFS
Aアドレスの収集が行われる。収集されたFSAアドレ
スは、ファームウェア213によって主記憶装置221
に格納される。この格納動作が終了すると、ファームウ
ェア213はオペレーティングシステム215に割り込
みを行い、以後オペレーティングシステム215は主記
憶装置221に格納されたFSAアドレスを読み出して
、2ビツトエラーの場合にはページ切離し等の障害処理
を行う。
In this way, when an error is detected in the storage control device 231, the FSA address is stored in the corresponding FSA registers 321 to 3.
27 and notifies the central processing unit 211 of the occurrence of this error. The firmware 213 of the central processing unit 211 starts the service processor 241 in response to this notification, and executes the FS by the service processor 241.
A collection of A addresses is performed. The collected FSA addresses are stored in the main storage 221 by the firmware 213.
is stored in When this storage operation is completed, the firmware 213 interrupts the operating system 215, and the operating system 215 reads the FSA address stored in the main memory 221 and performs fault processing such as page detachment in the case of a 2-bit error. conduct.

従って、エラー発生時に記憶制御装置231から中央処
理装置211へはエラー発生の旨の通知のみを行えばよ
く、FSAアドレスを送出する回路を省略して、記憶制
御装置231の装置規模を小型化することができる。
Therefore, when an error occurs, the storage control device 231 only needs to notify the central processing unit 211 of the occurrence of the error, and the circuit for sending the FSA address is omitted, reducing the size of the storage control device 231. be able to.

また、このようにエラー発生の有無のみを通知すること
で、主記憶装置221の容量を拡張する場合にも容易に
対応することができる(アドレス長に関係しないため)
In addition, by notifying only the presence or absence of an error in this way, it is possible to easily cope with the case where the capacity of the main storage device 221 is expanded (because it is not related to the address length).
.

l−第1尖施貫 第6図に、第2実施例の記憶制御装置611の構成を示
す。第6図の記憶制御装置611において、第3図の記
憶制御装置231と同一符号は同一構成部を示すものと
し、以下第1実施例との違いに着目して、第2実施例の
構成及び動作を説明する。尚、第2実施例の計算機シス
テムの全体構成は、第2図に示した計算機システム内の
記憶制御装置231を記憶制御装置611に置き換えた
ものとする。
FIG. 6 shows the configuration of the storage control device 611 of the second embodiment. In the storage control device 611 in FIG. 6, the same reference numerals as in the storage control device 231 in FIG. Explain the operation. In the overall configuration of the computer system of the second embodiment, the storage control device 231 in the computer system shown in FIG. 2 is replaced with a storage control device 611.

第6図において、631はエラー報告回路を、635は
セレクタを、637はFSAアドレス送出回路をそれぞ
れ示している。
In FIG. 6, 631 represents an error reporting circuit, 635 represents a selector, and 637 represents an FSA address sending circuit.

エラー検出回路351によってエラーが検出されエラー
信号が出力されると、該当するFSAレジスタ321〜
327にFSAアドレスが取り込まれる。このとき、各
FSAレジスタ321〜327の一部(例えば上位のn
ビット)はエラー報告回路631内のセレクタ635に
供給され、エラー検出回路351から出力されるエラー
信号に応じた選択動作が行われる。例えば、エラー検出
回路351から出力されるエラー信号によってFSAレ
ジスタ323にFSAアドレスを保持した場合には、F
SAレジスク323から出力されるFSAアドレスの一
部をこのエラー信号に基づいて選択する。
When the error detection circuit 351 detects an error and outputs an error signal, the corresponding FSA registers 321 to
327, the FSA address is captured. At this time, a part of each FSA register 321 to 327 (for example, the upper n
bit) is supplied to a selector 635 in the error reporting circuit 631, and a selection operation is performed according to the error signal output from the error detection circuit 351. For example, when the FSA address is held in the FSA register 323 by the error signal output from the error detection circuit 351,
A part of the FSA address output from the SA register 323 is selected based on this error signal.

セレクタ635によって選択され出力されるFSAアド
レスの一部は、FSAアドレス送出回路637によって
、中央処理装置211のファームウェア213に通知さ
れる。
A portion of the FSA address selected and output by the selector 635 is notified to the firmware 213 of the central processing unit 211 by the FSA address sending circuit 637.

また、第1実施例の場合と同様にして、レジスタ333
にエラ一種別に関する情報が格納され、中央処理装置2
11のファームウェア213に通知される。
Also, in the same manner as in the first embodiment, the register 333
Information regarding the error type is stored in the central processing unit 2.
The firmware 213 of No. 11 is notified.

第7図に、第2実施例のFSAアドレス収集の動作手順
を示す。また、第8図にFSAアドレス収集時のサービ
スプロセッサ241の動作手順を示す。
FIG. 7 shows the operational procedure for collecting FSA addresses in the second embodiment. Further, FIG. 8 shows the operation procedure of the service processor 241 when collecting FSA addresses.

以下、第2図及び第6図〜第8図を参照しながら第2実
施例の動作を説明する。尚、以下の■〜■の各符号は、
第2図に示した各符号に対応している。
The operation of the second embodiment will be described below with reference to FIG. 2 and FIGS. 6 to 8. In addition, each symbol of ■ to ■ below is
They correspond to the respective symbols shown in FIG.

■主記憶装置221から読み出したデータにエラーが発
生すると(ステップ711)、エラー検出回路351は
このエラーを検出し、対応するFSAレジスタ321〜
327にFSAアドレスを格納する(ステップ712)
■When an error occurs in the data read from the main memory device 221 (step 711), the error detection circuit 351 detects this error and stores the corresponding FSA registers 321-
Store the FSA address in 327 (step 712)
.

また、FSAレジスタ321〜327の何れかに格納さ
れたFSAアドレスの一部がセレクタ635を介してF
SAアドレス送出回路637に送られる。エラー報告回
路631は、エラー検出回路351によって格納された
レジスタ333内のエラ一種別に関する情報と、FSA
アドレス送出回路637に送られたFSAアドレスの一
部とを中央処理装置211のファームウェア213に通
知する(ステップ713)。
Further, a part of the FSA address stored in any of the FSA registers 321 to 327 is transferred to the FSA address via the selector 635.
It is sent to the SA address sending circuit 637. The error reporting circuit 631 receives information regarding the error type in the register 333 stored by the error detection circuit 351 and the FSA.
The part of the FSA address sent to the address sending circuit 637 is notified to the firmware 213 of the central processing unit 211 (step 713).

■次に1、ファームウェア213は、サービスプロセッ
サ241に対してFSAアドレスの収集を依頼する(ス
テップ714)。
(1) Next, the firmware 213 requests the service processor 241 to collect FSA addresses (step 714).

■FSAアドレスの収集依願を受けたサービスプロセッ
サ241は、記憶制御装置611に対してスキャンアウ
トを行って、記憶制御装置611のFSAレジスタ32
1〜327に格納されているFSAアドレスを収集する
(ステップ715)。
■The service processor 241, which has received the request to collect FSA addresses, scans out the storage control device 611 and registers the FSA register 32 of the storage control device 611.
The FSA addresses stored in 1 to 327 are collected (step 715).

例えば第1実施例と同様に、アクセスパイプラインの本
数に対応してアクセス指示用の入力ポートが4つあり、
それぞれをAボート、BポートCボート、Dボートとす
る。
For example, as in the first embodiment, there are four input ports for access instructions, corresponding to the number of access pipelines.
Let them be A boat, B port C boat, and D boat, respectively.

先ず、サービスプロセッサ241は、記憶制御装置61
1からの通知に含まれるFSAアドレスの一部を得る(
ステップ811)。
First, the service processor 241
Get part of the FSA address included in the notification from 1 (
step 811).

次に、サービスプロセッサ241は、Aポートでエラー
発生か否かを判定しくステップ812)、肯定判断とき
にはAポートに対応したFSAレジスタ321の上位n
ビットと、ステップ811で得たFSAアドレスの一部
とが一致しているか否かの判定を行う(ステップ813
)。ここで肯定判断すると、サービスプロセッサ241
はFSAアドレスの残り部分を対応するFSAレジスタ
321〜327から収集する(ステップ820)。
Next, the service processor 241 determines whether an error has occurred in the A port (step 812), and if the determination is affirmative, the service processor 241 determines whether or not an error has occurred in the A port.
It is determined whether the bit matches the part of the FSA address obtained in step 811 (step 813).
). If an affirmative judgment is made here, the service processor 241
collects the remaining portion of the FSA address from the corresponding FSA registers 321-327 (step 820).

ステップ812あるいはステップ813で否定判断する
と、以後同様にして、Bボートでエラー発生か否かの判
定(ステップ814)、FSAアドレスの一部が一致か
否かの判定(ステップ815)、Cボートでエラー発生
か否かの判定(ステップ816)、FSAアドレスの一
部が一敗か否かの判定(ステップ817)、Dボートで
エラー発生か否かの判定(ステップ81B)、FSAア
ドレスの一部が一致か否かの判定(ステップ819)を
行う。ステップ81.5,817,819の何れかで肯
定判断すると、対応するF’SAレジスタからFSAア
ドレスの残り部分を収集する(ステップ820)。
If a negative determination is made in step 812 or step 813, the following steps are performed in the same way: determining whether an error has occurred in the B boat (step 814), determining whether a part of the FSA address matches (step 815), and determining whether or not a part of the FSA address matches (step 815). Determining whether an error has occurred (step 816), determining whether part of the FSA address is a one-time loss (step 817), determining whether an error has occurred in the D boat (step 81B), part of the FSA address It is determined whether or not they match (step 819). If a positive determination is made in any of steps 81.5, 817, and 819, the remaining portion of the FSA address is collected from the corresponding F'SA register (step 820).

また、ステップ81Bあるいはステップ819で否定判
断した場合には、エラーの検出機構に障害・が発生した
旨のエラーメツセージを出力して(ステップ821)、
動作を終了する。
If a negative determination is made in step 81B or step 819, an error message indicating that a failure has occurred in the error detection mechanism is output (step 821),
Finish the operation.

■サービスプロセッサ241は、収集したFSAアドレ
スをファームウェア213に送る。
(2) The service processor 241 sends the collected FSA address to the firmware 213.

0次にファームウェア213は、FSAアドレスを主記
憶装置221に格納する(ステ9.プ716)。
Next, the firmware 213 stores the FSA address in the main storage device 221 (Step 9. Step 716).

■主記憶装置221へのFSAアドレスの格納が終了す
ると、ファームウェア213は、オペレーティングシス
テム215の動作に割り込みを行い(ステップ717L
マシーンチエツクエラー発生の通知を行う(このFSA
アドレス収集動作の終了を通知する)。
■When the storage of the FSA address in the main storage device 221 is completed, the firmware 213 interrupts the operation of the operating system 215 (step 717L).
Notify machine check error occurrence (this FSA
(notify the end of the address collection operation).

このように、記憶制御装置611でエラーを検出すると
、対応するFSAレジスタ321〜327にFSAアド
レスを保持し、このエラー発生の旨と共にFSAアドレ
スの一部を中央処理装置211に通知する。中央処理装
置211のファームウェア213は、この通知に応じて
サービスプロセッサ241を起動し、サービスプロセッ
サ241によるFSAアドレスの収集が行われる。
In this manner, when the storage control device 611 detects an error, it holds the FSA address in the corresponding FSA registers 321 to 327, and notifies the central processing unit 211 of a portion of the FSA address along with the fact that the error has occurred. The firmware 213 of the central processing unit 211 activates the service processor 241 in response to this notification, and the service processor 241 collects FSA addresses.

このFSAアドレスの収集において、サービスプロセッ
サ241は、記憶制御装置611から遥知されたFSA
アドレスの一部と、FSAレジスタ321〜327から
収集したFSAアドレスの一部とを比較し、一致したF
SAレジスタの残りのFSAアドレス(全部でもよい)
を収集するようにする。このような比較動作を行うこと
により、2つ以上のアクセスパイプラインに対応した複
数のエラーが発生した場合に、エラー発生の通知に対応
した1つのFSAアドレスを特定することが容易になる
In collecting this FSA address, the service processor 241 collects the FSA addresses learned from the storage control device 611.
The part of the address is compared with the part of the FSA address collected from the FSA registers 321 to 327, and the matching FSA
Remaining FSA addresses in SA register (all are OK)
to collect. By performing such a comparison operation, when a plurality of errors corresponding to two or more access pipelines occur, it becomes easy to specify one FSA address corresponding to the notification of error occurrence.

収集されたFSAアドレスは、ファームウェア213に
よって主記憶装置221に格納される。
The collected FSA addresses are stored in the main storage device 221 by the firmware 213.

この格納動作が終了すると、ファームウェア2I3はオ
ペレーティングシステム215に割り込みを行い、以後
オペレーティングシステム215は主記憶装置221に
格納されたFSAアドレスを読み出して、2ビツトエラ
ーの場合にはページ切離し等の障害処理を行う。
When this storage operation is completed, the firmware 2I3 interrupts the operating system 215, and the operating system 215 thereafter reads the FSA address stored in the main storage device 221 and performs failure processing such as page separation in the case of a 2-bit error. conduct.

従って、エラー発生時に記憶制御装置611から中央処
理装置211へはエラー発生の旨とFSAアドレスの一
部とを通知すればよく、FSAアドレスの全部を送出す
る場合に比べて、記憶制御装置611の装置規模を小型
化することができる。
Therefore, when an error occurs, the storage control device 611 only needs to notify the central processing unit 211 of the error occurrence and a part of the FSA address. The scale of the device can be reduced.

また、このようにエラー発生の旨とFSAアドレスの一
部とを通知することで、主記憶装置221の容量を拡張
する場合にも容易に対応することができる。この場合、
通知するFSAアドレスの一部以外のアドレス長を拡張
して、主記憶装置221の容量拡張を行えばよい。
Further, by notifying the occurrence of an error and a part of the FSA address in this way, it is possible to easily cope with the case where the capacity of the main storage device 221 is expanded. in this case,
The capacity of the main storage device 221 may be expanded by extending the length of addresses other than a part of the FSA address to be notified.

■、 明の・ノ一様 なお、上述した本発明の実施例にあっては、エラー発生
の際に、レジスフ333に格納されたエラ一種別に関す
る3ビツト情報を通知するようにしたが、エラー発生か
否かを示す情報のみを通知して、エラ一種別及びFSA
アドレスをサービスプロセッサ241が収集するように
してもよい。
■Note: In the embodiment of the present invention described above, when an error occurs, 3-bit information regarding the type of error stored in the register 333 is notified. Only information indicating whether or not an error has occurred will be notified, and the type of error and FSA
The addresses may be collected by the service processor 241.

また、rl、実施例と第1図との対応関係」において、
本発明と実施例との対応関係を説明しておいたが、これ
に限られることはなく、本発明には各種の変形態様があ
ることは当業者であれば容易に推考できるであろう。
In addition, in ``correspondence between Examples and Figure 1'',
Although the correspondence between the present invention and the embodiments has been described, those skilled in the art will easily assume that the present invention is not limited to this and that there are various modifications.

〔発明の効果〕〔Effect of the invention〕

上述したように、請求項1の発明にあっては、障害発生
の旨を記憶制御装置からアクセス元プロセッサに通知し
、エラーアドレスの収集をサービスプロセッサによって
行うので、記憶制御装置のエラーアドレス送出に関する
部分を省いて、記憶制御装置の装置規模を小型化するこ
とができる。
As described above, in the invention of claim 1, the storage control device notifies the access source processor of the occurrence of a failure, and the service processor collects the error address. By omitting this section, the scale of the storage control device can be reduced.

また、請求項2の発明にあっては、障害発生の旨とエラ
ーアドレスの一部を記憶制御装置からアクセス元プロセ
ッサに通知し、エラーアドレスの収集をサービスプロセ
ッサによって行うので、記憶制御装置のエラーアドレス
送出に関する部分を小型化して、記憶制御装置の装置規
模を小型化することが可能になる。
Further, in the invention of claim 2, since the storage control device notifies the access source processor of the occurrence of a failure and a part of the error address, and the service processor collects the error address, an error in the storage control device It becomes possible to reduce the size of the storage control device by reducing the size of the portion related to address sending.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明のエラーアドレス収集方式の原理ブロッ
ク図、 第2図は本発明のエラーアドレス収集方式を適用した実
施例の構成図、 第3図は第1実施例の記憶制御装置の構成図、第4図は
第1実施例のFSAアドレス収集の動作説明図、 第5図は第1実施例のサービスプロセッサの動作説明図
、 第6図は第2実施例の記憶制御装置の構成図、第7図は
第2実施例のFSAアドレス収集の動作説明図、 第8図は第2実施例のサービスプロセッサの動作説明図
、 第9図は計算機システムの構成図、 第10図は従来の記憶制御装置の構成図である。 図において、 Illは主記憶装置、 113は記憶制御装置、 115はサービスプロセッサ、 117はアクセス元プロセッサ、 121はアクセスパイプライン、 123はエラーアドレス保持手段、 125は障害通知手段、 131は起動手段、 133は格納制御手段、 211は中央処理装置(CPU)、 213はファームウェア、 215はオペレーティングシステム、 221は主記憶装置(MSU)、 231は記憶制御装置(MCU)、 241はサービスプロセッサ(svp)、311.3−
13,315,317はアクセスパイプライン、 321.323,325,327はFSAレジスタ(F
SA−R)、 331.631はエラー報告回路、 333.661,663,665,667はレジスタ、 351はエラー検出回路、 635はセレクタ、 637はFSAアドレス送出回路である。 才全F3日り厘理ゲD・・Zu 第1図 第2図 、第1更ぎと、f’l’J ty> FSAアF゛し又
り又某つ重βf乍たもθ8図第4図 第1火グ色仔O勺“−ビスfo仁・ツブのψ力f1を光
明記第5図 $2’iyビイ列のFSAアト′トス胡え集n重カラ1
シ月Eグ第7図 第8図
FIG. 1 is a principle block diagram of the error address collection method of the present invention. FIG. 2 is a configuration diagram of an embodiment to which the error address collection method of the present invention is applied. FIG. 3 is a configuration of a storage control device according to the first embodiment. 4 is an explanatory diagram of the operation of FSA address collection in the first embodiment, FIG. 5 is an explanatory diagram of the operation of the service processor of the first embodiment, and FIG. 6 is a configuration diagram of the storage control device of the second embodiment. , Fig. 7 is an explanatory diagram of the operation of FSA address collection in the second embodiment, Fig. 8 is an explanatory diagram of the operation of the service processor of the second embodiment, Fig. 9 is a configuration diagram of the computer system, and Fig. 10 is the conventional FIG. 2 is a configuration diagram of a storage control device. In the figure, Ill is a main storage device, 113 is a storage control device, 115 is a service processor, 117 is an access source processor, 121 is an access pipeline, 123 is an error address holding means, 125 is a failure notification means, 131 is a starting means, 133 is a storage control means, 211 is a central processing unit (CPU), 213 is a firmware, 215 is an operating system, 221 is a main storage unit (MSU), 231 is a storage control unit (MCU), 241 is a service processor (SVP), 311.3-
13, 315, 317 are access pipelines, 321, 323, 325, 327 are FSA registers (FSA registers).
SA-R), 331.631 is an error reporting circuit, 333.661, 663, 665, and 667 are registers, 351 is an error detection circuit, 635 is a selector, and 637 is an FSA address sending circuit. Saizen F3 day training D...Zu Fig. 1 Fig. 2, 1st change, f'l'J ty> 4. Figure 1. Lightly specifies the ψ force f1 of Bisfo Ren and Tsubu. Figure 5.
Figure 7 Figure 8

Claims (2)

【特許請求の範囲】[Claims] (1)主記憶装置(111)へのアクセス指示を順次格
納する複数のアクセスパイプライン(121)と、この
アクセスパイプライン(121)のそれぞれに対応し、
前記主記憶装置(111)に障害が発生したときに前記
アクセス指示に含まれる前記主記憶装置(111)のア
ドレスをエラーアドレスとして保持する複数のエラーア
ドレス保持手段(123)と、前記障害発生の旨の通知
を行う障害通知手段(125)とを有する記憶制御装置
(113)と、 前記エラーアドレス保持手段(123)の保持内容の収
集を行うサービスプロセッサ(115)と、 前記主記憶装置(111)のアクセス元であって、前記
障害通知手段(125)からの通知に応じて前記サービ
スプロセッサ(115)を起動する動作をファームウェ
アで実現する起動手段(131)と、前記サービスプロ
セッサ(115)によって収集した前記エラーアドレス
を前記主記憶装置(111)に格納する格納制御手段(
133)とを有するアクセス元プロセッサ(117)と
、を備え、 前記アクセス元プロセッサ117に報告すべき前記主記
憶装置111のエラーアドレスを、前記アクセス元プロ
セッサ117上で実行する前記ファームウェアを介して
前記サービスプロセッサ115によって収集するように
構成したことを特徴とするエラーアドレス収集方式。
(1) A plurality of access pipelines (121) that sequentially store access instructions to the main storage device (111), and corresponding to each of the access pipelines (121),
a plurality of error address holding means (123) for holding the address of the main storage device (111) included in the access instruction as an error address when a failure occurs in the main storage device (111); a storage control device (113) having a failure notification means (125) that notifies the error address; a service processor (115) that collects the contents held by the error address holding means (123); and the main storage device (111). ), the activation means (131) is an access source of the service processor (115) and uses firmware to realize an operation of activating the service processor (115) in response to a notification from the failure notification means (125); storage control means (111) for storing the collected error addresses in the main storage device (111);
an access source processor (117) having: an access source processor (117) having an access source processor (133); An error address collection method characterized by being configured to be collected by a service processor 115.
(2)請求項1のエラーアドレス収集方式において、前
記障害発生の旨と前記エラーアドレス保持手段(123
)に保持したエラーアドレスの一部とを前記障害通知手
段(125)から前記アクセス元プロセッサ(117)
に通知し、前記サービスプロセッサ(115)において
このエラーアドレスの一部と収集した前記複数のエラー
アドレス保持手段(123)のそれぞれの保持内容とを
比較して前記エラーアドレスを特定することを特徴とす
るエラーアドレス収集方式。
(2) In the error address collection method according to claim 1, the fact that the failure has occurred and the error address holding means (123
) from the failure notification means (125) to the access source processor (117).
and the service processor (115) identifies the error address by comparing a part of the error address with the collected contents of each of the plurality of error address holding means (123). error address collection method.
JP1126321A 1989-05-19 1989-05-19 Error address collection method Expired - Lifetime JP2688368B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1126321A JP2688368B2 (en) 1989-05-19 1989-05-19 Error address collection method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1126321A JP2688368B2 (en) 1989-05-19 1989-05-19 Error address collection method

Publications (2)

Publication Number Publication Date
JPH02304652A true JPH02304652A (en) 1990-12-18
JP2688368B2 JP2688368B2 (en) 1997-12-10

Family

ID=14932293

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1126321A Expired - Lifetime JP2688368B2 (en) 1989-05-19 1989-05-19 Error address collection method

Country Status (1)

Country Link
JP (1) JP2688368B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165772A (en) * 2007-01-02 2008-07-17 Internatl Business Mach Corp <Ibm> Method and system for identifying faulty memory element in memory system
JP2010122873A (en) * 2008-11-19 2010-06-03 Nec Corp Information processor

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008165772A (en) * 2007-01-02 2008-07-17 Internatl Business Mach Corp <Ibm> Method and system for identifying faulty memory element in memory system
JP2010122873A (en) * 2008-11-19 2010-06-03 Nec Corp Information processor

Also Published As

Publication number Publication date
JP2688368B2 (en) 1997-12-10

Similar Documents

Publication Publication Date Title
JP2706602B2 (en) Interrupt retry reduction device
JPH02297228A (en) Fault information storing system
JPH0950424A (en) Dump sampling device and dump sampling method
JPH02304652A (en) Error address collecting system
JP5316502B2 (en) I / O bridge device, response notification method, and program
JPH09134314A (en) Memory access controller
JPH0255816B2 (en)
JPH1027115A (en) Fault information sampling circuit for computer system
JP4749812B2 (en) Test equipment
JPH11143789A (en) Bus tracing device
JP4286731B2 (en) Buffer device and buffer fault diagnosis method
KR0121442B1 (en) The method of cache error detecting for multi-processor system
JPS5832422B2 (en) Micro Shindan Houshiki
CN116431453A (en) Method, device and equipment for detecting system faults through BIOS
JPS6143739B2 (en)
JPH0135369B2 (en)
JPH0341528A (en) Diagnostic device in computer
JPH0255815B2 (en)
JP2001243125A (en) Input and output controller and lockout process method at failure time
JPH04107649A (en) Dump processing system
JPH0520049A (en) Information processing system with correcting function for control memory and correcting method for control memory
JPS61237138A (en) Data processor
JPH04365145A (en) Memory fault processing method
JPH02212948A (en) Fault information collector for central processing unit
JPS63101947A (en) Error processing system