JPH0255815B2 - - Google Patents

Info

Publication number
JPH0255815B2
JPH0255815B2 JP60061184A JP6118485A JPH0255815B2 JP H0255815 B2 JPH0255815 B2 JP H0255815B2 JP 60061184 A JP60061184 A JP 60061184A JP 6118485 A JP6118485 A JP 6118485A JP H0255815 B2 JPH0255815 B2 JP H0255815B2
Authority
JP
Japan
Prior art keywords
channel
fault
failure
processing
common
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60061184A
Other languages
Japanese (ja)
Other versions
JPS61220049A (en
Inventor
Seiichi Shimizu
Satoshi Sugiura
Teruo Aizawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60061184A priority Critical patent/JPS61220049A/en
Publication of JPS61220049A publication Critical patent/JPS61220049A/en
Publication of JPH0255815B2 publication Critical patent/JPH0255815B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Description

【発明の詳細な説明】 〔概要〕 複数チヤネルを共通に制御するチヤネルプロセ
ツサにおいて、共通部、個別部をそれぞれにおけ
る障害状態に対応した適確な障害処理および
CPUへの報告と、SVPによる詳細な障害情報の
収集とを可能にする。
[Detailed Description of the Invention] [Summary] In a channel processor that commonly controls a plurality of channels, the common part and the individual parts are provided with appropriate fault handling and processing corresponding to the fault state in each.
Enables reporting to the CPU and collection of detailed failure information by SVP.

〔産業上の利用分野〕 本発明は計算機システムに関するものであり、
特にチヤネルプロセツサにおけるチヤネルの障害
処理方式に関する。
[Industrial Application Field] The present invention relates to a computer system,
In particular, it relates to a channel fault handling method in a channel processor.

〔従来の技術〕[Conventional technology]

第2図は、本発明が対象とするチヤネルプロセ
ツサを有する一般的な計算機システムの構成を示
したものである。図において、1は主記憶装置
MSU,2は中央処理装置CPU,3はチヤネルプ
ロセツサCHP,4はチヤネルCH,5は入出力装
置I/O,6はチヤネルプロセツサSVPを表し
ている。
FIG. 2 shows the configuration of a general computer system having a channel processor, which is the object of the present invention. In the figure, 1 is the main memory
MSU, 2 represents a central processing unit CPU, 3 represents a channel processor CHP, 4 represents a channel CH, 5 represents an input/output device I/O, and 6 represents a channel processor SVP.

チヤネルプロセツサCHPは、複数のチヤネル
CHを順次的に制御して、入出力装置I/Oと主
記憶装置MSUとの間の入出力データ転送を行わ
せる。
Channel Processor CHP supports multiple channels
The CHs are sequentially controlled to perform input/output data transfer between the input/output device I/O and the main storage device MSU.

チヤネルプロセツサCHPは、各チヤネルCHを
個別的、循環的に制御する個別部と、各チヤネル
CHで発生する処理要求を逐次的に処理する共通
部を含み、それぞれの障害を管理している。障害
が発生すると、中央処理装置CPUのオペレーテ
イング・システム(OS)へ報告が行われ、また
サービスプロセツサSVPによつて障害の詳細な
情報が収集される。
The channel processor CHP consists of an individual section that controls each channel CH individually and cyclically, and a
It includes a common part that sequentially processes processing requests generated on the CH, and manages each failure. When a failure occurs, it is reported to the operating system (OS) of the central processing unit CPU, and detailed information about the failure is collected by the service processor SVP.

第3図は、チヤネルプロセツサCHPにおける
チヤネルCHの制御機構を示したものである。図
において、7は16個のチヤネルCH0ないしCHF
それぞれの制御情報が格納されているスタツクメ
モリ、8は個別部、9は共通部を示している。
FIG. 3 shows the control mechanism of the channel CH in the channel processor CHP. In the figure, 7 is the 16 channels CH0 to CHF
A stack memory in which respective control information is stored, 8 indicates an individual section, and 9 indicates a common section.

個別部8では、スタツクメモリ7から、チヤネ
ルCH0からCH1,CH2,…,CHF,CH0,
CH1,CH2,…のように、循環的に制御情報
を読み出し、更新を行う。このとき、共通部9に
より処理が必要であれば、共通部9に対して処理
要求を発行する。
In the individual section 8, from the stack memory 7, channels CH0 to CH1, CH2, ..., CHF, CH0,
Control information is read and updated cyclically like CH1, CH2, . . . At this time, if processing is required by the common unit 9, a processing request is issued to the common unit 9.

このとき、共通部9が他チヤネルの処理要求に
ついて処理中であれば、次のサイクルになつて再
度処理要求を発行する。要求が受付けられると、
共通部9は該チヤネルの制御情報を読み出し、処
理をして更新を行う。
At this time, if the common unit 9 is processing a processing request from another channel, it issues the processing request again in the next cycle. Once the request is accepted,
The common unit 9 reads out the control information of the channel, processes it, and updates it.

ところで上記動作中に、ハードウエアの障害、
例えばレジスタのパリテイエラー等が発生すれ
ば、その旨がチヤネルコントロールチエツク
CCC(Channel Control Check)としてOSに対
して報告される。
By the way, during the above operation, a hardware failure occurred.
For example, if a register parity error occurs, the channel control check will notify you of this.
Reported to the OS as a CCC (Channel Control Check).

またたとえば、共通部9が、マイクロプロセツ
サで構成され、その制御記憶に2ビツト誤りが検
出されると、処理続行が不可能である旨を示すた
め、チヤネルダメージとしてOSに報告される。
For example, if the common section 9 is composed of a microprocessor and a 2-bit error is detected in its control memory, this is reported to the OS as channel damage, indicating that it is impossible to continue processing.

またこれらの障害報告の処理中に重なつて発生
するような障害もチヤネルダメージとしてOSに
通知され、OSが障害の回復処理をするのが、一
般的に行われている手法である。
Additionally, a common method is for failures that occur multiple times during the processing of these failure reports to be notified to the OS as channel damage, and for the OS to perform failure recovery processing.

またあるチヤネルの動作中に通常の動作が続行
可能な程度の障害が発生した場合には、該チヤネ
ルのみがチヤネルコントロールチエツク(CCC)
となつて、他のチヤネルは影響を受けることなく
通常動作を続行できるようにすることも一般的で
ある。
In addition, if a failure occurs to the extent that normal operation can continue while a certain channel is operating, only that channel will undergo a channel control check (CCC).
Therefore, it is common to allow other channels to continue normal operation without being affected.

このため従来の方式では、OSによる回復処理
の際、無関係なチヤネルの処理実行が影響されな
いよう、各チヤネルの個別部に必要最小限の量の
障害状態を記録するログ情報(以後ログアウト情
報という)格納域を設け、CPUに対し障害報告
を行うとともに、主記憶装置MSUにログアウト
情報の出力を行なつていた。
For this reason, in the conventional method, during recovery processing by the OS, log information (hereinafter referred to as logout information) records the minimum necessary amount of failure status in each individual section of each channel so that processing execution of unrelated channels is not affected. It created a storage area, reported failures to the CPU, and output logout information to the main storage MSU.

さらにサービスプロセツサSVPに対してログ
アウト情報を出力する従来のシステムもあつた。
このようなシステムにおいては、SVPに対する
ログアウト情報を、CHP内のログバツフアと称
する格納域に一時保持しておく必要があつた。
There was also a conventional system that outputs logout information to the service processor SVP.
In such a system, it is necessary to temporarily store logout information for the SVP in a storage area called a log buffer within the CHP.

第4図は、従来の計算機システムにおけるチヤ
ネル障害処理機構の1例を示したもので、図中の
1は主記憶装置MSU,2は中央処理装置CPU,
3はチヤネルプロセツサCHP,4はチヤネル
CH,5は入出力装置I/O,6はサービスプロ
セツサSVP,8は個別部、9は共通部、10は
状態レジスタ、11はオペレーテイングシステム
OS,12はエラー検出ラツチEDL,13および
14はログアウト情報を表している。
Figure 4 shows an example of a channel failure handling mechanism in a conventional computer system. In the figure, 1 is the main storage unit MSU, 2 is the central processing unit CPU,
3 is the channel processor CHP, 4 is the channel
CH, 5 is the input/output device I/O, 6 is the service processor SVP, 8 is the individual part, 9 is the common part, 10 is the status register, 11 is the operating system
OS, 12 is an error detection latch EDL, and 13 and 14 are logout information.

エラー検出ラツチEDLは、チヤネルCHごとに
複数設けられており、パリテイエラー等の障害が
発生したレジスタ等の位置を表示するものであ
る。
A plurality of error detection latches EDL are provided for each channel CH, and are used to display the position of a register or the like where a failure such as a parity error has occurred.

ログアウト情報13は、各チヤネルCHごとの
障害発生状態を示すために設けられていて、それ
ぞれのチヤネルCH内の複数のエラー検出ラツチ
EDLの情報を集約し簡単なコード化した形で作
成される。このログアウト情報13は、チヤネル
ごとにその制御情報域に格納されている。
The logout information 13 is provided to indicate the failure occurrence status for each channel CH, and is provided to indicate the failure occurrence status for each channel CH.
It is created by consolidating EDL information and converting it into a simple code. This logout information 13 is stored in the control information area for each channel.

ログアウト情報14は、共通部9内における障
害発生状態を示すためのものである。
The logout information 14 is for indicating the failure occurrence state within the common section 9.

共通部9は、これらのログアウト情報に基づい
て障害処理を行い、障害に応じて、状態レジスタ
10にチヤネルコントロールチエツクCCC(軽度
の障害の場合)あるいはチヤネルダメージCD(重
度の障害の場合)をセツトし、中央処理装置
CPUのOSに報告する。チヤネルダメージはサー
ビスプロセツサSVPへも報告され、それにより、
サービスプロセツサSVPへログアウト情報13,
14を読み出して障害原因の解析が行われる。
The common unit 9 performs fault processing based on this logout information, and sets a channel control check CCC (in the case of a minor fault) or channel damage CD (in the case of a severe fault) in the status register 10 depending on the fault. and central processing unit
Report to CPU OS. Channel damage is also reported to the service processor SVP, which
Logout information to service processor SVP 13,
14 is read out and the cause of the failure is analyzed.

また上述のような計算機システムにおいて、装
置の保守員が障害箇所を分析して、部品交換等を
行うこともまた一般的に行われている。そしてそ
の際に、チヤネルプロセツサCHPから収集され
る障害原因を解析するための情報は、詳細かつ正
確であることが要求されている。
Furthermore, in the above-mentioned computer system, it is also common practice for maintenance personnel of the device to analyze the failure location and replace parts. At this time, the information collected from the channel processor CHP for analyzing the cause of the failure is required to be detailed and accurate.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

従来の方式では、共通部の障害をあるチヤネル
に特定できる場合、他チヤネルの動作に影響を与
えないようにするため、その詳細情報を、各チヤ
ネルの制御情報域にコード化する等の工夫をし
て、ログ出力するまで保持していた。
In the conventional method, when a fault in a common part can be identified in a certain channel, in order to prevent it from affecting the operation of other channels, it is necessary to take measures such as encoding the detailed information in the control information area of each channel. and retained it until it was output to the log.

したがつて、各チヤネルには、チヤネル対応に
ログアウト情報格納域が必要であり、またログア
ウト情報は格納域を節約するために加工されてい
るので、このログアウト情報を用いては障害検出
箇所の特定を充分に行うことができなかつた。
Therefore, each channel requires a logout information storage area for each channel, and since the logout information is processed to save storage space, this logout information can be used to identify the failure detection location. I was unable to do so adequately.

さらに、共通部で発生した障害のうち、チヤネ
ルを特定できない場合や、以後の正常動作を保証
できない障害は、より重度な障害としてCPUに
報告されるが、このような場合でも、入手できる
詳細情報は不十分なものであつた。
Furthermore, among failures that occur in common parts, if the channel cannot be identified or failures that cannot guarantee normal operation thereafter, they are reported to the CPU as more serious failures, but even in such cases, detailed information that is available was insufficient.

〔問題点を解決するための手段〕[Means for solving problems]

本発明は、複数チヤネルを共通に制御するチヤ
ネルプロセツサにおいて、チヤネルごとにログア
ウト情報格納域を設けずに、共通部に障害が発生
してチヤネルを特定できる場合には、障害発生時
からその報告終了までの間、他チヤネルの動作に
影響を与えることなくその障害が発生したことを
CPUに報告させ、しかもその報告処理とは独立
に、サービスプロセツサによつて従来よりも詳細
な情報を収集できるようにする手段を提供するも
のである。
In a channel processor that controls multiple channels in common, the present invention does not provide a logout information storage area for each channel, and if a failure occurs in a common section and the channel can be identified, the problem is reported from the time of occurrence. Until termination, the failure can be detected without affecting the operation of other channels.
This provides a means for having the CPU report and, moreover, allowing the service processor to collect more detailed information than before, independently of the report processing.

第1図は、本発明の原理的構成を示す説明図で
ある。図において、2は中央処理装置CPU,3
はチヤネルプロセツサCHP,4はチヤネルCH,
6はサービスプロセツサSVP,8は個別部、9
は共通部、15は第1障害処理部、16は第2障
害処理部、17は1組の障害位置表示ラツチを示
している。
FIG. 1 is an explanatory diagram showing the basic configuration of the present invention. In the figure, 2 is the central processing unit CPU;
is the channel processor CHP, 4 is the channel CH,
6 is the service processor SVP, 8 is the individual section, 9
15 is a common part, 15 is a first fault processing section, 16 is a second fault processing section, and 17 is a set of fault position display latches.

障害位置表示ラツチ17は、チヤネルプロセツ
サCHP内の各レジスタのエラー検出ラツチ
(EDL)などの障害原因箇所を第一次的に表示す
る手段であり、個別部8あるいは共通部9によつ
て識別されるとともに、その情報はサービスプロ
セツサSVPによつて直接収集可能にされる。
The fault location display latch 17 is a means for primarily displaying the location of the fault, such as the error detection latch (EDL) of each register in the channel processor CHP, and is identified by the individual section 8 or the common section 9. and the information is made available for collection directly by the service processor SVP.

第1障害処理部15は、個別部8あるいは共通
部9において障害が検出されたとき、個別部8か
らの障害処理要求あるいは共通部9からの障害処
理要求でもチヤネルが特定できるものについて
は、該当するチヤネルのみを障害として処理し、
チヤネル障害としてCPUに報告する。
When a failure is detected in the individual unit 8 or the common unit 9, the first failure processing unit 15 receives a failure processing request from the individual unit 8 or a failure processing request from the common unit 9 for which the channel can be specified. only the channels that are affected are treated as failures,
Report to CPU as channel failure.

また1つのチヤネルの障害処理中に同一または
他のチヤネルに同種あるいは異種の障害が重ねて
発生した場合には、動作中のチヤネル全てについ
てチヤネル障害として処理するか、あるいは第2
障害処理部16に依頼して重度の障害状態を表す
チヤネルダメージとして処理させ、CPUに報告
させる。この場合、同時にサービスプロセツサ
SVPにも報告し、各障害位置表示ラツチ17を
スキヤンアウトさせ、情報を収集させる。
In addition, if faults of the same type or different types repeatedly occur in the same channel or other channels while fault processing is in progress in one channel, all operating channels will be processed as channel faults, or a second channel fault will be processed.
A request is made to the failure processing unit 16 to process it as channel damage representing a severe failure state and report it to the CPU. In this case, the service processor
It also reports to the SVP, scans out each failure location display latch 17, and collects information.

しかし、1つのチヤネルの障害処理中に他の障
害が発生しなかつた場合には、他の実行中のチヤ
ネルの処理はそのまま続行させる。
However, if no other failure occurs during the failure processing of one channel, the processing of other channels being executed is continued as is.

〔作用〕[Effect]

本発明によれば、障害詳細情報はサービスプロ
セツサSVPによつて、EDL等から直接に収集さ
れるので、従来方式のように、ログアウト情報の
格納域をチヤネル毎に設ける必要もなく、またロ
グバツフアのような一時記憶域も必要としない。
According to the present invention, since detailed failure information is directly collected from the EDL etc. by the service processor SVP, there is no need to provide a logout information storage area for each channel as in the conventional method, and there is no need to provide a storage area for logout information for each channel. It also does not require temporary storage.

したがつて、ログアウト情報格納域やログバツ
フアの大きさによつて情報量が制限されることが
ないので、入手可能な詳細な障害情報を十分に収
集することができる。
Therefore, since the amount of information is not limited by the size of the logout information storage area or log buffer, it is possible to collect a sufficient amount of available detailed failure information.

〔実施例〕〔Example〕

第5図は、本発明の1実施例システムの構成を
示したものであり、第6図はその処理フローであ
る。
FIG. 5 shows the configuration of a system according to an embodiment of the present invention, and FIG. 6 shows its processing flow.

第5図において、1は主記憶装置MSU,2は
中央処理装置CPU,3はチヤネルプロセツサ
CHP,4はチヤネルCH,5は入出力装置I/
O,6はサービスプロセツサSVP,8は個別部、
9は共通部、10は状態レジスタ、11はオペレ
ーテイングシスチムOS,12はエラー検出ラツ
チEDL,15は第1障害処理部、16は第2障
害処理部、18は第1障害処理要求フラグ、19
は第2障害処理要求フラグ、20は実行ラツチを
表している。
In Figure 5, 1 is the main storage unit MSU, 2 is the central processing unit CPU, and 3 is the channel processor.
CHP, 4 is channel CH, 5 is input/output device I/
O, 6 is the service processor SVP, 8 is the individual section,
9 is a common part, 10 is a status register, 11 is an operating system OS, 12 is an error detection latch EDL, 15 is a first fault processing section, 16 is a second fault processing section, 18 is a first fault processing request flag, 19
2 represents a second failure processing request flag, and 20 represents an execution latch.

チヤネルプロセツサCHP内の多数のエラー検
出ラツチEDLは、関連する個別部8および共通
部9により統括されており、障害発生状態を表示
すると、対応する個別部8あるいは共通部9によ
つて認識される。またこれらの各EDLは、シフ
トレジスタの各段としても構成されており、サー
ビスプロセツサSVPの指示により、内容がスキ
ヤンアウトできるようになつている。
A large number of error detection latches EDLs in the channel processor CHP are integrated by related individual sections 8 and common sections 9, and when a failure condition is displayed, it is recognized by the corresponding individual section 8 or common section 9. Ru. Each of these EDLs is also configured as each stage of a shift register, and the contents can be scanned out according to instructions from the service processor SVP.

各個別部8は、それぞれ1ビツトの第1障害処
理要求フラグ18を有し、障害発生を配下の
EDLによつて認識したとき、フラグをオンにセ
ツトする。このフラグは、たとえば第3図のスタ
ツクメモリの各チヤネルごとの制御情報の一部に
含めることができる。
Each individual unit 8 has a 1-bit first fault processing request flag 18, and indicates the occurrence of a fault to a subordinate.
Sets the flag on when recognized by the EDL. This flag can be included as part of the control information for each channel of the stack memory shown in FIG. 3, for example.

共通部9で発生した障害については、対応する
チヤネルCHが特定できる場合であれば、第1障
害処理要求フラグ18の該当するものをオンにセ
ツトする。
Regarding a failure occurring in the common unit 9, if the corresponding channel CH can be specified, the corresponding one of the first failure processing request flags 18 is set to ON.

しかし、チヤネルを特定できない場合あるいは
全体的に正常動作が保証できない場合には、重度
の障害として第2障害処理要求フラグ19をオン
にセツトする。なお、この場合、その時点で動作
中の全てのチヤネルの個別部に対応する第1障害
処理要求フラグをオンにセツトする方法をとるこ
ともできる。
However, if the channel cannot be identified or if normal operation cannot be guaranteed as a whole, the second failure processing request flag 19 is set on as a serious failure. In this case, it is also possible to set on the first fault handling request flags corresponding to the individual units of all channels operating at that time.

実行ラツチ20は、第1障害処理部15が障害
処理を実行している間、オンにセツトされる。
The execution latch 20 is set on while the first fault handler 15 is performing fault handling.

次に第6図の処理フローを参照して、第1障害
処理部15および第2障害処理部16の機能を説
明する。
Next, the functions of the first fault processing section 15 and the second fault processing section 16 will be explained with reference to the processing flow shown in FIG.

第1障害処理部15は、第1障害処理要求フ
ラグ18を調べ、オンであればの処理を実行
し、オフであればの処理を実行する。
The first failure processing unit 15 checks the first failure processing request flag 18, and executes a process if it is on, and executes a process if it is off.

第1障害処理要求フラグがオンの場合、実行
ラツチ20がオンにセツトされているか否か、
すなわち現在すでに第1障害処理実行中である
か否かを調べ、オンであればを実行し、オフ
であればを実行する。
If the first fault processing request flag is on, whether the execution latch 20 is set on or not;
That is, it is checked whether or not the first failure process is currently being executed, and if it is on, it is executed, and if it is off, it is executed.

実行ラツチ20がオフであるため、オンにセ
ツトする。次にを実行する。
Since run latch 20 is off, it is set on. Then run:

第1障害処理を実行し、要求のあつたチヤネ
ルを障害チヤネルとしてテーブルに登録し、状
態レジスタ10にチヤネルコントロールチエツ
ク(CCC)をセツトして、CPUのオペレーテ
イングシステムOSに報告する。次にを実行
する。
The first fault processing is executed, the requested channel is registered in the table as a faulty channel, a channel control check (CCC) is set in the status register 10, and the result is reported to the operating system OS of the CPU. Then run:

実行ラツチ20をオフにリセツトする。 Reset run latch 20 off.

で第1障害処理要求フラグがオフの場合、
第2障害処理要求フラグ19を調べる。オンの
場合を実行し、オフの場合へ戻る。
If the first failure processing request flag is off in
Check the second failure processing request flag 19. Execute the on case and return to the off case.

で実行ラツチがオンである場合、すなわち
先に障害チヤネルの障害処理中に同一チヤネル
あるいは他のチヤネルでさらに障害が発生した
場合と、で第2障害処理要求フラグがオンの
場合、すなわち共通部で発生した障害について
実行中のチヤネルを特定できない場合や以後の
正常動作が保証できない場合に、重度の障害と
して処理し、チヤネルダメージ(CD)を状態
レジスタ10にセツトしてCPUのOSに報告す
る。
If the execution latch is on, that is, a fault occurs in the same channel or another channel while processing the fault in the faulty channel, and if the second fault handling request flag is on, that is, in the common part. When a fault that has occurred cannot be identified and the channel being executed cannot be guaranteed or normal operation cannot be guaranteed thereafter, it is treated as a severe fault, channel damage (CD) is set in the status register 10, and reported to the CPU OS.

オペレーテイングシステムOSは、チヤネル
プロセツサCHPからチヤネルコントロールチ
エツク(CCC)あるいはチヤネルダメージ
(CD)を報告されると、チヤネルの初期化や制
御メモリへの再ロードなどのそれぞれに対応す
る回復処理を実行する。
When the operating system OS receives a channel control check (CCC) or channel damage (CD) report from the channel processor CHP, it executes the corresponding recovery processing, such as initializing the channel or reloading the control memory. do.

特にチヤネルダメージ(CD)の報告は、
CPUに対するのと同時にサービスプロセツサ
SVPに対しても行われる。サービスプロセツ
サSVPは、これに対応して、CPUへの報告処
理から独立して、チヤネルプロセツサCHPの
各エラー検出ラツチEDLをスキヤンアウトに
より読み出し、障害解析のための詳細情報とし
て収集し、処理終了後、エラー検出ラツチ
EDLをリセツトする。
Especially when reporting channel damage (CD),
service processor at the same time as the CPU
This is also done for SVP. In response to this, the service processor SVP reads each error detection latch EDL of the channel processor CHP by scanout, independently from the reporting process to the CPU, collects it as detailed information for failure analysis, and processes it. After completion, error detection latch
Reset the EDL.

〔発明の効果〕 以上のように本発明によれば、チヤネルプロセ
ツサからCPUへのチヤネル障害を報告するため
に必要な情報は、チヤネルプロセツサ配下のチヤ
ネル(個別部)あたり1ビツトの第1障害処理要
求フラグと、チヤネルプロセツサあたり1ビツト
の第2障害処理要求フラグの僅かな量の情報があ
ればよく、しかも従来よりも詳細な障害情報をサ
ービスプロセツサが収集できる。そしてそれによ
り、チヤネルプロセツサの障害処理機能が簡単化
されるとともに、障害解析処理を容易にすること
ができる。
[Effects of the Invention] As described above, according to the present invention, the information necessary for reporting a channel fault from the channel processor to the CPU is the first bit of 1 bit per channel (individual part) under the channel processor. A small amount of information such as the fault processing request flag and the second fault processing request flag of 1 bit per channel processor is required, and moreover, the service processor can collect more detailed fault information than before. This simplifies the fault handling function of the channel processor and facilitates fault analysis processing.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の原理的構成図、第2図は本発
明が対象とする一般的な計算機システムの構成
図、第3図はチヤネルプロセツサの制御機構の構
成図、第4図は従来システムにおけるチヤネル障
害処理機構の構成図、第5図は本発明の1実施例
システムの構成図、第6図は第5図の実施例のシ
ステムの処理フロー図である。 第1図において、2は中央処理装置CPU、3
はチヤネルプロセツサCHP、4はチヤネルCH、
5は入出力装置I/O、6はサービスプロセツサ
SVP、8は個別部、9は共通部、15は第1障
害処理部、16は第2障害処理部、17は障害位
置表示ラツチ、CCCは軽度のチヤネル障害を報
告するチヤネルコントロールチエツク、CDは重
度のチヤネル障害を報告するチヤネルダメージの
信号を表す。
Figure 1 is a diagram showing the basic configuration of the present invention, Figure 2 is a diagram showing the configuration of a general computer system targeted by the present invention, Figure 3 is a diagram showing the configuration of the control mechanism of a channel processor, and Figure 4 is a diagram of the conventional system. FIG. 5 is a block diagram of a channel failure processing mechanism in the system, FIG. 5 is a block diagram of a system according to an embodiment of the present invention, and FIG. 6 is a processing flow diagram of the system of the embodiment of FIG. In Figure 1, 2 is the central processing unit CPU;
is the channel processor CHP, 4 is the channel CH,
5 is an input/output device I/O, 6 is a service processor
SVP, 8 is an individual part, 9 is a common part, 15 is a first fault processing part, 16 is a second fault processing part, 17 is a fault location display latch, CCC is a channel control check that reports a minor channel fault, and CD is a Represents a channel damage signal that reports severe channel failure.

Claims (1)

【特許請求の範囲】 1 複数のチヤネルを個別的、循環的に制御する
個別部と、各チヤネルから発生する処理要求を逐
次処理する共通部とを有し、個別部および共通部
において発生した障害は、チヤネル障害として
CPUに報告されるチヤネルプロセツサにおいて、 個別部で発生する障害について処理し、チヤネ
ル障害として報告するとともに、共通部で発生す
る障害について、共通部で動作中のチヤネルを特
定できる場合には、個別部において発生する障害
と同等の処理を行い、チヤネル障害として報告す
る第1の障害処理手段と、 チヤネルを特定できない場合に、共通部の配下
で動作中の各チヤネルについて、すべてチヤネル
障害として終了報告するかあるいはチヤネル障害
よりも重度な障害として報告する第2の障害処理
手段と、 障害詳細情報を与える1組の障害位置表示ラツ
チとをそなえ、 1つのチヤネルの障害検出から障害が報告され
るまでの間に、同一チヤネル若しくは他チヤネル
で同種のもしくは異種の障害が発生する場合に
は、第2の障害処理手段によつて障害報告を行わ
せ、 他方、1つのチヤネルの障害処理中に他の障害
が発生しない場合には、実行中の他チヤネルの動
作には影響を与えずに通常の処理を続行させ、 第1の障害処理手段若しくは第2の障害処理手
段によつて、CPUに障害を報告する処理とは独
立に、上記障害詳細情報を障害位置表示ラツチか
らサービスプロセツサへ読み出し可能にされてい
ることを特徴とするチヤネルの障害処理方式。
[Scope of Claims] 1. Includes an individual unit that individually and cyclically controls a plurality of channels and a common unit that sequentially processes processing requests generated from each channel. as a channel failure
The channel processor that reports to the CPU processes failures that occur in individual parts and reports them as channel failures.For failures that occur in common parts, if the channel operating in the common part can be identified, it processes them individually. A first fault handling means that performs the same processing as a fault that occurs in the common section and reports it as a channel fault, and when the channel cannot be identified, reports the completion of all channels operating under the common section as a channel fault. a second fault handling means for detecting a fault in one channel or reporting it as a fault more severe than a channel fault; and a set of fault location display latches for providing detailed fault information, from the detection of a fault in one channel until the fault is reported. If the same type of failure or different type of failure occurs in the same channel or other channels during this period, the failure is reported by the second failure handling means. If no failure occurs, normal processing is continued without affecting the operation of other channels being executed, and the first failure handling means or the second failure handling means is used to remove the failure from the CPU. A channel failure handling method characterized in that the detailed failure information can be read from a failure location display latch to a service processor independently of reporting processing.
JP60061184A 1985-03-26 1985-03-26 Trouble processing system for channel Granted JPS61220049A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60061184A JPS61220049A (en) 1985-03-26 1985-03-26 Trouble processing system for channel

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60061184A JPS61220049A (en) 1985-03-26 1985-03-26 Trouble processing system for channel

Publications (2)

Publication Number Publication Date
JPS61220049A JPS61220049A (en) 1986-09-30
JPH0255815B2 true JPH0255815B2 (en) 1990-11-28

Family

ID=13163816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60061184A Granted JPS61220049A (en) 1985-03-26 1985-03-26 Trouble processing system for channel

Country Status (1)

Country Link
JP (1) JPS61220049A (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02212946A (en) * 1989-02-13 1990-08-24 Nec Corp Fault informing system for information processor
JP2658813B2 (en) * 1993-08-13 1997-09-30 日本電気株式会社 I / O channel failure recovery device

Also Published As

Publication number Publication date
JPS61220049A (en) 1986-09-30

Similar Documents

Publication Publication Date Title
US5410545A (en) Long-term storage of controller performance
US4312066A (en) Diagnostic/debug machine architecture
US5134701A (en) Test apparatus performing runtime replacement of program instructions with breakpoint instructions for processor having multiple instruction fetch capabilities
US6253317B1 (en) Method and apparatus for providing and handling traps
US20080276129A1 (en) Software tracing
US20030084376A1 (en) Software crash event analysis method and system
JPS58225453A (en) Error detecting system of diagnosing circuit
JPH0255815B2 (en)
US6141635A (en) Method of diagnosing faults in an emulated computer system via a heterogeneous diagnostic program
JPH0255816B2 (en)
JP5056479B2 (en) Competitive partial processing detection method, apparatus and computer program
US20120123761A1 (en) Testing Software On A Computer System
JPH0341528A (en) Diagnostic device in computer
JP2936170B2 (en) Failure handling method
JP2743562B2 (en) Failure handling method
JPS6111855A (en) Function diagnosing method of data processor
JP2947571B2 (en) Fault diagnosis device
JPS5924351A (en) Processing system of fault information
US5168501A (en) Method for checking hardware errors
JPS6010328A (en) Input and output error demarcating and processing system
EP0271986A2 (en) Data processing system having a hierarchy of service computer
JPH07110790A (en) Memory diagnostic device
JPH02297114A (en) Method for inspecting computer
JPH0573351A (en) Information processor
JPH0844583A (en) Diagnostic system for information processor