JP3746957B2 - Control method of logical partitioning system - Google Patents

Control method of logical partitioning system Download PDF

Info

Publication number
JP3746957B2
JP3746957B2 JP2001027757A JP2001027757A JP3746957B2 JP 3746957 B2 JP3746957 B2 JP 3746957B2 JP 2001027757 A JP2001027757 A JP 2001027757A JP 2001027757 A JP2001027757 A JP 2001027757A JP 3746957 B2 JP3746957 B2 JP 3746957B2
Authority
JP
Japan
Prior art keywords
processor
failure
partition
stop
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001027757A
Other languages
Japanese (ja)
Other versions
JP2002229811A (en
Inventor
毅 小池
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP2001027757A priority Critical patent/JP3746957B2/en
Publication of JP2002229811A publication Critical patent/JP2002229811A/en
Application granted granted Critical
Publication of JP3746957B2 publication Critical patent/JP3746957B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、情報処理装置の障害処理に関し、特に密結合接続における論理分割システムの制御方法に関する。
【0002】
【従来の技術】
情報処理装置が障害となった場合、障害の程度によってシステム運用を停止させる必要が発生する。システム運用を停止する要因は大別すると2つあり、1つはソフトウェア的な要因によるもので、多くの場合特定のプロセスやジョブで異常を検出し、このプロセスまたはジョブがシステムコアとなる処理であった場合にシステム停止を要するものである。このような障害はハードウェア故障によるものではないので、障害要因をソフトウェア的な観点から見直し、システムの再立ち上げを実行することによって救済される。
【0003】
もう1つの障害はハードウェア的な要因によるもので、システムコアとなるプロセッサ等の故障によって発生し、故障発生装置の修理を行うか、障害部位の縮退を行った後にシステムの再立ち上げを実施する。
【0004】
汎用コンピュータのような大規模情報処理装置では、障害発生から障害内容の解析、被疑部品の特定を容易に行うために、上述のソフトウェア/ハードウェア障害の対策としてログ機能を具備している。ハードウェア障害対策のログ機能にはレジスタのダンプ機能や実行トレース機能等が存在する。
【0005】
このようなハードウェアログ採取は障害発生時点からなるべく早急に行われる方が望ましい。その理由は前記レジスタダンプ情報やトレース情報の内容が障害発生時点から時間が経過すればするほど状態の変化が進行し、ログとしての確度が失われるためである。最も簡単かつ効果的に情報処理装置を障害・停止状態に遷移させるための方法は、ログ採取対象とするプロセッサ間をハードウェア・ワイヤードの障害・停止用信号線で結線し、何れかのプロセッサで異常を検出した際に本信号線を活性化させる事によって、情報処理装置全体を障害・停止状態に移行させるものである。
【0006】
近年のマルチプロセッサ技術の発展により、密結合装置においても主記憶に対して数十台〜数百台のプロセッサを接続してシステム運用を行う情報処理装置が登場するに至った。この種の情報処理装置では、業務の処理量に応じて必要な数ごとにプロセッサ群を分割し、このプロセッサ群ごとに1つのオペレーティングシステムを稼働させる論理分割システムが採用されている。論理分割はIBM(インターナショナル・ビジネス・マシン)社の商標であるPR/SMが著名である。
【0007】
論理分割システムにおいて、単一の障害・停止用信号線でプロセッサ間を結線した場合、障害の程度によっては本来閉塞する必要のない、健全運用されている論理区画まで閉塞してしまう。そのため、通常論理分割システムで耐故障性能を向上させる場合には、複数の情報処理装置をホットスタンバイ構成とするように構成し、運用系全体に障害が波及した場合でも待機系でシステム運用を継続する様にしている。
しかし情報技術の普及と共にコンピュータで扱う業務も多様化し、単一情報処理装置で構成した小規模システムにおいても複数のオペレーティングシステムを稼働させたいというニーズは増加している。またその一方で24時間運転を初めとする基幹業務サーバとしてのコンピュータの信頼性向上も急務であり、こうした意味でも単にホットスタンバイ構成にしただけの信頼性向上ではなく、情報処理装置単体としての信頼性向上技術が重要視されている。
図7は、従来技術によるバス制御部の詳細構成を表したブロック図である。
アドレスデータレジスタ202は、プロセッサ間バス100中のアドレスデータバス101と接続され、他プロセッサ群および主記憶装置400との間でデータの交換を行う。コマンドレジスタ203は、プロセッサ間バス100中のアドレスデータバス101と接続され、他プロセッサおよび主記憶装置400との間でデータの交換を行う際の主記憶トランザクションの属性を格納する。コマンドデコーダ204は、コマンドレジスタ203およびアドレスデータレジスタ202の一部のビットフィールドと接続され、主記憶トランザクションをデコードし、リード命令/ライト命令やその他の制御命令によるバス制御装置の各種動作を指示する。ロード/ストア制御回路206は、演算や入出力を行うプロセッサの他の機能部とプロセッサアドレスデータ信号線208で接続され、プロセッサが使用する命令やデータのプリフェッチ制御、読み出し/書き込みの順序制御、キャッシュ制御等を行う。割り込み制御回路205は、プロセッサ間バス100中の障害・停止信号線102を介して他プロセッサおよび主記憶装置400と接続され、自プロセッサが障害を検出した時には障害・停止信号線102を活性化する。また他プロセッサで障害が発生した時には、障害・停止信号線102の活性化を検出することにより、自プロセッサを障害・停止状態に移行させる機能を備える。バス制御部およびプロセッサの他の機能部は、停止指示信号線207が割り込み制御回路205によって活性化されることにより機能を停止する。
【0008】
【発明が解決しようとする課題】
上述の通り、論理分割下では各論理区画の障害はなるべく他区画に波及しない方が望ましい。しかしながら、障害・停止用信号線で結線する方法を論理分割システムに適用すると、最大区画数分の障害・停止用信号線が必要となる。近年LSIの高集積化により、LSI内に取り込めるゲート量は加速度的に増大してはいる。しかしながらLSIと基板間、あるいはプロセッサとプロセッサを結ぶ信号線数は、物理的な実装制約からLSIの論理増加に付いていけないのが実状である。この点からも障害・停止用信号線の様な通常論理に関係のない信号線数は削減する必要がある。
【0009】
本発明の目的は、主記憶装置に対して複数のプロセッサを密結合で接続し、このプロセッサ群を予め複数の論理区画に分割し、前記の論理区画ごとにオペレーティングシステムを割り付けて運用する論理分割システムにおいて、障害発生時に特定の論理区画のみを選択的に障害・停止状態に遷移させるための制御を、専用の信号線を使用することなく実現することにある。
【0010】
【課題を解決するための手段】
本発明の論理分割システムの制御方法は、主記憶装置に対して複数のプロセッサを密結合で接続し、このプロセッサ群をあらかじめ複数の論理区画に分割し、前記論理区画ごとにオペレーティングシステムを割り付けて運用する論理分割システムにおいて、前記主記憶装置のトランザクションを受信するステップと、該トランザクションの1つとして定義される障害停止命令中に設けた停止対象区画番号とプロセッサごとにあらかじめ設定された自らが所属する区画番号とを比較するステップと、前記主記憶装置のトランザクションが異区画で正常動作しているプロセッサに影響を与えないよう、該主記憶装置のトランザクションを複数のステージに分割し、同一のハードウェア資源を共用可能なもの同士を一つのバスサイクルとして結合して繰り返すステップと、前記比較結果が一致した場合に前記一つのバスサイクルを実行中であればこれを全うしてから前記区画番号により示されるプロセッサを障害・停止状態に遷移させるステップとからなることを特徴としている。
【0011】
さらに本発明の論理分割システムの制御方法は、前記障害停止命令中に設けた停止対象とすべき区画番号に全区画指定に対応する同報区画番号を定義するステップと、前記同報区画番号が設定された障害停止命令を受信した場合に、前記複数のプロセッサはその時点のバスサイクルに依らず、即座に各々を障害停止状態に遷移させるステップからなることを特徴としている。
【0012】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して詳細に説明する。
【0013】
図1に示すように本発明は、演算プロセッサ200〜240および入出力プロセッサ300〜320が、プロセッサ間バス100を介して主記憶装置400と密結合で相互に接続されている。
【0014】
演算プロセッサ200、210、220および入出力プロセッサ300は区画1という一つのプロセッサ群を構成し、これに対して1つのオペレーティングシステムを運用する。また、演算プロセッサ230と入出力プロセッサ310で1つのプロセッサ群を構成し、これを区画2として区画1とは別のオペレーティングシステムを運用する。同様に、演算プロセッサ240と入出力プロセッサ320で1つのプロセッサ群を構成し、この区画3にも別のオペレーティングシステムを運用する。主記憶装置400は情報処理装置内の全ての演算プロセッサ及び入出力プロセッサから参照される区画共有装置である。
【0015】
次に図2を用いて、演算プロセッサ200〜240や入出力プロセッサ300〜320に内蔵されるバス制御部の詳細構成を説明する。なお、従来技術と同様の処理を行う部分については説明を省略する。
【0016】
区画番号格納レジスタ201は、演算プロセッサ200〜240および入出力プロセッサ300〜320が所属する区画番号を保持するレジスタである。コマンドデコーダ204はコマンドレジスタ203およびアドレスデータレジスタ202の一部のビットフィールドと接続され、主記憶トランザクションをデコードしリード命令/ライト命令やその他の制御命令によるバス制御装置の各種動作を指示する。
ロード/ストア制御回路206は演算や入出力を行うプロセッサの他の機能部とプロセッサアドレスデータ信号線208で接続され、プロセッサが使用する命令やデータのプリフェッチ制御、読み出し/書き込みの順序制御、キャッシュ制御等を行う。割り込み制御回路205はコマンドデコーダ204からの指示で、自プロセッサを障害・停止状態に移行させるための制御を行う。
【0017】
以下演算プロセッサ210で障害を検出し、他の演算プロセッサ200および220〜240と入出力プロセッサ300〜320と主記憶装置400を障害・停止状態とする場合の動作を例に挙げて説明する。
【0018】
論理分割方式を使用しない情報処理装置の場合、最も簡単な方法で情報処理装置全体を障害・停止状態に移行させるためには障害・停止信号線102を使用する。
【0019】
従来技術においては、障害を検出した演算プロセッサ210の割り込み制御回路205が障害・停止信号線102を使用して情報処理装置の緊急停止を指示し、他のプロセッサおよび主記憶装置の割り込み制御回路205が前記の信号を受信し、停止指示信号線207を使用してプロセッサ機能を停止させるというのが基本的動作であった。
【0020】
しかし論理分割方式でこのよう制御を行った場合、例えば図1の演算プロセッサ200〜220と入出力プロセッサ300で構成する区画1において演算プロセッサ210の障害波及範囲が区画1内に閉じている場合は、本来停止させる必要のない区画2の演算プロセッサ230および入出力プロセッサ310、区画3の演算プロセッサ240および入出力プロセッサ320までも停止させてしまうことになる。
【0021】
そこで本発明では、障害・停止信号線102に替わって区画番号格納レジスタ201を設けている。プロセッサ210で障害が発生し、システムとして区画1上で動作しているオペレーティングシステムを閉塞する必要が発生した場合に、プロセッサ210はプロセッサ間バス100を介して、自プロセッサが所属する区画1の障害・停止命令を発行する。
障害・停止命令はメモリリード命令やメモリライト命令等の主記憶トランザクションの1つとして定義され、アドレスデータバス101を介して転送される。障害・停止命令は引数として区画番号をアドレス/データ部のビットフィールドの一部に持つ。区画1を閉塞する必要があるプロセッサ210は、コマンドレジスタ203に障害・停止命令に対応するコマンドコードを、アドレスデータレジスタ202に区画1に対応する区画番号をそれぞれ設定し、アドレスデータバス101にデータを送出することによって区画1配下の全プロセッサに障害・停止命令を通知する。プロセッサ間バス100に送出されたデータは情報処理装置内の全てのプロセッサと主記憶装置400にも伝搬する。
【0022】
同一区画1に所属する演算プロセッサ200では、バス制御部に内蔵するコマンドレジスタ203によってデータを取り込みコマンドデコーダ204に転送する。コマンドデコーダ204はデコードした主記憶トランザクションが障害・停止命令であった場合は、アドレスデータレジスタ202に取り込まれているアドレスデータバス101の一部のビットフィールドデータと、区画番号格納レジスタ201に予め保持されている、自プロセッサの所属する区画番号とを比較し、一致する場合には割り込み制御回路205に指示して、停止指示信号線207によってプロセッサの機能を停止させる。
【0023】
この時注目すべきは、演算プロセッサ200のバス制御部以外の機能が障害・停止状態となり動作を停止しても、バス制御部自身はすぐには機能停止しない点である。演算プロセッサ200のバス制御部は、システム上で正常に運用されている他の区画2および区画3に影響を与えない様に、プロセッサ間バス100へのアクセスをバス動作が正常な状態で終了するまで動作させた後、初めて障害・停止状態となる。具体的には、ロード/ストア制御回路206が他区画にも影響のある書き込み動作を完了していなかった場合には書き込み動作を継続させる動作や、プロセッサに内蔵するキャッシュがストアイン方式(ライトバック方式とも言う)である様な場合には、主記憶のデータの写しをキャッシュ内に保持している可能性があるので、キャッシュ内容の主記憶への掃き出し動作を行う動作等がこれに該当する。
【0024】
一方、演算プロセッサ210から発行された障害・停止命令は、プロセッサ間バス100を介して区画2や区画3に属するプロセッサにも通知される。しかしこれらのプロセッサでは、区画番号格納レジスタ201に設定されている区画番号と、コマンドデコーダ204がデコードした障害・停止命令で示されるアドレスデータレジスタ202中の区画番号が不一致となるので、本障害・停止命令に対しては何も機能せずに以後の動作を継続する。
【0025】
以上に示す動作によって、区画1に属する演算プロセッサ200、210、220と入出力プロセッサ300は、区画2に属する演算プロセッサ230と入出力プロセッサ310、および区画3に属する演算プロセッサ240と入出力プロセッサ320の動作に擾乱を与えることなく、選択的に区画1のみを障害・停止状態とすることが可能となる。
【0026】
また本発明は、情報処理装置内の全てのプロセッサを包括して障害・停止状態とするための同報通信機能を備えている。
【0027】
これは前記の障害・停止命令中の引数で指定されるアドレス/データ部の論理区画番号を表すビットフィールドの値として全区画に対応する同報区画番号を定義し、各プロセッサが同報区画番号を設定された障害・停止命令を受信した場合に、プロセッサ間バス100の動作状態に関係なく自プロセッサを即座に障害・停止状態にすべく緊急停止させることを特徴とする。
【0028】
前記の一区画に限定した障害・停止状態への遷移手段との違いは、各プロセッサに内蔵するバス制御部のコマンドデコーダ204で障害・停止命令をデコードし、アドレスデータレジスタ202に取り込んだアドレスデータバス101のデータが全区画に対応する同報区画番号であった場合は、論理区画番号格納レジスタ201の値の如何に拘わらす、割り込み制御回路205に指示して停止指示信号線207によってプロセッサの停止を指示した後、バス制御部自身も以後のバス制御動作を停止する点にある。具体的には、ロード/ストア制御回路206の動作をその時点で停止し、読み込み途中あるいは書き込み途中のデータがロード/ストア制御回路206内に残った状態でも強制停止するという動作がこれに当たる。
【0029】
同報区画番号を定義しバス制御部自身も緊急停止させるのは、障害が情報処理装置全体に関わる問題の場合、バス制御部自身にも障害が存在する可能性があるためである。
【0030】
図2中のバス制御部は、主記憶トランザクションとして図3に示す4つのコマンドコードを使用するものとする。即ちメモリリード命令(コマンドコード0)、メモリライト命令(コマンドコード1)、ロック命令(コマンドコード2)、障害・停止命令(コマンドコード3)である。メモリライト命令は、演算プロセッサ200〜240および入出力プロセッサ300〜320が主記憶装置400に対してデータを書き込む場合に使用する命令である。メモリリード命令は、演算プロセッサ200〜240および入出力プロセッサ300〜320に対して主記憶装置400からデータを読み込む場合に使用する命令である。ロック命令は、演算プロセッサ200〜240間で排他制御が必要な場合に使用する命令である。障害・停止命令は、本発明に関わる命令で演算プロセッサ200〜240および入出力プロセッサ300〜320が自プロセッサの所属する区画または情報処理装置全体を障害・停止状態とする場合に使用する命令である。
【0031】
コマンドコードは4ビットで構成されており、アドレスデータバス101の内4本の信号線を使用する。コマンドコードはコマンドレジスタ203でアドレスデータバス101から取り出される。
【0032】
図3において、主記憶トランザクションは、コマンドが要求される際にコマンドコードに対応する引数として、アドレスデータバス101の内32本の信号線を使用する。この引数は、アドレスデータレジスタ202によってアドレスデータバス101から取り出される。引数に使用される32本の信号線はメモリリード命令およびメモリライト命令ではアドレスの送出やデータの送受信にも兼用される。
【0033】
全ての命令は、アドレスデータレジスタ202で示される引数のビット0〜7に命令の送信元プロセッサの識別番号が格納される。また、命令がロック命令の場合は引数のビット8〜15はロック種別を表し、障害・停止命令の場合には引数のビット8〜15は障害・停止状態とすべき区画番号が設定される。
【0034】
障害・停止命令で使用される前記引数の区画番号設定フィールド(ビット8〜15)に停止させるべき区画の区画番号が設定される。図1の構成の場合、その手順は、演算プロセッサ200〜220と入出力プロセッサ300のバス制御部に内蔵する区画番号格納レジスタ201には事前に区画1を表す01(16進数、以下H)が設定されている。同様に、区画2に属する演算プロセッサ230と入出力プロセッサ310の区画番号格納レジスタ201には、02(H)が、区画3に属する演算プロセッサ240と入出力プロセッサ320の区画番号格納レジスタ201には03(H)が設定されている。
【0035】
何れかの区画で当該区画に所属するプロセッサが障害となり、同一区画に所属する他のプロセッサを障害・停止状態とする時には、コマンドレジスタ203に障害・停止命令のコマンドコードである3(H)を設定すると共に、アドレスデータレジスタ202のビット0〜7に自プロセッサ固有の識別番号を、ビット8〜15に、区画番号格納レジスタ201に予め設定してある自己の所属する区画の値を設定した後、アドレスデータバス101に主記憶トランザクションを送信する。また各プロセッサはアドレスデータバス101を流れる主記憶トランザクションをコマンドレジスタ203で受信し、コマンドデコーダ204で命令をデコードした際に、障害・停止命令のコマンドコードである3(H)であった場合は、アドレスデータレジスタ202のビット8〜15で与えられる停止対象とする区画番号と自プロセッサの区画番号設定レジスタ201の値を比較する。この両者が一致した場合に、障害・停止命令を受信したプロセッサは自分自身を障害・停止状態に移行させる。
【0036】
一方、各区画から共通に使用される主記憶装置400は、メモリリード命令とメモリライト命令のみをデコードする。したがって主記憶装置400のバス制御部で障害・停止命令を受信しても、区画共有装置である主記憶装置400は障害・停止状態とはならない。
【0037】
次に本発明の障害・停止状態への移行処理について説明する。図4は本発明を説明するに当たって使用する一バスプロトコルのタイミング図である。
本バスプロトコルでは1つの主記憶トランザクションは8つのステージ(段階)で構成されている。即ちバスの獲得要求ステージREQ(request)、バスの調停ステージARB(arbitration)、バスの同期ステージSYN(syncronize)アドレス送出ステージADR(address)、トランザクションの取消ステージCAN(cancel)、データの前半1/2の送出ステージDT0(data0)、データの後半1/2の送出ステージDT1(data1)、パリティエラー等の検出報告ステージCHK(check)、の8つである。
【0038】
これらのステージ同士は場合によって同一のハードウェア資源を共用しても動作上問題とならないので、1つの主記憶トランザクションの途中から次のトランザクションを実行することが可能である(パイプライン構造)。例えばステージ1のバスの獲得要求REQでは図2のアドレスデータレジスタ202に引数が格納されるが、ステージ4のアドレス送出ADRではアドレスデータレジスタ202に主記憶アクセスのためのアドレス情報が格納される。また前記のアドレス情報に対して主記憶装置400が書き込みまたは読み込みデータを準備するまでの間に時間差があるため、2ステージ後のステージ6データ送出DT0で書き込み/読み込みデータの前半1/2が、続くステージ7データ送出DT1で書き込み/読み込みデータの後半1/2がアドレスデータレジスタ202に格納される。
【0039】
この時ステージ1〜4とステージ5〜8を重ね合わせて実行しても、アドレスデータレジスタ202に格納されるステージ1の引数、ステージ4のアドレス、ステージ6、7のデータは同一のタイミングでアドレスデータレジスタ202を使用することがないので、ステージ1〜4が終了した時点で次の主記憶トランザクションを実行し始めても支障はない。この様に重ね合わせが可能なステージをステート(状態)と呼び、ステートの繰り返しの単位をサイクルと呼ぶ。
【0040】
図4に示すバスプロトコルの場合、ステートAはステージ1のREQとステージ5のCANで、ステートBはステージ2のARBとステージ6のDT0で、ステートCはステージ3のSYNとステージ7のDT1で、ステートDはステージ4のADRとステージ8のCHKで構成されており、ステートA〜Dの4ステートで1バスサイクルを形成している。
【0041】
図5は区画1に所属する演算プロセッサ210で障害を検出し、同じ区画1に所属する演算プロセッサ200が障害・停止状態へ移行するまでのバス動作を表したタイミング図である。
【0042】
演算プロセッサ200はトランザクション1に従って主記憶装置400へのメモリライト命令を実行中であり。この時ステージ1〜4の間に演算プロセッサ210が障害を検出し、区画1を障害・停止状態に移行させる必要が生じたものとする。演算プロセッサ210はステージ5から始まるトランザクション2で障害・停止命令を実行する。
【0043】
演算プロセッサ210はステージ5でバスの獲得要求を行う際に、アドレスデータバス101に対して障害・停止命令のコマンドコードと停止させるべき区画番号を送出する。同一区画に所属する演算プロセッサ200では、プロセッサバスに送出された命令が障害・停止命令であることを認識し、自己の区画番号と比較した結果同一であるので、ステージ5のタイミングでプロセッサのバス制御部以外の部位を機能停止させる。この時、演算プロセッサ200のバス制御部は、先行する主記憶トランザクション1のメモリライト命令を実行中であるので、トランザクションの実行途中でバス動作の停止を行うと続くステージ6、7の書き込みデータが不定となり主記憶のデータ化けが発生する。
【0044】
本発明の第一実施例では、演算プロセッサ200のバス動作を他の区画に影響のないところまで実行した後、障害・停止状態に移行する様に作用する。したがって、演算プロセッサ200は主記憶トランザクション1をステージ8のSYNまで実行し、初めてバス制御部を障害停止状態に移行させる。これにより主記憶装置400内のデータはデータ化けを起こすことなく、正常な状態で保持される。
【0045】
一方、区画2に所属する演算プロセッサ230は、ステージ9から始まる主記憶トランザクション3でメモリリード命令を実行しようとしている。演算プロセッサ230においてもステージ5の演算プロセッサ210が要求した障害・停止命令をデコードするが、こちらはアドレスデータレジスタ202に障害・停止命令の引数として格納された区画番号と、演算プロセッサ230の論理区画番号格納レジスタ201の値が不一致となるので、障害・停止状態とはならず、ステージ9から正常にメモリリード命令を実行する。
【0046】
また、仮に演算プロセッサ200がトランザクション1によって書き込みを行った主記憶アドレスから、演算プロセッサ230がデータを読み出したとしても、トランザクション1は正常に終了しているので、演算プロセッサ230の読み出しデータはデータ化けを起こすことなく、正常な状態で区画2の運用が継続される。
【0047】
本発明の第二の実施形態では、障害・停止命令の引数として使用されるアドレスデータレジスタ202の区画番号設定フィールドに設定する区画番号として、情報処理装置内の全プロセッサを停止させることを目的とした同報区画番号を定義している。図3に示す例では、アドレスデータバスで受け渡される障害・停止命令の引数の内、ビット8〜15にFF(H)を設定した場合がこれに当たる。
【0048】
障害・停止状態に至る動作を詳細に説明すると、何れかのプロセッサが障害となりその障害が情報処理装置全体に影響するものであった場合には、障害となったプロセッサはコマンドレジスタ203に障害・停止命令のコマンドコードである3(H)を設定すると共に、アドレスデータレジスタ202のビット0〜7に自プロセッサ固有の識別番号を、ビット8〜15に同報通知を表す区画番号であるFF(H)を設定した後、アドレスデータバス101に主記憶トランザクションを送信する。
【0049】
一方、主記憶トランザクションを受信するプロセッサでは、アドレスデータバス101を流れる主記憶トランザクションをコマンドレジスタ203で受信し、コマンドデコーダ204で命令をデコードした際に障害・停止命令のコマンドコードである3(H)であった場合は、アドレスデータレジスタ202のビット8〜15で与えられる対象区画番号を参照する。この時演算プロセッサ200〜240と入出力プロセッサ300〜320に内蔵する区画番号格納レジスタ201には、自己の所属する区画番号が事前にが設定されているが、アドレスデータレジスタ202で与えられた対象区画番号が同報通知を表すFF(H)であった場合は、区画番号設定レジスタ201の値との比較を実施することなく自プロセッサを障害・停止状態に遷移させる。
【0050】
次に本発明の第二の実施形態について、動作を詳細に説明する。
【0051】
図6は区画1に所属する演算プロセッサ210で障害を検出し、障害状態を波及させる範囲が情報処理装置全体に及ぶと判断した場合の、障害・停止状態へ移行するまでのバス動作を表したタイミングチャートである。
【0052】
演算プロセッサ200はトランザクション1に従って主記憶装置400へのメモリライト命令を実行中であるとする。この時ステージ1〜4の間に演算プロセッサ210が障害を検出し、情報処理装置全体を障害・停止状態に移行させる必要が生じたとする。演算プロセッサ210はステージ5から始まるトランザクション2で障害・停止命令を実行する。
【0053】
演算プロセッサ210はステージ5でバスの獲得要求を行う際に、アドレスデータバス101に対して障害・停止命令のコマンドコードと全区画を表す同報区画番号を送出する。一方、演算プロセッサ200では、アドレスデータバス101に送出された命令をステージ5でコマンドレジスタ203に取り込み、コマンドデコーダ204で命令をデコードすることによって障害・停止命令であることを認識する。この時、演算プロセッサ200がアドレスデータレジスタ202から取り出した停止対象とすべき区画番号に同報区画番号が設定されている場合は、バス制御部を含めたプロセッサ全体を早急に障害・停止状態とすべく動作する。
【0054】
図6を参照すると、演算プロセッサ200はステージ5においてトランザクションの取消処理CANを実行中であるが、同報区画番号による障害・停止命令を受信したので、続くステージ6データの前半1/2の送出処理DT0、ステージ7データの後半1/2の送出処理DT1、ステージ8パリティエラー等の検出報告処理CHKの3つを実行することなく、演算プロセッサ200のバス制御を含めた機能を停止させる。
【0055】
また、区画2に所属する演算プロセッサ230も、ステージ9から始まる主記憶トランザクション3においてメモリリード命令を実行しようとしているが、こちらもステージ5において演算プロセッサ200と同様に障害・停止命令をデコードし、障害・停止命令の引数として与えられた区画番号が同報区画番号であるので、ステージ9からのメモリリード命令を実行することなく、演算プロセッサ230の機能を停止する。
【0056】
本発明の第二の形態では、第一の形態より更に3ステージ早いタイミングで、バス制御部の状態情報が保持できることになる。
【0057】
【発明の効果】
本発明の第1の効果は、論理分割方式の情報処理装置において、特定の論理区画のみを選択的に障害・停止状態に移行させるための機構を、専用の信号線を使用することなく少ないハードウェア信号線で実現できることにある。これは、障害・停止指示用の信号線に替わって主記憶トランザクションの1つとしてプロセッサの障害・停止命令を定義することによって、プロセッサが通常有するアドレスデータバスを使用して障害・停止状態を通知し、障害・停止指示用の信号線を削減が可能になることによる。
【0058】
第2の効果は、情報処理装置全体に関わる障害が発生した場合に、障害発生時点からより早い時期に障害・停止状態へ移行可能とすることで、障害解析のために有用なレジスタ情報やトレース情報の破壊が進行することを防ぐことができることにある。これは、障害・停止命令の引数として特定の区画を障害・停止とさせるための区画番号と、全区画を障害・停止とさせるための同報区画番号を使い分けることによって、バス制御動作を停止させるタイミングを選択していることによる。
【図面の簡単な説明】
【図1】本発明の実施の形態を表す構成図である。
【図2】本発明の実施例を表すバス制御部の詳細ブロック図である。
【図3】本発明の実施例を表す主記憶トランザクションの命令体系図である。
【図4】本発明の実施例を表すバスプロトコルのタイミング図である。
【図5】本発明の第一実施形態のバス動作を表すタイミング図である。
【図6】本発明の第二実施形態のバス動作を表すタイミング図である。
【図7】従来技術の実施例を表すバス制御部の詳細ブロック図である。
【符号の説明】
100 プロセッサ間バス
200、210、220、230、240 演算プロセッサ
300、310、320 入出力プロセッサ
400 主記憶装置
101 アドレスデータバス
102 障害・停止信号線
201 論理区画番号格納レジスタ
202 アドレスデータレジスタ
203 コマンドレジスタ
204 コマンドデコーダ
205 割り込み制御回路
206 ロード/ストア制御回路
207 プロセッサ停止指示信号線
208 プロセッサアドレスデータ信号線
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to failure processing of an information processing apparatus, and more particularly to a control method of a logical partitioning system in tightly coupled connection.
[0002]
[Prior art]
When the information processing apparatus becomes a failure, the system operation needs to be stopped depending on the degree of the failure. There are two main reasons for stopping system operation. One is due to software. In many cases, an abnormality is detected in a specific process or job, and this process or job is a process that becomes the system core. If this happens, the system must be stopped. Since such a failure is not caused by a hardware failure, it is remedied by reviewing the cause of the failure from the viewpoint of software and executing a system restart.
[0003]
The other failure is due to hardware factors, and occurs due to a failure of the system core processor, etc., and repairs the failure generation device or reduces the failure part and restarts the system. To do.
[0004]
A large-scale information processing apparatus such as a general-purpose computer has a log function as a countermeasure against the above-mentioned software / hardware failure in order to easily analyze the content of the failure and identify the suspected component from the occurrence of the failure. The log function for countermeasures against hardware failure includes a register dump function and an execution trace function.
[0005]
It is desirable that such hardware log collection is performed as soon as possible from the time of failure occurrence. The reason is that as the contents of the register dump information and the trace information elapse from the failure occurrence point, the state changes and the accuracy as a log is lost. The simplest and most effective method for transitioning the information processing device to the fault / stop state is to connect the processors to be logged with hardware-wired fault / stop signal lines and use either processor. By activating this signal line when an abnormality is detected, the entire information processing apparatus is shifted to a fault / stop state.
[0006]
With the recent development of multiprocessor technology, information processing apparatuses that perform system operations by connecting tens to hundreds of processors to the main memory have appeared in the tightly coupled apparatus. This type of information processing apparatus employs a logical partitioning system that divides a processor group into a necessary number according to the amount of business processing and operates one operating system for each processor group. The logical division is famous for PR / SM, a trademark of IBM (International Business Machines).
[0007]
In a logical partitioning system, when a processor is connected with a single failure / stop signal line, depending on the degree of failure, the logical partition that is not required to be blocked and that is properly operated is blocked. Therefore, to improve fault tolerance in a normal logical partitioning system, configure multiple information processing devices in a hot standby configuration, and continue system operation in the standby system even if a failure spreads to the entire active system Like.
However, with the spread of information technology, the work handled by computers has diversified, and there is an increasing need to operate a plurality of operating systems even in a small-scale system composed of a single information processing apparatus. On the other hand, there is an urgent need to improve the reliability of computers as mission-critical servers such as 24-hour operation. In this sense, the reliability of the information processing device alone is not an improvement in the reliability of a hot standby configuration. Improvement in technology is regarded as important.
FIG. 7 is a block diagram showing a detailed configuration of a conventional bus control unit.
The address data register 202 is connected to the address data bus 101 in the inter-processor bus 100 and exchanges data with other processor groups and the main storage device 400. The command register 203 is connected to the address data bus 101 in the inter-processor bus 100 and stores the attribute of the main memory transaction when data is exchanged between the other processor and the main memory 400. The command decoder 204 is connected to some bit fields of the command register 203 and the address data register 202, decodes the main memory transaction, and instructs various operations of the bus control device by a read instruction / write instruction and other control instructions. . The load / store control circuit 206 is connected to other functional units of the processor that performs operations and input / outputs through the processor address data signal line 208, and controls prefetch control of instructions and data used by the processor, read / write order control, cache Control and so on. The interrupt control circuit 205 is connected to another processor and the main storage device 400 via the failure / stop signal line 102 in the inter-processor bus 100, and activates the failure / stop signal line 102 when the own processor detects a failure. . In addition, when a failure occurs in another processor, a function of shifting the own processor to a failure / stop state by detecting activation of the failure / stop signal line 102 is provided. The bus control unit and other functional units of the processor stop functioning when the stop instruction signal line 207 is activated by the interrupt control circuit 205.
[0008]
[Problems to be solved by the invention]
As described above, it is desirable that the failure of each logical partition does not spread to other partitions as much as possible under logical division. However, if the method of connecting with the fault / stop signal lines is applied to the logical partitioning system, the maximum number of fault / stop signal lines is required. In recent years, with the high integration of LSIs, the amount of gates that can be taken into LSIs is increasing at an accelerated rate. However, the actual number of signal lines between the LSI and the board or between the processor and the processor cannot be increased due to physical mounting restrictions. From this point of view as well, it is necessary to reduce the number of signal lines that are not related to normal logic, such as failure / stop signal lines.
[0009]
An object of the present invention is to connect a plurality of processors to a main storage device by tight coupling, divide this processor group into a plurality of logical partitions in advance, and allocate and operate an operating system for each logical partition. In the system, when a failure occurs, control for selectively transitioning only a specific logical partition to a failure / stop state is realized without using a dedicated signal line.
[0010]
[Means for Solving the Problems]
According to the logical partitioning system control method of the present invention, a plurality of processors are connected to the main storage device by tight coupling, the processor group is divided into a plurality of logical partitions in advance, and an operating system is allocated to each logical partition. In the logical partitioning system to be operated, a step of receiving a transaction of the main storage device, a partition number to be stopped provided in a failure stop instruction defined as one of the transactions, and a preset one for each processor belong Comparing the partition number to be The main storage device transaction is divided into a plurality of stages so that the main storage transaction does not affect a processor operating normally in a different partition. The step of combining and repeating as one bus cycle, and if the comparison result matches, if the one bus cycle is being executed, it is completed and then the processor indicated by the partition number is shifted to the fault / stop state Step to make It is characterized by consisting of.
[0011]
The logical partitioning system control method according to the present invention further includes a step of defining a broadcast partition number corresponding to all partition designations as a partition number to be stopped provided in the failure stop command, and the broadcast partition number is When the set failure stop command is received, the plurality of processors Regardless of the current bus cycle The method is characterized by comprising the steps of immediately transitioning each to a fault stop state.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
Next, embodiments of the present invention will be described in detail with reference to the drawings.
[0013]
As shown in FIG. 1, in the present invention, arithmetic processors 200 to 240 and input / output processors 300 to 320 are connected to the main storage device 400 in a tightly coupled manner via an interprocessor bus 100.
[0014]
The arithmetic processors 200, 210, and 220 and the input / output processor 300 constitute one processor group called partition 1, and operate one operating system for this. Further, the processor 230 and the input / output processor 310 constitute one processor group, and this is used as a partition 2 to operate an operating system different from the partition 1. Similarly, the processor 240 and the input / output processor 320 constitute one processor group, and another operating system is also operated in this partition 3. The main storage device 400 is a partition sharing device that is referred to by all arithmetic processors and input / output processors in the information processing apparatus.
[0015]
Next, a detailed configuration of the bus control unit built in the arithmetic processors 200 to 240 and the input / output processors 300 to 320 will be described with reference to FIG. Note that description of the same processing as in the prior art is omitted.
[0016]
The partition number storage register 201 is a register that holds partition numbers to which the arithmetic processors 200 to 240 and the input / output processors 300 to 320 belong. The command decoder 204 is connected to some bit fields of the command register 203 and the address data register 202, decodes the main memory transaction, and instructs various operations of the bus control device by a read command / write command and other control commands.
The load / store control circuit 206 is connected to other functional units of the processor that performs operations and input / outputs by a processor address data signal line 208, and controls prefetch control of instructions and data used by the processor, read / write order control, and cache control. Etc. In response to an instruction from the command decoder 204, the interrupt control circuit 205 performs control for shifting the own processor to a fault / stop state.
[0017]
Hereinafter, an operation in the case where a fault is detected by the arithmetic processor 210 and the other arithmetic processors 200 and 220 to 240, the input / output processors 300 to 320, and the main storage device 400 are put into a fault / stop state will be described as an example.
[0018]
In the case of an information processing apparatus that does not use the logical partitioning method, the fault / stop signal line 102 is used to shift the entire information processing apparatus to the fault / stop state by the simplest method.
[0019]
In the prior art, the interrupt control circuit 205 of the arithmetic processor 210 that has detected a fault instructs the emergency stop of the information processing apparatus using the fault / stop signal line 102. And The basic operation is that the interrupt control circuit 205 of the other processor and the main storage device receives the signal and stops the processor function using the stop instruction signal line 207.
[0020]
But with logical partitioning Na When the control is performed, for example, when the failure propagation range of the arithmetic processor 210 is closed in the partition 1 in the partition 1 constituted by the arithmetic processors 200 to 220 and the input / output processor 300 in FIG. The operation processor 230 and the input / output processor 310 in the partition 2 and the operation processor 240 and the input / output processor 320 in the partition 3 are also stopped.
[0021]
Therefore, in the present invention, a partition number storage register 201 is provided in place of the failure / stop signal line 102. When a failure occurs in the processor 210 and the operating system operating on the partition 1 needs to be blocked as a system, the processor 210 transmits a failure in the partition 1 to which the own processor belongs via the inter-processor bus 100.・ A stop command is issued.
The failure / stop instruction is defined as one of main memory transactions such as a memory read instruction and a memory write instruction, and is transferred via the address data bus 101. The failure / stop instruction has a partition number as an argument in a part of the bit field of the address / data section. The processor 210 that needs to block the partition 1 sets a command code corresponding to the failure / stop instruction in the command register 203, sets a partition number corresponding to the partition 1 in the address data register 202, and stores data in the address data bus 101. Is sent to all processors under partition 1 to notify the failure / stop command. The data sent to the interprocessor bus 100 is also propagated to all the processors in the information processing apparatus and the main memory 400.
[0022]
In the arithmetic processors 200 belonging to the same partition 1, data is fetched by the command register 203 built in the bus control unit and transferred to the command decoder 204. If the decoded main memory transaction is a failure / stop instruction, the command decoder 204 holds in advance a part of the bit field data of the address data bus 101 fetched in the address data register 202 and the partition number storage register 201. Compared with the partition number to which the own processor belongs, if they match, the interrupt control circuit 205 is instructed to stop the function of the processor by the stop instruction signal line 207.
[0023]
What should be noted at this time is that even if functions other than the bus control unit of the arithmetic processor 200 become faulty / stopped and stop the operation, the bus control unit itself does not stop immediately. The bus control unit of the arithmetic processor 200 ends the access to the inter-processor bus 100 in a state where the bus operation is normal so as not to affect other partitions 2 and 3 that are normally operated on the system. It will be in the fault / stop state for the first time after being operated. Specifically, when the load / store control circuit 206 has not completed a write operation that affects other partitions, an operation for continuing the write operation or a cache built in the processor is stored in a write-in method (write back). In this case, a copy of the data in the main memory may be held in the cache, and the operation for performing the operation of flushing the cache contents to the main memory corresponds to this. .
[0024]
On the other hand, the failure / stop instruction issued from the arithmetic processor 210 is also notified to the processors belonging to the partition 2 and the partition 3 via the inter-processor bus 100. However, in these processors, the partition number set in the partition number storage register 201 and the partition number in the address data register 202 indicated by the failure / stop instruction decoded by the command decoder 204 do not match. No operation is performed for the stop command, and the subsequent operation is continued.
[0025]
Through the operations described above, the arithmetic processors 200, 210, 220 and the input / output processor 300 belonging to the partition 1 are operated by the arithmetic processor 230 and the input / output processor 310 belonging to the partition 2, and the arithmetic processor 240 and the input / output processor 320 belonging to the partition 3. Thus, it is possible to selectively set only the section 1 to the failure / stopped state without disturbing the operation.
[0026]
The present invention also has a broadcast communication function for bringing all processors in the information processing apparatus into a fault / stop state.
[0027]
This defines the broadcast partition number corresponding to all partitions as the value of the bit field indicating the logical partition number of the address / data part specified by the argument in the failure / stop instruction, and each processor assigns the broadcast partition number. When the failure / stop command set to is received, regardless of the operating state of the inter-processor bus 100, the own processor is immediately stopped to make it immediately into the failure / stop state.
[0028]
The difference from the failure / stop state transition means limited to the one partition is that the address data fetched into the address data register 202 by decoding the failure / stop instruction by the command decoder 204 of the bus controller built in each processor. If the data of the bus 101 is a broadcast partition number corresponding to all partitions, the interrupt control circuit 205 is instructed by the stop instruction signal line 207 regardless of the value of the logical partition number storage register 201 and the processor's After instructing the stop, the bus control unit itself stops the subsequent bus control operation. Specifically, the operation of the load / store control circuit 206 is stopped at that time, and the operation is forcibly stopped even when data being read or written remains in the load / store control circuit 206.
[0029]
The reason why the broadcast section number is defined and the bus control unit itself is also brought to an emergency stop is that the failure may be present in the bus control unit itself if the failure is a problem related to the entire information processing apparatus.
[0030]
The bus control unit in FIG. 2 uses the four command codes shown in FIG. 3 as the main memory transaction. That is, a memory read instruction (command code 0), a memory write instruction (command code 1), a lock instruction (command code 2), and a failure / stop instruction (command code 3). The memory write instruction is an instruction used when the arithmetic processors 200 to 240 and the input / output processors 300 to 320 write data to the main storage device 400. The memory read instruction is an instruction used when data is read from the main storage device 400 to the arithmetic processors 200 to 240 and the input / output processors 300 to 320. The lock instruction is an instruction used when exclusive control is required between the arithmetic processors 200 to 240. The failure / stop instruction is an instruction related to the present invention, which is used when the arithmetic processors 200 to 240 and the input / output processors 300 to 320 set the partition to which the processor belongs or the entire information processing apparatus to the failure / stop state. .
[0031]
The command code is composed of 4 bits and uses 4 signal lines of the address data bus 101. The command code is extracted from the address data bus 101 by the command register 203.
[0032]
In FIG. 3, the main memory transaction uses 32 signal lines of the address data bus 101 as arguments corresponding to the command code when a command is requested. This argument is extracted from the address data bus 101 by the address data register 202. The 32 signal lines used as arguments are also used for address transmission and data transmission / reception in the memory read command and memory write command.
[0033]
For all instructions, the identification number of the instruction source processor is stored in bits 0 to 7 of the argument indicated by the address data register 202. When the instruction is a lock instruction, the argument bits 8 to 15 indicate the lock type, and when the instruction is a failure / stop instruction, the argument bits 8 to 15 are set with a partition number to be in the failure / stop state.
[0034]
The partition number of the partition to be stopped is set in the partition number setting field (bits 8 to 15) of the argument used in the failure / stop instruction. In the case of the configuration of FIG. 1, the procedure is as follows. 01 (hexadecimal number, hereinafter referred to as “H”) representing the partition 1 is stored in the partition number storage register 201 built in the bus control unit of the arithmetic processors 200 to 220 and the input / output processor 300. Is set. Similarly, 02 (H) is stored in the partition number storage register 201 of the arithmetic processor 230 and the input / output processor 310 belonging to the partition 2, and the partition number storage register 201 of the arithmetic processor 240 and the input / output processor 320 belonging to the partition 3 is stored in the partition number storage register 201. 03 (H) is set.
[0035]
When a processor belonging to the partition becomes faulty in any partition and other processors belonging to the same partition are put into a failure / stop state, the command register 203 is set to 3 (H) as the command code of the failure / stop instruction. After setting, the identification number unique to the own processor is set in bits 0 to 7 of the address data register 202, and the value of the partition to which the self belongs is preset in the partition number storage register 201 in bits 8 to 15. The main memory transaction is transmitted to the address data bus 101. When each processor receives the main memory transaction flowing through the address data bus 101 by the command register 203 and decodes the instruction by the command decoder 204, the command code of the failure / stop instruction is 3 (H). The partition number to be stopped given by bits 8 to 15 of the address data register 202 is compared with the value of the partition number setting register 201 of the own processor. When the two match, the processor that has received the failure / stop instruction shifts itself to the failure / stop state.
[0036]
On the other hand, the main storage device 400 commonly used by each partition decodes only the memory read instruction and the memory write instruction. Therefore, even if the bus control unit of the main storage device 400 receives the failure / stop command, the main storage device 400 that is the partition sharing device does not enter the failure / stop state.
[0037]
Next, the transition process to the fault / stop state of the present invention will be described. FIG. 4 is a timing diagram of one bus protocol used in explaining the present invention.
In this bus protocol, one main memory transaction is composed of eight stages. That is, a bus acquisition request stage REQ (request), a bus arbitration stage ARB (arbitration), a bus synchronization stage SYN (synchronize) address transmission stage ADR (address), a transaction cancellation stage CAN (cancel), and the first half of data 1 / There are eight transmission stages DT0 (data0), transmission stage DT1 (data1) of the latter half of the data, and detection report stage CHK (check) such as a parity error.
[0038]
Even if these stages share the same hardware resource in some cases, there is no problem in operation, so that the next transaction can be executed from the middle of one main memory transaction (pipeline structure). For example, in the stage 1 bus acquisition request REQ, arguments are stored in the address data register 202 of FIG. 2, but in the address transmission ADR in stage 4, address information for main memory access is stored in the address data register 202. In addition, since there is a time lag before the main storage device 400 prepares write or read data for the address information, the first half of the write / read data in the stage 6 data transmission DT0 after two stages In the subsequent stage 7 data transmission DT 1, the second half of the write / read data is stored in the address data register 202.
[0039]
At this time, even if the stages 1 to 4 and the stages 5 to 8 are executed in an overlapping manner, the arguments of the stage 1 stored in the address data register 202, the addresses of the stage 4 and the data of the stages 6 and 7 are addressed at the same timing. Since the data register 202 is not used, there is no problem even if the next main storage transaction starts to be executed when the stages 1 to 4 are completed. A stage that can be overlapped in this way is called a state, and a unit of state repetition is called a cycle.
[0040]
In the case of the bus protocol shown in FIG. 4, state A is REQ of stage 1 and CAN of stage 5, state B is ARB of stage 2 and DT0 of stage 6, and state C is SYN of stage 3 and DT1 of stage 7. The state D is composed of the ADR of the stage 4 and the CHK of the stage 8, and one bus cycle is formed by the four states A to D.
[0041]
FIG. 5 is a timing diagram showing a bus operation until the arithmetic processor 210 belonging to the partition 1 detects a failure and the arithmetic processor 200 belonging to the same partition 1 shifts to the failure / stop state.
[0042]
The arithmetic processor 200 is executing a memory write command to the main memory 400 according to the transaction 1. At this time, it is assumed that the arithmetic processor 210 detects a failure during the stages 1 to 4 and needs to shift the partition 1 to the failure / stop state. The arithmetic processor 210 executes a failure / stop instruction in the transaction 2 starting from the stage 5.
[0043]
When the arithmetic processor 210 makes a bus acquisition request in stage 5, it sends a command code of a failure / stop instruction and a partition number to be stopped to the address data bus 101. The arithmetic processor 200 belonging to the same partition recognizes that the instruction sent to the processor bus is a failure / stop instruction, and is the same as a result of comparison with its own partition number. The parts other than the control unit are stopped. At this time, since the bus control unit of the arithmetic processor 200 is executing the memory write instruction of the preceding main memory transaction 1, if the bus operation is stopped during the execution of the transaction, the write data of the subsequent stages 6 and 7 will be stored. It becomes indefinite and data in the main memory is corrupted.
[0044]
In the first embodiment of the present invention, after the bus operation of the arithmetic processor 200 is executed to the point where there is no influence on other partitions, the operation is performed so as to shift to the failure / stop state. Therefore, the arithmetic processor 200 executes the main memory transaction 1 up to SYN in stage 8 and shifts the bus control unit to the fault stop state for the first time. As a result, the data in the main storage device 400 is held in a normal state without causing garbled data.
[0045]
On the other hand, the arithmetic processor 230 belonging to the partition 2 intends to execute a memory read instruction in the main memory transaction 3 starting from the stage 9. The arithmetic processor 230 also decodes the failure / stop instruction requested by the arithmetic processor 210 of stage 5, which is a partition number stored as an argument of the failure / stop instruction in the address data register 202 and a logical partition of the arithmetic processor 230. Since the values in the number storage register 201 do not match, the memory read instruction is normally executed from the stage 9 without being in a failure / stop state.
[0046]
Further, even if the arithmetic processor 230 reads data from the main memory address written by the arithmetic processor 200 in the transaction 1, the transaction 1 is normally completed, so the read data of the arithmetic processor 230 is garbled. The operation of the section 2 is continued in a normal state without causing any trouble.
[0047]
The second embodiment of the present invention aims to stop all the processors in the information processing apparatus as the partition number set in the partition number setting field of the address data register 202 used as an argument of the failure / stop instruction. Defined broadcast section number. In the example shown in FIG. 3, this corresponds to the case where FF (H) is set in bits 8 to 15 in the argument of the failure / stop instruction delivered via the address data bus.
[0048]
The operation up to the failure / stop state will be described in detail. If any processor fails and the failure affects the entire information processing apparatus, the failed processor stores a failure The stop instruction command code 3 (H) is set, the identification number unique to the own processor is set in bits 0 to 7 of the address data register 202, and the FF (partition number indicating broadcast notification is set in bits 8 to 15). After setting (H), the main memory transaction is transmitted to the address data bus 101.
[0049]
On the other hand, in the processor that receives the main memory transaction, the main memory transaction flowing through the address data bus 101 is received by the command register 203, and when the command is decoded by the command decoder 204, the command code 3 (H ), The target partition number given by bits 8 to 15 of the address data register 202 is referred to. At this time, the partition number storage register 201 built in the arithmetic processors 200 to 240 and the input / output processors 300 to 320 is set in advance with the partition number to which it belongs, but the object given by the address data register 202 If the partition number is FF (H) indicating the broadcast notification, the processor is shifted to the fault / stop state without performing comparison with the value of the partition number setting register 201.
[0050]
Next, the operation of the second embodiment of the present invention will be described in detail.
[0051]
FIG. 6 illustrates a bus operation until the failure / stop state is entered when it is determined that the operation processor 210 belonging to the partition 1 detects a failure and the range in which the failure state is propagated covers the entire information processing apparatus. It is a timing chart.
[0052]
It is assumed that the arithmetic processor 200 is executing a memory write command to the main storage device 400 according to the transaction 1. At this time, it is assumed that the arithmetic processor 210 detects a failure during stages 1 to 4 and the entire information processing apparatus needs to be shifted to the failure / stop state. The arithmetic processor 210 executes a failure / stop instruction in the transaction 2 starting from the stage 5.
[0053]
When the arithmetic processor 210 makes a bus acquisition request in stage 5, it sends a command code of a failure / stop instruction and a broadcast partition number indicating all partitions to the address data bus 101. On the other hand, the arithmetic processor 200 recognizes the failure / stop instruction by fetching the instruction sent to the address data bus 101 into the command register 203 at stage 5 and decoding the instruction by the command decoder 204. At this time, when the broadcast partition number is set to the partition number to be stopped, which is fetched from the address data register 202 by the arithmetic processor 200, the entire processor including the bus control unit is immediately set in the failure / stop state. It works as much as possible.
[0054]
Referring to FIG. 6, the arithmetic processor 200 is executing the transaction cancel processing CAN in the stage 5, but has received a failure / stop command based on the broadcast partition number, and therefore sends out the first half of the subsequent stage 6 data. The functions including the bus control of the arithmetic processor 200 are stopped without executing the process DT0, the transmission process DT1 of the latter half of the stage 7 data, and the detection report process CHK such as the stage 8 parity error.
[0055]
The arithmetic processor 230 belonging to the partition 2 is also trying to execute a memory read instruction in the main memory transaction 3 starting from the stage 9, but this also decodes the failure / stop instruction in the same manner as the arithmetic processor 200 in the stage 5, Since the partition number given as the argument of the failure / stop instruction is the broadcast partition number, the function of the arithmetic processor 230 is stopped without executing the memory read instruction from the stage 9.
[0056]
In the second mode of the present invention, the status information of the bus control unit can be held at a timing three stages earlier than the first mode.
[0057]
【The invention's effect】
The first effect of the present invention is that in a logical partitioning type information processing apparatus, a mechanism for selectively shifting only a specific logical partition to a failure / stop state is reduced without using a dedicated signal line. It can be realized by a wear signal line. This is because the failure / stop instruction of the processor is defined as one of the main memory transactions instead of the signal line for instructing the failure / stop, and the failure / stop state is notified using the address data bus that the processor normally has. This is because it is possible to reduce the number of signal lines for fault / stop instructions.
[0058]
The second effect is that register information and traces useful for failure analysis can be obtained by making it possible to shift to a failure / stop state at an earlier time from the failure occurrence point when a failure relating to the entire information processing apparatus occurs. This is to prevent the destruction of information from proceeding. This is because the bus control operation is stopped by using the partition number for making a specific partition failed / stopped and the broadcast partition number for making all partitions failed / stopped as arguments of the failure / stop command. By selecting the timing.
[Brief description of the drawings]
FIG. 1 is a configuration diagram illustrating an embodiment of the present invention.
FIG. 2 is a detailed block diagram of a bus control unit representing an embodiment of the present invention.
FIG. 3 is an instruction system diagram of a main memory transaction representing an embodiment of the present invention.
FIG. 4 is a bus protocol timing diagram representing an embodiment of the present invention.
FIG. 5 is a timing chart showing a bus operation according to the first embodiment of this invention.
FIG. 6 is a timing chart showing a bus operation according to the second embodiment of the present invention.
FIG. 7 is a detailed block diagram of a bus control unit representing an embodiment of the prior art.
[Explanation of symbols]
100 Interprocessor bus
200, 210, 220, 230, 240 arithmetic processor
300, 310, 320 I / O processor
400 Main memory
101 Address data bus
102 Fault / stop signal line
201 Logical partition number storage register
202 Address data register
203 Command register
204 Command decoder
205 Interrupt control circuit
206 Load / store control circuit
207 Processor stop instruction signal line
208 Processor address data signal line

Claims (2)

主記憶装置に対して複数のプロセッサを密結合で接続し、このプロセッサ群をあらかじめ複数の論理区画に分割し、前記論理区画ごとにオペレーティングシステムを割り付けて運用する論理分割システムにおいて、前記主記憶装置のトランザクションを受信するステップと、該トランザクションの1つとして定義される障害停止命令中に設けた停止対象区画番号とプロセッサごとにあらかじめ設定された自らが所属する区画番号とを比較するステップと、前記主記憶装置のトランザクションが異区画で正常動作しているプロセッサに影響を与えないように、該主記憶装置のトランザクションを複数のステージに分割し、同一のハードウェア資源を共用可能なもの同士を一つのバスサイクルとして結合して繰り返すステップと、前記比較結果が一致した場合に前記一つのバスサイクルを実行中であればこれを全うしてから前記区画番号により示されるプロセッサを障害・停止状態に遷移させるステップとによりなることを特徴とする論理分割システムの制御方法。In a logical partitioning system in which a plurality of processors are tightly coupled to a main storage device, the processor group is divided into a plurality of logical partitions in advance, and an operating system is assigned to each logical partition for operation, the main storage device A step of receiving the transaction of the above , a step of comparing the partition number to be stopped provided in the failure stop instruction defined as one of the transactions and a partition number to which the processor belongs in advance set for each processor, The main storage device transaction is divided into a plurality of stages so that the main storage device transaction does not affect a processor operating normally in a different partition. Combining and repeating as one bus cycle, and the comparison result Control logic partitioning system characterized by comprising by the steps of shifting the long execution in the one bus cycle when match after fulfilling this processor indicated by the partition number in fault-stopped state Method. 前記障害停止命令中に設けた停止対象とすべき区画番号に全区画指定に対応する同報区画番号を定義するステップと、前記同報区画番号が設定された障害停止命令を受信した場合に、前記複数のプロセッサはその時点のバスサイクルに依らず、即座に各々を障害停止状態に遷移させるステップからなることを特徴とする、請求項1記載の論理分割システムの制御方法。A step of defining a broadcast partition number corresponding to all partition designations in a partition number to be a stop target provided in the failure stop command, and a failure stop command in which the broadcast partition number is set, 2. The method of controlling a logical partitioning system according to claim 1, further comprising the step of causing each of the plurality of processors to immediately transition each to a fault stop state regardless of a current bus cycle .
JP2001027757A 2001-02-05 2001-02-05 Control method of logical partitioning system Expired - Fee Related JP3746957B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001027757A JP3746957B2 (en) 2001-02-05 2001-02-05 Control method of logical partitioning system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001027757A JP3746957B2 (en) 2001-02-05 2001-02-05 Control method of logical partitioning system

Publications (2)

Publication Number Publication Date
JP2002229811A JP2002229811A (en) 2002-08-16
JP3746957B2 true JP3746957B2 (en) 2006-02-22

Family

ID=18892362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001027757A Expired - Fee Related JP3746957B2 (en) 2001-02-05 2001-02-05 Control method of logical partitioning system

Country Status (1)

Country Link
JP (1) JP3746957B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4529767B2 (en) * 2005-04-04 2010-08-25 株式会社日立製作所 Cluster configuration computer system and system reset method thereof
WO2007096999A1 (en) * 2006-02-24 2007-08-30 Fujitsu Limited Separating device and separating method
JP4653838B2 (en) * 2006-02-28 2011-03-16 富士通株式会社 Arithmetic processing device, control method of arithmetic processing device, and control program
WO2008120383A1 (en) * 2007-03-29 2008-10-09 Fujitsu Limited Information processor and fault processing method
EP2302524B1 (en) 2008-06-02 2019-01-23 Fujitsu Limited Data processing system, data processing method, and data processing program

Also Published As

Publication number Publication date
JP2002229811A (en) 2002-08-16

Similar Documents

Publication Publication Date Title
US5193181A (en) Recovery method and apparatus for a pipelined processing unit of a multiprocessor system
US20080126718A1 (en) Method And Device For Monitoring A Memory Unit In A Mutliprocessor System
EP1760559B1 (en) Method and apparatus for synchronizing an industrial controller with a redundant controller
US5621885A (en) System and method for providing a fault tolerant computer program runtime support environment
US5640508A (en) Fault detecting apparatus for a microprocessor system
JPH01152543A (en) Defect resistance computer system having defect separating and repairing function
EP0372751B1 (en) Pipelined data-processing apparatus
WO2020239060A1 (en) Error recovery method and apparatus
US20040216003A1 (en) Mechanism for FRU fault isolation in distributed nodal environment
US7966536B2 (en) Method and apparatus for automatic scan completion in the event of a system checkstop
JP3746957B2 (en) Control method of logical partitioning system
CN100511167C (en) Method and device for monitoring memory cell of multiprocessor system
JP3526031B2 (en) Data transfer device
JP3434735B2 (en) Information processing system and fault handling method used for it
US7243257B2 (en) Computer system for preventing inter-node fault propagation
JP3317776B2 (en) Information processing device
JPS6113626B2 (en)
WO2023030013A1 (en) Data processing method and apparatus
US5182754A (en) Microprocessor having improved functional redundancy monitor mode arrangement
JPH0498326A (en) Microprocessor
JP2002215471A (en) Memory port, storage device and information processing system
JPH03209523A (en) Detection system for error of instruction data
JPH03228189A (en) Microprocessor
JPS6146535A (en) Pseudo error setting control system
JPH10214207A (en) Information processing system

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050222

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050307

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051125

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3746957

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081202

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081202

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091202

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091202

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101202

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111202

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111202

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121202

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121202

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131202

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees