JP2009205427A - 情報処理システム、リソース診断方法、および診断管理プログラム - Google Patents

情報処理システム、リソース診断方法、および診断管理プログラム Download PDF

Info

Publication number
JP2009205427A
JP2009205427A JP2008046903A JP2008046903A JP2009205427A JP 2009205427 A JP2009205427 A JP 2009205427A JP 2008046903 A JP2008046903 A JP 2008046903A JP 2008046903 A JP2008046903 A JP 2008046903A JP 2009205427 A JP2009205427 A JP 2009205427A
Authority
JP
Japan
Prior art keywords
diagnostic
partition
diagnosis
cell
card
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008046903A
Other languages
English (en)
Other versions
JP5251165B2 (ja
Inventor
Hideyuki Wada
英之 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008046903A priority Critical patent/JP5251165B2/ja
Publication of JP2009205427A publication Critical patent/JP2009205427A/ja
Application granted granted Critical
Publication of JP5251165B2 publication Critical patent/JP5251165B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Hardware Redundancy (AREA)

Abstract

【課題】リソースの追加/交換に際して、運用に組み入れる前に稼動状態の相互接続手段を共用しながらリソースの診断が可能なシステム、診断方法、プログラムを提供する。
【解決手段】オンラインで追加又は交換したリソースに対して診断パーティションP1に組み込んで事前診断を実施した後に運用パーティションP0に組み入れ可能とした情報処理システム。診断動作中は、診断パーティションP1は、診断専用I/Oカード35,診断専用セル15と、運用パーティションP0から切り離して組み入れた少なくとも診断対象セル12又は診断用のメモリマップドI/O空間又はI/O空間をその内部に有するI/Oブリッジ23を伴った診断対象I/Oカード33とを構成要素とし、運用パーティションP0との相互干渉を排して診断を行なう構成とした。
【選択図】図1

Description

本発明は、情報処理システムの部品等のリソースの診断に関するものであり、特にオンライン(活線状態)での部品の追加・交換時において事前に行なうようにした情報処理システム、リソース診断方法、および診断管理プログラムに関する。
従来より、情報処理システムにおいては、CPU(中央処理装置)と主メモリを構成単位とするセル(CELL)やI/Oカード等の部品を追加又は修理・交換をする時には、オフラインで行い、その後オフライン診断用プログラムによって診断を実施した後に、システムを立ち上げることによって、それら部品のシステムへの組み込みを実施していた。このため、部品の追加や故障部品の交換を実施するためにはシステムの停止が必要であった。
近年、このシステム停止の問題を回避するために、オンライン(活線状態)での部品の追加や故障部品の交換が実現されてきている。しかし、この場合、POST(Power On Self Test:オンラインでの自己診断)のみを実行して、追加・交換部品をシステムに組み込む前に十分な動作検証を実施しないまま、運用中のシステムに組み込むのが常であり、このため、組み込み直後にシステム障害が発生しやすいという不都合があった。
これに対し、組み込み前に事前診断を十分行なうコンピュータシステムの診断方法が知られている(特許文献1)。
この場合、この特許文献1におけるコンピュータシステムは、図5に示すように、ハードウェアコア部(CPU、メモリ、電源等)100、周辺装置用制御回路200、周辺装置用接続スイッチ400、周辺装置600、I/Oバス制御回路300、I/Oバス接続スイッチ500、及びI/Oカード700を備えて構成されている。
そして、ソフトウェアとしては、メインOS800、サブOS900を搭載でき、電源を入れたまま、ハードウェアの修理、交換、増設可能になっており、修理、交換、増設されたハードウェアをメインOS800から切り離し、メインOS800が通常の処理を実行している状態で、サブOS900によって、修理、交換、増設されたハードウェアの動作を確認した後、上記ハードウェアの制御をメインOS800の制御に引き渡すようにしたものである(ここで、図5中の符号は特許文献1に記載された符号を一部変更している)。かかる構成により、ハードウェアの修理、交換、増設時においても信頼性を向上させ、かつ、ノンストップ運転が可能になるとされている。
特開2002−366375号公報
しかしながら、上記特許文献1の図(図5参照)及び本文の記載からは、この診断技術の核になるメインOS800とサブOS900の同時動作時における分離の方法等が具体的に記載されておらず、概念的な提案にとどまっている。
このため、オンライン状態で部品の新規実装や故障部品の交換は実施されるがこれら部品に対する事前の十分な診断方法は確立しておらず、これがため、時には運用中のシステムに組み込んだ直後に障害が発生してシステムが停止という不都合が生じていた。
また、システム構成によっては、診断対象の各リソースに対して診断用信号パスを信号バス等の相互接続手段とは別に設けるものもあり、診断用信号パスに稼動状態と同じ十分な負荷を与えた診断が出来なかったり、稼動状態の信号バス部分等の相互接続手段を含めた診断ができないという問題もあった。
(発明の目的)
本発明は、上記問題に鑑み、オンラインでの部品の追加、交換に際して運用システムに影響を及ぼさないでこれら部品の事前診断を有効になし得る情報処理システム、リソース診断方法および診断管理プログラムを提供することを、その目的とする。
上記目的を達成するため、本発明に係る情報処理システムは、プロセッサ及びメモリを備えた1又は2以上のセルとこの各セルに対する入出力を選択的に実行する複数のI/Oカードとを、この各I/Oカードに対応して装備された複数のI/Oブリッジ並びに共通の相互接続手段とを介して接続して運用パーティションが構成されて成る情報処理システムであって、前記セルおよび前記I/Oカードの追加又は修理交換をオンラインで行なった後の正常動作の確認診断に際しては、当該追加又は修理交換した診断対象のセル,診断対象のI/Oカード,又はこのI/Oカードに接続制御しているI/Oブリッジに対して、診断専用のセル及び診断専用のI/Oカードを、前記各I/Oカードに対応して装備されたI/Oブリッジおよび共通の相互接続手段を介して接続することにより診断パーティションを構成する。
そして、この診断パーティションの前記診断対象セル及び前記診断用セルのメモリ領域を、前記運用パーティションからのアクセスを受け付けない領域として予め特定されたメモリ領域に設けると共に、前記I/OブリッジのI/O空間を予め設定された診断用I/O空間に配置して、前記運用パーティションとは独立して前記診断対象セル及び診断対象I/Oカードを診断可能な状態に設定したことを特徴とする。
また、上記目的を達成するため、本発明に係るリソース診断方法は、プロセッサ及びメモリを備えた1又は2以上のセルと当該各セルに対する入出力を選択的に実行する複数のI/Oカードとを、この各I/Oカードに対応して装備された複数のI/Oブリッジ並びに共通の相互接続手段とを介して接続し、これにより運用パーティションが構成された情報処理システムにあって、前記セルおよび前記I/Oカードの追加又は修理交換をオンラインで行なった後の正常動作の確認診断を行うリソース診断方法において、オンラインで追加又は修理交換した診断対象セル,診断対象I/Oカード,及びこのI/Oカードに対応するI/Oブリッジと、新たに装備した診断用セル及び診断専用I/Oカードとにより、診断パーティションを形成する診断パーティション構築工程と、この構築された診断パーティションに基づいて且つ前記診断対象セル及び診断用セルが前記運用パーティションからのアクセスを受け付けない状態に設定すると共に当該設定状態を維持しつつ当該診断対象の正常動作確認診断を行なう診断工程と、前記診断用セルによる正常動作確認後に前記診断対象セル,前記診断対象I/Oカード及び前記I/Oブリッジを前記診断パーティションから解放し、前記運用パーティションへ組み込む組込み工程と、を備えたことを特徴とする。
更に、上記目的を達成するため、本発明に係る診断管理用プログラムは、プロセッサ及びメモリを備えた1又は2以上のセルと当該各セルに対する入出力を選択的に実行する複数のI/Oカードとを、この各I/Oカードに対応して装備された複数のI/Oブリッジ並びに共通の相互接続手段とを介して接続し、これにより運用パーティションが構成された情報処理システムにあって、前記セルおよび前記I/Oカードの追加又は修理交換をオンラインで行なった後の正常動作の確認診断に際し使用される診断管理プログラムであって、前記オンラインで追加又は修理交換した診断対象セル,診断対象I/Oカード,及び当該I/Oカードに対応するI/Oブリッジと、診断用のセル及び診断専用I/Oカードとを包含して診断パーティションを形成する診断パーティション構築機能、 この構築された診断パーティションにおける前記診断対象セル及び診断用セルでは前記運用パーティションで使用を禁止されたメモリ領域を使用すると共に、前記I/Oブリッジでは前記運用パーティションで使用を禁止された診断用I/O空間を使用して前記両パーティションの相互干渉を排除しつつ前記診断対象の診断が実行されるのを許容する診断動作管理機能、および前記診断用セルによる正常動作確認後に前記診断対象セル,前記診断対象I/Oカード及び前記I/Oブリッジを前記診断パーティションから解放して前記運用パーティションへ組み込むように構成された接続切り換え制御機能、をコンピュータに実行させるようにしたことを特徴とする。
本発明は上述したように構成したので、これによると、オンライン状態でセルやI/Oカード等のリソースを追加又は交換した場合には診断により正常動作を確認した後に運用システムへ組み込むこととなり、これがため、部品の追加や交換に起因する障害を低減することが可能になり、同時に各リソースへの診断専用の信号伝送路が不要になり、実動作状態における十分な負荷を与えた診断及びインタフェース部分の診断も可能となるという従来にない優れた効果を奏する。
(第1の実施形態)
本発明の第1の実施形態に係る情報処理システムについて図面に基づいて説明する。
図1は、本情報処理システムの診断動作中のブロック構成図である。この図1においては、網掛けで表示されているセル12及びI/Oカード33の二つの部品が、追加又は修理・交換されたものとして診断対象となっている。
図1に示すように、診断動作中の本情報処理システム1は、通常の情報処理を実行する運用パーティションP0と、診断パーティションP1と、これら両パーティションP0,P1の構成管理等を行なうためのコントローラ50とのより構成されている。
運用パーティションP0は、プロセッサ(CPU)と主メモリとにより構成される運用中のセル11,13と、運用中のI/Oカード31,32,34と、相互接続手段40と、この相互接続手段40と前記I/Oカード31,32,34を接続するI/Oブリッジ21〜24をと備えて構成されている。
又、診断パーティションP1は、診断対象セル12と,診断対象I/Oカード33と、I/Oブリッジ23,25と、診断専用セル15、診断専用I/Oカード35及び相互接続手段40を備えて構成されている。
上記各パーティションP0,P1同士は、相互接続手段40を互いに共用しながらも、異なった領域のメモリを専有使用することから、相互に干渉を起こさないよう独立したシステムとして動作するよう構築されている。そして、運用パーティションP0内の各構成要素は、診断パーティションP1が診断動作中も、通常の運用動作をしてサービスを提供している。一方、診断パーティションP1では、診断対象セル12及び診断対象I/Oカード33を診断専用セル15及び診断専用I/Oカード35を用いて運用パーティションP0と同じ環境条件であるオンライン状態で診断している状態を示している。
診断が正常に終了し、診断対象の正常動作が検証されれば、診断対象セル12及び診断対象I/Oカード33は、診断パーティションP1から解放され、運用パーティションP0に組み込まれ、運用動作に移行することになる。
このように、本情報処理システム1では、診断パーティションP1を運用パーティションP0と異なったセルを用いて別個に定義し、追加部品や交換部品は、先ず運用パーティションP0とは切り離して診断パーティションP1に組み込んで、その中で十分に診断を行ない正常動作確認をおこなう。これにより、事前にオンラインで十分な動作確認、検証を行うことができるため、組み込み直後に障害が発生する危険を十分小さくすることが可能になる。さらに、相互接続手段40は両パーティションP0,P1で共用されているので、運用状態に近い条件での診断が可能になる。
以下、これを更に詳細に説明する。
上述した診断パーティションP1中の診断専用セル15は、診断に必要な最小限のプロセッサとメモリを有し、そのメモリに保持した診断プログラムを実行して診断を行なう機能を備えている。
また、診断専用I/Oカード35は、診断対象セル12等との情報交換により診断を実施するための最小限必要な機能を備えている。
ここで、診断パーティションP1においては、診断専用セル15及び診断対象セル12のメモリ空間は運用パーティションP0では使用されない異なった領域に確保され、運用パーティションP0内部からのメモリアクセスを遮断する構成をとり、互いにパーティションの独立性を確保している。
又、診断パーティションP1においては、I/Oブリッジ23,25は、運用パーティションP0では使用されない診断用のメモリマップドI/O空間又はI/O空間(異なったI/O空間)を有し、運用パーティションP0内部からのI/Oアクセスを遮断する構成をとり、両パーティションの独立性を確保している。
相互接続手段40は、セル及びI/Oブリッジ等を相互接続する機能を有し、バス構成やクロスバースイッチ等により構成される。この相互接続手段40は、運用パーティションP0と診断パーティションP1とに共用されている。この場合、例えば運用中セル13から診断パーティションP1のI/Oブリッジ23へのアクセスは禁止され、診断パーティションP1内部の情報の流れは、図1に示すように太い実線で示され、運用パーティションP0には出て行かないように構成されている。
コントローラ50は、図示しない入出力機器等を通じて、運用パーティションP0および診断パーティションP1の構成内容の接続上の管理や制御を行なう。尚、後に説明するロード用の診断プログラムをその内部のメモリに格納している場合もある。
ここで、診断対象セル12を診断する場合には、診断専用セル15,診断対象セル12,及び診断専用I/Oカード35で診断パーティションP1を構成し、診断専用セル15中の診断プログラムによって診断を実施する。又、診断対象がI/Oカード33である場合には、診断専用セル15,I/Oブリッジ23,及び診断対象I/Oカード33で診断パーティションP1を構成し、診断を実施する。
このように、診断パーティションP1内で診断を行うことで、システム動作中に追加・交換した部品に対して十分な事前診断を実施した後に運用パーティションP0に組み込むことにより、信頼性の高いシステムを実現可能としている。
又、本システムでは、運用中の相互接続手段40を診断パーティションP1の構成部品間の信号インタフェースとして使用することにより、セルやI/Oカード等の構成部品への診断専用の信号伝送路(診断専用のパス)を不用としている。更には、これにより、実動作状態と同じ十分な負荷を与えた診断を可能にし、また、部品自体の診断に加えて相互接続手段(インタフェース部分)を含めた診断も可能としている。
尚、この図1には、診断対象としてセル12とI/Oカード33の2つの診断対象がある場合を表示されているが、どちらか片方を診断対象にして診断してもよい。また、診断対象が増える場合も、その増えた診断対象を診断パーティションP1の構成に組み入れて診断を実施することが可能である。また、図1に示した運用中セル、運用中I/Oカード等の数も一例を示したに過ぎず任意の数で構成されていてよい。
(動作の説明)
先ず、診断対象がセル12である場合について図2に基づいて説明する。
新規追加又は交換されて診断対象となっているセル12は、オンライン実装直後に運用パーティションP0に組み込む前に、先ず診断パーティションP1に組み込んで十分な事前診断を行なう。
即ち、診断に必要な最小限のプロセッサとメモリを有する診断用セル15と、診断に必要な最小限なI/O構成を有する診断用I/Oカード35から構成される診断パーティションP1にセル12を組み込み、診断専用セル15と、診断対象セル12と、診断用I/Oカード35とで診断パーティションP1を構成する(ステップS101,診断パーティション構築工程)。
この時、診断パーティションP1で使用するメモリ領域を運用パーティションP0で通常使用するメモリ領域とは異なる予め特定された区画領域に設定することで、動作中のパーティションP0内の他のセルやI/Oカードからのアクセスを受け付けない状態が実現される。
又、このときの運用パーティションP0は、図1を参考にして説明すれば、I/Oブリッジ23及び診断対象I/Oカード33が共に運用パーティションP0に組み入れられており、セル11,13、I/Oブリッジ21〜24、及びI/Oカード31〜34から構成されている。
診断パーティションP1では、診断対象セル12はオフライン診断やオンライン診断によって十分に診断を実行され正常動作を確認する(ステップS102,診断工程)。このとき、診断専用セル15と診断対象セル12等の間では、図1中に太い実線で示すように運用中の相互接続手段40をそのまま使って、運用中の信号と混在した状態で診断が行なわれている。これにより、運用中と同じ負荷を与えた診断が可能となり、また、通常動作中のパスを含んだ構成で診断を実施することより、追加や交換対象部材自体の診断に加えて、相互接続手段40等の信号インタフェース部分の診断も可能としている。
診断が終了しセル12の正常動作が確認されると、診断対象セル12は診断パーティションP1から切り離され、動作中の運用パーティションP0に組み込まれ(ステップS103,組み込み工程)、運用動作を開始する。
診断対象がI/Oカードである場合についても、上述した診断対象がセルの場合と基本的に同じである。即ち、I/Oカード33を新規追加又は障害により交換する場合、診断対象I/Oカード33及びI/Oブリッジ23が診断パーティションP1に組み入れられる。これによって、診断専用セル15と、診断専用I/Oカード35と、I/Oブリッジ23と、診断対象I/Oカード33とで、診断パーティションP1が構成される(ステップS101,診断パーティション構築工程)。
この時、診断パーティションP1で使用するメモリ領域を運用パーティションP0で使用するメモリ領域とは異なった区画領域に設定すると共に、診断対象I/Oカード02のメモリマップドIO空間又はIO空間も運用パーティションP0で使用する領域とは異なる区画領域に設定し、I/Oブリッジ23にそれらの空間以外のアクセスを拒否させることで、動作中の運用パーティションP0中のセルや他のI/Oカードからのアクセスが流れてこないように制御される。かかる一連の動作は相互接続手段40を介して予め装備されたコントローラ50により、規制されるようになっている。
診断対象I/Oカード33は、診断パーティションP1でオフライン診断やオンライン診断によって十分に診断を実行された後(ステップS102,診断工程)、診断パーティションP1から切り離され、動作中のパーティションP0に組み込まれる(ステップS103,組み込み工程)。
図1では、セル12及びI/Oカード33の両方を診断対象としており、この場合は上記二つの動作を組み合わせた動作又は順次動作となる。さらに、診断対象が増えた場合は、診断パーティションP1の構成を拡張して診断を実施する。
上述したような動作により、診断によって正常動作を確認した後に運用システムへ組み込むので、部品の追加や交換に起因する障害を低減することが可能になる。同時に、各部品等のリソースへの診断パスが不要になり、実動作状態と同じ十分な負荷を与えた診断及び追加・交換対象部品自体の診断に加えて相互接続手段(インタフェース部分)を含めた診断も可能となる。
ここで、上述した診断パーティション構築工程、診断工程、及び組み込み工程等により、リソース診断方法が構成されている。
即ち、マルチパーティション構成可能な情報処理システムにおけるリソース診断方法は、セル又はI/Oカードの追加又は修理交換をオンラインで行なった後の正常動作確認の診断に際し,オンラインで追加又は修理交換した診断対象セル12又は診断対象I/Oカード33及びこのI/Oカード33に対応するI/Oブリッジ23と,診断専用セル15及び診断専用I/Oカード35とを備えて成る診断パーティションP1を形成する診断パーティション構築工程と、前記診断パーティションP1においては運用パーティションP0からのアクセスを受け付けないよう診断対象セル及び診断用セルのメモリ領域は特別な領域に設定され,また前記I/Oブリッジ23のIO空間も特別な診断用メモリマップドIO空間又は診断用I/O空間に設定され,前記両パーティションの相互干渉を排しながら上記診断対象の診断を行なう診断工程と、正常動作確認後,前記診断対象セル又は前記診断対象I/Oカード12及び前記I/Oブリッジ23を前記診断パーティションP1から解放し,運用パーティションP0に組み込む組込み工程とを備えている。
この診断方法により、セルやI/Oカード等のリソースを追加・交換した場合に、運用システムに組み入れる前の事前診断により正常動作を確認するので、部品の追加や交換に起因する障害を低減することが可能になる。同時に、各部品等のリソースへの診断パスが不要になると共に、実動作状態と同じ負荷を与えた診断及び相互接続手段(インタフェース)部分を含めた診断も可能となる。
また、ここで、上述した診断パーティション構築工程、診断工程、及び組み込み工程の各工程の各処理内容をプログラム化し診断管理用プログラムとしてコンピュータに実行させるように構成してもよい。
即ち、マルチパーティション構成可能な情報処理システムにおける診断管理用プログラムは、前記セル又は前記I/Oカードの追加又は修理交換をオンラインで行なった後の正常動作確認の診断に際し,オンラインで追加又は修理交換した診断対象セル12又は診断対象I/Oカード33及びこのI/Oカード33に対応するI/Oブリッジ23と,診断専用セル15及び診断専用I/Oカード35とを備えて成る診断パーティションP1を形成する診断パーティション構築処理、前記診断パーティションP1においては,診断対象セル12及び診断用セルは運用パーティションP0で使用を禁止されたメモリ領域を使用し,また前記I/Oブリッジ23は運用パーティションP0で使用を禁止された診断用メモリマップドI/O空間又は診断用I/O空間を使用して,前記両パーティションの相互干渉を排しながら上記診断対象の診断を診断プログラムに行なわせる診断管理処理、正常動作確認後,前記診断対象セル12又は前記診断対象I/Oカード33及び前記I/Oブリッジ23を前記診断パーティションP1から解放し,運用パーティションP0に組み込む組込み処理、等の各処理をコンピュータに実行させるように構成したものである。
このような診断管理用プログラムにより、セルやI/Oカード等のリソースを追加・交換した場合に、事前診断により正常動作を確認した後に運用システムへ組み込むので、部品の追加や交換に起因する障害を低減することが可能になる。同時に、各リソースへの診断パスが不要になると共に、実動作状態と同じ十分な負荷を与えた診断及び追加・交換対象部品自体の診断に加えて相互接続手段(インタフェース部分)を含めた診断も可能となる。
(第2の実施形態)
次に、本発明の第2の実施形態に係る情報処理システムを図3に基づいて説明する。
この図3は、本情報処理システム2における診断対象がI/Oカードの場合における診断動作中の診断パーティションP1と運用パーティションP0の各構成を示している。
ここで、前述した第1の実施形態と異なるのは、診断専用セル15が設けられておらず、その代わりに運用中のセルから診断パーティションP1に組み入れられたセル11が診断用として診断動作を行なうように構成した点である。
即ち、情報処理システム2においては、診断用セル11Aは、運用パーティションP0から切り離して診断パーティションP1に組み入れたセルであって、診断プログラムをロードされた後に診断用セル11Aとして動作する。そのため、通常は、診断プログラムを、予め格納しておいた記憶装置等からセル11Aにロードする(組み込む)動作を行なう。その後の動作については、前述した第1実施形態の場合と基本的に同じである。
また、これに対応するリソース診断方法は、前述した第1実施形態におけるリソース診断方法に対して、運用パーティションP0から切り離して診断パーティションP1に組み入れたセルを、診断用セル11Aとして診断用動作をさせるために、このセルに診断プログラムをロードするロード工程を前記診断パーティション構築工程の後に設定した。
これにより、診断専用セル35がなくとも、I/Oカードの事前診断が可能になる。
更に、この第2の実施形態の特殊な形態として、図4に示すように、診断対象がセルの場合に、その診断対象セル12自体を診断用セル12としても兼務させて診断動作可能にしたものである。
これは、本来ならば、診断対象セルと診断用セルが別個であるべきものを、一つのセルに縮退動作させた情報処理システムである。この場合も、診断用セルとしての機能させるためセル12に、診断プログラムを予め格納しておいた記憶装置等からロードする。そして、診断対象セル12(兼診断用セル)と、I/Oブリッジ25と、診断I/Oカード35とで、診断パーティションP1を構成して診断動作を行なう。
この情報処理システムに対応するリソース診断方法として、前述のリソース診断方法において、診断対象セル自体を診断用セルとして用いて診断動作を行なうものがある。これによって、診断対象セル(と診断専用I/Oカード35)のみがあれば、事前診断が可能になる。
その他の構成およびその作用効果については、前述した第1実施形態と同一となっている。
システム動作中に、追加/交換した部品に対して事前診断を実施した後に当該運用パーティションに組み込むことができるので、あらゆる情報処理システムに適用が可能となり汎用性は高いものがある。
本発明の第1実施形態に係る情報処理システムを示すブロック図である。 図1に示す情報処理システムの診断動作を示すフローチャートである。 本発明の第2実施形態に係る情報処理システムを示すブロック図である。 図3に示す実施形態の特殊な形態(診断対象と診断用セルが縮退した診断システム)を示すブロック図である。 本発明に関連する技術の一例を示すブロック図である。
符号の説明
1,2 情報処理システム
11,13 運用中セル
12 診断対象セル
15 診断専用セル
21,22,24 運用中I/Oブリッジ
25 診断専用I/Oブリッジ
31,32,34 運用中I/Oカード
33 診断対象I/Oカード
35 診断専用I/Oカード
40 相互接続手段
50 コントローラ

Claims (11)

  1. プロセッサ及びメモリを備えた1又は2以上のセルとこの各セルに対する入出力を選択的に実行する複数のI/Oカードとを、この各I/Oカードに対応して装備された複数のI/Oブリッジ並びに共通の相互接続手段とを介して接続して運用パーティションが構成されて成る情報処理システムであって、
    前記セルおよび前記I/Oカードの追加又は修理交換をオンラインで行なった後の正常動作の確認診断に際しては、当該追加又は修理交換した診断対象のセル,診断対象のI/Oカード,又はこのI/Oカードに接続制御しているI/Oブリッジに対して、診断専用のセル及び診断専用のI/Oカードを、前記各I/Oカードに対応して装備されたI/Oブリッジおよび共通の相互接続手段を介して接続することにより診断パーティションを構成し、
    この診断パーティションの前記診断対象セル及び前記診断用セルのメモリ領域を、前記運用パーティションからのアクセスを受け付けない領域として予め特定されたメモリ領域に設けると共に、
    前記I/OブリッジのI/O空間を予め設定された診断用I/O空間に配置して、前記運用パーティションとは独立して前記診断対象セル及び診断対象I/Oカードを診断可能な状態に設定したことを特徴とする情報処理システム。
  2. 前記請求項1に記載の情報処理システムにおいて、
    前記診断パーティションによる前記正常動作確認後にあっては、前記診断対象セル,診断対象I/Oカード及び前記I/Oブリッジを、前記診断パーティションから解放して前記運用パーティションに組み込む構成としたことを特徴とする情報処理システム。
  3. 前記請求項1に記載の情報処理システムにおいて、
    前記診断用セルは、診断プログラムを備えた診断専用セルとして予め診断パーティションに組み込まれていることを特徴とした情報処理システム。
  4. 前記請求項1に記載の情報処理システムにおいて、
    前記診断用セルは、前記運用パーティションとして予め装備されたセルの内の特定された一つのセルとし且つ診断プログラムを外部から取り込んで診断用として動作するものであることを特徴とした情報処理システム。
  5. 前記請求項4に記載の情報処理システムにおいて、
    前記診断対象セル自体を前記診断用セルとして縮退動作させることを特徴とする情報処理システム。
  6. 前記請求項1乃至5の何れか一つに記載の情報処理システムにおいて、
    前記診断及び運用の各パーティションの管理及び診断プログラムの導入にかかる各機能を備えたコントローラを、前記相互接続手段を介して前記各パーティションに併設したことを特徴とする情報処理システム。
  7. プロセッサ及びメモリを備えた1又は2以上のセルと当該各セルに対する入出力を選択的に実行する複数のI/Oカードとを、この各I/Oカードに対応して装備された複数のI/Oブリッジ並びに共通の相互接続手段とを介して接続し、これにより運用パーティションが構成された情報処理システムにあって、前記セルおよび前記I/Oカードの追加又は修理交換をオンラインで行なった後の正常動作の確認診断を行うリソース診断方法において、
    オンラインで追加又は修理交換した診断対象セル,診断対象I/Oカード,及びこのI/Oカードに対応するI/Oブリッジと、新たに装備した診断用セル及び診断専用I/Oカードとにより、診断パーティションを形成する診断パーティション構築工程と、
    この構築された診断パーティションに基づいて且つ前記診断対象セル及び診断用セルが前記運用パーティションからのアクセスを受け付けない状態に設定すると共に当該設定状態を維持しつつ当該診断対象の正常動作確認診断を行なう診断工程と、
    前記診断用セルによる正常動作確認後に前記診断対象セル,前記診断対象I/Oカード及び前記I/Oブリッジを前記診断パーティションから解放し、前記運用パーティションへ組み込む組込み工程と、
    を備えたことを特徴とするリソース診断方法。
  8. 前記請求項7に記載のリソース診断方法において、
    前記診断用セルは、診断プログラムを備えた診断専用セルとして予め診断パーティションに組み込まれていることを特徴としたリソース診断方法。
  9. 前記請求項7に記載のリソース診断方法において、
    前記診断パーティション構築工程の前工程として、前記運用パーティションの一部を構成する複数のセルの内の特定の一つのセルを信号処理上当該運用パーティションから切り離して前記診断パーティション構築用の診断用セルとする診断用セル特定工程を設定すると共に、
    前記診断パーティション構築工程と診断工程との間に、前記正常動作の確認診断を行うための診断プログラムを外部から前記診断用セルに取り込む診断プログラムロード工程を設定したことを特徴とするリソース診断方法。
  10. 前記請求項9に記載のリソース診断方法において、
    前記診断対象セル自体を前記診断用セルとして縮退動作させることを特徴とするリソース診断方法。
  11. プロセッサ及びメモリを備えた1又は2以上のセルと当該各セルに対する入出力を選択的に実行する複数のI/Oカードとを、この各I/Oカードに対応して装備された複数のI/Oブリッジ並びに共通の相互接続手段とを介して接続し、これにより運用パーティションが構成された情報処理システムにあって、前記セルおよび前記I/Oカードの追加又は修理交換をオンラインで行なった後の正常動作の確認診断に際し使用される診断管理プログラムであって、
    前記オンラインで追加又は修理交換した診断対象セル,診断対象I/Oカード,及び当該I/Oカードに対応するI/Oブリッジと、診断用のセル及び診断専用I/Oカードとを包含して診断パーティションを形成する診断パーティション構築機能、
    この構築された診断パーティションにおける前記診断対象セル及び診断用セルでは前記運用パーティションで使用を禁止されたメモリ領域を使用すると共に、前記I/Oブリッジでは前記運用パーティションで使用を禁止された診断用I/O空間を使用して前記両パーティションの相互干渉を排除しつつ前記診断対象の診断が実行されるのを許容する診断動作管理機能、
    前記診断用セルによる正常動作確認後に前記診断対象セル,前記診断対象I/Oカード及び前記I/Oブリッジを前記診断パーティションから解放して前記運用パーティションへ組み込むように構成された接続切り換え制御機能、
    をコンピュータに実行させるようにしたことを特徴とする診断管理プログラム。
JP2008046903A 2008-02-27 2008-02-27 情報処理システム、リソース診断方法、および診断管理プログラム Expired - Fee Related JP5251165B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008046903A JP5251165B2 (ja) 2008-02-27 2008-02-27 情報処理システム、リソース診断方法、および診断管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008046903A JP5251165B2 (ja) 2008-02-27 2008-02-27 情報処理システム、リソース診断方法、および診断管理プログラム

Publications (2)

Publication Number Publication Date
JP2009205427A true JP2009205427A (ja) 2009-09-10
JP5251165B2 JP5251165B2 (ja) 2013-07-31

Family

ID=41147614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008046903A Expired - Fee Related JP5251165B2 (ja) 2008-02-27 2008-02-27 情報処理システム、リソース診断方法、および診断管理プログラム

Country Status (1)

Country Link
JP (1) JP5251165B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150699A (ja) * 2011-01-20 2012-08-09 Nec Corp 故障検出装置、故障検出方法、及び、故障検出プログラム
JP2015026291A (ja) * 2013-07-26 2015-02-05 富士通株式会社 メモリダンプ方法及びプログラム、並びに、情報処理装置
JP2016200890A (ja) * 2015-04-08 2016-12-01 富士通株式会社 管理システム、管理方法、および管理プログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366375A (ja) * 2001-06-05 2002-12-20 Hitachi Ltd コンピュータ装置および診断方法
JP2006268519A (ja) * 2005-03-24 2006-10-05 Nec Corp マルチosに対応するbios制御方式
JP2006268521A (ja) * 2005-03-24 2006-10-05 Nec Corp 予備cell試験システム
JP2007122552A (ja) * 2005-10-31 2007-05-17 Nec Corp メモリダンプ方法、コンピュータシステム、およびプログラム
WO2007096991A1 (ja) * 2006-02-24 2007-08-30 Fujitsu Limited 初期診断プログラムの管理装置、管理方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002366375A (ja) * 2001-06-05 2002-12-20 Hitachi Ltd コンピュータ装置および診断方法
JP2006268519A (ja) * 2005-03-24 2006-10-05 Nec Corp マルチosに対応するbios制御方式
JP2006268521A (ja) * 2005-03-24 2006-10-05 Nec Corp 予備cell試験システム
JP2007122552A (ja) * 2005-10-31 2007-05-17 Nec Corp メモリダンプ方法、コンピュータシステム、およびプログラム
WO2007096991A1 (ja) * 2006-02-24 2007-08-30 Fujitsu Limited 初期診断プログラムの管理装置、管理方法およびプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012150699A (ja) * 2011-01-20 2012-08-09 Nec Corp 故障検出装置、故障検出方法、及び、故障検出プログラム
JP2015026291A (ja) * 2013-07-26 2015-02-05 富士通株式会社 メモリダンプ方法及びプログラム、並びに、情報処理装置
JP2016200890A (ja) * 2015-04-08 2016-12-01 富士通株式会社 管理システム、管理方法、および管理プログラム

Also Published As

Publication number Publication date
JP5251165B2 (ja) 2013-07-31

Similar Documents

Publication Publication Date Title
US7787388B2 (en) Method of and a system for autonomously identifying which node in a two-node system has failed
CN101681286A (zh) 多处理器系统及其控制方法
US9128913B2 (en) Method and device for testing input/output interfaces of avionic modules of IMA type
KR20130009816A (ko) 제어 컴퓨터 시스템, 제어 컴퓨터 시스템을 제어하는 방법, 및 제어 컴퓨터 시스템의 이용
JP5251165B2 (ja) 情報処理システム、リソース診断方法、および診断管理プログラム
CN104798046A (zh) 对称多处理器布置、安全关键系统及其方法
JP2007299213A (ja) Raid制御装置および障害監視方法
CN110497941A (zh) 热备冗余系统工作装置
FI96068C (fi) Laite redundantin moniprosessorijärjestelmän käyttämiseksi elektronisen asetinlaitteen ohjausta varten
US20230101026A1 (en) Method and Arrangement for Commissioning an Updated Application for an Industrial Automation Arrangement
JP2007334668A (ja) メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム
KR102195968B1 (ko) 비행체의 고장 모니터링 방법 및 시스템
CN114967634A (zh) 处理器诊断装置、处理器诊断方法和电子设备
JP4576433B2 (ja) 情報処理装置、演算処理装置、情報処理装置の制御方法及びプログラム
WO2021111896A1 (ja) 車載電子制御装置
JP2021013135A (ja) 車両用電子制御装置
JP2006344086A (ja) データ照合装置,データ照合方法,データ制御装置及びデータ制御方法
JP4348485B2 (ja) プロセス制御装置
JP2014215622A (ja) プラント監視システム及びプラント監視方法
KR100309678B1 (ko) 프로세스감시및장애복구방법
JP7349416B2 (ja) 分散制御システム
CN115276922B (zh) 一种适用于全电子系统的主备状态控制方法
JP5924616B2 (ja) 冗長化無線制御システム
WO2020208915A1 (ja) 制御方法および制御装置
JP4117685B2 (ja) フォルトトレラント・コンピュータとそのバス選択制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130319

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

R150 Certificate of patent or registration of utility model

Ref document number: 5251165

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees