JP6111605B2 - コンピュータシステム、コンピュータシステムの診断方法及び診断プログラム - Google Patents

コンピュータシステム、コンピュータシステムの診断方法及び診断プログラム Download PDF

Info

Publication number
JP6111605B2
JP6111605B2 JP2012246301A JP2012246301A JP6111605B2 JP 6111605 B2 JP6111605 B2 JP 6111605B2 JP 2012246301 A JP2012246301 A JP 2012246301A JP 2012246301 A JP2012246301 A JP 2012246301A JP 6111605 B2 JP6111605 B2 JP 6111605B2
Authority
JP
Japan
Prior art keywords
diagnosis
storage unit
target device
control unit
computer system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012246301A
Other languages
English (en)
Other versions
JP2014095989A (ja
Inventor
隆 米村
隆 米村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012246301A priority Critical patent/JP6111605B2/ja
Publication of JP2014095989A publication Critical patent/JP2014095989A/ja
Application granted granted Critical
Publication of JP6111605B2 publication Critical patent/JP6111605B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)

Description

本発明は、コンピュータシステム、コンピュータシステムの診断方法及び診断プログラムに関する。特に、2重化されたメモリを有するコンピュータシステムを構成する装置の診断に関する。
コンピュータシステムの信頼性を向上させることを目的として、主記憶装置であるメモリを2重化する技術がある。2重化された2つのメモリに同じデータを書き込めば、マスタとなる一方のメモリに訂正不可能なエラーが発生しても、スレーブとなるもう一方のメモリのデータを使用することによってデータが保護される。
特許文献1には、図10に示したように、多重化メモリ装置のオンライン診断方式について開示されている。特許文献1の計算機システム100は、2つのメモリユニット111,112と、メモリ制御部113とを備えた多重化メモリシステム110と、中央演算処理装置120(CPU:Central Processing Unit)と、各装置を接続してアドレスやデータを転送するバス130と、多重化メモリ診断プログラム141を有するオペレーションシステム140(OS:Operation System)とを構成要素とする。
特許文献1の中央演算処理装置120は、機械語命令を実行し、機械語命令レベルで多重化メモリ装置110をアクセスするとともに、内部には多重化メモリ110に対するアクセスのモードを示すテストモードフラグ122が含まれる制御レジスタ121を有している。多重化メモリ診断プログラム141には、テストモードを設定してテストモードフラグ122をONするテストモードアクセスON命令142(ON TM)と、テストモードを解除してテストモードフラグ122をOFFするテストモードアクセスOFF命令143(OFF TM)とが設定されている。
特許文献1のメモリ制御部113は、メモリユニット111,112のいずれかに障害が発生した場合に、その障害ユニットをシステムから切り離す制御機能に加えて、テストモードフラグ122の状態によりテストモードか否かを判断してアクセス先のメモリユニットを決定する制御機能を有している点に特徴がある。そのため、テストモードフラグ122の状態によって、システムから切り離されたメモリユニットをオンライン運用に影響を与えずに診断することができる。
また、一般的なコンピュータシステムでは、メモリのエラーのみならずコンピュータシステムを構成する装置、さらにはI/Oポート(I/O:Input Output)に接続された外部装置をエラーが起こる前に診断し、コンピュータシステムの安定動作を継続して制御することが求められる。
特開平4−74243号公報
特許文献1の多重化メモリ装置のオンライン診断方式では、メモリ自体の診断はできるものの、コンピュータシステムを構成するメモリ以外の装置や外部装置の診断については言及されていない。
一般に、主記憶装置へのデータの読み書きを伴ってI/Oポートに接続された外部装置の診断を行う際には、当該外部装置にデータを書き込む主記憶装置上のアドレスを誤る障害が起こる場合が想定される。そのような場合、当該外部装置の診断によって、別のI/Oポートに接続された他の運用中の外部装置、または、コンピュータシステム上で処理を行うジョブに擾乱を与え、システムの運用を止めてしまう可能性がある。
そのため、一般的な外部装置の診断においては、主記憶装置を使わずに当該外部装置内のローカルメモリを擬似的に主記憶部に見立てて診断を行っている。しかしながら、このような一般的な方法では、外部装置が持つ本来の機能の全てを診断することができず、コンピュータシステムに外部装置を組み込んでから障害が発覚してしまうという課題があった。このような障害は、外部装置のみならずコンピュータシステムを構成する装置においても同様に起こりうる。
本発明のコンピュータシステムの診断装置は、少なくとも2つのメモリを有する多重化された主記憶部によってコンピュータシステムを構成する装置を診断する際に、コンピュータシステムの運用に擾乱を与えずに診断することを可能とする手段を提供することを目的とする。
本発明のコンピュータシステムは、第1の記憶部と、第2の記憶部と、第1及び第2の記憶部へのデータの読み書きを制御するメモリ制御部と、メモリ制御部を介して第1及び第2の記憶部に接続された診断対象装置を診断する診断手段とメモリ制御部に対して診断対象装置を診断する診断モードへの移入・復帰を指示する指示手段とを有する診断プロセッサ部と、を備え、メモリ制御部は、通常のシステム運用においては、第1及び第2の記憶部の両方にデータの書き込みを実行させるのに対し、第1の記憶部のみにデータの読み込みを実行させ、診断モードに移行した場合においては、診断対象装置がアクセスしていない第1の記憶部にデータの読み書きを実行させることで通常のシステム運用を行わせるとともに、診断プロセッサ部の指示に応じて診断対象装置がアクセスしている第2の記憶部のみを診断対象装置の診断に割り当てる。
また、本発明のコンピュータシステムの診断方法は、第1の記憶部と、第2の記憶部と、第1及び第2の記憶部へのデータの読み書きを制御するメモリ制御部と、メモリ制御部を介して第1及び第2の記憶部に接続された診断対象装置を診断する診断手段とメモリ制御部に対して診断対象装置を診断する診断モードへの移入・復帰を指示する指示手段とを有する診断プロセッサ部と、を備えたコンピュータシステムにおいて、メモリ制御部は、通常のシステム運用においては、第1及び第2の記憶部の両方にデータの書き込みを実行させるのに対し、第1の記憶部のみにデータの読み込みを実行させ、診断モードに移行した場合においては、診断対象装置がアクセスしていない第1の記憶部にデータの読み書きを実行させることで通常のシステム運用を行わせるとともに、診断プロセッサ部の指示に応じて診断対象装置がアクセスしている第2の記憶部のみを診断対象装置の診断に割り当てることを特徴とするコンピュータシステム。
また、本発明のコンピュータシステムの診断プログラムは、第1の記憶部と、第2の記憶部と、第1及び第2の記憶部へのデータの読み書きを制御するメモリ制御部と、メモリ制御部を介して第1及び第2の記憶部に接続された診断対象装置を診断する診断手段とメモリ制御部に対して診断対象装置を診断する診断モードへの移入・復帰を指示する指示手段とを有する診断プロセッサ部と、を備えたコンピュータシステムにおいて、メモリ制御部が、第1及び第2の記憶部の両方にデータの書き込みを実行させ、第1の記憶部のみにデータの読み込みを実行させる通常のシステム運用処理と、メモリ制御部が、診断対象装置がアクセスしていない第1の記憶部にデータの読み書きを実行させることによって通常のシステム運用を行わせるととともに、診断プロセッサ部の指示に応じて診断対象装置がアクセスしている第2の記憶部のみを診断対象装置の診断に割り当てる診断モード処理と、をコンピュータに実行させる。
本発明のコンピュータシステムによれば、コンピュータシステムの運用に擾乱を与えずにコンピュータシステムを構成する装置及びコンピュータシステムに接続された外部装置を診断することが可能となる。
本発明の実施形態に係るコンピュータシステムの構成を示す概念図である。 本発明の実施形態に係るメモリコントローラの構成例を示す概略図である。 本発明の実施形態に係るメモリコントローラへデータの読み書きを指示する命令形式の一例である。 通常モードにおけるメモリコントローラを介したデータの流れである。 診断モードにおけるメモリコントローラを介したデータの流れである。 診断モードにおける実行の流れを示すシークエンス図である。 本発明の実施例に係るコンピュータシステムの構成を示す概念図である。 本発明の実施例に係る診断モードにおけるコンピュータシステムの動作を示す概念図である。 本発明の実施例に係る診断モードにおけるコンピュータシステムの動作を示すフローチャートである。 特許文献1に係る計算機システムの構成を示す概念図である。
以下に、本発明を実施するための形態について図面を用いて説明する。但し、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。
(実施形態)
(構成)
図1は、本発明の実施形態に係るコンピュータシステム1の構成を示す概念図である。
図1に示したコンピュータシステム1は、2重化された主記憶部として、第1及び第2記憶部11,12と、これらの主記憶部への読み書きを制御するメモリ制御部であるメモリコントローラ13と、診断プロセッサ14とを備えている。
2重化された第1及び第2記憶部11,12は、一般的なメモリで構成される。例えば、第1記憶部11をマスタとし、第2記憶部12をスレーブとすれば、マスタである第1記憶部11に障害が発生した場合、スレーブである第2記憶部12をマスタに切替えることによって、コンピュータシステム1の運用を継続できる。なお、状況に応じて、第2記憶部12をマスタとし、第1記憶部11をスレーブとしてもよい。
2重化された第1及び第2記憶部11,12は、同じ構成をとる異なるメモリであってもよく、同一のメモリ内において区分されたメモリ領域であってもよい。また、2重化された第1及び第2記憶部11,12は、同じ構成からなることが好ましい。ただし、メモリコントローラ13によって同時に制御できるのであれば、2重化された第1及び第2記憶部11,12は、異なる構成であってもかまわない。
また、本実施形態では2つのメモリからなる主記憶装置について説明しているが、本発明の主記憶装置は2つ以上に多重化されてさえいればよく、本発明の範囲は必ずしも2つのメモリに限定されるわけではない。
メモリコントローラ13は、メモリ制御部として機能し、2重化された第1及び第2記憶部11,12に対するアクセスを制御する。第1及び第2記憶部11,12に対するアクセスは、例えば後述する外部装置18やコンピュータシステム1を構成する装置によって行なわれる。なお、本実施形態の説明においては、外部装置18が後述するI/Oコントローラ15を介して第1及び第2記憶部11,12にアクセスすることを例として説明するが、I/Oコントローラ15自体を診断対象としてもよい。
診断プロセッサ14は、後述するコンソール19の入力装置からの指示に応じて、指定された装置を診断する診断手段16を備えている。
また、診断プロセッサ14は、メモリコントローラ13に対して診断の直前に診断モードへの移入指示を行うとともに、メモリコントローラ13に対して診断の直後に診断モードからの復帰指示を行う指示手段17を有している。
この診断対象となる装置の異常は、例えば、図示しない検知手段によって検知される。
診断プロセッサ14には、コンピュータシステム1の操作員が診断内容を入力するためのコンソール19が接続されている。コンソール19は、キーボードなどの入力装置と表示画面などの出力装置とを有する。
コンソール19を構成する入力装置は、操作員の入力に応じたデータを後述するメモリコントローラ13に送信する。また、コンソール19を構成する出力装置は、診断プロセッサ14から出力されたデータを操作員が読み取れるように表示する。
コンピュータシステム1は、コンピュータシステム1に外部装置18(18−1〜18−N)を接続するための入出力制御部であるI/Oコントローラ15(15−1〜15−N)を備えている。I/Oコントローラ15は、外部装置18を制御するだけではなく、I/Oコントローラ15自身も診断対象装置となりうる。
本実施形態においては、I/Oコントローラ15は、メモリコントローラ13を介して外部装置18から送信されたデータを第1及び第2記憶部11,12に書き込む。また、I/Oコントローラ15は、第1記憶部11のみからデータを読み出して外部装置18に送信する。この際、第2記憶部12からはデータの読み出しを行なわないものとする。ただし、第2記憶部12からのデータの読み出しは設定によって制限されているものとし、第1記憶部11に障害が発生した際には、必要に応じて第2記憶部12からデータを読み出せる設定としてもよい。
図2は、本発明の実施形態に係るメモリコントローラ13の構成の一例を示す概略図である。メモリコントローラ13は、制御手段21と、切替え手段22と、一時的な記憶領域となる記憶領域20を備えている。なお、これらの構成要素は、互いに通信可能に接続されているものとする。
制御手段21は、I/Oコントローラ15の制御や切替え手段22が接続する記憶部の切替え制御を行ない、例えば、一般的な制御回路で構成することができる。
切替え手段22は、制御手段21の指示に応じて第1又は第2記憶部11,12のいずれにアクセスするのかを切替える。例えば、ダイオードを用いたスイッチ回路などで構成することができる。
例えば、メモリコントローラ13の内部に備えられた記憶領域20に、診断対象となる外部装置18の情報を格納する装置判別領域25と、診断モードであるか否かを示すフラグ領域26を割り当てることができる。記憶領域20としては、例えばレジスタなどで構成することができる。
装置判別領域25には、診断対象装置を判別するための情報である診断対象装置判別情報が格納される。また、フラグ領域26には、診断プロセッサ14からの指示によって通常モードと診断モードのいずれであるかが切り替わるフラグ情報が格納される。
なお、装置判別領域25及びフラグ領域26は、メモリコントローラ13の外部に設けられていてもよい。例えば、診断プロセッサ14の内部にレジスタ設けたり、コンピュータシステム1に備えられた図示しない中央演算処理装置の内部にも設けたりしてもよい。さらには、第1及び第2記憶部11,12の少なくとも一方の内部にレジスタ領域を設け、装置判別領域25及びフラグ領域26を形成してもよい。なお、装置判別領域25及びフラグ領域26については、上述の形態に関わらず、診断対象装置判別情報及びフラグ情報を格納しさえすればよい。
以上が本発明の実施形態に係るコンピュータシステム1の構成の説明である。なお、実施形態に係るコンピュータシステム1は上述の形態に限定されず、種々の変形・構成要素を追加してもかまわない。また、上記においては、外部装置18を診断することについて説明したが、外部装置18を接続するI/Oコントローラ15などのコンピュータシステム1を構成するその他の装置を診断することとしてもよい。
(動作)
次に、本実施形態のコンピュータシステム1の動作について図面を参照しながら詳細に説明する。
最初に、図3〜5を用いてメモリコントローラ13の動作について説明する。
図3は、メモリコントローラ13へデータの読み書きを指示する命令形式30である。命令形式30は、メモリコントローラ13に対し、主記憶装置となる第1及び第2記憶部11,12の読み書きにおいて使用される。メモリコントローラ13は、診断プロセッサ14から送られる命令形式30に従って、診断対象となる外部装置18の読み書き動作を行なう。なお、命令形式30は、診断に関与しない外部装置18の命令形式としても適用可能であり、その場合は、図示しない制御手段の指示に従って読み書き動作を行なうものとする。
命令形式30は、指示対象となる外部装置18の装置識別子31と、読み込みと書き込みの区別を示すフラグとなる読み書き区別33と、読み書きを行う主記憶上のアドレス35からなる。なお、命令形式30は、必要に応じて記憶領域20に割り当てた領域に格納することができ、装置識別子31・読み書き区別33・アドレス35のそれぞれに対して領域を割り当てることが好ましい。
装置識別子31は、診断対象となる外部装置18がどの装置であるかを示す識別子である。装置識別子31は、診断モード時、主記憶の読み書きを指示してきたのが診断対象となる外部装置18であれば、後述するように、そのアクセスを記憶部12のみに対して行うように制御するのに使用される。読み書き区別33は、その装置識別子31に対応する外部装置18が書き込み・読み込みのいずれの動作を行なっているのかを示すフラグとなる。アドレス35は、その装置識別子31に対応する外部装置18のデータを、第1及び第2の記憶装置11,12のどのアドレス領域で読み書きするかを示す。
実際の読み書きのデータは、この命令形式30によるメモリコントローラ13へのデータの読み書き指示の後に、外部装置18との間で直接授受される。なお、命令形式30については、必要に応じて図3の構成に種々の変更を加えてもよい。
図4は、通常モードにおけるメモリコントローラ13を介したデータの流れである。但し、図4ではI/Oコントローラ15を省略している。
外部装置18からの書き込みデータは、メモリコントローラ13の切替え動作に従って、第1及び第2記憶部11,12の両方に書き込まれる(矢印42)。一方、外部装置18への読み出しデータは、第1記憶部11のみから読み出される(矢印41)。なお、2重化された第1及び第2記憶部11,12のいずれかをマスタとして設定している場合、通常モードにおいては、マスタとして設定した方の記憶部から外部装置18にデータを書き込むものとする。
図5は、診断モードにおけるメモリコントローラ13を介したデータの流れである。なお、図5の診断モードに示した本実施形態においては、診断対象装置57を診断対象である外部装置18とする。但し、図5ではI/Oコントローラ15を省略している。
診断モードであっても、診断対象装置57以外の外部装置18は、図4で説明した通常モード時と同じ動作を行なう。
データの読み書き対象となる外部装置が診断対象装置57の場合は、診断対象装置57からの書き込みデータは、第2記憶部12に対してのみに書き込まれる(矢印51)。また、診断対象装置57への読み出しデータは、第2記憶部12のみから読み出される(矢印52)。
ここで注意すべき点は、診断対象装置57とデータの授受を行なうのは、通常モード時に読み出しが行われる第1記憶部11とは異なる第2記憶部12であるということである。すなわち、診断モードでは、通常モード時にマスタとして設定された第1記憶部11ではなく、スレーブとして設定された第2記憶部12と診断対象装置57との間でデータの授受を行なう。
次に、図6のシークエンス図を用いて、診断モードにおける実行の流れを説明する。なお、以下の説明においては、図1,2,5の符号を用いて説明する。
最初に、コンソール19は、操作員によって入力された診断対象装置57に関する診断指示を診断プロセッサ14に送信する。ここで、診断対象装置57は、例えば、第1及び第2記憶部11,12にアクセスする機能を持つ外部装置18である。
指示を受けた診断プロセッサ14は、診断を実行する前にメモリコントローラ13に診断モードへの移入指示を行う。この際、診断プロセッサ14は、操作員に指定された診断対象装置判別情報をメモリコントローラ13に通知する。
指示を受けたメモリコントローラ13は、診断対象装置判別情報を装置判別領域25に格納し、診断モードに移入する。ここで、フラグ領域26には、診断モードであることを示すフラグ情報が格納される。
その後、診断プロセッサ14は、診断対象装置57の診断を実施し、その中で、第2記憶部12のデータの読み書きを行う。
診断プロセッサ14による診断は、例えば、診断プロセッサ14から診断対象装置57を制御し、診断で用いる第2記憶部12に対して、予め用意しているテストパターンのデータのアクセス(書き込み/読み出し)を実行することで行なう。その診断においては、アクセス自体がエラーとなるかどうか、書き込んだデータを読み出した際にデータが期待値である書き込みデータと比較して正しいかどうか、といったことを検証し、診断対象装置57が故障しているかどうかを試験する。
そして、診断が終了すると、診断プロセッサ14は、メモリコントローラ13に診断モードからの復帰指示を行う。
復帰指示を受けたメモリコントローラ13は、装置判別領域25の情報をクリアしたのちに診断モードから復帰する。ここで、フラグ領域26には、通常モードであることを示すフラグ情報が格納される。
フラグ領域26が診断モードから通常モードになった段階で、メモリコントローラ13は、第1記憶部11の情報を第2記憶部12に上書きコピーする。なお、このコピーの指示は、診断プロセッサ14の判断に従うことにしてもよい。
メモリコントローラ13は、必要に応じて、診断プロセッサ14に対して、第1記憶部11の情報が第2記憶部12に上書きコピーされたことを通知する。なお、このコピー完了通知は省略することもできる。
診断プロセッサ14は、コンソール19の表示装置に診断対象装置57の診断結果を表示する指示を行う。
以上のような流れによって、スレーブとなる第2記憶部12によって診断対象装置57が診断を受けた後に、マスタとなる第1記憶部11に格納されたデータが第2記憶部12に上書きされる。このようにすれば、診断中に診断対象装置57が誤動作をしたとしても、記憶部への誤った書き込みは、システム運用から切り離された第2記憶部12のみになされる。そのため、第1記憶部11が受け持つシステム運用に関しては、診断における誤動作の影響を受けることがなくなる。また、診断終了後、第1記憶部11に格納されたデータが第2記憶部12に上書きされてから、第2記憶部12を図4に示した通常モードに復帰させるため、診断から復帰した第2記憶部12がシステム運用に誤動作を引き起こす可能性もなくなる。
すなわち、本実施形態のコンピュータシステム1の診断方法によれば、コンピュータシステム1の運用には影響を与えずに、外部装置18の診断を安全に実施することができる。なお、図6に示した実行手順をコンピュータに実行させるプログラムも本発明の範囲に含まれるものとする。
このように、本実施形態におけるコンピュータシステムによれば、コンピュータシステムの運用に擾乱を与えずにI/Oポートに接続された外部装置を診断することが可能となる。また、コンピュータシステムを診断中であっても、コンピュータシステムの運用は複数の記憶装置に含まれる一つのメモリをミラーで使用可能であるため、その他のメモリに障害が発生しても処理を継続させて可用性を維持することが可能となる。さらに、コンピュータシステムをオンラインで運用している場面においても、オンライン状態を維持しながらのコンピュータシステムの運用が可能となる。
(実施例)
次に、図7のコンピュータシステム70においてI/Oコントローラ71によって外部装置73を運用中に、別の外部装置73を制御するI/Oコントローラ72に異常が発生した場合を想定した実施例について説明する。
本実施例は、異常を示すI/Oコントローラ72が、スレーブとなる第2記憶部12上の誤ったアドレスである書き込み領域85にデータの誤書き込み83を実行した場合であっても、コンピュータシステム70の運用に影響が及ばないことを説明するための例である。
図7には、本発明の実施例に係るコンピュータシステム70の構成を示した。なお、コンピュータシステム70において、コンピュータシステム1と同様の構成については同一の符号を用いた。
図8には、本発明の実施例に係る第1及び第2記憶部11,12へのデータ書き込み動作時における誤動作の一例を示した。診断モードにおいて、第1記憶部11は、X番地からのエリアは使用せずに、Y番地からのアドレスを使用して運用中装置であるI/Oコントローラ71と接続していることを示している。また、診断モードにおいて、診断に使用される第2記憶部12は、診断対象となるI/Oコントローラ72の診断用領域としてX番地からのアドレスを使用し、運用中装置であるI/Oコントローラ71からの書き込みはY番地からのアドレスに行なうことを示している。すなわち、X番地から1KBのエリアは運用ではアクセスされない、診断専用のエリアとなる。
図8においては、診断対象装置74から第2記憶部12への書き込み動作で誤作動が起こり、第2記憶部12のX番地からのアドレスに書き込みを行なうところ、第2記憶部12のY番地からのアドレスに書き込んだ例を示している。Y番地からのアドレスは、第1記憶部11では、運用中装置であるI/Oコントローラ71とのアクセスに用いられている領域である。
図9には、実施例の動作を示すフローチャートを示した。なお、図9に示した診断モードにおいて、運用中装置であるI/Oコントローラ71は、第1記憶部11のY番地からのアドレスを使用して通常モードで使用されているものとする。
ここで、図9を用いて、I/Oコントローラ72を診断している場面で、I/Oコントローラ72に異常が起こった際の実施例の動作フローを説明する。
図9において、I/Oコントローラ72の診断指示がコンソール19に入力される(ステップ91でYes)と、診断プロセッサ14は、メモリコントローラ13に診断対象装置識別情報としてI/Oコントローラ72の情報を通知し、診断モードへの移入を指示する(ステップ92)。診断指示が入力されていない場合(ステップ91でNo)、コンソール19からの診断指示を待つ。
指示を受けたメモリコントローラ13は、装置判別領域25にI/Oコントローラ72の識別情報を格納し(ステップ93)、診断モードに移入する(ステップ94)。
次に、診断プロセッサ14は、I/Oコントローラ72の診断を開始する(ステップ95)。ここで、図2のフラグ領域26には診断モードであることを示すフラグ情報が格納される。
さらに、診断対象であるI/Oコントローラ72によって、運用では使われない第2記憶部12のアドレスX番地から1KBの領域においてデータの読み書きを行う(ステップ96)。なお、診断中は、運用で用いている第1記憶部11においては、アドレスX番地から1kBの領域にはデータの読み書きを行なわないものとする。また、診断では第2記憶部12の診断エリアを使って書き込み/読み込みの診断のアクセスを行う。この診断では、正しく書き込みがなされ、書き込みされた値が正しく読めるか等の試験を行うため、診断前から診断エリアに入っていたデータを使うことはない。
ここで、診断対象であるI/Oコントローラ72は異常を示し、診断用のアドレスX番地にデータを書き込むべきところ、コンピュータシステム70の運用で使用されているアドレスY番地に含まれる書き込み領域85にデータの読み書きを行ったとする(ステップ97でYes)。診断対象であるI/Oコントローラ72に異常が発生したことは、コンソール19に対して通知される(ステップ98)。
なお、ステップ97で異常が起こらなかった場合(ステップ97でNo)は、異常がなかったことをコンソール19に対して通知する(ステップ99)。
コンソール19は、I/Oコントローラ72の書き込みにおける異常の有無を表示装置に表示する(ステップ100)。
ここで、診断モードを継続する必要がある場合(ステップ101でYes)、ステップ95に戻る。なお、診断モードを継続するか否かは、コンソール19への入力によって設定されるものとするが、診断モードからの復帰指示が即座に出されない場合は、一定の待機時間を経過後に自動的に再診断もしくは復帰を行なうように設定してもよい。
診断モードを終了する場合(ステップ101でNo)、診断プロセッサ14は、メモリコントローラ13に対して診断モードからの復帰を指示する(ステップ102)。なお、装置判別領域25に格納されたI/Oコントローラ72の識別情報は、必要に応じて削除してもよく、次の診断モードの移行時まで格納しておいてもよい。
指示を受けたメモリコントローラ13は、診断モードから復帰する(ステップ103)。
最後に、システム運用を継続させていた第1記憶部11のデータを、診断に用いた第2記憶部12に上書きして終了とする(ステップ104)。診断後に第1記憶部11のデータを第2記憶部12に上書きするのは、壊れている可能性のある第2記憶部12のデータを第1記憶部11の正しいデータで修復するためである。
ここで、図8に示したように、メモリコントローラ13は、I/Oコントローラ72による誤った書き込み領域85へのデータの誤書き込み83は診断に用いた第2記憶部12に対してのみ行われたことになる。すなわち、診断による書き込み/読み込みによって診断エリアに記憶されたデータが壊れても、診断用エリアを運用で使用するエリアと分けるため、運用には影響しないことになる。
一方、コンピュータシステム70の運用におけるY番地へのアクセスとしては、第1及び第2記憶部11,12の両方への書き込み81と、システム運用に用いていた第1記憶部11からの読み出し82とが行われる。すなわち、コンピュータシステム70の運用では、第1記憶部11のみから読み出し82を行なっていたことになる。そのため、第2記憶部12の書き込み領域85に誤って書き込まれたデータは、コンピュータシステム70の運用においては、システム運用を請け負っていた第1記憶部11には全く参照されなかったことになる。
仮に、診断対象のI/Oコントローラ72が壊れており、診断時に本来は診断用エリアに書き込みしなければならないところ、誤書き込みで第2記憶部12の診断用エリアではなくて運用で使用するエリアに書き込みしてしまったとしても、診断モードでは、I/Oコントローラ72からの書き込みは、第2記憶部12のみに対する書き込みになる。よって、データが壊されるのは第2記憶部12のみで、第1記憶部11のデータは壊されず、第1記憶部11による運用に支障がでることはない。
そのため、先のI/Oコントローラ72による書き込み領域85へのデータの誤書き込み83は、コンピュータシステム70の運用へ擾乱を与えることはない。
以上が図7〜9に示した本発明の実施例に関する動作例の説明である。なお、上記の動作例は一例であって本発明の範囲を限定するものではない。また、図9に示したような実行手順をコンピュータに実行させるプログラムも本発明の範囲に含まれるものとする。
また、上記においては、I/Oコントローラの異常診断について説明したが、I/Oコントローラに接続された外部装置や、コンピュータを構成するその他の装置の診断についても同様の動作をし、同様の作用・効果を得られることは当然である。
以上、実施形態及び実施例を参照して本願発明を説明してきたが、本願発明は上記実施形態及び実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
1 コンピュータシステム
11 第1記憶部
12 第2記憶部
13 メモリコントローラ
14 診断プロセッサ
15 I/Oコントローラ
16 診断手段
17 指示手段
18 外部装置
19 コンソール
20 記憶領域
21 制御手段
22 切替え手段
25 装置判別領域
26 フラグ領域
30 命令形式
31 装置識別子
33 読み書き区別
35 アドレス
57 診断対象装置
70 コンピュータシステム
71 I/Oコントローラ
72 I/Oコントローラ
73 外部装置
74 診断対象装置
85 書き込み領域
110 多重化メモリ装置
111,112 メモリユニット
113 メモリ制御部
120 中央演算処理装置
121 制御レジスタ
122 テストモードフラグ
130 バス
140 オペレーションシステム
141 多重化メモリ診断プログラム
142 テストモードアクセスON命令
143 テストモードアクセスOFF命令

Claims (8)

  1. 第1の記憶部と、
    第2の記憶部と、
    前記第1及び第2の記憶部へのデータの読み書きを制御するメモリ制御部と、
    前記メモリ制御部を介して前記第1及び第2の記憶部に接続された診断対象装置を診断する診断手段と前記メモリ制御部に対して前記診断対象装置を診断する診断モードへの移入・復帰を指示する指示手段とを有する診断プロセッサ部と、を備え、
    前記メモリ制御部は、
    通常のシステム運用においては、前記第1及び第2の記憶部の両方にデータの書き込みを実行させるのに対し、前記第1の記憶部のみにデータの読み込みを実行させ、
    前記診断モードに移行した場合においては、前記診断対象装置がアクセスしていない前記第1の記憶部にデータの読み書きを実行させることで前記通常のシステム運用を行わせるとともに、前記診断プロセッサ部の指示に応じて前記診断対象装置がアクセスしている前記第2の記憶部のみを前記診断対象装置の診断に割り当てる際に、前記通常のシステム運用で使用されている前記第1の記憶部上の記憶領域とは重ならない前記第2の記憶部上の記憶領域を診断に割り当て、
    前記診断モードからの復帰時に、前記第1の記憶部に格納されたデータを前記第2の記憶部に上書きすることを特徴とするコンピュータシステム。
  2. さらに外部装置に接続される入出力制御部を備え、
    前記メモリ制御部は、前記入出力制御部を介して前記外部装置と接続され、前記外部装置を前記第1及び第2の記憶部にアクセスさせることを特徴とする請求項1に記載のコンピュータシステム。
  3. 前記診断対象装置が前記外部装置であることを特徴とする請求項2に記載のコンピュータシステム。
  4. 前記診断対象装置が前記入出力制御部であることを特徴とする請求項2に記載のコンピュータシステム。
  5. 前記メモリ制御部は、
    前記診断対象装置の情報を格納する装置判別領域と、
    前記診断モードであるか否かを示すフラグ領域と、を有することを特徴とする請求項2に記載のコンピュータシステム。
  6. 前記診断モードにおける前記診断対象装置の診断において、
    前記診断プロセッサ部は、
    前記診断対象装置を識別するための識別子と、
    前記診断対象装置がデータの読み込みと書き込みのいずれの状態であるかを区別するためのフラグと、
    前記診断対象装置のデータの読み書きに用いる前記第2の記憶部上のアドレスと、を含む命令形式によって前記メモリ制御部に指示を出すことを特徴とする請求項3に記載のコンピュータシステム。
  7. 第1の記憶部と、
    第2の記憶部と、
    前記第1及び第2の記憶部へのデータの読み書きを制御するメモリ制御部と、
    前記メモリ制御部を介して前記第1及び第2の記憶部に接続された診断対象装置を診断する診断手段と前記メモリ制御部に対して前記診断対象装置を診断する診断モードへの移入・復帰を指示する指示手段とを有する診断プロセッサ部と、を備えたコンピュータシステムにおいて、
    前記メモリ制御部は、
    通常のシステム運用においては、前記第1及び第2の記憶部の両方にデータの書き込みを実行させるのに対し、前記第1の記憶部のみにデータの読み込みを実行させ、
    前記診断モードに移行した場合においては、前記診断対象装置がアクセスしていない前記第1の記憶部にデータの読み書きを実行させることで前記通常のシステム運用を行わせるとともに、前記診断プロセッサ部の指示に応じて前記診断対象装置がアクセスしている前記第2の記憶部のみを前記診断対象装置の診断に割り当てる際に、前記通常のシステム運用で使用されている前記第1の記憶部上の記憶領域とは重ならない前記第2の記憶部上の記憶領域を診断に割り当て、
    前記診断モードからの復帰時に前記第1の記憶部に格納されたデータを前記第2の記憶部に上書きすることを特徴とするコンピュータシステムの診断方法。
  8. 第1の記憶部と、
    第2の記憶部と、
    前記第1及び第2の記憶部へのデータの読み書きを制御するメモリ制御部と、
    前記メモリ制御部を介して前記第1及び第2の記憶部に接続された診断対象装置を診断する診断手段と前記メモリ制御部に対して前記診断対象装置を診断する診断モードへの移入・復帰を指示する指示手段とを有する診断プロセッサ部と、を備えたコンピュータシステムにおいて、
    前記メモリ制御部が、前記第1及び第2の記憶部の両方にデータの書き込みを実行させ、前記第1の記憶部のみにデータの読み込みを実行させる通常のシステム運用処理と、
    前記メモリ制御部が、前記診断対象装置がアクセスしていない前記第1の記憶部にデータの読み書きを実行させることによって前記通常のシステム運用を行わせるととともに、前記診断プロセッサ部の指示に応じて前記診断対象装置がアクセスしている前記第2の記憶部のみを前記診断対象装置の診断に割り当てる際に、前記通常のシステム運用で使用されている前記第1の記憶部上の記憶領域とは重ならない前記第2の記憶部上の記憶領域を診断に割り当てる診断モード処理と、
    前記メモリ制御部が、前記診断モードからの復帰時に前記第1の記憶部に格納されたデータを前記第2の記憶部に上書きする処理とをコンピュータに実行させることを特徴とするコンピュータシステムの診断プログラム。
JP2012246301A 2012-11-08 2012-11-08 コンピュータシステム、コンピュータシステムの診断方法及び診断プログラム Active JP6111605B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012246301A JP6111605B2 (ja) 2012-11-08 2012-11-08 コンピュータシステム、コンピュータシステムの診断方法及び診断プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012246301A JP6111605B2 (ja) 2012-11-08 2012-11-08 コンピュータシステム、コンピュータシステムの診断方法及び診断プログラム

Publications (2)

Publication Number Publication Date
JP2014095989A JP2014095989A (ja) 2014-05-22
JP6111605B2 true JP6111605B2 (ja) 2017-04-12

Family

ID=50939021

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012246301A Active JP6111605B2 (ja) 2012-11-08 2012-11-08 コンピュータシステム、コンピュータシステムの診断方法及び診断プログラム

Country Status (1)

Country Link
JP (1) JP6111605B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018156463A (ja) 2017-03-17 2018-10-04 東芝メモリ株式会社 メモリシステム
JP7045293B2 (ja) * 2018-09-19 2022-03-31 日立Astemo株式会社 電子制御装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5831020B2 (ja) * 1980-04-04 1983-07-02 日本電信電話株式会社 マルチプロセツサ制御システム
JPS5994160A (ja) * 1982-11-19 1984-05-30 Toshiba Corp 複合系電子計算機システムのデ−タ等価方式
JP2635063B2 (ja) * 1987-12-14 1997-07-30 株式会社日立製作所 システム制御装置
US4965717A (en) * 1988-12-09 1990-10-23 Tandem Computers Incorporated Multiple processor system having shared memory with private-write capability

Also Published As

Publication number Publication date
JP2014095989A (ja) 2014-05-22

Similar Documents

Publication Publication Date Title
US8504765B2 (en) Method of improving efficiency of capacity of volume used for copy function and apparatus thereof
JP2548480B2 (ja) アレイディスク装置のディスク装置診断方法
JP6282482B2 (ja) プログラマブル回路装置、コンフィギュレーション情報修復方法
JP4132322B2 (ja) 記憶制御装置およびその制御方法
US9092398B2 (en) Restoring expander operations in a data storage switch
JP2006012004A (ja) ホットスタンバイシステム
JP5287974B2 (ja) 演算処理システム、再同期方法、およびファームプログラム
JP6111605B2 (ja) コンピュータシステム、コンピュータシステムの診断方法及び診断プログラム
JPH05233162A (ja) データ退避方式および保守機能を備えたデータ処理システム
JP2006260141A (ja) 記憶システムの制御方法、記憶システム、記憶制御装置、記憶システムの制御プログラム、情報処理システム
JPH07121315A (ja) ディスクアレイ
EP2757477A1 (en) Information processing apparatus and stored information analyzing method
JP5900336B2 (ja) エミュレータ検証システム、エミュレータ検証方法
JP2626127B2 (ja) 予備系ルート試験方式
JP2019101704A (ja) 情報処理システム及び情報処理方法
JP2011076528A (ja) Raidカードの冗長化方法及びraidカードの冗長化装置
JP4876662B2 (ja) メモリダンプ機能を備えたコンピュータシステム、プログラム及びメモリダンプの方法
JP5227653B2 (ja) 多重化計算機システム、及びその処理方法
JP4413723B2 (ja) メモリ交差制御装置およびディスクコピー方法
JP2011018187A (ja) 試験方法、試験プログラム、試験装置、及び試験システム
JP2853593B2 (ja) ダウンロード装置
JP2002100979A (ja) 情報処理装置及び情報処理装置のエラー情報保持方法
JPS59123056A (ja) 冗長機能自動切替システム
JP2016143103A (ja) 制御装置
JP2003345676A (ja) 二重化メモリシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151015

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160816

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161004

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170227

R150 Certificate of patent or registration of utility model

Ref document number: 6111605

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150