JP2008033598A - 動的置き換えシステム、動的置き換え方法およびプログラム - Google Patents

動的置き換えシステム、動的置き換え方法およびプログラム Download PDF

Info

Publication number
JP2008033598A
JP2008033598A JP2006205738A JP2006205738A JP2008033598A JP 2008033598 A JP2008033598 A JP 2008033598A JP 2006205738 A JP2006205738 A JP 2006205738A JP 2006205738 A JP2006205738 A JP 2006205738A JP 2008033598 A JP2008033598 A JP 2008033598A
Authority
JP
Japan
Prior art keywords
cell board
processor
interrupt
memory
spare
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006205738A
Other languages
English (en)
Other versions
JP4788516B2 (ja
Inventor
Eiji Nakajima
英二 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2006205738A priority Critical patent/JP4788516B2/ja
Publication of JP2008033598A publication Critical patent/JP2008033598A/ja
Application granted granted Critical
Publication of JP4788516B2 publication Critical patent/JP4788516B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】 立ち上げ時や運用時の故障部位の置き換え処理におけるセルボードとサービス装置のオーバヘッドがない動的置き換えシステム、動的置き換え方法およびプログラムを提供する。
【解決手段】 少なくとも一つのプロセッサとメモリが搭載された現用セルボード100と、少なくとも一つのプロセッサとメモリが搭載された予備用セルボード200と、現用セルボード100から予備用セルボード200へ割り込みを転送する手段と、前期割り込みを転送されたことを契機として予備用セルボード200を新たな現用セルボードとする手段を有する。
【選択図】 図1

Description

本発明はプロセッサとメモリを搭載した複数のボードを有する情報処理装置及びその制御方法に関し、特に、プロセッサとメモリを搭載したボードの動的予防交換を行う障害処理方式に関する。
従来技術として、特許文献1の情報処理システムがある。図10は、従来の情報処理システムにおける構成例を示すブロック図である。
本従来の情報処理システムは、次のように動作する。まず、サービス装置Bは、切り離し対象セルであるセルボード1aを含むパーティションA1内のセルボード1a、1b、および組み込み対象となる交換用セルボード1a’内の各MMC15a、15b、15a’に対して、セルボード1a内のメモリ13aのデータを交換用セルボード1a’内のメモリ13a’にコピーする動作を指示する。MMC15aはコピー中の書き込み要求に対しては、セルボード1aのメモリ13aと交換用セルボード1a’のメモリ13a’の両方に書き込む。コピーが完了すると、パーティションA1内のCPUの動作を強制的に中断させ、BIOSに対してセルボード1a内のCPU11a、12aの内部情報を交換用セルボード1a’内のCPU11a’、12a’にコピーする処理を指令する。コピーが完了すると、サービス装置Bは、セルボード1aと交換用セルボード1a’との論理IDなどのOSの制御に関わるCPU外部の情報をスワップし、OSから交換用セルボード1a’がセルボード1aに見えるようにする。
本情報処理システムでは、メモリ切り替え、プロセッサ切り替え、OSによる処理の再開の各手順の一つ一つについて、サービス装置とセルボードとがインタフェースを取りつつ処理を行い、最終的にセルボードの切り替えを可能としている。
特開2003−256396
上述した従来の情報処理システムにおける故障部位の置き換えには、セルボードとサービス装置の複雑な連携を必要とし、双方に切り替え処理のオーバヘッドが生じていた。
本発明の目的は、立ち上げ時や運用時の故障部位の置き換え処理におけるセルボードとサービス装置のオーバヘッドがない動的置き換えシステム、動的置き換え方法およびプログラムを提供することにある。
本発明の第1の動的置き換えシステムは、一以上の現用セルボードと、一以上の予備用セルボードと、前記現用セルボードから前記予備用セルボードへ割り込みを転送する手段と、前期割り込みを転送されたことを契機として前記予備用セルボードを新たな現用セルボードとする手段を有することを特徴とする。
本発明の第2の動的置き換えシステムは、少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードと、OSへのプロセッサ組み込み要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送する手段と、前期OSへの前記プロセッサ組み込み要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込む手段と、メモリの切り替え要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送する手段と、前期メモリの切り替え要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込む手段とを有することを特徴とする。
本発明の第3の動的置き換えシステムは、少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードと、回復可能な障害の発生通知割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送する手段と、前期回復可能な障害の発生通知割り込みを転送された前記予備用セルボードの前記プロセッサをOSに組み込む手段とを有することを特徴とする。
本発明の第1の動的置き換え方法は、一以上の現用セルボードと、一以上の予備用セルボードで構成された情報処理装置における動的置き換え方法であって、前記現用セルボードから前記予備セルボードへ割り込みを転送するステップと、前期割り込みを転送されたことを契機として前記予備用セルボードを新たな現用セルボードとするステップを有することを特徴とする。
本発明の第2の動的置き換え方法は、少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードで構成された情報処理装置における動的置き換え方法であって、OSへのプロセッサ組み込み要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送するステップと、前期OSへの前記プロセッサ組み込み要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込むステップと、メモリの切り替え要求割り込みを前記現用セルボードの前記プロセッサから前記予備用セルボードの前記プロセッサへ転送するステップと、前期メモリの切り替え要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込むステップとを有することを特徴とする。
本発明の第3の動的置き換え方法は、少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードで構成された情報処理装置における動的置き換え方法であって、回復可能な障害の発生通知割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送するステップと、前期回復可能な障害の発生通知割り込みを転送された前記予備用セルボードの前記プロセッサをOSに組み込むステップとを有することを特徴とする。
本発明の第1のプログラムは、現用セルボードと予備用セルボードをもつ情報処理装置に、前記現用セルボードから前記予備セルボードへ割り込みを転送し、前期割り込みを転送されたことを契機として前記予備用セルボードを新たな現用セルボードとする処理を行わせることを特徴とする。
本発明の第2のプログラムは、少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボード情報処理装置に、OSへのプロセッサ組み込み要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送し、前期OSへの前記プロセッサ組み込み要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込み、メモリの切り替え要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送し、前期メモリの切り替え要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込む処理を行わせることを特徴とする。
本発明の第3のプログラムは、少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボード情報処理装置に、回復可能な障害の発生通知割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送し、前期回復可能な障害の発生通知割り込みを転送された前記予備用セルボードの前記プロセッサをOSに組み込む処理を行わせることを特徴とする。
本発明によれば、故障部位の置き換え処理におけるセルボードとサービス装置との複雑な連携を不要とし、オーバヘッドをなくすことが可能となる。その理由は、現用セルボードへの割り込みを予備用セルボードへ転送し、割り込みを転送された予備用セルボードのプロセッサをOSへ組み込み、予備用セルボードのメモリを使用するように切り換えることを可能としたためである。
次に、本発明について図面を参照して詳細に説明する。
図1を参照すると、本発明の第1の実施の形態の情報処理装置は、現用セルボード100と、予備用セルボード200と、内部バス240と、外部バス250とから構成される。
現用セルボード100は、CPUA111、CPUB112、CPUM118、CPUN119等の複数のプロセッサと、メモリ120と、切り替えスイッチ130とから構成される。
予備用セルボード200は、CPUA211、CPUB212、CPUM218、CPUN219等の複数のプロセッサと、メモリ220と、切り替えスイッチ230とから構成される。
切り替えスイッチ130および切り替えスイッチ230は、図示しない外部からのメモリアクセスにおいて、現用セルボード100のメモリ120と予備用セルボード200のメモリ220とを排他的に使用可能とするためのものである。すなわち、一方がアクセス可能に設定されている場合は、他方がアクセス不可に設定される。
内部バス240は、現用セルボード100と予備用セルボード200のインタフェースを実現する。
外部バス250は、現用セルボード100および予備用セルボード200と図示しない外部の入出力制御部等とのインタフェースを実現する。
各CPUは、メモリ120、メモリ220に格納されたBIOS(Basic Input Output System)あるいはOS(Operating System)によって動作する。
図2は、本発明の第1の実施の形態の機能ブロック図である。
初期OS立ち上げ手段301は、BIOSの機能の1つとして実現され、CPUA111にて動作する。初期OS立ち上げ手段301は、自身が動作しているCPUA111にCPU内部情報の初期値を設定し、OSに制御を渡す。なお、CPU内部情報とは各CPUA111〜CPUN119、CPUA211〜CPUN219内のレジスタ等のデータである。
P割り込み受付手段302は、BIOSの機能の1つとして実現され、CPUB112〜CPUN119およびCPUB212〜CPUN219にて動作する。P割り込みとは、CPUA111で動作しているOSから発行され、CPUB112〜CPUN119をOSに組み込むことを要求する割り込みである。P割り込みは、CPUA111から出力され、内部バス240を介してCPUB112〜CPUN119に入力される。P割り込み受付手段302は、P割り込みを受け付け、立ち上げ障害検出状況記憶手段314の内容を読み出し現用セルボード100のいずれかのCPUA111〜CPUN119、メモリ120において継続可能な軽度の故障が検出されている状態か否かを確認する。そして、P割り込み受付手段302は、前記故障が検出されていなければP割り込みOS遷移手段304に制御を渡し、前記故障が検出されていればP割り込み転送手段305に制御を渡す。
立ち上げ障害検出状況記憶手段314は、図示しない立ち上げ時の試験手段によって、いずれかのCPUA111〜CPUN119、メモリ120において継続可能な軽度の故障が検出されている状態か否かを書き込まれ、記憶する。
P割り込みOS遷移手段304は、BIOSの機能の1つとして実現され、CPUB112〜CPUN119およびCPUB212〜CPUN219にて動作する。P割り込みOS遷移手段304は、自身が動作しているCPUB112〜CPUN119およびCPUB212〜CPUN219にCPU内部情報の初期値を設定し、OSに制御を渡す。
P割り込み転送手段305は、BIOSの機能の1つとして実現され、CPUB112〜CPUN119で動作する。P割り込み転送手段305は、自身が動作している現用セルボード100上のCPUB112〜CPUN119に対応する予備用セルボード200上のCPUB212〜CPUN219にP割り込みを転送する。
Q割り込み発生手段306は、BIOSの機能の1つとして実現され、CPUN119上で動作する。Q割り込み発生手段306は、CPUA111へQ割り込みを上げる。Q割り込みは、メモリ120からメモリ220への切り替えを要求する割り込みである。Q割り込みは、CPUN119から出力され、内部バス240を介してCPUA111に入力される。
Q割り込みBIOS遷移手段307は、一般的なCPUの機能の1つとして実現され、CPUA111上で動作する。Q割り込みBIOS遷移手段307は、Q割り込みを受けた時点のCPU内部情報を、メモリ120に保存して、BIOSのR割り込み発生手段308制御を渡す。
R割り込み発生手段308は、BIOSの機能の1つとして実現され、CPUA111上で動作する。R割り込み発生手段308は、CPUB212〜CPUN219へR割り込みを上げる。R割り込みは、予備用セルボード200上のCPUB212〜CPUN219をBIOSに渡すことを要求する割り込みである。R割り込みは、CPUA111から出力され、内部バス240を介してCPUB212〜CPUN219に入力される。
R割り込みBIOS遷移手段309は、一般的なCPUの機能の1つとして実現され、CPUB212〜CPUN219で動作する。R割り込みBIOS遷移手段309は、R割り込みを受けた時点のCPU内部情報をメモリ120に保存して、BIOSに制御を渡す。そしてBIOSは、待ち状態に入る。
メモリ切り替え手段310は、BIOSの機能の1つとして実現され、CPUA111〜CPUN119で動作する。メモリ切り替え手段310は、メモリ120の内容をメモリ220へコピーする。そして、メモリ切り替え手段310は、切り替えスイッチ130をアクセス不可に、切り替えスイッチ230をアクセス可に設定して、現用セルボード100のメモリ120から予備用セルボード200のメモリ220へ切り替える。
メモリ切り替え後OS遷移手段311は、BIOSの機能の1つとして実現され、CPUB212〜CPUN219で動作する。メモリ切り替え後OS遷移手段311は、自身が動作しているCPUに、R割り込みBIOS遷移手段309によって保存されたCPU内部情報を設定し、OSに制御を渡す。
Q割り込み転送手段312は、BIOSの機能の1つとして実現され、CPUA111上で動作する。Q割り込み転送手段312は、CPUA211へQ割り込みを転送する。Q割り込みの転送は、CPUA111から出力され、内部バス240を介してCPUA211に入力される。
Q割り込みOS遷移手段313は、BIOSの機能の1つとして実現され、CPUA211で動作する。Q割り込みOS遷移手段313は自身が動作しているCPUに、Q割り込みBIOS遷移手段307によって保存されたCPU内部情報を設定し、OSに制御を渡す。
次に図1〜図5を参照して、本発明の第1の実施の形態の動作について、具体的な実施例を示して詳細に説明する。
本発明の第1の実施の形態においては、図1の構成の情報処理装置の立ち上げ時に、現用セルボード100上のいずれかのCPUA111〜CPUN119またはメモリ120において動作継続可能な故障が発生した場合に、本情報処理装置を停止することなく、現用セルボード100のCPUA111〜CPUN119、メモリ120から予備用セルボード200のCPUA211〜CPUN219、メモリ220へと交換可能とするための具体的な実施例について詳細に説明する。
図3は、立ち上げ障害検出状況記憶手段314に記憶されている、立ち上げ障害検出状況の構造を示す図である。
図4は、本発明の第1の実施の形態における、フローチャートである。図5は、本発明の第1の実施の形態における、CPUA111〜CPUN119およびCPUA211〜CPUN219の状態遷移図である。
初期状態は、現用セルボード100のCPUA111〜CPUN119上にはBIOSが、予備用セルボード200のCPUA211〜CPUN219上にはBIOSが動作している(図5のC501参照)。
先ず始めに、初期OS立ち上げ手段301は、CPUA111に初期値としてCPU内部情報(Y)を設定し、OSを立ち上げる(図4のステップS401、図5のC503参照)。なお、CPU内部情報に続いて記載する「(Y)」は、説明の便宜上付与した符号であり、構成や動作の違いを表すものではない。以下の「(W)」、「(X)」、「(Y)」、「(Z)」も同様である。
CPUA111で立ち上がったOSはCPUB112〜CPUN119を組み込むためにP割り込みを発生する(フローチャートには図示しない)。
P割り込みを受けたCPUB112〜CPUN119で動作しているBIOSのP割り込み受付手段302は、立ち上げ障害検出状況記憶手段314から図3の立ち上げ障害検出状況を読み出し、現用セルボード100上のCPUA111〜CPUN119、メモリ120のいずれかでの継続可能な軽度の故障の検出状態を確認し、故障無しの場合はステップS403へ進み、故障有りの場合はステップS404へ進む(図4のステップS402)。本実施例では、図3の立ち上げ障害検出状況において『CPUB』が『故障有り』となっているため、ステップS404へ進む。
ステップS403では、CPUB112〜CPUN119で動作しているBIOSのP割り込みOS遷移手段304は、CPUB112〜CPUN119に初期値としてCPU内部情報(Y)を設定し、OSへ渡す(図4のステップS403、図5のC505参照)。そして、処理は終了する。
ステップ404では、CPUB112〜CPUN119で動作しているBIOSのP割り込み転送手段305は、それぞれCPUB212〜CPUN219に対してP割り込みを転送する(図4のステップS404)。
CPUB212〜CPUN219で動作しているBIOSのP割り込み受付手段302は、P割り込みを受ける。そして、前記BIOSのP割り込みOS遷移手段304は、CPUB212〜CPUN219に初期値としてCPU内部情報(Y)を設定し、OSへ渡す(図4のステップS405)。こうして、P割り込みの転送により、この時点で現用のCPUB112〜CPUN119が予備用のCPUB212〜CPUN219へと交換される(図5のC507参照)。
CPUN119で動作しているBIOSのQ割り込み発生手段306は、CPUA111に対してQ割り込みを送る(図4のステップS406)。
CPUA111のQ割り込みBIOS遷移手段307は、Q割り込みを受けると直ちに、CPU内部情報(Z)をメモリ120に保存し、BIOSへ制御を渡す(図4のステップS407、図5のC509参照)。
CPUA111で動作しているBIOSのR割り込み発生手段308は、現用セルボード100のメモリ120から予備用セルボード200のメモリ220への内容のコピー中にメモリアクセスが発生しないようにするために、OSへ制御が移っているCPUB212〜CPUN219に対してR割り込みを送る(図4のステップS408)。
CPUB212〜CPUN219のR割り込みBIOS遷移手段309は、R割り込みを受けると直ちに、CPU内部情報(W)をメモリ120に保存し、BIOSへ制御を渡す。そして、CPUB212〜CPUN219で動作しているBIOSはメモリ120,メモリ220へのアクセスをしないようにするために、待ち処理に入る(図4のステップS409、図5のC511参照)。
CPUA111で動作しているBIOSのメモリ切り替え手段310は、メモリ120の内容をメモリ220へコピーする。そして、前記メモリ切り替え手段310は、切り替えスイッチ130をアクセス不可に、切り替えスイッチ230をアクセス可に設定して、現用セルボード100のメモリ120から予備用セルボード200のメモリ220へ切り替える(図4のステップS410)。この時点で現用のメモリ120が予備用のメモリ220へと交換される。
メモリ切り替えが完了すると、待ち処理に入っていたCPUB212〜CPUN219で動作しているBIOSのメモリ切り替え後OS遷移手段311は、CPUB212〜CPUN219にCPU内部情報(W)を設定し、OSに渡す。前記CPU内部情報(W)は、ステップS409で現用セルボード100上のメモリ120に保存され、ステップS410で現用セルボード100上のメモリ120から予備用セルボード200上のメモリ220へコピーされたものである(図4のステップS411、図5のC513参照)。
次に、CPUA111で動作しているBIOSのQ割り込み転送手段312は、Q割り込みをCPUA211に対して転送する(図4のステップS412)。
CPUA211で動作しているBIOSのQ割り込みOS遷移手段313は、Q割り込みを受けると、CPUA211にCPU内部情報(Z)を設定し、OSに渡す。前記CPU内部情報(Z)は、ステップS407で現用セルボード100上のメモリ120に保存され、ステップS410で現用セルボード100上のメモリ120から予備用セルボード200上のメモリ220へコピーされたものである(図4のステップS413)。こうして、Q割り込みの転送により、この時点で現用のCPUA111が予備用のCPUA211へと交換される(図5のC515参照)。
以上により、本発明の第1の実施の形態の動作が完了する。本発明の第1の実施の形態によれば、立ち上げ時のOSが発したP割り込みの転送により現用のCPUB112〜CPUN119が予備用のCPUB212〜CPUN219へと交換され、続いてQ割り込みを発生して現用のメモリ120を予備用にメモリ220へ置き換え、さらにQ割り込みの転送により現用のCPUA111を予備用のCPUA211へと交換されるようにしたことにより、立ち上げ時にオペレーティングシステムを再立ち上げすることなく、サービス装置との連携なしに、セルボードを予備へと置き換えることができるという効果を有している。
尚、以上の説明では、理解を容易にするため現用セルボードも予備用セルボードも一枚としたが、現用セルボード乃至予備用セルボードが複数枚である場合においても同様である。
次に、本発明の第2の実施の形態について図面を参照して詳細に説明する。
図6は、本発明の第2の実施の形態の機能ブロック図である。
まず、図示しない障害検出手段が回復可能な障害を検出し、現用セルボード100のCPUA111〜CPUN119のいずれかにT割り込みを発生する。T割り込みは、回復可能な障害の発生を通知する割り込みである。T割り込みは、図示しない障害検出手段から出力され、内部バス240を介してCPUA111〜CPUN119のいずれかに入力される。
T割り込みBIOS遷移手段331は、一般的なCPUの機能の1つとして実現され、CPUA111〜CPUN119で動作する。T割り込みBIOS遷移手段331は、T割り込みを受けた時点のCPU内部情報を、メモリ120に保存して、T割り込み回数確認手段332へ制御を渡す。
T割り込み回数確認手段332は、BIOSの機能の1つとして実現され、CPUA111〜CPUN119で動作する。T割り込み回数確認手段332は、T割り込み状態記憶手段344から障害検出回数と閾値を読み出し、障害検出回数が閾値を超えているか否かを確認する。そして、T割り込み回数確認手段332は、障害検出回数が閾値を超えていなければT割り込み後OS遷移手段334に制御を渡し、障害検出回数が閾値を超えていればU割り込み発生手段335に制御を渡す。
T割り込み状態記憶手段344は、図示しない閾値設定手段によって予め設定された閾値と、図示しない障害検出手段によって検出された障害の検出回数を記憶する。
T割り込み後OS遷移手段334は、BIOSの機能の1つとして実現され、CPUA111〜CPUN119で動作する。T割り込み後OS遷移手段334は、自身が動作しているCPUA111〜CPUN119にT割り込みBIOS遷移手段331によって保存されたCPU内部情報を設定し、OSに制御を渡す。
U割り込み発生手段335は、BIOSの機能の1つとして実現され、CPUA111〜CPUN119いずれかで動作する。U割り込み発生手段335は、自身が動作している現用セルボード100上のCPUA111〜CPUN119いずれか以外の現用セルボード100上のCPUA111〜CPUN119にU割り込みを送信する。U割り込みは、T割り込みを受けた現用セルボード100上のCPUA111〜CPUN119いずれかから現用セルボード100上のそれ以外のCPUA111〜CPUN119へのT割り込みの転送であり、現用セルボード100上のCPUA111〜CPUN119の制御をBIOSに渡すことを要求する割り込みである。R割り込みは、CPUA111〜CPUN119いずれかから出力され、内部バス240を介して自身以外のCPUA111〜CPUN119に入力される。
U割り込みBIOS遷移手段339は、一般的なCPUの機能の1つとして実現され、CPUA111〜CPUN119で動作する。U割り込みBIOS遷移手段339は、U割り込みを受けた時点のCPU内部情報を、メモリ120に保存して、BIOSに制御を渡す。そしてBIOSは、待ち状態に入る。
メモリ切り替え手段340は、BIOSの機能の1つとして実現され、CPUA111〜CPUN119で動作する。メモリ切り替え手段340は、メモリ120の内容をメモリ220へコピーする。そして、メモリ切り替え手段340は、切り替えスイッチ130をアクセス不可に、切り替えスイッチ230をアクセス可に設定して、現用セルボード100のメモリ120から予備用セルボード200のメモリ220へ切り替える。
U割り込み転送手段336は、BIOSの機能の1つとして実現され、CPUA111〜CPUN119で動作する。U割り込み転送手段336は、自身が動作している現用セルボード100上のいずれかのCPUA111〜CPUN119から、予備用セルボード200上の前記現用セルボード100上のいずれかのCPUA111〜CPUN119に対応するCPU以外のCPUA211〜CPUN219へ、U割り込みを発行する。このU割り込みは、予備用セルボード200上のCPUA211〜CPUN219をOSに渡すことを要求する割り込みである。U割り込みの転送は、CPUA111〜CPUN119のいずれかから出力され、内部バス240を介して、U割り込みの転送を出力したCPUA111〜CPUN119のいずれかに対応するCPUA211〜CPUN219のいずれか以外のCPUA211〜CPUN219に入力される。
U割り込みOS遷移手段341は、BIOSの機能の1つとして実現され、CPUA211〜CPUN219で動作する。U割り込みOS遷移手段341は、自身が動作しているCPUA211〜CPUN219に、U割り込みBIOS遷移手段339によって保存されたCPU内部情報を設定し、OSに制御を渡す。
V割り込み発生手段342は、BIOSの機能の1つとして実現され、CPUA111〜CPUN119で動作する。V割り込み発生手段342は、自身が動作している現用セルボード100上のいずれかのCPUA111〜CPUN119から、予備用セルボード200上の前記現用セルボード100上のいずれかのCPUA111〜CPUN119に対応するCPUA211〜CPUN219へ、V割り込みを送信する。このV割り込みは、予備用セルボード200上のCPUA211〜CPUN219をOSに渡すことを要求する割り込みである。V割り込みは、CPUA111〜CPUN119のいずれかから出力され、内部バス240を介して、V割り込みを出力したCPUA111〜CPUN119のいずれかに対応するCPUA211〜CPUN219のいずれかに入力される。
V割り込みOS遷移手段343は、BIOSの機能の1つとして実現され、CPUA211〜CPUN219で動作する。V割り込みOS遷移手段343は、自身が動作しているCPUA211〜CPUN219に、T割り込みBIOS遷移手段331によって保存されたCPU内部情報を設定し、OSに制御を渡す。
次に、図1および図6〜図9を参照して、本発明の第2の実施の形態の動作について、具体的な実施例を示して詳細に説明する。
本発明の第2の実施の形態においては、図1の構成の情報処理装置において、現用セルボード100のCPUA111〜CPUN119上でOSが動作しており、業務アプリケーションなどが動作している。この状態で、現用セルボード100上のCPUA111〜CPUN119、又はメモリ120において動作継続可能な故障が特定の閾値を超える回数発生した場合に、本情報処理装置を停止することなく、現用セルボード100のCPUA111〜CPUN119、およびメモリ120から予備用セルボード200のCPUA211〜CPUN219、およびメモリ220へ交換可能とするための具体的な実施例について詳細に説明する。
図7は、T割り込み状態記憶手段344に記憶されている、T割り込み状態の構造を示す図である。
図8は、本発明の第2の実施の形態における、フローチャートである。図9は、本発明の第2の実施の形態における、CPUA111〜CPUN119およびCPUA211〜CPUN219の状態遷移図である。
初期状態は、現用セルボード100のCPUA111〜CPUN119上にはOSが、予備用セルボード200のCPUA211〜CPUN219上にはBIOSが動作している(図9のC531参照)。
現用セルボード100上のCPUA111〜CPUN119、又はメモリ120において動作継続可能な故障が発生すると、それはCPUA111〜CPUN119、又はメモリ120によって自動訂正される。そして、前記動作継続可能な故障による訂正可能障害が発生したことを示すT割り込みが、CPUA111〜CPUN119のいずれかへ通知される。本実施例では、現用セルボード100上で継続可能な故障が発生し、T割り込みがCPUN119へ通知されたとする。(図8のステップS431)
CPUN119のT割り込みBIOS遷移手段331は、T割り込みを受けると直ちに、CPU内部情報(Z)をメモリ120に保存し、BIOSへ制御を渡す(図8のステップS432、図9のC533参照)。
CPUN119で動作しているBIOSのT割り込み発生回数確認手段は、T割り込み状態記憶手段344から図7に示すT割り込み状態を読み出し、現用セルボード100上のCPUA111〜CPUN119、又はメモリ120いずれかで故障検出回数が閾値を超えているか否かを確認する。そして、故障検出回数が閾値未満の場合はステップS434へ進み、故障検出回数が閾値以上の場合はステップS435へ進む(図8のステップS433)。本実施例では、図7のT割り込み状態において、いずれのCPUA111〜CPUN119、又はメモリ120とも閾値を超えていないため、ステップS434へ進む。
ステップ434では、CPUN119で動作しているBIOSのT割り込み後OS遷移手段334は、CPUN119にCPU内部情報(Z)を設定し、OSへ渡す。前記CPU内部情報(Z)は、ステップS432でメモリ120に保存されたものである(図8のステップS434、図9のC535参照)。そして、処理は終了する。
ステップS435では、CPUN119で動作しているBIOSのU割り込み発生手段335は、現用セルボード100のメモリ120から予備用セルボード200のメモリ220への内容のコピー中にメモリアクセスが発生しないようにするために、OSが動作しているCPUA111〜CPUM118に対してU割り込みを送る(図8のステップS435)。
CPUA111〜CPUM118のU割り込みBIOS遷移手段339は、U割り込みを受けると直ちに、CPU内部情報(X)をメモリ120に保存し、BIOSへ制御を渡す。そして、CPUA111〜CPUM118で動作しているBIOSはメモリ120、メモリ220へのアクセスをしないようにするために、待ち処理に入る(図8のステップS436、図9のC537参照)。
CPUN119で動作しているBIOSのメモリ切り替え手段340は、メモリ120の内容をメモリ220へコピーする。そして、メモリ切り替え手段340は、切り替えスイッチ130をアクセス不可に、切り替えスイッチ230をアクセス可に設定して、現用セルボード100のメモリ120から予備用セルボード200のメモリ220へ切り替える(図8のステップS437)。この時点で現用のメモリ120が予備用のメモリ220へと交換される。
メモリ切り替えが完了すると、CPUN119で動作しているBIOSのU割り込み転送手段336は、CPUA211〜CPUM218に対してU割り込みを送る(図8のステップS438)。
CPUA211〜CPUM218で動作しているBIOSのU割り込みOS遷移手段341は、U割り込みを受けると、CPUA211〜CPUM218にCPU内部情報(X)を設定し、OSに渡す。前記CPU内部情報(X)は、ステップS436で現用セルボード100上のメモリ120に保存され、ステップS437で現用セルボード100上のメモリ120から予備用セルボード200上のメモリ220へコピーされたものである(図8のステップS439、図9のC539参照)。こうして、T割り込みをU割り込みとして転送することにより、この時点で現用のCPUA111〜CPUM118が予備用のCPUA211〜CPUN219へと交換される。
次に、CPUN119で動作しているBIOSのV割り込み発生手段342は、CPUN219に対して、V割り込みを送る(図8のステップS440)。
CPUN219で動作しているBIOSのV割り込みOS遷移手段343は、V割り込みを受けると、CPUN219にCPU内部情報(Z)を設定し、OSに渡す。前記CPU内部情報(Z)は、ステップS432でメモリ120に保存され、ステップS437で現用セルボード100上のメモリ120から予備用セルボード200上のメモリ220へコピーされたものである(図8のステップS441)。こうして、T割り込みをV割り込みとして転送することにより、この時点で現用のCPUN119が予備用のCPU219へと交換される(図5のC541参照)。以上により、本発明の第2の実施の形態の動作が完了する。本発明の第2の実施の形態によれば、CPUA111〜CPUN119、又はメモリ120で運用継続可能な軽度の故障が閾値以上の回数発生すると、これを契機に現用のメモリ120を予備用のメモリ220へ置き換え、U割り込みの転送により現用のCPUA111〜CPUM118を予備用のCPUA211〜CPUM218へと交換し、さらにT割り込みをV割り込みに変更して転送することにより現用のCPUN119が予備用のCPUN219へと交換されるようにしたことにより、運用中に業務アプリケーションを停止、オペレーティングシステムを再立ち上げすることなく、サービス装置との連携なしに、セルボードを予備へと置き換えることができるという効果を有している。
尚、以上の説明では、理解を容易にするため現用セルボードも予備用セルボードも一枚としたが、現用セルボード乃至予備用セルボードが複数枚である場合においても同様である。
以上のように実現することで本発明は、情報処理装置の可用性の改善が図られる。特に、立ち上げ時の故障検出に対しての予備系への切り替えによる運用信頼性の向上、運用中の継続運転可能な故障に対しての再立ち上げを必要としない予備系への切り替え、そして予備系への切り替え後におけるシステム停止を必要としない保守交換が要求されるミッションクリティカルシステム構築の分野に利用できる。
本発明の第1および第2の実施の形態の構成を示すブロック図である。 本発明の第1の実施の形態における機能ブロック図である。 本発明の第1の実施の形態における立ち上げ障害検出状況記憶手段314に記憶された立ち上げ障害検出状況の構造を示す図である。 本発明の第1の実施の形態におけるフローチャートである。 本発明の第1の実施の形態におけるCPUの状態遷移を示す図である。 本発明の第2の実施の形態における機能ブロック図である。 本発明の第2の実施の形態におけるT割り込み状態記憶手段344に記憶されたT割り込み状態の構造を示す図である。 本発明の第2の実施の形態におけるフローチャートである。 本発明の第2の実施の形態におけるCPUの状態遷移を示す図である。 従来技術の構成を示すブロックを示す図である。
符号の説明
100 現用セルボード
111 CPUA
112 CPUB
118 CPUM
119 CPUN
120 メモリ
130 切り替えスイッチ
200 予備用セルボード
211 CPUA
212 CPUB
218 CPUM
219 CPUN
220 メモリ
230 切り替えスイッチ
240 内部バス
250 外部バス
301 初期OS立ち上げ手段
302 P割り込み受付手段
304 P割り込みOS遷移手段
305 P割り込み転送手段
306 Q割り込み発生手段
307 Q割り込みBIOS遷移手段
308 R割り込み発生手段
309 R割り込みBIOS遷移手段
310 メモリ切り替え手段
311 メモリ切り替え後OS遷移手段
312 Q割り込み転送手段
313 Q割り込みOS遷移手段
314 立ち上げ障害検出状況記憶手段
331 T割り込みBIOS遷移手段
332 T割り込み回数確認手段
334 T割り込み後OS遷移手段
335 U割り込み発生手段
336 U割り込み転送手段
339 U割り込みBIOS遷移手段
340 メモリ切り替え手段
341 U割り込みOS遷移手段
342 V割り込み発生手段
343 V割り込みOS遷移手段
344 T割り込み状態記憶手段

Claims (9)

  1. 一以上の現用セルボードと、一以上の予備用セルボードと、前記現用セルボードから前記予備用セルボードへ割り込みを転送する手段と、前期割り込みを転送されたことを契機として前記予備用セルボードを新たな現用セルボードとする手段を有することを特徴とする動的置き換えシステム。
  2. 少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードと、OSへのプロセッサ組み込み要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送する手段と、前期OSへの前記プロセッサ組み込み要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込む手段と、メモリの切り替え要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送する手段と、前期メモリの切り替え要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込む手段とを有することを特徴とする動的置き換えシステム。
  3. 少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードと、回復可能な障害の発生通知割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送する手段と、前期回復可能な障害の発生通知割り込みを転送された前記予備用セルボードの前記プロセッサをOSに組み込む手段とを有することを特徴とする動的置き換えシステム。
  4. 一以上の現用セルボードと、一以上の予備用セルボードで構成された情報処理装置における動的置き換え方法であって、前記現用セルボードから前記予備セルボードへ割り込みを転送するステップと、前期割り込みを転送されたことを契機として前記予備用セルボードを新たな現用セルボードとするステップを有することを特徴とする動的置き換え方法。
  5. 少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードで構成された情報処理装置における動的置き換え方法であって、OSへのプロセッサ組み込み要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送するステップと、前期OSへの前記プロセッサ組み込み要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込むステップと、メモリの切り替え要求割り込みを前記現用セルボードの前記プロセッサから前記予備用セルボードの前記プロセッサへ転送するステップと、前期メモリの切り替え要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込むステップとを有することを特徴とする動的置き換え方法。
  6. 少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボードで構成された情報処理装置における動的置き換え方法であって、回復可能な障害の発生通知割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送するステップと、前期回復可能な障害の発生通知割り込みを転送された前記予備用セルボードの前記プロセッサをOSに組み込むステップとを有することを特徴とする動的置き換え方法。
  7. 現用セルボードと予備用セルボードをもつ情報処理装置に、前記現用セルボードから前記予備セルボードへ割り込みを転送し、前期割り込みを転送されたことを契機として前記予備用セルボードを新たな現用セルボードとする処理を行わせることを特徴とするプログラム。
  8. 少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボード情報処理装置に、OSへのプロセッサ組み込み要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送し、前期OSへの前記プロセッサ組み込み要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込み、メモリの切り替え要求割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送し、前期メモリの切り替え要求割り込みを転送された前記予備用セルボードの前記プロセッサを前記OSに組み込む処理を行わせることを特徴とするプログラム。
  9. 少なくとも一つのプロセッサとメモリが搭載された一以上の現用セルボードと、少なくとも一つのプロセッサとメモリが搭載された一以上の予備用セルボード情報処理装置に、回復可能な障害の発生通知割り込みを前記現用セルボードに搭載された前記プロセッサから前記予備用セルボードに搭載された前記プロセッサへ転送し、前期回復可能な障害の発生通知割り込みを転送された前記予備用セルボードの前記プロセッサをOSに組み込む処理を行わせることを特徴とするプログラム。
JP2006205738A 2006-07-28 2006-07-28 動的置き換えシステム、動的置き換え方法およびプログラム Expired - Fee Related JP4788516B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006205738A JP4788516B2 (ja) 2006-07-28 2006-07-28 動的置き換えシステム、動的置き換え方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006205738A JP4788516B2 (ja) 2006-07-28 2006-07-28 動的置き換えシステム、動的置き換え方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2008033598A true JP2008033598A (ja) 2008-02-14
JP4788516B2 JP4788516B2 (ja) 2011-10-05

Family

ID=39122949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006205738A Expired - Fee Related JP4788516B2 (ja) 2006-07-28 2006-07-28 動的置き換えシステム、動的置き換え方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4788516B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205362A (ja) * 2008-02-27 2009-09-10 Nec Corp コンピュータ装置、コンピュータ装置の運用継続方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140438A (ja) * 1983-12-27 1985-07-25 Nec Corp 情報処理系の系切替制御方式
JPH0553938A (ja) * 1991-08-22 1993-03-05 Fujitsu Ltd 二重化構成の中央制御装置切替え方式
JP2003256396A (ja) * 2002-02-26 2003-09-12 Nec Corp 情報処理システム及び該システムの制御方法並びにプログラム
JP2004318885A (ja) * 2003-04-17 2004-11-11 Internatl Business Mach Corp <Ibm> 故障プロセッサを置き換える方法、媒体およびシステム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140438A (ja) * 1983-12-27 1985-07-25 Nec Corp 情報処理系の系切替制御方式
JPH0553938A (ja) * 1991-08-22 1993-03-05 Fujitsu Ltd 二重化構成の中央制御装置切替え方式
JP2003256396A (ja) * 2002-02-26 2003-09-12 Nec Corp 情報処理システム及び該システムの制御方法並びにプログラム
JP2004318885A (ja) * 2003-04-17 2004-11-11 Internatl Business Mach Corp <Ibm> 故障プロセッサを置き換える方法、媒体およびシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205362A (ja) * 2008-02-27 2009-09-10 Nec Corp コンピュータ装置、コンピュータ装置の運用継続方法及びプログラム

Also Published As

Publication number Publication date
JP4788516B2 (ja) 2011-10-05

Similar Documents

Publication Publication Date Title
JP4585463B2 (ja) 仮想計算機システムを機能させるためのプログラム
US7865782B2 (en) I/O device fault processing method for use in virtual computer system
JP4315016B2 (ja) コンピュータシステムの系切替方法
JP2009211517A (ja) 仮想計算機冗長化システム
WO2008101386A1 (fr) Procédé de récupération d&#39;une exception à noyau unique dans un système à plusieurs noyaux
JP2006277205A (ja) 記憶装置システムおよびその制御方法、制御プログラム
JP2010224847A (ja) 計算機システム及び設定管理方法
JP5224038B2 (ja) コンピュータ装置、コンピュータ装置の運用継続方法及びプログラム
JP5287974B2 (ja) 演算処理システム、再同期方法、およびファームプログラム
JP4640071B2 (ja) 情報処理装置、情報処理復旧方法及び情報処理復旧プログラム
JP4788516B2 (ja) 動的置き換えシステム、動的置き換え方法およびプログラム
JP6109404B2 (ja) 計算機装置及び計算機機構
JP2009116699A (ja) 情報処理システム
US20070038849A1 (en) Computing system and method
JP3604171B2 (ja) プロセス自動再起動処理方式
JP4876662B2 (ja) メモリダンプ機能を備えたコンピュータシステム、プログラム及びメモリダンプの方法
JP2010061258A (ja) デュプレックスプロセッサシステム及びプロセッサ二重化方法
US20090307471A1 (en) Methods, systems and computer program products for fault tolerant applications
JP3340284B2 (ja) 冗長システム
JP2004046474A (ja) マルチos環境の計算機システムおよびそのプログラム
JP2012190064A (ja) 情報処理装置、メモリ管理方法、およびメモリ管理プログラム
JP2013186727A (ja) 多重系システム用計算機および多重系制御方法
JPH09305440A (ja) エラー処理方法
JP4494263B2 (ja) サービスシステムの冗長化方式
JPH0395634A (ja) 計算機システム再起動制御方式

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080616

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20090512

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110621

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110704

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140729

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4788516

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees