JP6928148B1 - フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラム - Google Patents

フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラム Download PDF

Info

Publication number
JP6928148B1
JP6928148B1 JP2020088667A JP2020088667A JP6928148B1 JP 6928148 B1 JP6928148 B1 JP 6928148B1 JP 2020088667 A JP2020088667 A JP 2020088667A JP 2020088667 A JP2020088667 A JP 2020088667A JP 6928148 B1 JP6928148 B1 JP 6928148B1
Authority
JP
Japan
Prior art keywords
input
information processing
output
processing device
resource information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020088667A
Other languages
English (en)
Other versions
JP2021184131A (ja
Inventor
康 竹森
康 竹森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2020088667A priority Critical patent/JP6928148B1/ja
Application granted granted Critical
Publication of JP6928148B1 publication Critical patent/JP6928148B1/ja
Publication of JP2021184131A publication Critical patent/JP2021184131A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

【課題】フォールトトレラントシステムにおいて、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間を短縮する。【解決手段】フォールトトレラントシステム3は、第1及び第2の情報処理装置30a及び30bによる二重化構成を有し、第1の情報処理装置30aのみで稼働している状態において第2の情報処理装置30bの稼働が開始されるときに、第1の情報処理装置30aの入出力資源の構成に関する第1の入出力資源情報310aを記憶する第1の記憶部31aと、第2の情報処理装置30bのCPUの初期化が開始される前に、第1の入出力資源情報310aを第2の入出力資源情報310bとして記憶する第2の記憶部31bと、第2の情報処理装置30bのCPUの初期化において、第2の入出力資源情報310bを用いて第2の情報処理装置30bの入出力資源に関する設定を行う設定部32bと、を備える。【選択図】 図5

Description

本発明は、フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラムに関する。
現在、例えば二重化したサーバを備えることによって可用性を向上させた、多数のフォールトトレラントシステムが構築されている。このようなフォールトトレラントシステムでは、障害が発生したのち、片系のサーバによる稼働状態から二重化構成による稼働状態に復帰する際に、稼働中のサーバにおけるデータを、稼働を開始するもう片方のサーバにコピーする処理を行う。そして、その処理を行う間、システムの運用を一時的に停止する必要があるので、このようなシステムの停止時間を短縮する技術が期待されている。
このような技術に関連する技術として、特許文献1には、オンライン系サブシステムとオフライン系サブシステムとによる情報処理を二重化するように構成されたフォールトトレラントサーバが開示されている。このサーバは、二重化を開始する前に、オンライン系サブシステムのメモリに記憶されている全てのデータを、オフライン系サブシステムのメモリにコピーする全コピー処理を実行する。このサーバは、オンライン系サブシステムのメモリに記憶されているデータのうち、全コピー処理中に内容が変更されたと判定される基準を満たすデータを検出する。そしてこのサーバは、検出されたデータを、オンライン系サブシステムのメモリから オフライン系サブシステムのメモリにコピーするように動作する。
また、特許文献2には、ライトアドレスデータ格納用メモリモジュールをメモリスロットに実装したフォールトトレラントサーバが開示されている。このサーバは、メインメモリへのライトアドレスを、ライトアドレスデータ格納用メモリに蓄積する。このサーバは、障害発生に起因して片系動作となった時点から片系動作を終了して二重化動作に復旧させる時点の間にかけて蓄積されたライトアドレスを、メモリバスへ出力する。そしてこのサーバは、出力されたライトアドレスに対応付けられるメインメモリに格納されたデータを読み出して、障害から復旧した他の片系のメインメモリへコピーする。
また、特許文献3には、動作系情報処理システムに待機系情報処理システムを同期化させる二重化情報処理システムが開示されている。このシステムは、この同期化の際、動作系のキャッシュメモリの内容を待機系のキャッシュメモリにコピーすると共に、動作系の主記憶装置の内容を待機系の主記憶装置にコピーする。このシステムは、コピーが完了するまでの間、動作系のCPU(Central Processing Unit)および待機系のCPUからのリードおよびライトを動作系の主記憶装置に対するリードおよびライトとして処理する。そしてこのシステムにおける動作系及び待機系のCPUは、キャッシュメモリのコピーの完了時、主記憶装置のコピーの完了を待たずに、同一タイミングで同一の処理の実行を開始する。
特開2015−184866号公報 特開2014−157492号公報 特開2013−020566号公報
コンピュータシステムの規模、及び、コンピュータシステムが処理するデータ量は、年々急速に増加していることから、上述したフォールトトレラントシステムを、片系による稼働状態から二重化構成による稼働状態へ復帰するのに要する時間も増加する傾向にある。したがって、上述した特許文献1乃至3が示す技術では、フォールトトレラントシステムの可用性を向上する点において十分であるとはいえず、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間をさらに短縮することが課題である。
本発明の主たる目的は、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間を短縮するフォールトトレラントシステム等を提供することにある。
本発明の一態様に係るフォールトトレラントシステムは、第一及び第二の情報処理装置による二重化構成を有するフォールトトレラントシステムであって、前記第一の情報処理装置のみで稼働している状態において前記第二の情報処理装置の稼働が開始されるときに、前記第一の情報処理装置の入出力資源の構成に関する第一の入出力資源情報を記憶する第一の記憶手段と、前記第二の情報処理装置のCPUの初期化が開始される前に、前記第一の入出力資源情報を第二の入出力資源情報として記憶する第二の記憶手段と、前記第二の情報処理装置のCPUの初期化において、前記第二の入出力資源情報を用いて前記第二の情報処理装置の入出力資源に関する設定を行う設定手段と、を備える。
上記目的を達成する他の見地において、本発明の一態様に係るフォールトトレラント制御方法は、第一及び第二の情報処理装置による二重化構成を有するフォールトトレラントシステムによって、前記第一の情報処理装置のみで稼働している状態において前記第二の情報処理装置の稼働が開始されるときに、前記第一の情報処理装置の入出力資源の構成に関する第一の入出力資源情報を第一の記憶手段に記憶し、前記第二の情報処理装置のCPUの初期化が開始される前に、前記第一の入出力資源情報を第二の入出力資源情報として第二の記憶手段に記憶し、前記第二の情報処理装置のCPUの初期化において、前記第二の入出力資源情報を用いて前記第二の情報処理装置の入出力資源に関する設定を行う。
また、上記目的を達成する更なる見地において、本発明の一態様に係るフォールトトレラント制御プログラムは、第一及び第二の情報処理装置による二重化構成を有するフォールトトレラントシステムにおいて、前記第一の情報処理装置のみで稼働している状態において前記第二の情報処理装置の稼働が開始されるときに、前記第一の情報処理装置の入出力資源の構成に関する第一の入出力資源情報を第一の記憶手段が記憶する場合に、前記第二の情報処理装置のCPUの初期化が開始される前に、前記第一の入出力資源情報を第二の入出力資源情報として第二の記憶手段に記憶する処理と、前記第二の情報処理装置のCPUの初期化において、前記第二の入出力資源情報を用いて前記第二の情報処理装置の入出力資源に関する設定を行う処理と、を前記第二の情報処理装置に実行させる。
更に、本発明は、係るフォールトトレラント制御プログラム(コンピュータプログラム)が格納された、コンピュータ読み取り可能な、不揮発性の記録媒体によっても実現可能である。
本発明によれば、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間を短縮するフォールトトレラントシステム等が得られる。
本発明の第1の実施形態に係るフォールトトレラントシステム1の構成を示すブロック図である。 本発明の第1の実施形態に係るフォールトトレラントシステム1の動作を示すフローチャートである。 一般的なフォールトトレラントシステム2の構成を示すブロック図である。 一般的なフォールトトレラントシステム2の動作を示すフローチャートである。 本発明の第2の実施形態に係るフォールトトレラントシステム3の構成を示すブロック図である。 本発明の各実施形態に係るフォールトトレラントシステムに含まれるサーバ、フォールトトレラント制御回路、あるいは情報処理装置を実現可能な情報処理装置900の構成を示すブロック図である。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
<第1の実施形態>
図1は、本発明の第1の実施の形態に係るフォールトトレラントシステム1の構成を示すブロック図である。フォールトトレラントシステム1は、サーバ10a及び10bによる二重化構成を有する。
サーバ10a及び10bの構成は同等であり、その機能も同等である。具体的には、サーバ10a(10b)は、CPU11a(11b)、メモリ12a(12b)、フォールトトレラント制御回路13a(13b)、IO(Input Output)コントローラ14a(14b)を備える。サーバ10a及び10bは、後述する図6に例示する情報処理装置900としても表される。
フォールトトレラント制御回路13a及び13bは、サーバ10a(10b)で障害が発生した場合に、サーバ10a(10b)の運用を停止し、フォールトトレラントシステム1を片系での運用状態に移行することを制御する。フォールトトレラント制御回路13a及び13bは、また、フォールトトレラントシステム1がサーバ10aあるいは10bによる片系での運用状態から二重化構成の状態に復帰することを制御する。フォールトトレラント制御回路13a及び13bは、クロスリンク15によって通信可能に接続されており、互いに連携して上述した制御に関する動作を行う。
フォールトトレラント制御回路13a(13b)は、記憶部130a(130b)、設定部132a(132b)を備える。記憶部130a(130b)、設定部132a(132b)は、順に、記憶手段、設定手段の一例である。記憶部130a(130b)は、後述する通り、データを記憶する機能に加えて、当該データの記憶の制御に関係する処理を行う記憶制御機能を備えることとする。フォールトトレラント制御回路13a(13b)は、例えばチップセットとして構成される。フォールトトレラント制御回路13a(13b)は、また、後述する図6に例示する情報処理装置900の少なくとも一部としても表される。
本実施形態では、フォールトトレラントシステム1が、サーバ10bが障害等により停止した後にサーバ10aのみにより(即ち片系で)運用されている状態において、サーバ10bの再稼働によって二重化構成に復帰する場合の動作について説明することとする。この場合、サーバ10aは第1の情報処理装置とも称し、サーバ10bは第2の情報処理装置とも称する。
尚、フォールトトレラントシステム1が、サーバ10aが障害等により停止した後サーバ10bのみにより運用されている状態において、サーバ10aの再稼働によって二重化構成に復帰する場合の動作も同様である。この場合、サーバ10aは第2の情報処理装置とも称し、サーバ10bは第1の情報処理装置とも称する。
フォールトトレラントシステム1が二重化構成の状態に復帰する動作を開始するにあたって、サーバ10bにおけるフォールトトレラント制御回路13bは、サーバ10bの稼働準備の開始を、サーバ10aにおけるフォールトトレラント制御回路13aに通知する。尚、フォールトトレラント制御回路13a及び13bは、順に、第1及び第2のフォールトトレラント制御回路とも称する。
フォールトトレラント制御回路13aの記憶部130a(第1の記憶手段の一例)は、稼働準備の開始の通知に応じて、仮想IOバッファ131aに、サーバ10aの現在のIOリソース(入出力資源とも称する)の構成に関するIOリソース情報(第1の入出力資源情報の一例)を格納する。仮想IOバッファ131aは、例えば、記憶部130aが備えるメモリによって構成される。IOリソース情報は、例えば、CPU11aがIOコントローラ14a(入出力コントローラの一例)を介してアクセスする外部記憶装置等の周辺機器を含むIOリソース(不図示)の構成を表す情報である。したがって、IOリソース情報は、IOリソースの構成が変更されない限り変化しない情報である。
仮想IOバッファ131aは、CPU11aから発行された、IOリソースに対するIOリクエスト(入出力リクエストの一例)に対して、IOコントローラ14aに代行して応答する機能を備える。すなわち、仮想IOバッファ131aは、IOコントローラ14aにおける実際のIOバッファを仮想化したものであり、CPU11aによって、IOコントローラ14aにおける実際のIOバッファと同等に認識される。以上のことから、記憶部130aは、仮想IOバッファ131aに格納するIOリソース情報を、IOコントローラ14aから取得すればよい。
フォールトトレラント制御回路13bの記憶部130bも、フォールトトレラント制御回路13aの記憶部130aと同様に、仮想IOバッファ131bを備えている。仮想IOバッファ131bは、例えば、記憶部130bが備えるメモリによって構成される。
仮想IOバッファ131bも仮想IOバッファ131aと同様に、CPU11bから発行された、IOリソースに対するIOリクエストに対して、IOコントローラ14bに代行して応答する機能を備える。すなわち、仮想IOバッファ131bは、IOコントローラ14bにおける実際のIOバッファを仮想化したものであり、CPU11bによって、IOコントローラ14bにおける実際のIOバッファと同等に認識される。
サーバ10bの再稼働によってフォールトトレラントシステム1の二重化構成を復帰する動作が開始される時点において、仮想IOバッファ131bには、サーバ10bが以前稼働していたときのIOリソース情報(第3の入出力資源情報とも称する)が格納されている場合がある。当該IOリソース情報は、サーバ10bが稼働していた当時のサーバ10bのIOリソースの構成を表す情報である。あるいは、二重化構成に組み込むサーバ10bが新たなサーバである場合などでは、仮想IOバッファ131bには、IOリソース情報が格納されていない場合もある。
記憶部130bは、記憶部130aから取得した仮想IOバッファ131aに格納されているIOリソース情報と、仮想IOバッファ131bに格納されているIOリソース情報とを比較する。記憶部130bは、この比較を、例えば巡回冗長検査(CRC:Cyclic Redundancy Check)により行ってもよいし、あるいは、その他の一般的なデータの比較手法を用いて行ってもよい。
記憶部130bは、上述の比較において、両方のIOリソース情報が一致しない場合、仮想IOバッファ131bに格納されているIOリソース情報を、仮想IOバッファ131aに格納されているIOリソース情報に置き換える。尚、仮想IOバッファ131bにおいて置き換えられたのちのIOリソース情報は、第2の入出力資源情報とも称する。
フォールトトレラントシステム1において上述した処理が行われたのち、フォールトトレラント制御回路13bは、CPU11bの初期化を開始する。フォールトトレラント制御回路13bにおける設定部132bは、CPU11bの初期化において、仮想IOバッファ131bに格納されているIOリソース情報を用いて、CPU11bのIOリソースに関する設定を行う。CPU11bのIOリソースに関する設定とは、具体的には、例えば、IOコントローラ14bを介した個々の周辺機器へのアクセスに関するCPU11bのリソースの割り当てなどである。
フォールトトレラント制御回路13bは、CPU11bの初期化を完了したのち、メモリ12aに格納されているデータを、CPU11a及び11bを用いてメモリ12bにコピーする。そして、フォールトトレラント制御回路13bは、CPU11bに対して、上述したIOリソースに関する設定以外の設定をCPU11aと同等に設定する。フォールトトレラント制御回路13bは、この設定を、例えば、CPU11aが備えるレジスタに格納されているCPUの動作環境を表すデータを、CPU11bが備えるレジスタに同様に格納すればよい。
フォールトトレラントシステム1は、フォールトトレラント制御回路13a及び13bによる上述した処理を完了したのち、サーバ10bを再稼働することによって二重化構成による運用を開始する。
次に図2のフローチャートを参照して、本実施形態に係るフォールトトレラントシステム1の動作(処理)について詳細に説明する。
フォールトトレラント制御回路13bは、フォールトトレラントシステム1がサーバ10aのみにより(即ち片系で)運用されている状態において、サーバ10bの稼働準備の開始をフォールトトレラント制御回路13aに通知する(ステップS101)。フォールトトレラント制御回路13aがこの通知を受信すると、フォールトトレラント制御回路13aにおける記憶部130aは、仮想IOバッファ131aに、IOコントローラ14aから取得した、サーバ10aのIOリソース情報を格納する(ステップS102)。
フォールトトレラント制御回路13bにおける記憶部130bは、仮想IOバッファ131aに格納されているIOリソース情報と仮想IOバッファ131bに格納されているIOリソース情報とを、CRCにより比較する(ステップS103)。
ステップS103における比較において両方のIOリソース情報が一致する場合(ステップS104でYes)、処理はステップS106へ進む。ステップS103における比較において両方のIOリソース情報が一致しない場合(ステップS104でNo)、記憶部130bは、仮想IOバッファ131bのIOリソース情報を、仮想IOバッファ131aのIOリソース情報に更新する(ステップS105)。
フォールトトレラント制御回路13bは、CPU11bの初期化を開始する(ステップS106)。フォールトトレラント制御回路13bにおける設定部132bは、仮想IOバッファ131bに格納されているIOリソース情報を用いて、CPU11bのIOリソースに関する設定を行う(ステップS107)。フォールトトレラント制御回路13bは、CPU11bの初期化を終了する(ステップS108)。
フォールトトレラント制御回路13bは、メモリ12aのデータをメモリ12bにコピーするとともに、CPU11bに対して、IOリソースに関する設定以外の設定を、CPU11aと同等に設定し(ステップS109)、全体の処理は終了する。
本実施形態に係るフォールトトレラントシステム1は、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間を短縮することができる。その理由は、フォールトトレラントシステム1は、稼働中のサーバ10aのIOリソース情報を、稼働を開始するサーバ10bにおける仮想IOバッファ131bに格納し、CPU11bの初期化においてに、仮想IOバッファ131bに格納したIOリソース情報を用いて、CPU11bのIOリソースに関する設定を行うからである。
以下に、本実施形態に係るフォールトトレラントシステム1によって実現される効果について、詳細に説明する。
コンピュータシステムの規模、及び、コンピュータシステムが処理するデータ量は、年々急速に増加していることから、フォールトトレラントシステムを、片系による稼働状態から二重化構成による稼働状態へ復帰するのに要する時間も増加する傾向にある。したがって、フォールトトレラントシステムの可用性が低下しないように、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間をさらに短縮することが課題である。
このような課題に対して、本実施形態に係るフォールトトレラントシステム1は、記憶部130aと記憶部130bと設定部132bとを備え、例えば図1及び図2を参照して上述した通り動作する。即ち、記憶部130aは、サーバ10aのみで稼働している状態においてサーバ10bの稼働が開始されるときに、サーバ10aの入出力資源の構成に関するIOリソース情報を記憶する。記憶部130bは、サーバ10bのCPUの初期化が開始される前に、記憶部130aに記憶されているIOリソース情報を記憶する。そして設定部132bは、サーバ10bのCPUの初期化において、記憶部130bに記憶されたIOリソース情報を用いてサーバ10bの入出力資源に関する設定を行う。
ここで、図3及び図4を参照して、本実施形態に係るフォールトトレラントシステム1と、一般的なフォールトトレラントシステム2との動作の差異について説明する。
図3は、一般的なフォールトトレラントシステム2の構成を示すブロック図である。図4は、一般的なフォールトトレラントシステム2の動作(処理)を示すフローチャートである。
フォールトトレラントシステム2は、サーバ20a及び20bによる二重化構成を有する。サーバ20a及び20bの構成は同等であり、その機能も同等である。具体的には、サーバ20a(20b)は、CPU11a(11b)、メモリ12a(12b)、フォールトトレラント制御回路23a(23b)、IOコントローラ14a(14b)を備える。但し、フォールトトレラントシステム2に含まれる構成要素のうち、その機能が上述したフォールトトレラントシステム1に含まれる構成要素と同等である構成要素に対しては、フォールトトレラントシステム1における番号と同一の番号を付与することとする。したがって、サーバ20a(20b)の構成は、フォールトトレラント制御回路23a(23b)を除き、サーバ10a(10b)と同等である。フォールトトレラント制御回路23a(23b)は、設定部232a(232b)を備えている。
図4に例示するフローチャートにおいて、ステップS201、ステップS206乃至S209は、順に、図2に例示するフローチャートにおける、ステップS101、ステップS106乃至S109に相当する。
本実施形態に係るフォールトトレラントシステム1におけるフォールトトレラント制御回路13a及び13bは、図2に例示する通り、ステップS106においてCPU11bの初期化を開始する前に、ステップS102乃至S105の処理を行う。これに対して、一般的なフォールトトレラントシステム2におけるフォールトトレラント制御回路23a及び23bは、図4に例示する通り、ステップS206においてCPU11bの初期化を開始する前に、ステップS102乃至S105に相当する処理を行わない。本実施形態に係るフォールトトレラントシステム1は、ステップS102乃至S105の処理を行うので、ステップS107において、CPU11bのIOリソースに関する設定を完了することができる。これに対して、一般的なフォールトトレラントシステム2は、ステップS102乃至S105に相当する処理を行わないので、ステップS207において、CPU11bのIOリソースに関する実際の設定を行うことができず、その仮設定を行う。そして、フォールトトレラントシステム2は、CPU11bの初期化が完了したのちに、ステップS210において、CPU11bに対して、IOリソースに関する設定を、CPU11aと同等に設定する。
このように、本実施形態に係るフォールトトレラントシステム1は、一般的なフォールトトレラントシステム2においてCPU11bの初期化を終了した後に行われていたS210の処理を行う必要がない。したがって、フォールトトレラントシステム1は、CPU11bの初期化が完了した後の、サーバ10bの動作状態をサーバ10aの動作状態に同期させるために必要な処理の量を削減するので、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間を短縮することができる。
また、本実施形態に係るフォールトトレラント制御回路13a(13b)は、一般的なフォールトトレラントシステム2におけるフォールトトレラント制御回路23a(23b)に、仮想IOバッファ131a(131b)を有する記憶部130a(130b)を追加することにより実現可能である。即ち、フォールトトレラントシステム1において、片系による稼働状態から二重化構成による稼働状態への復帰を制御するファームウェアは、フォールトトレラントシステム2におけるファームウェアから大きな変更を加えることなく実現可能である。したがって、本実施形態に係るフォールトトレラントシステム1は、一般的なフォールトトレラントシステム2との間において、ファームウェアの互換性を維持したまま、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間を短縮することができる。
<第2の実施形態>
図5は、本発明の第2の実施形態に係るフォールトトレラントシステム3の構成を示すブロック図である。
本実施形態に係るフォールトトレラントシステム3は、第1の情報処理装置30a及び第2の情報処理装置30bによる二重化構成を有する。第1の情報処理装置30a及び第2の情報処理装置30bは、例えば、第1の実施形態に係るサーバ10a及び10bのような装置である。
フォールトトレラントシステム3は、第1の記憶部31a、第2の記憶部31b、及び、設定部32bを備えている。第1の記憶部31a、第2の記憶部31b、設定部32bは、順に、第1の記憶手段、第2の記憶手段、設定手段の一例である。
第1の記憶部31aは、第1の情報処理装置30aのみで稼働している状態において第2の情報処理装置30bの稼働が開始されるときに、第1の情報処理装置30aの入出力資源の構成に関する第1の入出力資源情報310aを記憶する。第1の記憶部31aは、例えば第1の実施形態に係る記憶部130aと同様に仮想IOバッファを備え、当該仮想IOバッファに第1の入出力資源情報310aを記憶してもよい。第1の入出力資源情報310aは、例えば、第1の実施形態に係るIOリソース情報のような情報である。
第2の記憶部31bは、第2の情報処理装置30bのCPUの初期化が開始される前に、第1の入出力資源情報310aを第2の入出力資源情報310bとして記憶する。
設定部32bは、第2の情報処理装置30bのCPUの初期化において、第2の入出力資源情報310bを用いて第2の情報処理装置30bの入出力資源に関する設定を行う。設定部32bは、例えば第1の実施形態に係る設定部132bと同様に、この入出力資源に関する設定を行う。
本実施形態に係るフォールトトレラントシステム3は、片系による稼働状態から二重化構成による稼働状態への復帰に要する時間を短縮することができる。その理由は、フォールトトレラントシステム3は、稼働中の第1の情報処理装置30aの入出力資源情報を、稼働を開始する第2の情報処理装置30bにおける第2の記憶部31bに格納し、第2の情報処理装置30bのCPUの初期化において、当該入出力資源情報を用いて、当該CPUの入出力資源に関する設定を行うからである。
<ハードウェア構成例>
上述した各実施形態において図1、及び、図5に示したフォールトトレラントシステムにおける各部は、専用のHW(HardWare)(電子回路)によって実現することができる。また、図1、及び、図5において、少なくとも、下記構成は、プロセッサによって実行される命令を含むソフトウェアプログラムの機能(処理)単位(ソフトウェアモジュール)と捉えることができる。
・記憶部130a及び130bにおける記憶制御機能、
・設定部132a及び132b、
・第1の記憶部31aにおける記憶制御機能、
・第2の記憶部31bにおける記憶制御機能、
・設定部32b。
但し、これらの図面に示した各部の区分けは、説明の便宜上の構成であり、実装に際しては、様々な構成が想定され得る。この場合のハードウェア環境の一例を、図6を参照して説明する。
図6は、本発明の各実施形態に係るフォールトトレラントシステムに含まれるサーバ、フォールトトレラント制御回路、あるいは情報処理装置を実現可能な情報処理装置900(コンピュータ)の構成を例示的に説明する図である。即ち、図6は、図1、及び、図5に示したフォールトトレラントシステムを実現可能なコンピュータ(情報処理装置)の構成であって、上述した実施形態における各機能を実現可能なハードウェア環境を表す。
図6に示した情報処理装置900は、構成要素として下記を備えている。
・CPU(Central_Processing_Unit)901、
・ROM(Read_Only_Memory)902、
・RAM(Random_Access_Memory)903、
・ハードディスク(記憶装置)904、
・通信インタフェース905、
・バス906(通信線)、
・CD−ROM(Compact_Disc_Read_Only_Memory)等の記録媒体907に格納されたデータを読み書き可能なリーダライタ908、
・モニターやスピーカ、キーボード等の入出力インタフェース909。
即ち、上記構成要素を備える情報処理装置900は、これらの構成がバス906を介して接続された一般的なコンピュータである。情報処理装置900は、CPU901を複数備える場合もあれば、マルチコアにより構成されたCPU901を備える場合もある。
そして、上述した実施形態を例に説明した本発明は、図6に示した情報処理装置900に対して、次の機能を実現可能なコンピュータプログラムを供給する。その機能とは、その実施形態の説明において参照したブロック構成図(図1、及び、図5)における上述した構成、或いはフローチャート(図2)の機能である。本発明は、その後、そのコンピュータプログラムを、当該ハードウェアのCPU901に読み出して解釈し実行することによって達成される。また、当該装置内に供給されたコンピュータプログラムは、読み書き可能な揮発性のメモリ(RAM903)、または、ROM902やハードディスク904等の不揮発性の記憶デバイスに格納すれば良い。
また、前記の場合において、当該ハードウェア内へのコンピュータプログラムの供給方法は、現在では一般的な手順を採用することができる。その手順としては、例えば、CD−ROM等の各種記録媒体907を介して当該装置内にインストールする方法や、インターネット等の通信回線を介して外部よりダウンロードする方法等がある。そして、このような場合において、本発明は、係るコンピュータプログラムを構成するコード或いは、そのコードが格納された記録媒体907によって構成されると捉えることができる。
以上、上述した実施形態を模範的な例として本発明を説明した。しかしながら、本発明は、上述した実施形態には限定されない。即ち、本発明は、本発明のスコープ内において、当業者が理解し得る様々な態様を適用することができる。
1 フォールトトレラントシステム
10a(10b) サーバ
11a(11b) CPU
12a(12b) メモリ
13a(13b) フォールトトレラント制御回路
130a(130b) 記憶部
131a 仮想IOバッファ
131b 仮想IOバッファ
132a(132b) 設定部
14a(14b) IOコントローラ
15 クロスリンク
20a(20b) サーバ
23a(23b) フォールトトレラント制御回路
232a(232b) 設定部
3 フォールトトレラントシステム
30a 第1の情報処理装置
30b 第2の情報処理装置
31a 第1の記憶部
31b 第2の記憶部
310a 第1の入出力資源情報
310b 第2の入出力資源情報
32b 設定部
900 情報処理装置
901 CPU
902 ROM
903 RAM
904 ハードディスク(記憶装置)
905 通信インタフェース
906 バス
907 記録媒体
908 リーダライタ
909 入出力インタフェース

Claims (10)

  1. 第一及び第二の情報処理装置による二重化構成を有するフォールトトレラントシステムであって、
    前記第一の情報処理装置のみで稼働している状態において前記第二の情報処理装置の稼働が開始されるときに、前記第一の情報処理装置の入出力資源の構成に関する第一の入出力資源情報を記憶する第一の記憶手段と、
    前記第二の情報処理装置のCPUの初期化が開始される前に、前記第一の入出力資源情報を第二の入出力資源情報として記憶する第二の記憶手段と、
    前記第二の情報処理装置のCPUの初期化において、前記第二の入出力資源情報を用いて前記第二の情報処理装置の入出力資源に関する設定を行う設定手段と、
    を備えるフォールトトレラントシステム。
  2. 前記第二の記憶手段は、記憶済みである、前記第二の情報処理装置の入出力資源の構成に関する第三の入出力資源情報と前記第一の入出力資源情報とを比較し、前記第一の入出力資源情報と前記第三の入出力資源情報とが異なる場合、前記第三の入出力資源情報を前記第二の入出力資源情報に更新する、
    請求項1に記載のフォールトトレラントシステム。
  3. 前記第二の記憶手段は、巡回冗長検査により、前記第一の入出力資源情報と前記第三の入出力資源情報とを比較する、
    請求項2に記載のフォールトトレラントシステム。
  4. 前記第一の記憶手段は、前記第一の情報処理装置のCPUから発行された入出力リクエストに対して、前記第一の情報処理装置の入出力コントローラに代行して応答する仮想化された入出力バッファを備え、
    前記第二の記憶手段は、前記第二の情報処理装置のCPUから発行された入出力リクエストに対して、前記第二の情報処理装置の入出力コントローラに代行して応答する仮想化された入出力バッファを備える、
    請求項1乃至請求項3のいずれか一項に記載のフォールトトレラントシステム。
  5. 前記第一の記憶手段は、前記第一の情報処理装置に関する前記二重化構成への組み込みを制御する第一のフォールトトレラント制御回路に含まれ、
    前記第二の記憶手段、及び、前記設定手段は、前記第二の情報処理装置に関する前記二重化構成への組み込みを制御する第二のフォールトトレラント制御回路に含まれる、
    請求項1乃至請求項4のいずれか一項に記載のフォールトトレラントシステム。
  6. 前記第一の情報処理装置が備えるCPU、メモリ、入出力コントローラと、
    前記第二の情報処理装置が備える、CPU、メモリ、入出力コントローラと、
    をさらに備える請求項1乃至請求項4のいずれか一項に記載のフォールトトレラントシステム。
  7. 第一及び第二の情報処理装置による二重化構成を有するフォールトトレラントシステムによって、
    前記第一の情報処理装置のみで稼働している状態において前記第二の情報処理装置の稼働が開始されるときに、前記第一の情報処理装置の入出力資源の構成に関する第一の入出力資源情報を第一の記憶手段に記憶し、
    前記第二の情報処理装置のCPUの初期化が開始される前に、前記第一の入出力資源情報を第二の入出力資源情報として第二の記憶手段に記憶し、
    前記第二の情報処理装置のCPUの初期化において、前記第二の入出力資源情報を用いて前記第二の情報処理装置の入出力資源に関する設定を行う、
    フォールトトレラント制御方法。
  8. 前記第二の記憶手段に記憶済みである、前記第二の情報処理装置の入出力資源の構成に関する第三の入出力資源情報と前記第一の入出力資源情報とを比較し、前記第一の入出力資源情報と前記第三の入出力資源情報とが異なる場合、前記第三の入出力資源情報を前記第二の入出力資源情報に更新する、
    請求項7に記載のフォールトトレラント制御方法。
  9. 第一及び第二の情報処理装置による二重化構成を有するフォールトトレラントシステムにおいて、
    前記第一の情報処理装置のみで稼働している状態において前記第二の情報処理装置の稼働が開始されるときに、前記第一の情報処理装置の入出力資源の構成に関する第一の入出力資源情報を第一の記憶手段が記憶する場合に、
    前記第二の情報処理装置のCPUの初期化が開始される前に、前記第一の入出力資源情報を第二の入出力資源情報として第二の記憶手段に記憶する処理と、
    前記第二の情報処理装置のCPUの初期化において、前記第二の入出力資源情報を用いて前記第二の情報処理装置の入出力資源に関する設定を行う処理と、
    を前記第二の情報処理装置に実行させるためのフォールトトレラント制御プログラム。
  10. 前記第二の記憶手段に記憶済みである、前記第二の情報処理装置の入出力資源の構成に関する第三の入出力資源情報と前記第一の入出力資源情報とを比較し、前記第一の入出力資源情報と前記第三の入出力資源情報とが異なる場合、前記第三の入出力資源情報を前記第二の入出力資源情報に更新する処理を実行させる、
    請求項9に記載のフォールトトレラント制御プログラム。
JP2020088667A 2020-05-21 2020-05-21 フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラム Active JP6928148B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020088667A JP6928148B1 (ja) 2020-05-21 2020-05-21 フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020088667A JP6928148B1 (ja) 2020-05-21 2020-05-21 フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラム

Publications (2)

Publication Number Publication Date
JP6928148B1 true JP6928148B1 (ja) 2021-09-01
JP2021184131A JP2021184131A (ja) 2021-12-02

Family

ID=77456271

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020088667A Active JP6928148B1 (ja) 2020-05-21 2020-05-21 フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラム

Country Status (1)

Country Link
JP (1) JP6928148B1 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200919312A (en) * 2007-10-23 2009-05-01 Asustek Comp Inc Method for booting computer system
JP6098778B2 (ja) * 2012-03-29 2017-03-22 日本電気株式会社 冗長化システム、冗長化方法、冗長化システムの可用性向上方法、及びプログラム
JP6349827B2 (ja) * 2014-03-24 2018-07-04 日本電気株式会社 情報処理装置、初期化方法、及び、プログラム

Also Published As

Publication number Publication date
JP2021184131A (ja) 2021-12-02

Similar Documents

Publication Publication Date Title
JP4839091B2 (ja) データベース回復方法及び計算機システム
US8307363B2 (en) Virtual machine system, restarting method of virtual machine and system
US9507585B2 (en) Firmware update apparatus and storage control apparatus
JP2004252591A (ja) 計算機システム、i/oデバイス及びi/oデバイスの仮想共有方法
US20060036832A1 (en) Virtual computer system and firmware updating method in virtual computer system
JP2011170477A (ja) ハイパーバイザ及びサーバ装置
US20210089379A1 (en) Computer system
US20100205482A1 (en) Mirroring controller, storage device, and mirroring control method
CN113127263B (zh) 一种内核崩溃恢复方法、装置、设备及存储介质
JP6928148B1 (ja) フォールトトレラントシステム、フォールトトレラント制御方法、及び、フォールトトレラント制御プログラム
US11055263B2 (en) Information processing device and information processing system for synchronizing data between storage devices
JP2021026375A (ja) ストレージシステム
JP2846047B2 (ja) シャドウプロセス生成方式
JP6146092B2 (ja) 仮想化システム、仮想サーバ、仮想マシン制御方法、及び仮想マシン制御プログラム
US10656867B2 (en) Computer system, data management method, and data management program
US8762673B2 (en) Interleaving data across corresponding storage groups
JP6875237B2 (ja) ストレージ制御装置、ストレージ制御システム、ストレージ制御方法、及び、ストレージ制御プログラム
CN117687663B (zh) 基于ota的分区动态调整方法、装置、设备及存储介质
JPH08202627A (ja) 二重化された共用メモリの等価性回復処理方法および装置
JP6802304B2 (ja) ストレージ制御装置、ストレージ制御システム、ストレージ制御方法、及び、ストレージ制御プログラム
JP5488681B2 (ja) 二重化システム、制御方法および制御プログラム
JP5703860B2 (ja) フォールトトレラントシステム、メモリ制御方法、及びプログラム
JP2011159101A (ja) 情報処理装置、メモリ管理方法、およびメモリ管理プログラム
JP6981098B2 (ja) 復旧制御装置、復旧制御システム、復旧制御方法、及び、復旧制御プログラム
JP2009157880A (ja) サーバ装置及びファイルシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200521

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210805

R150 Certificate of patent or registration of utility model

Ref document number: 6928148

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150