JP5682703B2 - 情報処理システム及び情報処理システムの処理方法 - Google Patents

情報処理システム及び情報処理システムの処理方法 Download PDF

Info

Publication number
JP5682703B2
JP5682703B2 JP2013506822A JP2013506822A JP5682703B2 JP 5682703 B2 JP5682703 B2 JP 5682703B2 JP 2013506822 A JP2013506822 A JP 2013506822A JP 2013506822 A JP2013506822 A JP 2013506822A JP 5682703 B2 JP5682703 B2 JP 5682703B2
Authority
JP
Japan
Prior art keywords
control unit
memory
power supply
mcu
port
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013506822A
Other languages
English (en)
Other versions
JPWO2012131761A1 (ja
Inventor
亮大 田中
亮大 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2012131761A1 publication Critical patent/JPWO2012131761A1/ja
Application granted granted Critical
Publication of JP5682703B2 publication Critical patent/JP5682703B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • G06F11/2092Techniques of failing over between control units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Power Sources (AREA)
  • Hardware Redundancy (AREA)

Description

開示の技術は、情報処理システム及び情報処理システムの処理方法に関する。
近年、高信頼性を要求される情報処理システムにおいては、故障耐性を向上させるために、プロセッサ等のハードウエアからなる制御装置を2重化して双方に情報処理を実行させる情報処理システムが知られている。このような情報処理システムは、現用系として使用される制御装置に異常が発生しても、正常に動作している予備系の制御装置に対する入出力信号を使って情報処理を継続する機能を有している。
従来技術として、下記の文献がある。
特開昭62−191299号公報
2重化した情報処理システムでは、現用系の制御装置の障害時、現用系の制御装置で行われている全ての処理を、予備系の制御装置が引き継ぐ必要がある。そのため、予備系の制御装置は、現用系の制御装置と全く同じソフトウエアで動作させる必要がある。予備系の制御装置は常時電源が投入され、現用系の制御装置のソフトウエア更新に応じて、予備系の制御装置のソフトウエアの更新を行っているため、情報処理システムの消費電力が上がっている。
開示の技術は、情報処理システム全体の省電力化を図ることができる情報処理システム及び情報処理システムの処理方法を提供することを目的とする。
本発明の課題を解決するため、開示の技術の第1の側面によれば、
第1のソフトウエアを記憶する第1の不揮発性メモリを有する現用系処理装置、及び、前記現用系処理装置と接続され、且つ前記第1のソフトウエアと同期化されている第2のソフトウエアを記憶する第2の不揮発性メモリを有する予備系処理装置を有する情報処理システムであって、
前記現用系処理装置は、
前記第1の不揮発性メモリに記憶された前記第1のソフトウエアを処理するとともに、前記第1の不揮発性メモリに記憶されている前記第1のソフトウエアに更新の指示があった場合、前記第1の不揮発性メモリに記憶されているソフトウエアの更新を行なう第1の制御部を有し、
前記予備系処理装置は、
前記第2の不揮発性メモリに記憶された前記第2のソフトウエアを処理する第2の制御部と、
前記現用系処理装置の異常が検出された場合、外部からの起動指示に従い、前記第2の制御部に電源を投入する電源部と、
を有する情報処理システムが提供される。
開示の技術によれば、現用系処理装置の異常が検出された場合、外部からの起動指示に従い、予備系の制御部の電源を投入する。そのため、常時、予備系の電源を投入しておくことなく、現用系で使用していたソフトウエアの整合性を取ることが可能になる。そのため、情報処理システム全体の省電力化を図ることができる。
図1は、本実施例における情報処理システムのハードウエア構成の一例を示す図である。 図2は、本実施例における制御ユニットの構成図を示す図である。 図3は、本実施例における制御ユニットの通常運用時の電源投入状態を示す図である。 図4は、本実施例における制御ユニットの内部構成の一部を説明する為の図である。 図5は、本実施例における制御回路の内部構成の一部を説明する為の図である。 図6は、本実施例における制御回路の排他的論理和回路の真理値表を説明する為の図である。 図7は、本実施例における制御ユニットのGPIOの信号とレジスタ値との関係を説明する為の図である。 図8は、本実施例における制御ユニットの装置電源投入後の起動処理を示すシーケンス図である。 図9は、本実施例における制御ユニットの障害発生時の処理を示すシーケンス図である。 図10は、本実施例における制御ユニットの障害発生時の処理を示すシーケンス図である。
以下、開示の技術について、図面を用いて詳細に説明する。
図1は、本実施例における情報処理システムのハードウエア構成の一例を示す図である。図1に示すように、情報処理システム1000は、情報処理装置10、制御ユニット100、制御ユニット200を有する。更に、情報処理システム1000は、情報処理装置10と制御ユニット100を接続し、且つ情報処理装置10と制御ユニット200を接続するネットワーク500を有する。なお、制御ユニット100及び制御ユニット200は同一の構成を備える。制御ユニット200において、制御ユニット100で説明した構成と同様の構成には同一符号を付し、説明を省略する。
情報処理装置10は、CPU(Central Processing Unit)11、メモリ12、PSU(Power Supply Unit)13、ファンユニット14、通信インタフェース15及びバス16を有する。CPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15は、バス16を介して互いに接続されている。
CPU11は、情報処理装置10の各種処理を実行する。
メモリ12は、CPU11が実行するOS(Operating System)のプログラム、アプリケーションプログラム、情報処理装置10を制御するプログラムの少なくとも一部を一時的に記憶する。また、メモリ12は、CPU11における処理に必要な各種データを記憶する。
なお、プログラム12Aは、メモリ12以外の記憶媒体に保持してもよい。プログラム12Aは、例えば、情報処理装置10に挿入されるフレキシブルディスク(FD)、CD−ROM、MOディスク、DVDディスク、光磁気ディスク及びICカードなどの「可搬用の物理的記憶媒体」に記憶される。プログラム12Aは、情報処理装置10の内外に備えられるディスク装置、あるいはLAN(Local Area Network)、ネットワーク、公衆回線、インターネット、WANなどを介して情報処理装置10に接続される「他のコンピュータ(またはサーバ)」が保持する不図示の記憶媒体に記憶される。CPU11は、メモリ12からプログラム12Aを読み出し、プログラム12Aを実行する。
PSU13は、情報処理装置10のCPU11、メモリ12、ファンユニット14及び通信インタフェース15に直流電圧を供給する。
ファンユニット14は、情報処理装置10のCPU11、メモリ12、PSU13及び通信インタフェース15を冷却する。
通信インタフェース15は、情報処理装置10がネットワーク500を介して制御ユニット100及び制御ユニット200と接続するために設けられる。通信インタフェース15は、CPU11及びメモリ12間のデータの送受信を行うインタフェースの機能を提供する。
制御ユニット100は、MCU(Microcontroller Unit)141、メモリの一例としてのUSBメモリ123、ミッドプレーンコネクタ150及びバス160を有する。MCU141、USBメモリ123及びミッドプレーンコネクタ150は、バス160を介して互いに接続されている。
制御ユニット100は、制御ユニット200と同一の構成を備えており、互いに等価な同一の動作を行なう事ができる。そして、制御ユニット100は、制御ユニット100内で発生する内部障害を検出する機能を備える。内部障害の検出結果は、ミッドプレーンコネクタ150及びネットワーク500を介して制御ユニット200に伝送される。制御ユニット100が故障した場合、制御ユニット200が制御ユニット100の代わりに情報処理装置10に接続することで、情報処理装置10のCPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15に対する電源制御、初期化及び監視を行うことができる。
MCU141は、制御ユニット100の各種処理を実行する。また、MCU141は、情報処理装置10のCPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15に対する電源制御、初期化及び監視を行う。また、第1の制御部であるMCU141は、不揮発性メモリであるUSBメモリ123に記憶されたソフトウエア123Aを処理するとともに、USBメモリ123に記憶されているソフトウエア123Aのいずれかに更新の指示があった場合、USBメモリ123に記憶されている、変更指示があったソフトウエア123Aの更新を行なう。
USBメモリ123は、MCU141が実行するOSのプログラム、アプリケーションプログラム、制御ユニット100を制御するソフトウエア123Aの少なくとも一部を記憶する。また、USBメモリ123は、MCU141における処理に必要な各種データを記憶する。また、USBメモリ123は、情報処理装置10のCPU11、メモリ12、ファンユニット14及び通信インタフェース15のエラーログ情報を記憶する。また、USBメモリ123は、情報処理装置10のユーザによって任意に設定できる構成情報を含む設定情報を記憶する。また、USBメモリ123は、情報処理装置10のCPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15におけるFRU(Field Replacement Unit:フィールド交換可能ユニット)情報を記憶する。また、USBメモリ123は、情報処理装置10のCPU11及びメモリ12における各種バックアップ情報を記憶する。また、USB123は、制御ユニット100のエラーを検出するファームウェアを記憶する。また、USBメモリ123は、制御ユニット100及び制御ユニット200の故障要因を記録したログを記憶する。
USBメモリ123は、USBメモリ123が記憶するデータの破損防止を保証するためにUSBメモリ223と二重化されている。USBメモリ123は、USBメモリ223が記憶するデータおよびソフトウエア223Aと同一のデータ及びプログラムを記憶する。
ミッドプレーンコネクタ150は、制御ユニット100が、ネットワーク500を介して、情報処理装置10および制御ユニット200と接続するために設けられる。ミッドプレーンコネクタ150は、制御ユニット100と情報処理装置10との間、あるいは制御ユニット100と制御ユニット200との間におけるデータの送受信を行う。
制御ユニット200は、MCU241、USBメモリ223及びミッドプレーンコネクタ250を有する。MCU241、USBメモリ223及びミッドプレーンコネクタ250は、バス260を介して互いに接続されている。
制御ユニット200は、制御ユニット100と同一の構成を備えており、互いに等価な同一の動作を行なう事ができる。そして、制御ユニット200は、自装置内で発生する内部障害を検出する機能を備える。内部障害の検出結果は、ミッドプレーンコネクタ250及びネットワーク500を介して制御ユニット100に伝送される。制御ユニット200が故障した場合、制御ユニット100が制御ユニット200の代わりに情報処理装置10に接続することで、情報処理装置10のCPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15に対する電源制御、初期化及び監視を行うことができる。
また、第2の制御部であるMCU241は、検出部であるCPLDによって、現用系処理装置である制御ユニット100の異常が検出された場合、MCU241の起動に伴い、不揮発性メモリであるUSBメモリ223に記憶されたソフトウエア223Aを処理する。また、USBメモリ223は、USBメモリ223が記憶するデータの破損防止を保証するためにUSBメモリ123と二重化されている。USBメモリ223は、USBメモリ123が記憶するデータおよびソフトウエア123Aと同一のデータ及びプログラムを記憶する。即ち、情報処理システム1000は、ソフトウエア123A、223Aを記憶する不揮発性メモリ123、223、現用系処理装置100、及び、予備系処理装置200を有する。
図2は、本実施例における制御ユニット100及び制御ユニット200の構成を示す図である。図2において、図1で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
制御ユニット100は、第1電源回路110、第1電源系デバイス120、第2電源回路130及び第2電源系デバイス140を有する。制御ユニット100は、二系統に分離された第1電源回路110及び第2電源回路130を有する。なお、図2の例では、制御ユニット100は現用系として動作する。
第1電源回路110は、装置主電源に接続されている。第1電源回路110は、第1電源系デバイス120に直流電圧を供給する。第1電源回路110は、制御ユニット100が現用系として動作する場合、第1電源系デバイス120に対して直流電圧を供給する。
第1電源系デバイス120は、第1電源回路110によって直流電圧が供給される。第1電源系デバイス120は、例えばUSBメモリ123を含む。第1電源系デバイス120は、制御ユニット200のUSBメモリ223とデータを多重化するため、第1電源回路110によって常時電源が投入されている。第1電源系デバイス120は、現用系/予備系に関わらず、第1電源回路110によって電源が投入されている。
第2電源回路130は、第1電源回路110と同様に、装置主電源に接続されている。第2電源回路130は、第2電源系デバイス140に直流電圧を供給する回路である。第2電源回路130は、制御ユニット100が現用系として動作する場合、第2電源系デバイス140に対して直流電圧を供給する。なお、制御ユニット100が予備系として動作する場合、第2電源回路130には電源が投入されない。
第2電源系デバイス140は、第2電源回路130によって直流電圧が供給される。第2電源系デバイス140は、例えばMCU141を含む。又、第2電源系デバイス140は、情報処理装置10の制御対象ユニット群であるCPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15の監視及び制御を行う為に、他の制御ユニット200と通信するために用いられるデバイス群を含む。第2電源系デバイス140は、制御ユニット100が現用系として動作する場合、電源が投入される。
制御ユニット200は、第1電源回路210、第1電源系デバイス220、第2電源回路230及び第2電源系デバイス240を有する。制御ユニット200は、制御ユニット100と同様に、二系統に分離された第1電源回路210及び第2電源回路230を有する。なお、制御ユニット200は、図2の例では予備系として動作する。
第1電源回路210は、装置主電源に接続されている。第1電源回路210は、第1電源系デバイス220に直流電圧を供給する。第1電源回路210は、制御ユニット200が予備系として動作する場合でも、第1電源系デバイス220に対して直流電圧を供給する。
第1電源系デバイス220は、第1電源回路210によって直流電圧が供給される。第1電源系デバイス220は、例えばUSBメモリ223を含む。第1電源系デバイス220は、制御ユニット100のUSBメモリ123とデータを多重化するため、制御ユニット200が予備系として動作する場合でも、第1電源回路210によって常時電源が投入れている。
第2電源回路230は、第1電源回路210と同様に、装置主電源に接続されている。第2電源回路230は、第2電源系デバイス240に直流電圧を供給する回路である。第2電源回路230は、制御ユニット200が予備系として動作する場合、第2電源系デバイス240に対して直流電圧を供給しない。
第2電源系デバイス240は、第2電源回路230によって直流電圧が供給される。第2電源系デバイス240は、例えばMCU241を含む。又、第2電源系デバイス240は、情報処理装置10の制御対象ユニット群であるCPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15の監視及び制御を行う為に、他の制御ユニット100と通信するために用いられるデバイス群を含む。第2電源系デバイス240は、制御ユニット200が予備系として動作する場合、電源が投入されない。
図3は、本実施例における制御ユニット100及び制御ユニット200の通常運用時の電源投入状態を示す図である。通常運用とは、制御ユニット100が現用系として動作し、制御ユニット200が予備系として動作する場合を示す。図3において、図1〜図2で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
図3に示すように、制御ユニット100が現用系として動作する場合、第1電源系デバイス120及び第2電源系デバイス140には電源が投入される。一方、制御ユニット200が予備系として動作する場合、第1電源系デバイス220には電源が投入され、第2電源系デバイス240には電源が投入されない。即ち、制御ユニット200が予備系として動作する場合、現用系として動作する制御ユニット100とのデータの同期に必要なデバイス以外は、電源が投入されない。
図4は、本実施例における制御ユニット100及び制御ユニット200の内部構成の一部を説明する為の図である。図4において、図1〜図3で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
制御ユニット100は、第1電源回路110、制御回路121、GPIO(Genaral Purpose Input Output:汎用入出力)122、USB(Universal Serial Bus)メモリ123、USBスイッチ124、第2電源回路130、MCU141、BOOT FMEM(Flash Memory)143、CPLD(Configurable Programmable Logic Device)144、周辺デバイス145及びミッドプレーンコネクタ150を有する。なお、図4では、制御ユニット100が現用系として動作する。
なお、図2で前述した第1電源系デバイス120は、制御回路121、GPIO122、USBメモリ123及びUSBスイッチ124を含む。第1電源系デバイス120には、図2で前述したとおり、第1電源回路110によって直流電圧が供給される。又、図2で前述した第2電源系デバイス140は、MCU141、BOOT FMEM143、CPLD144及び周辺デバイス145を含む。第2電源系デバイス140には、図2で前述したとおり、第2電源回路130によって直流電圧が供給される。
制御回路121は、制御ユニット100のGPIO122、第2電源回路130、制御ユニット200の制御回路221、GPIO222及びCPLD244と、バスによって接続されている。制御回路121は、バスを介して、GPIO122、GPIO222及びCPLD244からの指示に基づいて、第2電源回路130に対する電源の投入及び切断の指示を行う。
GPIO122は、MCU141と、I2C(Inter−Integrated Circuit)によって接続されている。GPIO122は、I2Cを介したMCU141からの指示に基づいて、Port 0、Port 1、Port 2及びPort 3の設定を行う。また、GPIO122は、Port 0、Port 1、Port 2及びPort 3の設定を記憶するレジスタを内蔵する。
GPIO122のPort 0は、バスによって、制御回路121と接続されている。GPIO122のPort 1は、バスによって、制御ユニット200のGPIO222のPort 2と接続されている。GPIO122のPort 2は、バスによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御ユニット200のGPIO222のPort 1と接続されている。GPIO122のPort 3は、バスによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御ユニット200のCPLD244と接続されている。
USBメモリ123は、USB2.0によって、USBスイッチ124と接続されている。USBメモリ123は、USB2.0を介して、USBスイッチ124との間で記憶しているデータの送受信を行う。
USBスイッチ124は、Port Assign Interfaceによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御ユニット200のCPLD244と接続されている。Port Assign Interfaceは、USBスイッチ124のPort 0又はPort 1を設定する為の入力信号である。USBスイッチ124は、I2Cによって、MCU141と接続されている。USBスイッチ124のPort 0は、MCU141と、USB2.0によって接続されている。USBスイッチ124のPort 1は、制御ユニット200のMCU241と、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、USB2.0によって接続されている。
MCU141は、バスによって、ミッドプレーンコネクタ150と接続されている。MCU141は、USB2.0によって、USBスイッチ124のPort 0と接続されている。MCU141は、USB2.0によって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御ユニット200のUSBスイッチ224のPort 1と接続されている。MCU141は、バスによって、BOOT FMEM143及びCPLD144と接続されている。又、MCU141は、GPIOを内蔵している。
BOOT FMEM143は、MCU141とバスを介して接続されている。BOOT FMEM143は、MCU141の起動プログラムが記憶されている。BOOT FMEM143が記憶する起動プログラムは、周辺デバイス145の初期化を行うプログラムが組み込まれている。BOOT FMEM143が記憶する起動プログラムは、GPIO122のレジスタに記憶されたPort 0、Port 1、Port 2及びPort 3の設定情報をMCU141によって読出し、MCU141の起動要因が何であるか確認する処理を含む。なお、MCU141の起動要因が何かによって、MCU141の起動後の処理が変更される。
CPLD144は、バスによって、MCU141と接続されている。CPLD144は、Port Assign Interfaceによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御ユニット200のUSBスイッチ224と接続されている。CPLD144は、バスによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御ユニット200のGPIO222のPort 3と接続されている。CPLD144は、MCU141の動作状況を監視する回路であるウォッチドッグタイマを内蔵している。CPLD144は、MCU141の起動時、又は運用中に、MCU141からの応答が所定時間以上無かった場合、MCU141に動作異常が発生したと判断する。CPLD144は、MCU141に動作異常が発生したと判断した後、USBスイッチ224及びGPIO222のPort 3に対してMCU141のリセット信号又は割り込み(Non−Maskable Interrupt:NMI)信号をアサートする。即ち、CPLD144は、第1の制御部であるMCU141の異常の発生を検出する。
周辺デバイス145は、NIC(Network Interface Card)、Hub(集線装置)、I2C Controller、DRAM(Dynamic Random Access Memory)、MRAM(Magnetoresistive Random Access Memory)、Sensor、LED(Light Emitting Diode)コントローラ及びE2PROM(Electrically Erasable Programmable Read Only Memory)を含む。周辺デバイス145は、情報処理装置10の管理及び制御を行う為に用いられるデバイスである。
ミッドプレーンコネクタ150は、制御ユニット100と、情報処理装置10及び制御ユニット200との間を接続するコネクタである。ミッドプレーンコネクタ150は、制御ユニット100が情報処理システム1000のスロットに接続される際に、スロット位置に対応する信号が、情報処理システム1000のSlot#0から入力される。ミッドプレーンコネクタ150は、接続された制御ユニット100に対して、制御ユニット100が現用系になるか、又は予備系になるか識別する為の識別信号を、MCU141に対して伝送する。
MCU141は、第2電源回路130によって電源が投入された時、BOOT FMEM143に記憶されているMCU141の起動プログラムの読出しを行い、MCU141の起動を行う。MCU141は、MCU141の起動時に、BOOT FMEM143に記憶されている周辺デバイス145の初期化を行うプログラムを実行し、周辺デバイス145の初期化を行う。MCU141は、MCU141の起動時に、BOOT FMEM143に記憶されているプログラムのうち、GPIO122のレジスタに記憶されたPort 0、Port 1、Port 2及びPort 3の設定情報をMCU141によって読み出す処理を実行する。MCU141は、GPIO122のレジスタに記憶されたPort 0、Port 1、Port 2及びPort 3の設定情報から、MCU141の起動要因が何であるか確認する。MCU141は、ミッドプレーンコネクタ150から入力される識別信号に基づいて、制御ユニット100が現用系か、又は予備系であるかを認識する。
また、MCU141が制御不能になり、CPLD144のウォッチドッグタイマがMCU141からのハートビートを検出できずにタイムアウトする場合がある。この場合、CPLD144は、Port Assign Interfaceを介して、USBスイッチ224のPort 1によるMCU141の接続から、Port 0によるMCU241による接続に切換える。USBスイッチ224のPort 0がMCU241に接続することによって、MCU241は、USBスイッチ224を介してUSBメモリ223と接続可能になる。
制御ユニット200は、第1電源回路210、制御回路221、GPIO222、USBメモリ223、USBスイッチ224、第2電源回路230、MCU241、BOOT FMEM243、CPLD244、周辺デバイス245及びミッドプレーンコネクタ250を有する。なお、制御ユニット200は、予備系として動作する。なお、制御ユニット200において、制御ユニット100で説明した構成と同様の構成には同一符号を付し、説明を省略する。
なお、図2で前述した第1電源系デバイス220は、制御回路221、GPIO222、USBメモリ223及びUSBスイッチ224を含む。第1電源系デバイス220には、図2で前述したとおり、第1電源回路210によって直流電圧が供給される。又、図2で前述した第2電源系デバイス240は、MCU241、BOOT FMEM243、CPLD244及び周辺デバイス245を含む。第2電源系デバイス240には、図2で前述したとおり、第2電源回路230によって直流電圧が供給される。
制御回路221は、制御ユニット200のGPIO222、第2電源回路230、制御ユニット100のGPIO122及びCPLD144と、バスによって接続されている。制御回路221は、バスを介して、GPIO222、GPIO122、及びCPLD144からの指示に基づいて、第2電源回路230に対する電源の投入及び切断の指示を行う。即ち、起動制御部である制御回路221は、第2の制御部であるMCU241に起動指示を出力する。
GPIO222は、MCU241と、I2Cによって接続されている。GPIO222は、I2Cを介したMCU241からの指示に基づいて、Port 0、Port 1、Port 2及びPort 3の設定を行う。また、GPIO222は、Port 0、Port 1、Port 2及びPort 3の設定を記憶するレジスタを内蔵する。
GPIO222のPort 0は、バスによって、制御回路221と接続されている。GPIO222のPort 1は、バスによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御回路121及びGPIO122のPort 2と接続されている。GPIO222のPort 2は、バスによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、GPIO122のPort 1と接続されている。GPIO222のPort 3は、バスによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、CPLD144と接続されている。
USBメモリ223は、USB2.0によって、USBスイッチ224と接続されている。USBメモリ223は、USB2.0を介して、USBスイッチ224と、USBメモリ223に記憶されているデータの送受信を行う。
USBスイッチ224は、Port Assign Interfaceによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、制御ユニット100のCPLD144と接続されている。Port Assign Interfaceは、USBスイッチ224のPort 0又はPort 1を設定する為の入力信号である。USBスイッチ224は、I2Cによって、MCU241と接続されている。USBスイッチ224のPort 0は、MCU241と、USB2.0によって接続されている。USBスイッチ224のPort 1は、MCU141と、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、USB2.0によって接続されている。
MCU241は、バスによって、ミッドプレーンコネクタ250と接続されている。MCU241は、USB2.0によって、USBスイッチ224のPort 0と接続されている。MCU241は、USB2.0によって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、USBスイッチ124のPort 1と接続されている。MCU241は、バスによって、BOOT FMEM243及びCPLD244と接続されている。又、MCU241は、GPIOを内蔵している。
BOOT FMEM243は、MCU241とバスを介して接続されている。BOOT FMEM243は、MCU241の起動プログラムが記憶されている。BOOT FMEM243が記憶する起動プログラムは、周辺デバイス245の初期化を行うプログラムが組み込まれている。BOOT FMEM243が記憶する起動プログラムは、GPIO222のレジスタに記憶されたPort 0、Port 1、Port 2及びPort 3の設定情報をMCU241によって読出し、MCU241の起動要因が何であるか確認する処理を含む。なお、MCU241の起動要因が何かによって、MCU241の起動後の処理が変更される。
CPLD244は、バスによって、MCU241と接続されている。CPLD244は、Port Assign Interfaceによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、USBスイッチ124と接続されている。CPLD244は、バスによって、ミッドプレーンコネクタ150及びミッドプレーンコネクタ250を介して、GPIO122のPort 3と接続されている。CPLD244は、MCU241の動作状況を監視する回路であるウォッチドッグタイマを内蔵している。CPLD244は、MCU241の起動時、又は運用中に、MCU241からの応答が所定時間以上無かった場合、MCU241に動作異常が発生したと判断する。CPLD244は、MCU241に動作異常が発生したと判断した後、USBスイッチ124及びGPIO222のPort 3に対してMCU241のリセット信号又は割り込み(Non−Maskable Interrupt:NMI)信号をアサートする。
周辺デバイス245は、NIC、Hub、I2C Controller、DRAM、MRAM、Sensor、LEDコントローラ及びE2PROMを含む。周辺デバイス245は、制御ユニット100の周辺デバイス145と同様に、情報処理装置10の管理及び制御を行う為に用いられるデバイスである。
ミッドプレーンコネクタ250は、制御ユニット200と、情報処理装置10及び制御ユニット100との間を接続するコネクタである。ミッドプレーンコネクタ250は、制御ユニット200を情報処理システム1000のスロットに接続する際に、スロット位置に対応する信号が、情報処理システム1000のSlot#1から入力される。ミッドプレーンコネクタ250は、接続された制御ユニット200に対して、制御ユニット200が現用系になるか、又は予備系になるか識別する為の識別信号を、MCU241に対して伝送する。
MCU241は、第2電源回路230によって電源が投入された時、BOOT FMEM243に記憶されているMCU241の起動プログラムの読出しを行い、MCU241の起動を行う。MCU241は、MCU241の起動時に、BOOT FMEM243に記憶されている周辺デバイス245の初期化を行うプログラムを実行し、周辺デバイス245の初期化を行う。MCU241は、MCU241の起動時に、BOOT FMEM243に記憶されているプログラムのうち、GPIO222のレジスタに記憶されたPort 0、Port 1、Port 2及びPort 3の設定情報をMCU241によって読み出す処理を実行する。MCU241は、GPIO222のレジスタに記憶されたPort 0、Port 1、Port 2及びPort 3の設定情報から、MCU241の起動要因が何であるか確認する。MCU241は、ミッドプレーンコネクタ250から入力される識別信号に基づいて、制御ユニット100が現用系か、又は予備系であるかを認識する。
また、MCU241が制御不能になり、CPLD244のウォッチドッグタイマがMCU241からのハートビートを検出できずにタイムアウトする場合がある、この場合、CPLD244は、Port Assign Interfaceを介して、USBスイッチ124のPort 1によるMCU241の接続から、Port 1によるMCU141による接続へ切換える。USBスイッチ124のPort 0がMCU141に接続することによって、MCU141は、USBスイッチ124を介してUSBメモリ123と接続可能になる。
図5は、本実施例における制御回路121の内部構成を説明する為の図である。図5において、図1〜図4で説明した構成と同様の構成には同一の符号を付し、説明を省略する。
図5に示すように、制御回路121は、排他的論理和回路121A及び論理和回路121Bを有する。
排他的論理和回路121Aは、端子X1、端子X2及び端子X3を有する。端子X1は、GPIO122のPort 0と接続する。端子X2は、GPIO122のPort 2及び制御ユニット200のGPIO222のPort 1と接続する。端子X3は、論理和回路121Bの端子Y1と接続する。
論理和回路121Bは、端子Y1、端子Y2及び端子Y3を有する。端子Y1は、排他的論理和回路121Aの端子X3と接続する。端子Y2は、GPIO122のPort 3及び制御ユニット200のCPLD244と接続する。端子Y3は、第2電源回路130と接続する。
なお、端子X1は、GPIO122のPort 0からPOWER_ENABLE信号が入力される。POWER_ENABLE信号は、制御ユニット100の第2電源回路130の有効信号をアサートするために出力される信号である。信号のアサートとは、信号をハイ(High)レベルにすることを言う。端子X2は、制御ユニット200のGPIO222からOTHER_ENABLE信号が入力される。OTHER_ENABLE信号は、制御ユニット200にエラーが発生した時に、制御ユニット200から、制御ユニット100の第2電源回路130の電源をONするために出力される信号である。端子Y2は、制御ユニット200のCPLD244からWDT_ENABLE信号が入力される。WDT_ENABLE信号は、制御ユニット200のCPLD244に内蔵されているウォッチドッグタイマから、制御ユニット100の第2電源回路130の電源をONするために出力される信号である。端子Y3は、制御ユニット100の第2電源回路130に対して、POWER_ON信号が出力される。POWER_ON信号は、制御ユニット100の第2電源回路130の電源をONするために出力される信号である。
図6は、本実施例における制御回路121の排他的論理和回路121Aの真理値表を説明する為の図である。図6の真理値表は、排他的論理和回路121Aの入出力の関係全てを真理値で表した表である。
図6に示すように、端子X1及び端子X2に「0」が入力された時、端子X3から「0」が出力される。また、端子X1に「0」、端子X2に「1」が入力された時、端子X3から「1」が出力される。また、端子X1に「1」、端子X2に「0」が入力された時、端子X3から「1」が出力される。また、端子X1に「1」、端子X2に「1」が入力された時、端子X3から「0」が出力される。
図7は、本実施例における制御ユニット100のGPIO122の信号と、GPIO122に記憶されるレジスタ値との関係を説明する為の図である。GPIO122は、MCU141からの指示に基づいて、GPIO122に内蔵されているPort 0、Port 1、Port 2及びPort 3の設定を変更する。
GPIO122のPort 0から出力される信号は、制御回路121に出力されるPOWER_ENABLE信号に相当する。GPIO122のPort 0のレジスタ値が「1」に設定されているとき、GPIO122のPort 0から、制御ユニット100の第2電源回路130の電源をONする信号が出力される。GPIO122のPort 0のレジスタ値が「0」に設定されているとき、GPIO122のPort 0から、制御ユニット100の第2電源回路130の電源をOFFする信号が出力される。
GPIO122のPort 1から出力される信号は、制御ユニット200の制御回路221に対して出力されるOTHER_ENABLE信号に相当する。GPIO122のPort 1のレジスタ値が「0」に設定されているとき、エラー無しの通常状態を示すNormal信号が、GPIO122のPort 1から制御ユニット200の制御回路221に対して出力される。GPIO122のPort 1のレジスタ値が「1」に設定されているとき、制御ユニット100にエラーが発生したため、制御ユニット200の第2電源回路130の電源をONすることを示すError信号が、GPIO122のPort 1から制御ユニット200の制御回路221に対して出力される。
GPIO122のPort 2に入力される信号は、制御ユニット200のGPIO222のPort 1から入力されるOTHER_ENABLE信号に相当する。GPIO122のPort 2のレジスタ値が「0」に設定されているとき、エラー無しの通常状態を示すNormal信号がGPIO222のPort 1からGPIO122のPort 2に入力されたことを示す。GPIO122のPort 2のレジスタ値が「1」に設定されているとき、制御ユニット200が現用系として動作する場合に制御ユニット100にエラーが発生したため、制御ユニット100の第2電源回路130の電源がONされたことを示すError信号がGPIO222のPort 1からGPIO122のPort 2に入力されたことを示す。
GPIO122のPort 3に入力される信号は、制御ユニット200のCDLD244から入力されるWDT_ENABLE信号に相当する。GPIO122のPort 3のレジスタ値が「0」に設定されているとき、エラー無しの通常状態を示すNormal信号が、制御ユニット200のCDLD244からGPIO122のPort 3に入力されたことを示す。GPIO122のPort 3のレジスタ値が「1」に設定されているとき、制御ユニット200が現用系として動作する場合に制御ユニット200にエラーが発生したため、制御ユニット100の第2電源回路130の電源がONされたことを示すError信号が、制御ユニット200のCDLD244からGPIO122のPort 3に入力されたことを示す。
図8は、本実施例における制御ユニット100及び制御ユニット200の通常運用時の処理を示すシーケンス図である。図8において、図1〜図7で説明した構成と同様の構成には同一の符号を付し、説明を省略する。なお、本実施例において、制御ユニット100は現用系として動作する。制御ユニット200は予備系として動作する。
図8に示すように、制御ユニット100は、装置主電源がONされると(OP1)、制御ユニット100の第1電源回路110に電源が投入される(OP2)。第1電源回路110は、第1電源系デバイス120に電源を投入する。次いで、GPIO122のPort 0から出力されるPOWER_ENABLE信号に「High」(1)がアサートされる(OP2)。次いで、制御ユニット100の第2電源回路130に電源が投入される(OP2)。第2電源回路130は、第2電源系デバイス140に電源を投入する。GPIO122のレジスタ値は、POWER_ENABLE:1、OTHER_ENABLE:0、WDT_ENABLE:0及びPOWER_ON:1である。
制御ユニット100のMCU141は、BOOT FMEM143に記憶されている起動プログラムを読み出す(OP3)。MCU141は、周辺デバイス145を初期化する(OP3)。
MCU141は、ミッドプレーンコネクタ150から入力されているSlot#0識別信号により、制御ユニット100が現用系であることを認識する(OP4)。
MCU141は、制御ユニット100のUSBスイッチ124のアップストリーム側のポート設定をPort 0に設定する(OP5)。即ち、MCU141は、USBスイッチ124からMCU141に向かう側のポート設定をPort 0に設定する(OP5)。
MCU141は、制御ユニット100のUSBメモリ123及び制御ユニット200のUSBメモリ223に対して、データ及びプログラムの二重化書込みを開始する(OP6)。次いで、制御ユニット100は、通常運用業務に移行する(OP7)。通常運用業務とは、制御ユニット100が現用系として動作し、制御ユニット200が予備系として動作する運用業務を示す。
制御ユニット200は、装置主電源がONされると(OP8)、制御ユニット200の第1電源回路210に電源が投入される(OP9)。第1電源回路210は、第1電源系デバイス220に電源を投入する。次いで、GPIO222のPort 0から出力されるPOWER_ENABLE信号に「High」(1)がアサートされる(OP9)。次いで、制御ユニット200の第2電源回路230に電源が投入される(OP9)。第2電源回路230は、第2電源系デバイス240に電源を投入する。
制御ユニット200のMCU241は、BOOT FMEM243に記憶されている起動プログラムを読み出して起動する(OP10)。MCU241は、周辺デバイス245を初期化する(OP10)。
MCU241は、ミッドプレーンコネクタ250から入力されているSlot#1識別信号により、制御ユニット200が予備系であることを認識する(OP11)。
MCU241は、制御ユニット200のUSBスイッチ224のアップストリーム側のポート設定をPort 1に設定する(OP12)。即ち、MCU241は、USBスイッチ224からMCU241に向かう側のポート設定をPort 1に設定する(OP12)。
MCU241は、I2Cを介してGPIO222を制御し、GPIO222のPort 0から出力されるPOWER_EN信号に、「Low」(0)をアサートする(OP13)。
第2電源回路230は、「Low」(0)がアサートされたPOWER_EN信号が入力されると、第2電源回路230がOFFされる。そのため、第2電源系デバイス240の電源がOFFされる(OP14)。GPIO222のレジスタ値は、POWER_ENABLE:0、OTHER_ENABLE:0、WDT_ENABLE:0及びPOWER_ON:0である。
図9〜図10は、本実施例における制御ユニット100の障害発生時の処理を示すシーケンス図である。図9のAに示す処理は図10のAに続いている。図9〜図10において、図1〜図8で説明した構成と同様の構成には同一の符号を付し、説明を省略する。なお、本実施例において、制御ユニット100は現用系として動作する。制御ユニット200は予備系として動作する。
図9に示すように、制御ユニット100における障害の発生が検出されると(OP21)、CPLD144は、CPLD144に内蔵されているウォッチドッグタイマを用いて、MCU141が制御不能に陥っているか判断する(OP22)。具体的には、CPLD144は、MCU141の起動時、又は運用中に、MCU141からの応答が所定時間以上無かった場合、MCU141に動作異常が発生したと判断する。
MCU141が制御不能に陥っていない場合(OP22 N)、MCU141は、USBメモリ123に記憶されているファームウェアを読み出して、制御ユニット100のエラーを検出する(OP23)。
MCU141が制御不能に陥っている場合(OP22 Y)、制御ユニット100のCPLD144は、制御ユニット200の第2電源回路230の電源をONする(OP27)。具体的には、MCU141に動作異常が発生し、CPLD144のウォッチドッグタイマがMCU141からのハートビートを検出できずにタイムアウトした後の処理として、CPLD144が制御ユニット200の電源をONするための信号(WDT_ENABLE)をアサートする。MCU141は制御不能のため、制御ユニット200の第2電源回路230及び第2電源系デバイス240に対する電源投入は、CPLD144によって行われる。
MCU141が制御不能に陥っている場合(OP22 Y)の、制御ユニット200の第2電源回路230及び第2電源系デバイス240に対する電源投入の処理を説明する。最初に、CPLD144は、制御ユニット200の制御回路221に対して出力されるWDT_ENABLE信号に「High」(1)がアサートされる。次いで、制御回路221から第2電源回路230に対して出力されるPOWER_ON信号に「High」(1)がアサートされる。そのため、制御ユニット200の第2電源回路230に電源が投入される。GPIO222のレジスタ値は、POWER_ENABLE:0、OTHER_ENABLE:0、WDT_ENABLE:1及びPOWER_ON:1である。
MCU141は、制御ユニット100のエラーを検出した後(OP23)、USBメモリ123に記憶されているファームウェアを読み出して、制御ユニット100の障害箇所を特定する(OP24)。次いで、MCU141は、特定された制御ユニット100の障害箇所を、USBメモリ123、及び、USBメモリ123と2重化されているUSBメモリ223に記録する(OP24)。次いで、MCU141は、制御ユニット100のGPIO122を制御して、制御ユニット200の第2電源系デバイス240の電源をONする(OP25)。具体的には、GPIO122のPort 1から、制御ユニット200の制御回路221に対して出力されるOTHER_ENABLE信号に「High」(1)がアサートされる。次いで、制御ユニット200の第2電源回路230に電源がONされる(OP25)。GPIO122のレジスタ値は、POWER_ENABLE:0、OTHER_ENABLE:1、WDT_ENABLE:0及びPOWER_ON:1である。
MCU141は、Port Assign Interface経由で制御ユニット200のUSBスイッチ224にアクセスしてUSBスイッチ224の設定を変更する(OP26)。USBスイッチ224の設定変更後、制御ユニット200のMCU241は、USBメモリ223にアクセス可能となる(OP26)。具体的には、MCU141は、USBスイッチ224のPort 1をPort 0に設定する。
なお、CPLD144は、制御ユニット200の第2電源回路230の電源をONする(OP27)。次いで、CPLD144は、Port Assign Interface経由で制御ユニット200のUSBスイッチ224にアクセスしてUSBスイッチ224の設定を変更する(OP28)。即ち、CPLD144は、第1の制御部であるMCU141の異常を検出し、USBスイッチ224にアクセスしてUSBスイッチ224の設定を変更する。USBスイッチ224の設定変更後、制御ユニット200のMCU241は、USBメモリ223にアクセス可能となる(OP28)。具体的には、CPLD144は、USBスイッチ224のPort 1をPort 0に設定する。
次いで、制御ユニット200のMCU241は、BOOT FMEM243に記憶されている起動プログラムを読み出して起動する(OP31)。MCU241は、GPIO222のレジスタ値であるPort 0、Port 1、Port 2及びPort 3を読み出し、MCU241の起動要因を確認する。
MCU141が制御不能に陥っていない時(OP22 N)にMCU241が起動した場合、GPIO122のPort 1から、GPIO222のPort 2に対して出力されるOTHER_ENABLE信号に「High」(1)がアサートされている。そのため、GPIO222のレジスタのPort 2に、「High」(1)が設定されている。GPIO222のレジスタのPort 0、Port 1及びPort 3は、「Low」(0)が設定されている。
一方、MCU141が制御不能に陥っている時(OP22 Y)にMCU241が起動した場合について説明する。MCU241は、起動プログラムを読み出して起動する際に(OP31)、GPIO222のレジスタのPort 0、Port 1、Port 2及びPort 3を読み出し、MCU141の起動要因を確認する。この場合、CPLD144からGPIO222に出力されるWDT_ENABLEに「High」(1)がアサートされている。そのため、GPIO222のレジスタのPort 3に、「High」(1)が設定されている。GPIO222のレジスタのPort 0、Port 1及びPort 2は、「Low」(0)が設定されている。
MCU241は、GPIO222のレジスタPort 3に「High」(1)が設定されていることを確認した後、I2Cを介してGPIO222を制御し、制御回路221から第2電源回路230に対してPOWER_ENABLE信号をアサートする。POWER_ENABLE信号をアサートすることによって、CPLD144からのWDT_ENABLE信号がネゲートされても、第2電源回路230の電源が切断されない。そのため、第2電源回路230の電源は、ONの状態に維持される。第2電源回路230の電源は、ONの状態に維持されるため、第2電源系デバイス240に電源を供給できる。信号のネゲートとは、信号を無効にすることを言う。
MCU241は、BOOT FMEM243に記憶されている起動プログラムを読み出して起動した後(OP31)、GPIO222のレジスタ値及びUSBメモリ223に記録されている制御ユニット100の故障要因を記録したログを読み出す(OP32)。MCU241は、制御ユニット100の故障要因を記録したログから、制御ユニット100の故障要因を特定する(OP32)。
MCU241は、制御ユニット200のGPIO222を制御し、故障した制御ユニット100の第2電源回路130の電源をOFFする(OP33)。即ち、第2の制御部であるMCU241は、MCU241に起動指示が出力された後、現用系処理装置である制御ユニット100の起動制御部である制御回路121に対して、第1の制御部の電源である第2電源回路130を切断する指示を出力する。具体的には、MCU241は、I2Cを介してGPIO222のPort 1から制御ユニット100のGPIO122のPort 2に対して出力されるOTHER_ENABLE信号の「High」(1)をアサートする。GPIO122のPort 0から出力されるPOWER_ON信号は、「Low」(0)がアサートされる。その結果、制御ユニット100の第2電源回路130がOFFされる(OP33)。制御ユニット100の第2電源回路130の電源が切断されるため、第2電源系デバイス140の電源がOFFされる(OP34)。
故障した制御ユニット100の第2電源回路130の電源がOFFされた後、予備系の制御ユニット200が現用系となる。現用系となった制御ユニット200は、制御対象ユニット群である情報処理装置10のCPU11、メモリ12、PSU13、ファンユニット14及び通信インタフェース15の監視及び制御を開始する(OP35)。
本実施例における情報処理システム1000を用いることで、制御ユニット200の第2電源系デバイス240の電源が切断されるため、予備系である制御ユニット200の消費電力を削減できる。本実施例における制御ユニット200を用いると、現用系の制御ユニット100と比較して、約90%の消費電力を削減できる。
本実施例に開示の技術によれば、現用系処理装置である制御ユニット100が故障した時に、外部からの起動指示に従い、予備系の制御部であるMCU241の電源である第2電源回路230を投入する。そのため、常時、予備系の電源である第2電源回路230を投入しておくことなく、現用系で使用していたソフトウエア123Aの整合性を取ることが可能になる。そのため、情報処理システム1000全体の省電力化を図ることができる。
10 情報処理装置
11 CPU
12 メモリ
13 PSU
14 ファンユニット
15 通信インタフェース
16 バス
100、200 制御ユニット
110、210 第1電源回路
120、220 第1電源系デバイス
121、221 制御回路
121A 排他的論理和回路
121B 論理和回路
122、222 GPIO
123、223 USBメモリ
124、224 USBスイッチ
130、230 第2電源回路
140、240 第2電源系デバイス
141、241 MCU
143、243 BOOT FMEM
144、244 CPLD
145、245 周辺デバイス
150、250 ミッドプレーンコネクタ
160、260 バス
500 ネットワーク
1000 情報処理システム

Claims (10)

  1. 第1のソフトウエアを記憶する第1メモリを有する第1処理装置、及び、前記第1処理装置と接続され、且つ前記第1のソフトウエアと同一の第2のソフトウエアを記憶する第2メモリを有する第2処理装置を有する情報処理システムであって、
    前記第1メモリおよび前記第2メモリには電源が常時投入され、
    前記第1処理装置は、
    前記第1メモリに記憶された前記第1のソフトウエアを処理するとともに、前記第1メモリに記憶されている前記第1のソフトウエアに更新の指示があった場合、前記第1メモリに記憶されているソフトウエアの更新を行なうとともに前記第2メモリに記憶されているソフトウエアの更新も行なう第1の制御部を有し、
    前記第2処理装置は、
    前記第2メモリに記憶された前記第2のソフトウエアを処理する第2の制御部と、
    前記第1処理装置の異常が検出された場合、外部からの起動指示に従い、前記第2の制御部に電源を投入する電源部と、
    を有する情報処理システム。
  2. 前記第2の制御部は、前記電源部からの電源の投入に従い、前記第1処理装置の電源部に対して、前記第1の制御部の電源を切断する指示を出力することを特徴とする請求項1記載の情報処理システム。
  3. 前記第1処理装置の異常が検出され、且つ前記第1の制御部が前記第1メモリに記憶された前記第1のソフトウエアを処理可能である場合、前記第1の制御部は、前記第2処理装置の電源部に対し、前記第2の制御部に電源を投入する指示を出力することを特徴とする請求項1又は請求項2記載の情報処理システム。
  4. 第1のソフトウエアを記憶する第1メモリを有する第1処理装置、及び、前記第1処理装置と接続され、且つ前記第1のソフトウエアと同一の第2のソフトウエアを記憶する第2メモリを有する第2処理装置を有する情報処理システムの処理方法であって、
    前記第1メモリおよび前記第2メモリには電源が常時投入され、
    前記第1処理装置は、
    前記第1メモリに記憶された前記第1のソフトウエアを処理し、
    前記第1メモリに記憶されている前記第1のソフトウエアのいずれかに更新の指示があった場合、前記第1メモリに記憶されている、変更指示があったソフトウエアの更新を行なうとともに前記第2メモリに記憶されているソフトウエアの更新も行ない、
    前記第2処理装置は、
    前記第1処理装置の異常が検出された場合、外部からの起動指示に伴い、前記第2メモリに記憶された前記第2のソフトウエアを処理し、
    前記第1処理装置の異常が検出された場合、外部からの起動指示に従い、前記第2の制御部に電源を投入することを特徴とする情報処理システムの処理方法。
  5. 前記第2処理装置の制御部は、前記第2処理装置の電源部からの電源の投入に伴い、前記第1処理装置の電源部に対して、前記第1の制御部の電源を切断する指示を出力することを特徴とする請求項4記載の情報処理システムの処理方法。
  6. 前記第1処理装置の異常が検出され、且つ前記第1処理装置の制御部が前記第1メモリに記憶された前記第1のソフトウエアの処理が可能である場合、前記第1処理装置の前記制御部は、前記第2処理装置の電源部に対し、前記第2処理部の制御部に電源を投入する指示を出力することを特徴とする請求項4又は請求項5記載の情報処理システムの処理方法。
  7. 前記第1処理装置は現用系処理装置であり、前記第2処理装置は予備系処理装置であることを特徴とする請求項1乃至3の何れか一項に記載の情報処理システム。
  8. 前記第1メモリ及び前記第2メモリは不揮発性メモリであることを特徴とする請求項1乃至3又は請求項7の何れか一項に記載の情報処理システム。
  9. 前記第1処理装置は現用系処理装置であり、前記第2処理装置は予備系処理装置であることを特徴とする請求項4乃至6の何れか一項に記載の情報処理システムの処理方法。
  10. 前記第1メモリ及び前記第2メモリは不揮発性メモリであることを特徴とする請求項4乃至6又は請求項9の何れか一項に記載の情報処理システムの処理方法。
JP2013506822A 2011-03-28 2011-03-28 情報処理システム及び情報処理システムの処理方法 Active JP5682703B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/001843 WO2012131761A1 (ja) 2011-03-28 2011-03-28 情報処理システム及び情報処理システムの処理方法

Publications (2)

Publication Number Publication Date
JPWO2012131761A1 JPWO2012131761A1 (ja) 2014-07-24
JP5682703B2 true JP5682703B2 (ja) 2015-03-11

Family

ID=46929613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013506822A Active JP5682703B2 (ja) 2011-03-28 2011-03-28 情報処理システム及び情報処理システムの処理方法

Country Status (3)

Country Link
US (1) US9547567B2 (ja)
JP (1) JP5682703B2 (ja)
WO (1) WO2012131761A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912488B (zh) * 2016-05-20 2019-02-05 英业达科技有限公司 计算机装置及其控制方法
CN110554879B (zh) * 2019-07-26 2023-02-10 深圳震有科技股份有限公司 一种基于处理器的烧录方法、系统和计算机设备
CN110618909B (zh) * 2019-09-27 2021-03-26 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置、设备及存储介质
CN111767242B (zh) * 2020-05-28 2022-04-15 西安广和通无线软件有限公司 Pcie设备控制方法、装置、计算机设备和存储介质
CN113986804B (zh) * 2021-10-26 2024-10-29 超越科技股份有限公司 国产嵌入式系统计算机与外设的通信方法、计算机及介质
US11855533B2 (en) * 2022-01-20 2023-12-26 Atemitech Corporation Power supply device communicable with system and method for supplying power to system through switch thereof

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62191299A (ja) * 1986-02-17 1987-08-21 Tokyo Keiki Co Ltd 船舶用自動操舵装置
JPH04362744A (ja) * 1991-06-10 1992-12-15 Oki Electric Ind Co Ltd 二重化システムの系切替え制御装置
JPH0713787A (ja) * 1993-06-15 1995-01-17 Fujitsu Ltd 情報処理装置
JPH1185555A (ja) * 1997-09-10 1999-03-30 Mitsubishi Electric Corp コールドスタンバイ型二重系システム
JP2003167752A (ja) * 2001-11-29 2003-06-13 Nec Yonezawa Ltd プログラム更新システム、プログラム更新方法、および、プログラム更新プログラム
JP2007087269A (ja) * 2005-09-26 2007-04-05 Nec Saitama Ltd ソフトウェア更新システム、更新方法、及び、プログラム
JP2008217225A (ja) * 2007-03-01 2008-09-18 Hitachi Ltd ブレードサーバシステム
WO2008152790A1 (ja) * 2007-06-12 2008-12-18 Panasonic Corporation マルチプロセッサ制御装置、マルチプロセッサ制御方法及びマルチプロセッサ制御回路
JP2009205409A (ja) * 2008-02-27 2009-09-10 Nec Corp 冗長構成システム、該冗長構成システムに用いられる情報管理方法及び情報管理制御プログラム
JP2010067042A (ja) * 2008-09-11 2010-03-25 Hitachi Ltd 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP2010146087A (ja) * 2008-12-16 2010-07-01 Hitachi Ltd 系切替計算機システムの管理方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6058490A (en) * 1998-04-21 2000-05-02 Lucent Technologies, Inc. Method and apparatus for providing scaleable levels of application availability
US6715101B2 (en) * 2001-03-15 2004-03-30 Hewlett-Packard Development Company, L.P. Redundant controller data storage system having an on-line controller removal system and method
JP2005267111A (ja) * 2004-03-17 2005-09-29 Hitachi Ltd 記憶制御システム及び記憶制御システムの制御方法
JP4462024B2 (ja) * 2004-12-09 2010-05-12 株式会社日立製作所 ディスク引き継ぎによるフェイルオーバ方法
US7661018B2 (en) * 2006-12-21 2010-02-09 International Business Machines Corporation Method, apparatus and program storage device for providing automatic recovery from premature reboot of a system during a concurrent upgrade
JP2012018556A (ja) * 2010-07-08 2012-01-26 Hitachi Ltd 計算機システム及び計算機システムの系切替制御方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62191299A (ja) * 1986-02-17 1987-08-21 Tokyo Keiki Co Ltd 船舶用自動操舵装置
JPH04362744A (ja) * 1991-06-10 1992-12-15 Oki Electric Ind Co Ltd 二重化システムの系切替え制御装置
JPH0713787A (ja) * 1993-06-15 1995-01-17 Fujitsu Ltd 情報処理装置
JPH1185555A (ja) * 1997-09-10 1999-03-30 Mitsubishi Electric Corp コールドスタンバイ型二重系システム
JP2003167752A (ja) * 2001-11-29 2003-06-13 Nec Yonezawa Ltd プログラム更新システム、プログラム更新方法、および、プログラム更新プログラム
JP2007087269A (ja) * 2005-09-26 2007-04-05 Nec Saitama Ltd ソフトウェア更新システム、更新方法、及び、プログラム
JP2008217225A (ja) * 2007-03-01 2008-09-18 Hitachi Ltd ブレードサーバシステム
WO2008152790A1 (ja) * 2007-06-12 2008-12-18 Panasonic Corporation マルチプロセッサ制御装置、マルチプロセッサ制御方法及びマルチプロセッサ制御回路
JP2009205409A (ja) * 2008-02-27 2009-09-10 Nec Corp 冗長構成システム、該冗長構成システムに用いられる情報管理方法及び情報管理制御プログラム
JP2010067042A (ja) * 2008-09-11 2010-03-25 Hitachi Ltd 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
JP2010146087A (ja) * 2008-12-16 2010-07-01 Hitachi Ltd 系切替計算機システムの管理方法

Also Published As

Publication number Publication date
JPWO2012131761A1 (ja) 2014-07-24
US20140025989A1 (en) 2014-01-23
WO2012131761A1 (ja) 2012-10-04
US9547567B2 (en) 2017-01-17

Similar Documents

Publication Publication Date Title
EP3211532B1 (en) Warm swapping of hardware components with compatibility verification
JP5682703B2 (ja) 情報処理システム及び情報処理システムの処理方法
CN107526665B (zh) 机箱管理系统及机箱管理方法
US8601252B2 (en) Method and system for automatically restarting an information handling system to restore system configuration after disorderly shutdown indicated by setting a latch
US9329885B2 (en) System and method for providing redundancy for management controller
US8880937B2 (en) Reducing impact of a repair action in a switch fabric
WO2018045922A1 (zh) 一种备电方法及装置
US11314578B2 (en) Information handling system and method to detect and recover from spurious resets of PCIe devices
US8745437B2 (en) Reducing impact of repair actions following a switch failure in a switch fabric
TW200838084A (en) Updating a power supply microcontroller
US7984219B2 (en) Enhanced CPU RASUM feature in ISS servers
US20130117518A1 (en) System controller, information processing system and method of saving and restoring data in the information processing system
US8886974B2 (en) Controller
US10853211B2 (en) System and method for chassis-based virtual storage drive configuration
CN110096224B (zh) 存储器子系统中的功率控制
US20230315437A1 (en) Systems and methods for performing power suppy unit (psu) firmware updates without interrupting a user's datapath
US8738829B2 (en) Information system for replacing failed I/O board with standby I/O board
Intel
KR101775326B1 (ko) 제어 대상 단말을 제어 및 모니터링하는 방법 및 이를 수행하는 상세 제어 장치
JP2017041110A (ja) マルチコンピュータシステム,管理装置および管理プログラム
JP5970846B2 (ja) 計算機システム及び計算機システムの制御方法
US20240193104A1 (en) Computer system with flexible architecture
US20240361920A1 (en) Systems and methods for updating witness sleds
JP2012150543A (ja) ファームウェア管理システム、ファームウェア管理方法、情報処理装置
TWI704463B (zh) 伺服器系統與管理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141229

R150 Certificate of patent or registration of utility model

Ref document number: 5682703

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150