JP2004199120A - Information processor - Google Patents

Information processor Download PDF

Info

Publication number
JP2004199120A
JP2004199120A JP2002363331A JP2002363331A JP2004199120A JP 2004199120 A JP2004199120 A JP 2004199120A JP 2002363331 A JP2002363331 A JP 2002363331A JP 2002363331 A JP2002363331 A JP 2002363331A JP 2004199120 A JP2004199120 A JP 2004199120A
Authority
JP
Japan
Prior art keywords
firmware
information processing
modules
monitoring
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002363331A
Other languages
Japanese (ja)
Inventor
Takeshi Takeuchi
健 竹内
Akihiko Saito
明彦 斎藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2002363331A priority Critical patent/JP2004199120A/en
Publication of JP2004199120A publication Critical patent/JP2004199120A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stored Programmes (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a highly reliable information processor for automatically restoring all pieces of firmware even if disorder occurs in one or a plurality of pieces of firmware in an information processor in which the plurality of pieces of firmware exist. <P>SOLUTION: The information processor comprising two modules 1 and 2 functions as follows; when monitors 106 and 113 for at least one module detect a fault in used firmware 103 and 110, the monitor having detected the disorder informs a system monitor 115 that the fault has been detected; the system monitor 115 requests the monitors 106 and 113 for all of n modules to rewrite the firmware; before the information processor is restarted, all of the n modules are synchronously switched from the used firmware 103 and 110 to firmware 105 and 112 for restoration; and the information processor is normally restarted. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、複数のファームウェアを持つ情報処理装置に関し、特にファームウェアの自動修復機能を有する情報処理装置に適用して有効な技術に関する。
【0002】
【従来の技術】
本発明者が検討したところによれば、複数のファームウェアを持つ情報処理装置に関しては、以下のような技術が考えられる。
【0003】
たとえば、サーバー装置のような高信頼性が要求される情報処理装置では、通常、運用するファームウェアのほかに修復用ファームウェアを持ち、運用しているファームウェアで障害が発生したときには運用しているファームウェアから修復用ファームウェアへ自動的に切り替える情報処理装置が一般的である。
【0004】
ここで、本発明者が本発明の前提として検討した情報処理装置について、図6により説明する。図6は1つのファームウェアとそのファームウェアにより動作するCPUとが存在する情報処理装置の例である。
【0005】
図6に示すように、本発明の前提として検討した情報処理装置は、CPU101と、書き替え可能なROM102に格納される運用ファームウェア103と、修復用ファームウェア105を格納する不揮発性ROM104がシステムバス100で接続されている。CPU101は、書き替え可能なROM102に格納している運用ファームウェア103で通常処理している。
【0006】
監視装置106は、同一システムバス100上に接続され、情報処理装置が稼動しているときにCPU101を運用している運用ファームウェア103が正常に運用しているかを監視している。システム監視装置115は、監視装置106とシステム管理バス107で接続される。ここで、運用ファームウェア103に何らかの障害が発生し、正常な状態で情報処理装置を稼動できない場合、その障害を監視している監視装置106はシステム監視装置115に再起動の要求を指示し、再起動が始まる前に修復用ファームウェア105を書き替え可能なROM102に書き込み、自動的に情報処理装置を復元させる。
【0007】
なお、このような複数のファームウェアを持つ情報処理装置としては、たとえば不揮発性メモリに新旧のファームウェアをおき、入れ替えたファームウェアに障害があったときや書き替えに失敗したときに、正常に稼動する旧ファームウェアに戻す技術がある(たとえば、特許文献1参照)。
【0008】
【特許文献1】
特開平11−110218号公報
【0009】
【発明が解決しようとする課題】
ところで、前記のような情報処理装置の技術について、本発明者が検討した結果、以下のようなことが明らかとなった。
【0010】
たとえば、前述した図6に示す情報処理装置では、CPU101、書き替え可能なROM102に格納される運用ファームウェア103、修復用ファームウェア105を格納する不揮発性ROM104、および監視装置106をモジュールとし、そのモジュールがn個(n:2以上)存在した情報処理装置では、各モジュールのファームウェアが1つの情報処理装置に構成されるため、n個のファームウェアが情報処理装置のアドレス空間を共有するようになり、またn個の各ファームウェアが制御しているFPGAの情報を共有するようになる。
【0011】
従って、前述した図6に示す情報処理装置の技術を生かし、n個のファームウェアが一度に複数個で障害が発生した時に、その障害が発生したファームウェアのみを自動的に修復して再起動を実施しても、ファームウェア間で情報の共有ができなくなり、情報処理装置はシステムダウンすることになる。
【0012】
そこで、本発明の目的は、複数のファームウェアが存在する情報処理装置において、1つおよび複数のファームウェアで障害が発生した場合でも、全てのファームウェアを自動修復することができ、高い信頼性を得ることができる情報処理装置を提供することにある。
【0013】
【課題を解決するための手段】
本発明は、前記目的を達成するために、書き替え可能なメモリ(ROM)に格納された運用ファームウェアと、その運用ファームウェアで動作するCPUと、前記運用ファームウェアの1世代前もしくは動作実績のあるファームウェアである修復用ファームウェアを格納する不揮発性メモリ(ROM)が存在し、前記運用ファームウェアでの起動障害を検出する機能と前記修復用ファームウェアを前記書き替え可能なROMに書き込む機能を持つ監視装置がシステムバスで接続されるモジュールがn個(n:2以上)存在し、前記n個のモジュールにおいて障害が発生した場合、前記n個のモジュールの前記監視装置にファームウェアの書き替えを要求する機能と、再起動させる機能を持つシステム監視装置を1つ有する情報処理装置に適用され、以下のような特徴を有するものである。
【0014】
すなわち、本発明における第1の情報処理装置は、前記情報処理装置が稼働している時、前記n個のモジュールのうち、少なくとも1つのモジュールの前記監視装置が現在運用している前記運用ファームウェアでの障害を検出した時、障害を検出した前記監視装置は前記システム監視装置へ障害を検出したことを通知し、前記システム監視装置は前記n個全てのモジュールの前記監視装置に対してファームウェアの書き替えを要求し、前記情報処理装置が前記システム監視装置によって再起動される前に前記n個全てのモジュールの前記監視装置によって前記運用ファームウェアから前記修復用ファームウェアに同期して切り替え、正常に再起動する機能を有するものである。
【0015】
さらに、本発明における第2の情報処理装置は、外部装置から行うファームウェアの書き替えは、前記n個全てのモジュール内の不揮発性ROMにファームウェアを書き込み、前記システム監視装置はファームウェアの書き込み終了後に、前記n個全てのモジュール内の前記監視装置に対してファームウェアの書き替えを要求し、前記監視装置は再起動する前に書き込んだファームウェアを前記書き替え可能なROMに書き替え、正常に再起動する機能を有するものである。
【0016】
【発明の実施の形態】
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一機能を有する部材には同一の符号を付し、その繰り返しの説明は省略する。
【0017】
(実施の形態1)
図1は本発明の実施の形態1である情報処理装置の全体の概略構成を示すブロック図である。図2は本実装の形態である情報処理装置の各モジュールに構成される監視装置の動作のフローチャートを示し、図3は情報処理装置のシステム監視装置の動作のフローチャートを示す。
【0018】
まず、図1により、本実施の形態の情報処理装置の全体の概略構成の一例を説明する。
【0019】
本実施の形態の情報処理装置は、たとえば2個のモジュールにより構成された情報処理装置であり、書き替え可能なROM102に格納された運用ファームウェア103と、その運用ファームウェア103で動作するCPU101と、運用ファームウェア103の1世代前もしくは動作実績のあるファームウェアである修復用ファームウェア105を格納する不揮発性ROM104が存在し、システムバス100で接続されている。
【0020】
また、システムバス100には、運用ファームウェア103での起動障害を検出する機能と不揮発性ROM104に格納する修復用ファームウェア105を書き替え可能なROM102へ書き込む機能を持つ監視装置106が接続される。また、CPU101の情報などを格納するFPGA117も接続される。これらのシステムバス100、CPU101、書き替え可能なROM102、運用ファームウェア103、不揮発性ROM104、修復用ファームウェア105、FPGA117、および監視装置106を含めてモジュール1とする。
【0021】
同様に、モジュール2についても、書き替え可能なROM109に格納された運用ファームウェア110と、その運用ファームウェア110で動作するCPU108と、運用ファームウェア110の1世代前もしくは動作実績のあるファームウェアである修復用ファームウェア112を格納する不揮発性ROM111が存在し、システムバス114で接続されている。
【0022】
また、システムバス114には、運用ファームウェア110の起動障害を検出する機能と不揮発性ROM111に格納する修復用ファームウェア112を書き替え可能なROM109へ書き込む機能を持つ監視装置113が接続される。また、CPU108の情報などを格納するFPGA118も接続される。これらのシステムバス114、CPU108、書き替え可能なROM109、運用ファームウェア110、不揮発性ROM111、修復用ファームウェア112、FPGA118、および監視装置113を含めてモジュール2とする。
【0023】
この情報処理装置は、モジュール1とモジュール2が現在運用している運用ファームウェア103と運用ファームウェア110で起動障害を検出した場合に、モジュール1の監視装置106とモジュール2の監視装置113にファームウェアの書き替えを要求する機能と、再起動させる機能を持つシステム監視装置115がシステム管理バス107で接続される情報処理装置である。
【0024】
なお、この情報処理装置では、複数の運用ファームウェア103,110でアドレス空間を共有する共有メモリ116がシステム管理バス107に接続され、また各モジュール1,2内において、各運用ファームウェア103,110が制御しているFPGA117,118の情報も情報処理装置で共有するような構成となっている。
【0025】
次に、図2および図3により、本実施の形態の情報処理装置において、起動障害を検出した場合の動作の一例を説明する。
【0026】
たとえば、情報処理装置が稼働している時、モジュール1またはモジュール2において、現在運用している運用ファームウェア103または運用ファームウェア110で起動障害を検出した時、もしくはモジュール1の監視装置106とモジュール2の監視装置113が同時に運用ファームウェア103または運用ファームウェア110で起動障害を検出した時を想定する。この動作は、図2の監視装置106,113のフローチャートではステップS10とS11に相当する。
【0027】
この起動障害とは、CPU101およびCPU108から処理中におけるタイムアウト検出や、書き替え可能なROM102と書き替え可能なROM109の自己診断でエラーが発生した場合で、障害を検出した監視装置106および監視装置113はシステム監視装置115に障害が発生したことを通知する。この動作は、図2の監視装置106,113のフローチャートではステップS12に相当する。
【0028】
システム監視装置115は障害の報告を受けると、モジュール1の監視装置106およびモジュール2の監視装置113に対してファームウェアの書き替えを要求する。システム監視装置115は障害が発生したモジュールに関わらず、モジュール1の監視装置106およびモジュール2の監視装置113に対してファームウェアの書き替えを要求し、システム監視装置115は監視装置106と監視装置113にファームウェアの書き替え要求を通知した後、再起動する。この動作は、図3のシステム監視装置115のフローチャートではステップS20からS22に相当する。
【0029】
モジュール1の監視装置106は再起動前に修復用ファームウェア105を書き替え可能なROM102へ書き替え、モジュール2の監視装置113は再起動前に修復用ファームウェア112を書き替え可能なROM109へ書き替える。この動作は、図2の監視装置106,113のフローチャートではステップS13とS14に相当する。
【0030】
以上により、本実施の形態によれば、2個のモジュール1,2により構成され、複数の運用ファームウェア103,110が存在する情報処理装置において、1つおよび複数の運用ファームウェアで障害が発生した場合でも、運用ファームウェア103,110から修復用ファームウェア105,112に書き替えて自動修復することができる。
【0031】
すなわち、複数の運用ファームウェア103,110が共有メモリ116のアドレス空間を共有したり、また複数の各運用ファームウェア103,110が制御しているFPGA117,118の情報を共有するような構成においても、全ての運用ファームウェア103,110を自動修復することで、運用ファームウェア103,110間で情報の共有ができなくなることがないので、情報処理装置はシステムダウンすることはない。
【0032】
(実施の形態2)
図4は本発明の実施の形態2である情報処理装置の全体の概略構成を示すブロック図である。
【0033】
本実施の形態の情報処理装置は、前記実施の形態1と同様に、2個のモジュールにより構成された情報処理装置であり、前記実施の形態1との相違点は、ファームウェアの書き替えにおいて、情報処理装置をPCやサーバーの外部装置にシリアル回線200で接続するようにした点である。
【0034】
すなわち、本実施の形態の情報処理装置は、システムバス100、CPU101、書き替え可能なROM102、運用ファームウェア103、不揮発性ROM104、修復用ファームウェア105、FPGA117、および監視装置106を含めたモジュール1と、システムバス114、CPU108、書き替え可能なROM109、運用ファームウェア110、不揮発性ROM111、修復用ファームウェア112、FPGA118、および監視装置113を含めたモジュール2と、共有メモリ116と、システム監視装置115などから構成され、システム監視装置115は外部装置にシリアル回線200で接続されている。
【0035】
本実施の形態の情報処理装置において、システム監視装置115は、外部装置からの書き替えるファームウェアを不揮発性ROM104と不揮発性ROM111に書き込み、書き込み終了後、再起動前に監視装置106と監視装置113にファームウェアの切り替え要求を通知し、再起動する。すなわち、再起動前に、不揮発性ROM104と不揮発性ROM111に書き込んだファームウェアを書き替え可能なROM102と書き替え可能なROM109に書き替えて再起動する。
【0036】
以上により、本実施の形態の情報処理装置によれば、前記実施の形態1と同様の効果が得られるとともに、ファームウェアを外部装置から書き替えることができる。
【0037】
(実施の形態3)
図5は本発明の実施の形態3である情報処理装置において、システム監視装置の動作のフローチャートを示す。
【0038】
本実施の形態の情報処理装置は、前記実施の形態1および2のような2つのモジュールで構成された情報処理装置を含み、n個(n:2以上)のモジュールで構成された情報処理装置を考慮したものである。
【0039】
よって、本実施の形態のように、n個のモジュールで構成された情報処理装置では、システム監視装置のフローチャートのステップS30においてn個のモジュールの障害を監視し、障害を検出した時は(ステップS31)、ステップS32においてn個全てのモジュールに対してファームウェア更新を指示する機能を持つことで実現される。
【0040】
従って、本実施の形態によれば、2以上のn個のモジュールから構成される情報処理装置においても、前記実施の形態1および2と同様の効果を得ることができる。
【0041】
【発明の効果】
本発明によれば、情報処理装置内の複数のファームウェアが障害を検出した場合でも、全ての運用ファームウェアを修復用ファームウェアに更新することで、システムダウンを防ぐことができる。この結果、全てのファームウェアを自動修復することができるので、高い信頼性を得る情報処理装置を実現することができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1である情報処理装置を示すブロック図である。
【図2】本発明の実施の形態1である情報処理装置において、監視装置の動作を示すフローチャートである。
【図3】本発明の実施の形態1である情報処理装置において、システム監視装置の動作を示すフローチャートである。
【図4】本発明の実施の形態2である情報処理装置を示すブロック図である。
【図5】本発明の実施の形態3である情報処理装置において、システム監視装置の動作を示すフローチャートである。
【図6】本発明の前提として検討した情報処理装置を示すブロック図である。
【符号の説明】
100,114…システムバス、101,108…CPU、102,109…書き替え可能なROM、103,110…運用ファームウェア、104,111…不揮発性ROM、105,112…修復用ファームウェア、106,113…監視装置、107…システム管理バス、115…システム監視装置、116…共有メモリ、117,118…FPGA、200…シリアル回線。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an information processing apparatus having a plurality of firmware, and more particularly, to a technology effective when applied to an information processing apparatus having an automatic firmware repair function.
[0002]
[Prior art]
According to the study by the present inventors, the following technology can be considered for an information processing device having a plurality of firmware.
[0003]
For example, an information processing device that requires high reliability, such as a server device, usually has repair firmware in addition to the operating firmware, and when a failure occurs in the operating firmware, the operating firmware starts with the operating firmware. An information processing apparatus that automatically switches to the repair firmware is generally used.
[0004]
Here, an information processing device studied by the inventor as a premise of the present invention will be described with reference to FIG. FIG. 6 shows an example of an information processing apparatus including one firmware and a CPU operated by the firmware.
[0005]
As shown in FIG. 6, the information processing apparatus considered as a premise of the present invention includes a CPU 101, an operation firmware 103 stored in a rewritable ROM 102, and a nonvolatile ROM 104 storing a restoration firmware 105. Connected. The CPU 101 performs normal processing with the operation firmware 103 stored in the rewritable ROM 102.
[0006]
The monitoring device 106 is connected to the same system bus 100, and monitors whether the operation firmware 103 operating the CPU 101 is operating normally when the information processing device is operating. The system monitoring device 115 is connected to the monitoring device 106 via the system management bus 107. Here, if any failure occurs in the operation firmware 103 and the information processing apparatus cannot be operated in a normal state, the monitoring apparatus 106 monitoring the failure instructs the system monitoring apparatus 115 to request a restart, and restarts. Before starting the boot, the restoration firmware 105 is written into the rewritable ROM 102, and the information processing apparatus is automatically restored.
[0007]
As an information processing apparatus having such a plurality of firmwares, for example, old and new firmware are placed in a non-volatile memory, and an old firmware that operates normally when a fault occurs in the replaced firmware or when rewriting fails. There is a technique for returning to firmware (for example, see Patent Document 1).
[0008]
[Patent Document 1]
Japanese Patent Application Laid-Open No. H11-110218
[Problems to be solved by the invention]
By the way, the inventors of the present invention have studied the technology of the information processing apparatus as described above, and have found the following.
[0010]
For example, in the information processing apparatus shown in FIG. 6 described above, the CPU 101, the operation firmware 103 stored in the rewritable ROM 102, the nonvolatile ROM 104 storing the restoration firmware 105, and the monitoring device 106 are modules. In the case of n (n: 2 or more) information processing devices, the firmware of each module is configured in one information processing device, so that n firmware shares the address space of the information processing device, and The information of the FPGA controlled by each of the n firmwares is shared.
[0011]
Therefore, utilizing the technology of the information processing apparatus shown in FIG. 6 described above, when a failure occurs in a plurality of n firmware at a time, only the failed firmware is automatically repaired and restarted. However, the information cannot be shared between the firmwares, and the information processing apparatus goes down.
[0012]
Accordingly, it is an object of the present invention to provide an information processing apparatus having a plurality of firmware, in which even if a failure occurs in one or a plurality of firmware, all the firmware can be automatically repaired and high reliability can be obtained. It is an object of the present invention to provide an information processing apparatus capable of performing the above.
[0013]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides an operation firmware stored in a rewritable memory (ROM), a CPU operated by the operation firmware, and a firmware one generation before or having an operation record of the operation firmware There is a non-volatile memory (ROM) for storing the repair firmware, and a monitoring device having a function of detecting a boot failure in the operation firmware and a function of writing the repair firmware in the rewritable ROM. A function of requesting the monitoring device of the n modules to rewrite firmware when n modules (n: 2 or more) connected by the bus exist and a failure occurs in the n modules; Applied to an information processing device that has one system monitoring device with a function to restart It is those having the following features.
[0014]
That is, when the information processing apparatus is operating, the first information processing apparatus according to the present invention uses at least one of the n modules with the operation firmware currently operated by the monitoring device of at least one module. When the failure is detected, the monitoring device that has detected the failure notifies the system monitoring device that the failure has been detected, and the system monitoring device writes firmware to the monitoring devices of all the n modules. Request, and before the information processing apparatus is restarted by the system monitoring apparatus, the monitoring apparatuses of all the n modules switch from the operation firmware to the repair firmware in synchronization with each other, and restart normally. It has a function to perform.
[0015]
Further, in the second information processing apparatus according to the present invention, the rewriting of the firmware performed from the external device is performed by writing the firmware into the nonvolatile ROM in all of the n modules, and the system monitoring apparatus is configured to execute the A request is made to the monitoring devices in all of the n modules to rewrite firmware, and the monitoring device rewrites the firmware written before restarting to the rewritable ROM and restarts normally. It has a function.
[0016]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In all the drawings for describing the embodiments, members having the same functions are denoted by the same reference numerals, and repeated description thereof will be omitted.
[0017]
(Embodiment 1)
FIG. 1 is a block diagram showing a schematic configuration of the entire information processing apparatus according to the first embodiment of the present invention. FIG. 2 shows a flowchart of the operation of the monitoring device configured in each module of the information processing device according to the present embodiment, and FIG. 3 shows a flowchart of the operation of the system monitoring device of the information processing device.
[0018]
First, an example of the overall schematic configuration of the information processing apparatus according to the present embodiment will be described with reference to FIG.
[0019]
The information processing apparatus according to the present embodiment is, for example, an information processing apparatus including two modules, and includes an operation firmware 103 stored in a rewritable ROM 102, a CPU 101 operated by the operation firmware 103, an operation There is a non-volatile ROM 104 for storing a repair firmware 105 that is one generation before the firmware 103 or a firmware that has been operating, and is connected by a system bus 100.
[0020]
A monitoring device 106 having a function of detecting a start failure in the operation firmware 103 and a function of writing the restoration firmware 105 stored in the nonvolatile ROM 104 to the rewritable ROM 102 is connected to the system bus 100. Further, an FPGA 117 for storing information of the CPU 101 and the like is also connected. The module 1 includes the system bus 100, the CPU 101, the rewritable ROM 102, the operation firmware 103, the nonvolatile ROM 104, the restoration firmware 105, the FPGA 117, and the monitoring device 106.
[0021]
Similarly, for the module 2, the operation firmware 110 stored in the rewritable ROM 109, the CPU 108 operated by the operation firmware 110, and the repair firmware which is the firmware one generation before the operation firmware 110 or the operation record of the operation firmware 110 There is a non-volatile ROM 111 for storing 112 and is connected by a system bus 114.
[0022]
A monitoring device 113 having a function of detecting a boot failure of the operation firmware 110 and a function of writing the repair firmware 112 stored in the nonvolatile ROM 111 to the rewritable ROM 109 is connected to the system bus 114. Further, an FPGA 118 for storing information of the CPU 108 and the like is also connected. The module 2 includes the system bus 114, the CPU 108, the rewritable ROM 109, the operation firmware 110, the nonvolatile ROM 111, the restoration firmware 112, the FPGA 118, and the monitoring device 113.
[0023]
This information processing apparatus writes the firmware to the monitoring device 106 of the module 1 and the monitoring device 113 of the module 2 when a startup failure is detected by the operation firmware 103 and the operation firmware 110 that are currently operating by the module 1 and the module 2. A system monitoring device 115 having a function of requesting a change and a function of restarting is an information processing device connected via the system management bus 107.
[0024]
In this information processing apparatus, a shared memory 116 that shares an address space with a plurality of operation firmware 103 and 110 is connected to the system management bus 107, and in each of the modules 1 and 2, the operation firmware 103 and 110 The information of the FPGAs 117 and 118 is also shared by the information processing apparatus.
[0025]
Next, with reference to FIGS. 2 and 3, an example of an operation of the information processing apparatus according to the present embodiment when a boot failure is detected will be described.
[0026]
For example, when the information processing apparatus is operating, when the module 1 or the module 2 detects a boot failure in the currently operating operation firmware 103 or the operation firmware 110, or when the monitoring apparatus 106 of the module 1 and the module 2 It is assumed that the monitoring device 113 simultaneously detects a boot failure in the operation firmware 103 or the operation firmware 110. This operation corresponds to steps S10 and S11 in the flowchart of the monitoring devices 106 and 113 in FIG.
[0027]
The startup failure is when a timeout has occurred during processing from the CPU 101 or the CPU 108, or when an error has occurred in the self-diagnosis of the rewritable ROM 102 and the rewritable ROM 109. Notifies the system monitoring device 115 that a failure has occurred. This operation corresponds to step S12 in the flowchart of the monitoring devices 106 and 113 in FIG.
[0028]
Upon receiving the report of the failure, the system monitoring device 115 requests the monitoring device 106 of the module 1 and the monitoring device 113 of the module 2 to rewrite the firmware. The system monitoring device 115 requests the monitoring device 106 of the module 1 and the monitoring device 113 of the module 2 to rewrite the firmware regardless of the module in which the failure has occurred. After the firmware update request is notified, restart. This operation corresponds to steps S20 to S22 in the flowchart of the system monitoring device 115 in FIG.
[0029]
The monitoring device 106 of the module 1 rewrites the restoration firmware 105 to the rewritable ROM 102 before the restart, and the monitoring device 113 of the module 2 rewrites the restoration firmware 112 to the rewritable ROM 109 before the restart. This operation corresponds to steps S13 and S14 in the flowchart of the monitoring devices 106 and 113 in FIG.
[0030]
As described above, according to the present embodiment, in a case where a failure occurs in one and a plurality of operation firmware in an information processing apparatus including two modules 1 and 2 and including a plurality of operation firmware 103 and 110 However, automatic repair can be performed by rewriting the operation firmware 103, 110 to the repair firmware 105, 112.
[0031]
That is, even in a configuration in which the plurality of operation firmware 103 and 110 share the address space of the shared memory 116 and the information of the FPGAs 117 and 118 controlled by the plurality of operation firmware 103 and 110, By automatically restoring the operation firmware 103, 110, the information cannot be shared between the operation firmware 103, 110, so that the information processing apparatus does not go down.
[0032]
(Embodiment 2)
FIG. 4 is a block diagram illustrating a schematic configuration of the entire information processing apparatus according to the second embodiment of the present invention.
[0033]
The information processing apparatus according to the present embodiment is an information processing apparatus configured with two modules, similarly to the first embodiment. The difference from the first embodiment is that the firmware is rewritten. The information processing apparatus is connected to an external device such as a PC or a server via a serial line 200.
[0034]
That is, the information processing apparatus according to the present embodiment includes a module 1 including a system bus 100, a CPU 101, a rewritable ROM 102, an operation firmware 103, a nonvolatile ROM 104, a restoration firmware 105, an FPGA 117, and a monitoring device 106; A module 2 including a system bus 114, a CPU 108, a rewritable ROM 109, an operation firmware 110, a nonvolatile ROM 111, a restoration firmware 112, an FPGA 118, and a monitoring device 113, a shared memory 116, a system monitoring device 115, and the like. The system monitoring device 115 is connected to an external device via a serial line 200.
[0035]
In the information processing apparatus according to the present embodiment, the system monitoring device 115 writes the firmware to be rewritten from the external device to the nonvolatile ROM 104 and the nonvolatile ROM 111 and, after the writing is completed, the firmware to the monitoring device 106 and the monitoring device 113 before restarting. Notify the firmware switching request and restart. That is, before restarting, the firmware written in the non-volatile ROM 104 and the non-volatile ROM 111 is rewritten into the rewritable ROM 102 and the rewritable ROM 109, and restarted.
[0036]
As described above, according to the information processing apparatus of the present embodiment, the same effects as in the first embodiment can be obtained, and the firmware can be rewritten from an external device.
[0037]
(Embodiment 3)
FIG. 5 shows a flowchart of the operation of the system monitoring device in the information processing device according to the third embodiment of the present invention.
[0038]
The information processing apparatus according to the present embodiment includes an information processing apparatus including two modules as in the first and second embodiments, and an information processing apparatus including n (n: 2 or more) modules. Is considered.
[0039]
Therefore, as in the present embodiment, in the information processing apparatus including n modules, the failure of the n modules is monitored in step S30 of the flowchart of the system monitoring apparatus, and when the failure is detected (step S30). S31), which is realized by having a function to instruct firmware update to all n modules in step S32.
[0040]
Therefore, according to the present embodiment, the same effects as those of the first and second embodiments can be obtained in an information processing apparatus including two or more n modules.
[0041]
【The invention's effect】
According to the present invention, even when a plurality of firmware in the information processing apparatus detects a failure, it is possible to prevent the system from going down by updating all the operation firmware to the repair firmware. As a result, all the firmware can be automatically repaired, so that an information processing apparatus with high reliability can be realized.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an information processing device according to a first embodiment of the present invention.
FIG. 2 is a flowchart illustrating an operation of a monitoring device in the information processing device according to the first embodiment of the present invention;
FIG. 3 is a flowchart illustrating an operation of a system monitoring device in the information processing device according to the first embodiment of the present invention;
FIG. 4 is a block diagram illustrating an information processing device according to a second embodiment of the present invention;
FIG. 5 is a flowchart illustrating an operation of a system monitoring device in the information processing device according to the third embodiment of the present invention;
FIG. 6 is a block diagram showing an information processing apparatus studied as a premise of the present invention.
[Explanation of symbols]
100, 114 ... system bus, 101, 108 ... CPU, 102, 109 ... rewritable ROM, 103, 110 ... operation firmware, 104, 111 ... nonvolatile ROM, 105, 112 ... restoration firmware, 106, 113 ... Monitoring device, 107: system management bus, 115: system monitoring device, 116: shared memory, 117, 118: FPGA, 200: serial line.

Claims (2)

書き替え可能なメモリに格納された運用ファームウェアと、前記運用ファームウェアで動作するCPUと、前記運用ファームウェアの動作実績のあるファームウェアである修復用ファームウェアを格納する不揮発性メモリと、前記運用ファームウェアでの起動障害を検出する機能および前記修復用ファームウェアを前記書き替え可能なメモリに書き込む機能を持つ監視装置とがシステムバスで接続されるモジュールが複数個存在し、
前記複数個のモジュールにおいて障害が発生した場合、前記複数個のモジュールの前記監視装置にファームウェアの書き替えを要求する機能と、再起動させる機能とを持つシステム監視装置を有する情報処理装置であって、
前記情報処理装置が稼働している時、前記複数個のモジュールのうち、少なくとも1つのモジュールの前記監視装置が現在運用している前記運用ファームウェアでの障害を検出した時、障害を検出した前記監視装置は前記システム監視装置へ障害を検出したことを通知し、前記システム監視装置は前記複数個全てのモジュールの前記監視装置に対してファームウェアの書き替えを要求し、前記情報処理装置が前記システム監視装置によって再起動される前に前記複数個全てのモジュールの前記監視装置によって前記運用ファームウェアから前記修復用ファームウェアに同期して切り替え、再起動する機能を有することを特徴とする情報処理装置。
Operation firmware stored in a rewritable memory, a CPU that operates on the operation firmware, a non-volatile memory that stores restoration firmware that is firmware that has a track record of operation of the operation firmware, and activation by the operation firmware There are a plurality of modules connected by a system bus to a monitoring device having a function of detecting a failure and a function of writing the repair firmware to the rewritable memory,
An information processing apparatus having a system monitoring apparatus having a function of requesting the monitoring apparatus of the plurality of modules to rewrite firmware when a failure occurs in the plurality of modules and a function of restarting the firmware. ,
When the information processing device is operating, when the monitoring device of at least one of the plurality of modules detects a failure in the operating firmware currently operating, the monitoring that detects the failure The device notifies the system monitoring device that a failure has been detected, the system monitoring device requests the monitoring devices of all of the plurality of modules to rewrite firmware, and the information processing device performs the system monitoring. An information processing apparatus having a function of switching from the operation firmware to the restoration firmware by the monitoring devices of all of the plurality of modules in synchronization with the monitoring firmware before being restarted by the device, and restarting.
請求項1記載の情報処理装置において、
外部装置から行うファームウェアの書き替えは、前記複数個全てのモジュール内の不揮発性メモリにファームウェアを書き込み、前記システム監視装置はファームウェアの書き込み終了後に、前記複数個全てのモジュール内の前記監視装置に対してファームウェアの書き替えを要求し、前記監視装置は再起動する前に書き込んだファームウェアを前記書き替え可能なメモリに書き替え、再起動する機能を有することを特徴とする情報処理装置。
The information processing apparatus according to claim 1,
Rewriting of the firmware performed from the external device writes the firmware in the non-volatile memory in all of the plurality of modules, and after the completion of writing the firmware, the system monitoring device sends the firmware to the monitoring device in all of the plurality of modules. An information processing apparatus having a function of requesting rewriting of firmware by the monitoring apparatus, wherein the monitoring apparatus rewrites the firmware written before restarting to the rewritable memory and restarts the firmware.
JP2002363331A 2002-12-16 2002-12-16 Information processor Pending JP2004199120A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002363331A JP2004199120A (en) 2002-12-16 2002-12-16 Information processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002363331A JP2004199120A (en) 2002-12-16 2002-12-16 Information processor

Publications (1)

Publication Number Publication Date
JP2004199120A true JP2004199120A (en) 2004-07-15

Family

ID=32761503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002363331A Pending JP2004199120A (en) 2002-12-16 2002-12-16 Information processor

Country Status (1)

Country Link
JP (1) JP2004199120A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012079175A (en) * 2010-10-04 2012-04-19 Nec Corp Disk array device and firmware update method for the same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012079175A (en) * 2010-10-04 2012-04-19 Nec Corp Disk array device and firmware update method for the same
US8713553B2 (en) 2010-10-04 2014-04-29 Nec Corporation Disk array apparatus and firmware update method therefor

Similar Documents

Publication Publication Date Title
US10097563B2 (en) Reliable and secure firmware update with a dynamic validation for internet of things (IoT) devices
CN102708018B (en) Method and system for exception handling, proxy equipment and control device
US7750676B2 (en) Embedded system and control method therefor
US7882388B2 (en) Dual independent non volatile memory systems
JP2011090481A (en) Information processing apparatus and system setting method
JP2008033836A (en) Transmission device and software automatic update method
JP2011253408A (en) Server system and bios restoration method thereof
CN113626262A (en) BMC recovery method, system, equipment and medium
KR101731422B1 (en) Restoration apparatus and method for fault over the virtual environment
CN104572198A (en) Service restoration method and device
JP5683088B2 (en) Recovery system, recovery method, and backup control system
JP5387767B2 (en) Update technology for running programs
JPH117382A (en) Version-up method for firmware
JP2004054616A (en) Information processor with function to automatically restore firmware
JP2014191491A (en) Information processor and information processing system
JP4630023B2 (en) System control apparatus, system control method, and system control program
JP2007200103A (en) Client-server system and resource control method
JP2004199120A (en) Information processor
CN111427721B (en) Abnormality recovery method and device
JP2007087269A (en) Software update system, update method and program
JP2009025967A (en) Backup system of duplicated firmware, method and operating system
JP4363739B2 (en) Transmission equipment
JP6364773B2 (en) Information processing apparatus, information processing system, memory replication method, and computer program
KR20030062793A (en) Apparatus and Method for operating recovery and backup of linux operting system
JP2002044693A (en) Controller of electronic exchange