JP2008225567A - 情報処理システム - Google Patents

情報処理システム Download PDF

Info

Publication number
JP2008225567A
JP2008225567A JP2007058808A JP2007058808A JP2008225567A JP 2008225567 A JP2008225567 A JP 2008225567A JP 2007058808 A JP2007058808 A JP 2007058808A JP 2007058808 A JP2007058808 A JP 2007058808A JP 2008225567 A JP2008225567 A JP 2008225567A
Authority
JP
Japan
Prior art keywords
bmc
main body
system main
state
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007058808A
Other languages
English (en)
Inventor
Minoru Akiyama
実 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP2007058808A priority Critical patent/JP2008225567A/ja
Publication of JP2008225567A publication Critical patent/JP2008225567A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】システム本体をより確実に管理監視すること。
【解決手段】システム本体2を監視する第1BMC3と、第1BMC3を監視する第2BMC4とを備えている。第2BMC4は、第1BMC3に不具合を発見したときにシステム本体2を監視する。このとき、情報処理システム1は、第1BMC3に不具合が発生したときでも、第2BMC4を用いてシステム本体2をより確実に管理監視することができる。この結果、情報処理システム1は、障害発生時にシステム本体の障害箇所を特定する情報をより確実に収集することができ、障害発生時にシステム本体の機能をより確実に停止することができる。
【選択図】図1

Description

本発明は、情報処理システムに関し、特に、システム本体を管理監視するBMC(Baseboard Management Controller)を備える情報処理システムに関する。
システム本体を管理監視するBMC(BaseboardManagementController)を備える情報処理システムが知られている。このような情報処理システムとしては、パーソナルコンピュータ、ネットワークを介してクライアントにサービスを提供するサーバ装置が例示される。
図3は、公知の情報処理システムを示している。その情報処理システム101は、システム本体102とBMC(Baseboard Management Controller)103とROM105とメモリ107とを備えている。システム本体102は、バス111を介して、BMC103に情報伝達可能に接続されている。BMC103は、バス112を介して、ROM105に情報伝達可能に接続されている。BMC103は、さらに、バス113を介して、メモリ107に情報伝達可能に接続されている。
情報処理システム101は、さらに、図示されていない電源装置を備えている。その電源装置は、ユーザによる操作によりシステム本体102をDCON処理し、BMC103により制御されてシステム本体102をACON処理し、ユーザまたはBMC103により制御されてシステム本体102をDCOFF処理する。
システム本体102は、その電源装置により状態が遷移する。その状態は、DCOFF状態とACON状態(スタンバイ電源状態)とDCON状態とを含んでいる。システム本体102は、DCOFF状態であるときに、その電源装置によりACON処理されると、DCOFF状態からACON状態に遷移する。システム本体102は、ACON状態であるときに、その電源装置によりDCON処理されると、ACON状態からDCON状態に遷移する。システム本体102は、DCON状態であるときに、その電源装置によりDCOFF処理されると、DCON状態からDCOFF状態に遷移する。システム本体102は、DCON状態であるときに、所定のソフトウェアを実行して、図示されていない周辺機器を用いて所定のサービスをユーザに提供する。
メモリ107は、不揮発性の記憶装置であり、管理プログラムが記録されている。メモリ107は、さらに、BMC103により生成される情報を一時的に格納する。
ROM105は、不揮発性の記憶装置であり、ソフトウェアが記録されている。BMC103は、システム本体102がACON処理されることに応答して、ROM105に記録されているソフトウェアを実行することにより立ち上がる。BMC103は、立ち上がると、メモリ107に記録されている管理プログラムを実行することにより、その電源装置を制御し、システム本体102を管理監視する。
情報処理システム101の動作は、起動するときの動作とシステム本体102を監視する動作とを備えている。
その起動するときの動作は、ユーザの操作に応答して開始される。情報処理システム101の電源装置は、その操作に応答して、システム本体102をACON処理する。システム本体102は、ACON処理されると、DCOFF状態からACON状態に遷移する。BMC103は、システム本体102がACON処理されることに応答してROM105に記録されるソフトウェアを実行して立ち上がる。BMC103は、立ち上がると、メモリ107に記録されるソフトウェアを実行して、BMC103を監視することを開始する。
BMC103は、システム本体102に不具合がないことを検出すると、その電源装置を制御して、システム本体102をDCON処理する。システム本体102は、DCON処理されると、ACON状態からDCON状態に遷移して、所定のソフトウェアを実行して所定のサービスをユーザに提供する。
システム本体102を監視する動作は、BMC103により実行される。BMC103は、バス111を介してシステム本体102を監視し、その監視結果を示す監視結果情報をメモリ107に記録する。BMC103は、さらに、メモリ107に記録されるサーバ装置管理情報を用いてバス111を介してシステム本体102を管理し、メモリ107に記録されるサーバ装置管理情報を更新する。BMC103は、システム本体102に不具合が発見されると、その不具合が発生した箇所を特定するための障害情報データをシステム本体102からバス111を介して収集し、その障害情報データをメモリ107に記録する。BMC103は、システム本体102に不具合が発見されると、さらに、システム本体102をDCOFF処理するように電源装置を制御して、システム本体102をDCON状態からDCOFF状態に遷移させる。
このとき、メモリ107に記録されている障害情報データを解析することにより、システム本体102の不具合が発生した箇所をより確実に特定することができる。このような情報処理システム101は、BMC103またはROM105に不具合があるときに、システム本体102を管理監視することができないで、情報処理システム101が立ち上がらなかったり、情報処理システム101の運用中であれば正常な装置管理ができなくなり、情報処理システム101が不安定な状態となったり、障害発生時の障害箇所特定のための装置内情報の収集ができなくなる。より確実にシステム本体を管理監視することが望まれている。
図2は、本発明による情報処理システムの実施の他の形態を示している。その情報処理システム121は、システム本体122とBMC123とROM125とROM126とメモリ127とを備えている。システム本体122は、バス131を介して、BMC123に情報伝達可能に接続されている。BMC123は、バス132を介して、ROM125に情報伝達可能に接続され、ROM126に情報伝達可能に接続されている。BMC123は、さらに、バス133を介して、メモリ127に情報伝達可能に接続されている。
情報処理システム121は、さらに、図示されていない電源装置を備えている。その電源装置は、ユーザによる操作によりシステム本体122をDCON処理し、BMC123により制御されてシステム本体122をACON処理し、ユーザまたはBMC123により制御されてシステム本体122をDCOFF処理する。
システム本体122は、その電源装置により状態が遷移する。その状態は、DCOFF状態とACON状態(スタンバイ電源状態)とDCON状態とを含んでいる。システム本体122は、DCOFF状態であるときに、その電源装置によりACON処理されると、DCOFF状態からACON状態に遷移する。システム本体122は、ACON状態であるときに、その電源装置によりDCON処理されると、ACON状態からDCON状態に遷移する。システム本体122は、DCON状態であるときに、その電源装置によりDCOFF処理されると、DCON状態からDCOFF状態に遷移する。システム本体122は、DCON状態であるときに、所定のソフトウェアを実行して、図示されていない周辺機器を用いて所定のサービスをユーザに提供する。
メモリ127は、不揮発性の記憶装置であり、管理プログラムが記録されている。メモリ127は、さらに、BMC123により生成される情報を一時的に格納する。
ROM126は、不揮発性の記憶装置であり、ソフトウェアが記録されている。BMC123は、システム本体122がACON処理されることに応答して、ROM125に記録されているソフトウェアを実行することにより立ち上がる。BMC123は、ROM125に不具合が発見されたときに、ROM125に置換して、ROM126に記録されているソフトウェアを実行することにより立ち上がる。BMC123は、立ち上がると、メモリ127に記録されている管理プログラムを実行することにより、その電源装置を制御し、システム本体122を管理監視する。
情報処理システム121の動作は、起動するときの動作とシステム本体122を監視する動作とを備えている。
その起動するときの動作は、ユーザの操作に応答して開始される。情報処理システム121の電源装置は、その操作に応答して、システム本体122をACON処理する。システム本体122は、ACON処理されると、DCOFF状態からACON状態に遷移する。BMC123は、システム本体122がACON処理されることに応答してROM126に記録されるソフトウェアを実行して立ち上がる。BMC123は、ROM125に不具合が発見されたときに、ROM125に置換して、ROM126に記録されているソフトウェアを実行することにより立ち上がる。
BMC123は、立ち上がると、メモリ127に記録されるソフトウェアを実行して、BMC23を監視することを開始する。BMC23は、システム本体122に不具合がないことを検出すると、その電源装置を制御して、システム本体122をDCON処理する。システム本体122は、DCON処理されると、ACON状態からDCON状態に遷移して、所定のソフトウェアを実行して所定のサービスをユーザに提供する。
システム本体122を監視する動作は、BMC123により実行される。BMC123は、バス131を介してシステム本体122を監視し、その監視結果を示す監視結果情報をメモリ127に記録する。BMC123は、さらに、メモリ127に記録されるサーバ装置管理情報を用いてバス131を介してシステム本体122を管理し、メモリ127に記録されるサーバ装置管理情報を更新する。BMC123は、システム本体122に不具合が発見されると、その不具合が発生した箇所を特定するための障害情報データをシステム本体122からバス131を介して収集し、その障害情報データをメモリ127に記録する。BMC123は、システム本体122に不具合が発見されると、さらに、システム本体122をDCOFF処理するように電源装置を制御して、システム本体122をDCON状態からDCOFF状態に遷移させる。
このような情報処理システム121は、ROM125に不具合がある場合でも、BMC123を立ち上げることができ、システム本体122をより確実に管理監視することができる。情報処理システム121は、BMC103不具合があるときに、システム本体102を管理監視することができないで、情報処理システム101が立ち上がらなかったり、情報処理システム101の運用中であれば正常な装置管理ができなくなり、情報処理システム101が不安定な状態となったり、障害発生時の障害箇所特定のための装置内情報の収集ができなくなる。より確実にシステム本体を管理監視することが望まれている。
特開2000−148525号公報には、計算機システムの電源制御や障害監視等のサービスを行うサービスプロセッサをホットスタンバイ方式で二重化したシステムにおいて、現用系サービスプロセッサの負荷を軽減し、高負荷時の現用系サービスプロセッサの処理性能低下を防ぐサービスプロセッサ二重化システムの現用系負荷軽減方法が開示されている。そのサービスプロセッサ二重化システムの現用系負荷軽減方法は、計算機システムの各種サービス処理を実行するサービスプロセッサを現用系と待機系で二重化しているシステムにおいて、あらかじめ現用系での処理と待機系での処理を定義しておき、現用系サービスプロセッサは、計算機システムからの処理要求を判別し、現用系の処理は自サービスプロセッサで実行してその処理結果を計算機システムへ報告し、待機系の処理は待機系サービスプロセッサへ処理を依頼して、該待機系サービスプロセッサでの処理結果を計算機システムへ報告し、待機系サービスプロセッサは、現用系サービスプロセッサから依頼された処理を実行して、その処理結果を現用系サービスプロセッサへ報告することを特徴としている。
特開2003−15901号公報には、運用系監視制御ユニットの同期化による共有メモリへの監視制御情報の書込みが、ユニット内の運用系内部メモリへの監視制御情報の書込みに連動してほぼ同時に行えるようにする監視制御装置が開示されている。その監視制御装置は、2個の監視制御ユニットの一方を運用系,他方を待機系として監視制御を二重化し、前記両監視制御ユニットにバス接続された同期化用の共有メモリを備え、運用系監視制御ユニットにより、該ユニットの運用系内部メモリに書込まれる監視制御情報を前記共有メモリに書込み、待機系監視制御ユニットにより、前記共有メモリに書込まれた監視制御情報を読出してユニット内の待機系内部メモリに書込み、前記両監視制御ユニットを、同じ監視制御状態に同期化する監視制御装置であって、前記運用系監視制御ユニットに、アドレス監視により前記運用系内部メモリの監視制御情報の書込みアドレスの発生を検出したときに、自ユニットのインタフェース部の前記共有メモリへの書込みゲートを開き、前記運用系内部メモリに書込まれる監視制御情報を前記書込みゲートを介して前記共有メモリに送る手段と、前記書込みアドレスの発生を検出したときに、前記共有メモリの書込みアドレスを生成し、該書込みアドレスを前記書込みゲートを介して前記共有メモリに送る手段とを備え、前記運用系内部メモリの監視制御情報の書込みに連動して前記共有メモリに同一の監視制御情報を書込むようにしたことを特徴としている。
特開2000−148525号公報 特開2003−15901号公報
本発明の課題は、システム本体をより確実に管理監視する情報処理システムを提供することにある。
本発明の他の課題は、障害発生時にシステム本体の障害箇所を特定する情報をより確実に収集する情報処理システムを提供することにある。
本発明のさらに他の課題は、障害発生時にシステム本体の機能をより確実に停止する情報処理システムを提供することにある。
以下に、発明を実施するための最良の形態・実施例で使用される符号を括弧付きで用いて、課題を解決するための手段を記載する。この符号は、特許請求の範囲の記載と発明を実施するための最良の形態・実施例の記載との対応を明らかにするために付加されたものであり、特許請求の範囲に記載されている発明の技術的範囲の解釈に用いてはならない。
本発明による情報処理システム(1)(21)は、システム本体(2)(22)を監視する第1BMC(3)(23)と、第1BMC(3)(23)を監視する第2BMC(4)(24)とを備えている。第2BMC(4)(24)は、第1BMC(3)(23)に不具合を発見したときにシステム本体(2)(22)を監視する。
本発明による情報処理システム(1)(21)は、第1コンピュータプログラムを記録する第1記憶装置(5)(25)と、第2コンピュータプログラムを記録する第2記憶装置(6)(26)とをさらに備えている。第1BMC(3)(23)は、第1コンピュータプログラムを実行することによりシステム本体(2)(22)を監視する。第2BMC(4)(24)は、第2コンピュータプログラムを実行することにより、第1BMC(3)(23)を監視し、または、システム本体(2)(22)を監視する。
第2BMC(4)(24)は、第1BMC(3)(23)に不具合を発見したときに、第1BMC(3)(23)がシステム本体(2)(22)を監視しないように第1BMC(3)(23)を制御する。
本発明による情報処理システム(1)(21)は、システム本体(2)(22)と第1BMC(3)(23)と第2BMC(4)(24)との接続を制御するQSW(28、29)をさらに備えている。第2BMC(4)(24)は、第1BMC(3)(23)に不具合を発見しないときに、システム本体(2)(22)が第1BMC(3)(23)に接続され、かつ、システム本体(2)(22)が第2BMC(4)(24)に接続されないように、QSW(28、29)を制御する。第1BMC(3)(23)に不具合を発見したときに、システム本体(2)(22)が第1BMC(3)(23)に接続されないで、かつ、システム本体(2)(22)が第2BMC(4)(24)に接続されるように、QSW(28、29)を制御する。
第1BMC(3)(23)または第2BMC(4)(24)は、システム本体(2)(22)を監視している場合で、システム本体(2)(22)に不具合を発見したときに、不具合を特定するための情報をシステム本体(2)(22)から収集して記録装置(7、27)に記録する。
システム本体(2)(22)は、DCOFF状態とACON状態とDCON状態とのうちのいずれか1つの状態をとり、DCON状態であるときに所定のプログラムを実行する。第1BMC(3)(23)は、システム本体(2)(22)がDCOFF状態からACON状態に遷移された場合で、システム本体(2)(22)に不具合を発見されないときに、システム本体(2)(22)をACON状態からDCONに遷移させる。
第2BMC(4)(24)は、システム本体(2)(22)がDCOFF状態からACON状態に遷移されたときに、第1BMC(3)(23)を監視することを開始する。
第1BMC(3)(23)または第2BMC(4)(24)は、システム本体(2)(22)を監視している場合で、システム本体(2)(22)に不具合を発見したときに、システム本体(2)(22)をDCCON状態からDCOFF状態に遷移させる。
本発明による情報処理システムは、BMCに不具合が発生したときでも、システム本体をより確実に管理監視することができる。この結果、本発明による情報処理システムは、障害発生時にシステム本体の障害箇所を特定する情報をより確実に収集することができ、障害発生時にシステム本体の機能をより確実に停止することができる。
図面を参照して、本発明による情報処理システムの実施の形態を記載する。その情報処理システム1は、図1に示されているように、システム本体2とBMC(Baseboard Management Controller)3とBMC4とROM5とROM6とメモリ7とを備えている。システム本体2は、バス11を介して、BMC3に情報伝達可能に接続され、BMC4に情報伝達可能に接続されている。BMC3は、バス12を介して、ROM5に情報伝達可能に接続されている。BMC3は、さらに、バス13を介して、メモリ7に情報伝達可能に接続されている。BMC3は、さらに、バス14を介して、BMC4に情報伝達可能に接続されている。BMC4は、バス12を介して、ROM6に情報伝達可能に接続されている。BMC4は、さらに、バス13を介して、メモリ7に情報伝達可能に接続されている。
情報処理システム1は、さらに、図示されていない電源装置を備えている。その電源装置は、ユーザによる操作によりシステム本体2をDCON処理し、BMC3またはBMC4により制御されてシステム本体2をACON処理し、ユーザまたはBMC3またはBMC4により制御されてシステム本体2をDCOFF処理する。
システム本体2は、その電源装置により状態が遷移する。その状態は、DCOFF状態とACON状態(スタンバイ電源状態)とDCON状態とを含んでいる。システム本体2は、DCOFF状態であるときに、その電源装置によりACON処理されると、DCOFF状態からACON状態に遷移する。システム本体2は、ACON状態であるときに、その電源装置によりDCON処理されると、ACON状態からDCON状態に遷移する。システム本体2は、DCON状態であるときに、その電源装置によりDCOFF処理されると、DCON状態からDCOFF状態に遷移する。システム本体2は、DCON状態であるときに、所定のソフトウェアを実行して、図示されていない周辺機器を用いて所定のサービスをユーザに提供する。
メモリ7は、不揮発性の記憶装置であり、管理プログラムが記録されている。メモリ7は、さらに、BMC3により生成される情報を一時的に格納し、BMC4により生成される情報を一時的に格納する。
ROM5は、不揮発性の記憶装置であり、ソフトウェアが記録されている。BMC3は、図示されていない内部回路を備えている。その内部回路は、BMC4により制御されて、バス11とBMC3との接続を開閉する。BMC3は、システム本体2がACON処理されることに応答して、ROM5に記録されているソフトウェアを実行することにより立ち上がる。BMC3は、立ち上がると、メモリ7に記録されている管理プログラムを実行することにより、その電源装置を制御し、システム本体2を管理監視する。
ROM6は、不揮発性の記憶装置であり、ソフトウェアが記録されている。BMC4は、図示されていない内部回路を備えている。その内部回路は、BMC4により制御されて、バス11とBMC4との接続を開閉し、バス15とBMC4との接続を開閉する。BMC4は、システム本体2がACON処理されることに応答して、ROM5に記録されているソフトウェアを実行することにより立ち上がる。BMC4は、立ち上がると、メモリ7に記録されている管理プログラムを実行することにより、BMC4の内部回路を制御し、BMC3の内部回路を制御し、その電源装置を制御し、BMC3を管理監視し、または、システム本体2を管理監視する。
このような情報処理システム1としては、パーソナルコンピュータ、ネットワークを介してクライアントにサービスを提供するサーバ装置が例示される。
情報処理システム1の動作は、起動するときの動作とBMC3を監視する動作とシステム本体2を監視する動作とを備えている。
その起動するときの動作は、ユーザの操作に応答して開始される。情報処理システム1の電源装置は、その操作に応答して、システム本体2をACON処理する。システム本体2は、ACON処理されると、DCOFF状態からACON状態に遷移する。BMC3は、システム本体2がACON処理されることに応答してROM5に記録されるソフトウェアを実行して立ち上がる。BMC4は、システム本体2がACON処理されることに応答してROM6に記録されるソフトウェアを実行して立ち上がる。
BMC4は、立ち上がると、メモリ7に記録されるソフトウェアを実行して、バス11とBMC3とが接続するようにBMC3の内部回路を制御し、バス11とBMC4とが接続しないで、かつ、バス14とBMC4とが接続するようにBMC4の内部回路を制御し、BMC3を監視することを開始する。BMC3は、立ち上がると、メモリ7に記録されるソフトウェアを実行してシステム本体2を監視することを開始する。
BMC3は、システム本体2に不具合がないことを検出すると、その電源装置を制御して、システム本体2をDCON処理する。システム本体2は、DCON処理されると、ACON状態からDCON状態に遷移して、所定のソフトウェアを実行して所定のサービスをユーザに提供する。
そのBMC3を監視する動作は、システム本体2がACON状態またはDCON状態であるときにBMC4により実行される。BMC4は、BMC3に不具合が発見されると、バス11とBMC3とが接続しないようにBMC3の内部回路を制御する。この結果、BMC3は、システム本体2を監視することができなくなってしまう。BMC4は、BMC3に不具合が発見されると、さらに、バス11とBMC4とが接続し、かつ、バス14とBMC4とが接続しないようにBMC4の内部回路を制御し、BMC3を監視することを停止して、システム本体2を監視することを開始する。
システム本体2を監視する動作は、BMC3またはBMC4の一方により実行される。すなわち、システム本体2を監視する動作は、そのBMC3を監視する動作によりBMC3に不具合が発見されないときにBMC3により実行され、そのBMC3を監視する動作によりBMC3に不具合が発見されたときにBMC4により実行される。
システム本体2を監視する動作がBMC3により実行される場合に、BMC3は、バス11を介してシステム本体2を監視し、その監視結果を示す監視結果情報をメモリ7に記録する。BMC3は、さらに、メモリ7に記録されるサーバ装置管理情報を用いてバス11を介してシステム本体2を管理し、メモリ7に記録されるサーバ装置管理情報を更新する。BMC3は、システム本体2に不具合が発見されると、その不具合が発生した箇所を特定するための障害情報データをシステム本体2からバス11を介して収集し、その障害情報データをメモリ7に記録する。BMC3は、システム本体2に不具合が発見されると、さらに、システム本体2をDCOFF処理するように電源装置を制御して、システム本体2をDCON状態からDCOFF状態に遷移させる。
システム本体2を監視する動作がBMC4により実行される場合に、BMC4は、バス11を介してシステム本体2を監視し、その監視結果を示す監視結果情報をメモリ7に記録する。BMC4は、メモリ7に記録されるサーバ装置管理情報を用いてシステム本体2を管理し、メモリ7に記録されるサーバ装置管理情報を更新する。BMC4は、システム本体2に不具合が発見されると、その不具合を特定するための障害情報データをシステム本体2からバス11を介して収集し、その障害情報データをメモリ7に記録する。BMC4は、システム本体2に不具合が発見されると、さらに、システム本体2をDCOFF処理するように電源装置を制御して、システム本体2をDCON状態からDCOFF状態に遷移させる。
すなわち、メモリ7は、BMC3とBMC4とがこのような動作を実行するためのコンピュータプログラムである管理プログラムを初期的に記録している。
このような動作によれば、情報処理システム1は、BMC3に不具合が発生したときでも、システム本体2をより安定して管理監視することができる。すなわち、情報処理システム1は、BMC3に不具合が発生したときに、BMC3に置換してBMC4がシステム本体2を監視することができ、その不具合に関する障害情報データをシステム本体2にからより確実に収集することができ、その不具合が発生した箇所をより確実に特定することができる。情報処理システム1は、さらに、BMC3に不具合が発生したときに、BMC3により更新されたサーバ装置管理情報を用いてBMC4がシステム本体2を管理することができ、システム本体2の動作に影響なく、システム本体2を管理することができる。
図2は、本発明による情報処理システムの実施の他の形態を示している。その情報処理システム21は、システム本体22とBMC23とBMC24とROM25とROM26とメモリ27とQSW28とQSW29とを備えている。システム本体22は、バス31を介して、BMC23に情報伝達可能に接続され、BMC24に情報伝達可能に接続されている。BMC23は、バス32を介して、ROM25に情報伝達可能に接続されている。BMC23は、さらに、バス33を介して、メモリ27に情報伝達可能に接続されている。BMC23は、さらに、バス34を介して、BMC24に情報伝達可能に接続されている。BMC24は、バス32を介して、ROM26に情報伝達可能に接続されている。BMC24は、さらに、バス33を介して、メモリ27に情報伝達可能に接続されている。BMC24は、さらに、信号線36を介して、QSW28とQSW29とに情報伝達可能に接続されている。
情報処理システム21は、さらに、図示されていない電源装置を備えている。その電源装置は、ユーザによる操作によりシステム本体22をDCON処理し、BMC23またはBMC24により制御されてシステム本体22をACON処理し、ユーザまたはBMC23またはBMC24により制御されてシステム本体22をDCOFF処理する。
システム本体22は、その電源装置により状態が遷移する。その状態は、DCOFF状態とACON状態(スタンバイ電源状態)とDCON状態とを含んでいる。システム本体22は、DCOFF状態であるときに、その電源装置によりACON処理されると、DCOFF状態からACON状態に遷移する。システム本体22は、ACON状態であるときに、その電源装置によりDCON処理されると、ACON状態からDCON状態に遷移する。システム本体22は、DCON状態であるときに、その電源装置によりDCOFF処理されると、DCON状態からDCOFF状態に遷移する。システム本体22は、DCON状態であるときに、所定のソフトウェアを実行して、図示されていない周辺機器を用いて所定のサービスをユーザに提供する。
メモリ27は、不揮発性の記憶装置であり、管理プログラムが記録されている。メモリ27は、さらに、BMC23により生成される情報を一時的に格納し、BMC24により生成される情報を一時的に格納する。
ROM25は、不揮発性の記憶装置であり、ソフトウェアが記録されている。BMC23は、システム本体22がACON処理されることに応答して、ROM25に記録されているソフトウェアを実行することにより立ち上がる。BMC23は、立ち上がると、メモリ27に記録されている管理プログラムを実行することにより、その電源装置を制御し、システム本体22を管理監視する。
ROM26は、不揮発性の記憶装置であり、ソフトウェアが記録されている。BMC24は、システム本体22がACON処理されることに応答して、ROM25に記録されているソフトウェアを実行することにより立ち上がる。BMC24は、立ち上がると、メモリ27に記録されている管理プログラムを実行することにより、QSW28とQSW29とを制御し、その電源装置を制御し、BMC23を管理監視し、または、システム本体22を管理監視する。
QSW28は、BMC24により制御されて、バス31とBMC23との接続を開閉する。QSW29は、BMC24により制御されて、バス31とBMC23との接続を開閉する。信号線36は、QSW28に伝達される情報と逆の情報をQSW29に伝達する。すなわち、QSW29は、QSW28がBMC24により制御されてバス31とBMC23とを接続するときに、バス31とBMC23との接続を切断し、QSW28がBMC24により制御されてバス31とBMC23との接続を切断するときに、バス31とBMC23とを接続する。
情報処理システム21の動作は、起動するときの動作とBMC23を監視する動作とシステム本体22を監視する動作とを備えている。
その起動するときの動作は、ユーザの操作に応答して開始される。情報処理システム21の電源装置は、その操作に応答して、システム本体22をACON処理する。システム本体22は、ACON処理されると、DCOFF状態からACON状態に遷移する。BMC23は、システム本体22がACON処理されることに応答してROM25に記録されるソフトウェアを実行して立ち上がる。BMC24は、システム本体22がACON処理されることに応答してROM26に記録されるソフトウェアを実行して立ち上がる。
BMC24は、立ち上がると、メモリ27に記録されるソフトウェアを実行して、バス31とBMC23とが接続するようにQSW28を制御し、バス31とBMC24とが接続しないようにQSW29を制御し、BMC23を監視することを開始する。BMC23は、立ち上がると、メモリ27に記録されるソフトウェアを実行してシステム本体22を監視することを開始する。
BMC23は、システム本体22に不具合がないことを検出すると、その電源装置を制御して、システム本体22をDCON処理する。システム本体22は、DCON処理されると、ACON状態からDCON状態に遷移して、所定のソフトウェアを実行して所定のサービスをユーザに提供する。
そのBMC23を監視する動作は、システム本体22がACON状態またはDCON状態であるときにBMC24により実行される。BMC24は、BMC23に不具合が発見されると、バス31とBMC23とが接続しないようにQSW28を制御し、バス31とBMC24とが接続するようにQSW29を制御する。この結果、BMC23は、システム本体22を監視することができなくなってしまう。BMC24は、BMC23に不具合が発見されると、さらに、BMC23を監視することを停止して、システム本体22を監視することを開始する。
システム本体22を監視する動作は、BMC23またはBMC24の一方により実行される。すなわち、システム本体22を監視する動作は、そのBMC23を監視する動作によりBMC23に不具合が発見されないときにBMC23により実行され、そのBMC23を監視する動作によりBMC23に不具合が発見されたときにBMC24により実行される。
システム本体22を監視する動作がBMC23により実行される場合に、BMC23は、バス31を介してシステム本体22を監視し、その監視結果を示す監視結果情報をメモリ27に記録する。BMC23は、さらに、メモリ27に記録されるサーバ装置管理情報を用いてバス31を介してシステム本体22を管理し、メモリ27に記録されるサーバ装置管理情報を更新する。BMC23は、システム本体22に不具合が発見されると、その不具合が発生した箇所を特定するための障害情報データをシステム本体22からバス31を介して収集し、その障害情報データをメモリ27に記録する。BMC23は、システム本体22に不具合が発見されると、さらに、システム本体22をDCOFF処理するように電源装置を制御して、システム本体22をDCON状態からDCOFF状態に遷移させる。
システム本体22を監視する動作がBMC24により実行される場合に、BMC24は、バス31を介してシステム本体22を監視し、その監視結果を示す監視結果情報をメモリ27に記録する。BMC24は、メモリ27に記録されるサーバ装置管理情報を用いてシステム本体22を管理し、メモリ27に記録されるサーバ装置管理情報を更新する。BMC24は、システム本体22に不具合が発見されると、その不具合を特定するための障害情報データをシステム本体22からバス31を介して収集し、その障害情報データをメモリ27に記録する。BMC24は、システム本体22に不具合が発見されると、さらに、システム本体22をDCOFF処理するように電源装置を制御して、システム本体22をDCON状態からDCOFF状態に遷移させる。
すなわち、メモリ27は、BMC23とBMC24とがこのような動作を実行するためのコンピュータプログラムである管理プログラムを初期的に記録している。
このような動作によれば、情報処理システム21は、既述の実施の形態における情報処理システム1と同様にして、BMC23に不具合が発生したときでも、システム本体22をより安定して管理監視することができる。すなわち、情報処理システム21は、BMC23に不具合が発生したときに、BMC23に置換してBMC24がシステム本体22を監視することができ、その不具合に関する障害情報データをシステム本体22にからより確実に収集することができ、その不具合が発生した箇所をより確実に特定することができる。情報処理システム21は、さらに、BMC23に不具合が発生したときに、BMC23により更新されたサーバ装置管理情報を用いてBMC24がシステム本体22を管理することができ、システム本体22の動作に影響なく、システム本体22を管理することができる。
図1は、本発明による情報処理システムの実施の形態を示すブロック図である。 図2は、本発明による情報処理システムの実施の他の形態を示すブロック図である。 図3は、公知の情報処理システムを示すブロック図である。 図4は、公知の他の情報処理システムを示すブロック図である。
符号の説明
1 :情報処理システム
2 :システム本体
3 :BMC
4 :BMC
5 :ROM
6 :ROM
7 :メモリ
11:バス
12:バス
13:バス
14:バス
15:バス
21:情報処理システム
22:システム本体
23:BMC
24:BMC
25:ROM
26:ROM
27:メモリ
28:QSW
29:QSW
31:バス
32:バス
33:バス
34:バス
36:信号線

Claims (8)

  1. システム本体を監視する第1BMCと、
    前記第1BMCを監視する第2BMCとを具備し、
    前記第2BMCは、前記第1BMCに不具合を発見したときに前記システム本体を監視する
    情報処理システム。
  2. 請求項1において、
    第1コンピュータプログラムを記録する第1記憶装置と、
    第2コンピュータプログラムを記録する第2記憶装置とを更に具備し、
    前記第1BMCは、前記第1コンピュータプログラムを実行することにより前記システム本体を監視し、
    前記第2BMCは、前記第2コンピュータプログラムを実行することにより、前記第1BMCを監視し、または、前記システム本体を監視する
    情報処理システム。
  3. 請求項1または請求項2のいずれかにおいて、
    前記第2BMCは、前記第1BMCに不具合を発見したときに、前記第1BMCが前記システム本体を監視しないように前記第1BMCを制御する
    情報処理システム。
  4. 請求項1または請求項2のいずれかにおいて、
    前記システム本体と前記第1BMCと前記第2BMCとの接続を制御するQSWを更に具備し、
    前記第2BMCは、
    前記第1BMCに不具合を発見しないときに、前記システム本体が前記第1BMCに接続され、かつ、前記システム本体が前記第2BMCに接続されないように、前記QSWを制御し、
    前記第1BMCに不具合を発見したときに、前記システム本体が前記第1BMCに接続されないで、かつ、前記システム本体が前記第2BMCに接続されるように、前記QSWを制御する
    情報処理システム。
  5. 請求項1〜請求項4のいずれかにおいて、
    前記第1BMCまたは前記第2BMCは、前記システム本体を監視している場合で、前記システム本体に不具合を発見したときに、前記不具合を特定するための情報を前記システム本体から収集して記録装置に記録する
    情報処理システム。
  6. 請求項1〜請求項4のいずれかにおいて、
    前記システム本体は、DCOFF状態とACON状態とDCON状態とのうちのいずれか1つの状態をとり、前記DCON状態であるときに所定のプログラムを実行し、
    前記第1BMCは、前記システム本体が前記DCOFF状態から前記ACON状態に遷移された場合で、前記システム本体に不具合を発見されないときに、前記システム本体を前記ACON状態から前記DCONに遷移させる
    情報処理システム。
  7. 請求項6において、
    前記第2BMCは、前記システム本体が前記DCOFF状態から前記ACON状態に遷移されたときに、前記第1BMCを監視することを開始する
    情報処理システム。
  8. 請求項6または請求項7のいずれかにおいて、
    前記第1BMCまたは前記第2BMCは、前記システム本体を監視している場合で、前記システム本体に不具合を発見したときに、前記システム本体を前記DCCON状態から前記DCOFF状態に遷移させる
    情報処理システム。
JP2007058808A 2007-03-08 2007-03-08 情報処理システム Withdrawn JP2008225567A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007058808A JP2008225567A (ja) 2007-03-08 2007-03-08 情報処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007058808A JP2008225567A (ja) 2007-03-08 2007-03-08 情報処理システム

Publications (1)

Publication Number Publication Date
JP2008225567A true JP2008225567A (ja) 2008-09-25

Family

ID=39844161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007058808A Withdrawn JP2008225567A (ja) 2007-03-08 2007-03-08 情報処理システム

Country Status (1)

Country Link
JP (1) JP2008225567A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011048534A (ja) * 2009-08-26 2011-03-10 Nec Corp フォールトトレラントコンピュータ及び電源制御方法
JP2013073289A (ja) * 2011-09-27 2013-04-22 Nec Corp 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
JP2013182519A (ja) * 2012-03-02 2013-09-12 Nec Computertechno Ltd コンピュータ、ファームウェア管理方法、及びbmc
EP2645252A1 (en) 2012-03-29 2013-10-02 Fujitsu Limited Information processing system and virtual address setting method
JP2014170308A (ja) * 2013-03-01 2014-09-18 Nec Computertechno Ltd 情報処理装置、bmc切り替え方法、bmc切り替えプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011048534A (ja) * 2009-08-26 2011-03-10 Nec Corp フォールトトレラントコンピュータ及び電源制御方法
JP2013073289A (ja) * 2011-09-27 2013-04-22 Nec Corp 多重化システム、データ通信カード、状態異常検出方法、及びプログラム
US8990632B2 (en) 2011-09-27 2015-03-24 Nec Corporation System for monitoring state information in a multiplex system
JP2013182519A (ja) * 2012-03-02 2013-09-12 Nec Computertechno Ltd コンピュータ、ファームウェア管理方法、及びbmc
EP2645252A1 (en) 2012-03-29 2013-10-02 Fujitsu Limited Information processing system and virtual address setting method
JP2014170308A (ja) * 2013-03-01 2014-09-18 Nec Computertechno Ltd 情報処理装置、bmc切り替え方法、bmc切り替えプログラム

Similar Documents

Publication Publication Date Title
US7062676B2 (en) Method and system for installing program in multiple system
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
CN103546914B (zh) 一种hss主备管理的方法及装置
JP2007304687A (ja) クラスタ構成とその制御手段
JP4341571B2 (ja) 記憶装置システムおよびその制御方法、制御プログラム
JP6130520B2 (ja) 多重系システムおよび多重系システム管理方法
US7032128B2 (en) Method for managing computer, apparatus for managing computer, and computer readable medium storing program for managing computer
JP2004303122A (ja) データ転送制御システム
JP2008225567A (ja) 情報処理システム
JP2005196490A (ja) データ多重化のためのシステム及び方法
WO2015033433A1 (ja) ストレージ装置及び障害部位特定方法
JP2011065480A (ja) 電源制御装置及びその制御方法並びにストレージシステム
WO2020078355A1 (zh) 设备状态监控方法及装置
JP6124644B2 (ja) 情報処理装置および情報処理システム
JP6996602B1 (ja) Bmc、サーバシステム、装置安定度判定方法及びプログラム
JP5625605B2 (ja) Os動作状態確認システム、確認対象装置、os動作状態確認装置、os動作状態確認方法およびプログラム
JP5104479B2 (ja) 情報処理装置
JP3555047B2 (ja) 複合コンピュータシステム
JP2006260141A (ja) 記憶システムの制御方法、記憶システム、記憶制御装置、記憶システムの制御プログラム、情報処理システム
JP3771162B2 (ja) 保守管理方法、保守管理システム、情報処理システムおよびコンピュータプログラム
JP2007334668A (ja) メモリダンプ方法、クラスタシステム、それを構成するノードおよびプログラム
WO2012149744A1 (zh) 主备管理软件的切换方法及系统
JP2005301438A (ja) 分散監視制御システム
JP2004246621A (ja) 情報採取プログラム、情報採取装置および情報採取方法
JP5011159B2 (ja) システム監視回路を備えた計算機

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100511