JP2016212472A - 情報処理システム及び情報処理システムの制御方法 - Google Patents

情報処理システム及び情報処理システムの制御方法 Download PDF

Info

Publication number
JP2016212472A
JP2016212472A JP2015092495A JP2015092495A JP2016212472A JP 2016212472 A JP2016212472 A JP 2016212472A JP 2015092495 A JP2015092495 A JP 2015092495A JP 2015092495 A JP2015092495 A JP 2015092495A JP 2016212472 A JP2016212472 A JP 2016212472A
Authority
JP
Japan
Prior art keywords
server
temperature
management
electronic device
electronic devices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015092495A
Other languages
English (en)
Inventor
聡 平井
Satoshi Hirai
聡 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2015092495A priority Critical patent/JP2016212472A/ja
Priority to US15/071,843 priority patent/US20160324038A1/en
Publication of JP2016212472A publication Critical patent/JP2016212472A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)

Abstract

【課題】特別な装置を必要とせず、電子装置とその識別情報との対応付けを自動的に行う情報処理システム及び情報処理システムの制御方法を提供する。
【解決手段】情報処理システムは、温度情報を測定する温度センサ15a,15bを備える複数の電子装置13と、電子装置13を制御する管理装置11とを有する。また、管理装置11は、複数の電子装置13のうちいずれか1台の電子装置13の電源を投入する制御部18aと、温度センサ15a,15bからの温度情報を収集する収集部18bと、収集部18bが収集した複数の電子機器13の各々の温度情報の変化に基づいて、各電子装置13と、各電子装置13をそれぞれ識別する識別情報とを対応させる対応部18cとを有する。
【選択図】図3

Description

本発明は、情報処理システム及び情報処理システムの制御方法に関する。
データセンター及びオンプレミスのクラウドシステムの普及に伴い、1台のラック内に複数のサーバを収納し、多数のサーバをラック単位で管理することが多くなってきている。そのような情報処理システムでは、工場出荷時、又はデータセンター等の現場でサーバをラックに搭載し、各サーバとネットワークスイッチとを結線する。
ところで、資材管理のため及びメンテナンスの利便性を確保するためなどの理由により、サーバのIDとラック内の搭載位置とを対応付けて管理する必要がある。ここで、IDとは、例えばサーバ等の電子装置のシリアル番号や管理LANのMACアドレスなどであり、サーバ等の電子装置1台1台に固有の情報である。
通常、サーバのIDと搭載位置との対応付けは、サーバをラックに搭載する際に、作業者がサーバのIDと搭載位置とを目視で確認し、管理台帳(例えばコンピュータ上の管理ソフトウエア)に入力することで行っている。しかし、サーバのIDと搭載位置との対応付けを人手で行うと、多大な時間やコストがかかる。そのため、サーバのIDと搭載位置とを自動的に対応付ける技術が研究されている。
例えば、ラック側に位置情報を提供するモジュールを取り付け、サーバ側にモジュールから位置情報を読み取るセンサを取り付けて、サーバとその搭載位置とを自動的に対応付ける技術が開発されている。また、インテリジェントPDU(Power Distribution Unit)を使用して、サーバとその搭載位置を特定する技術も開発されている。
その他、温度センサを使用して特定の電子装置の位置又はプロセッサ内のホットスポットの位置を判定する技術も開発されている(例えば、特許文献1,2参照)。
特開平7−152442号公報 特開2005−346590号公報
前述のサーバとその搭載位置とを自動的に対応付ける技術では、特別な装置(モジュール、センサ、又はインテリジェントPDU等)が必要なため、コストがかかるという問題点がある。また、それらの特別な装置を搭載できないシステムも存在する。
開示の技術は、特別な装置を必要とせず、電子装置とその識別情報との対応付けを自動的に行う情報処理システム及び情報処理システムの制御方法を提供することを目的とする。
開示の技術の一観点によれば、温度情報を測定する温度センサをそれぞれ備える複数の電子装置と、前記複数の電子装置を制御する管理装置とを有する情報処理システムにおいて、前記管理装置は、前記複数の電子装置のうち、いずれか1台の電子装置の電源を投入する制御部と、前記複数の電子機器の各々が備える前記温度センサからの温度情報を収集する収集部と、前記収集部が収集した前記複数の電子機器の各々の温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる対応部とを有する情報処理システムが提供される。
開示の技術の他の一観点によれば、複数の電子装置のうちから1台の電子装置を選択し、選択した電子装置の動作を制御する制御部と、前記複数の電子装置のそれぞれに配置された温度センサから温度情報を収集する収集部と、前記収集部で収集した前記温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる対応部とを有する管理装置が提供される。
開示の技術の更に他の一観点によれば、温度情報を測定する温度センサをそれぞれ備える複数の電子装置と、前記複数の電子装置を制御する管理装置とを有する情報処理システムの制御方法において、前記管理装置が有する制御部が、前記複数の電子装置のうち、いずれか1台の電子装置の電源を投入し、前記管理装置が有する収集部が、前記複数の電子装置の各々が備える温度センサからの温度情報を収集し、前記管理装置が有する対応部が、前記収集部が収集した前記複数の電子装置の各々の温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる情報処理システムの制御方法が提供される。
上記の一観点に係る情報処理システム、管理装置及び情報処理システムの制御方法によれば、特別な装置を必要とせず、電子装置とその識別情報との対応付けを自動的に行うことができる。
図1は、第1の実施形態に係る情報処理システムの概要を示す模式図である。 図2は、運用サーバの上面図である。 図3は、専用のソフトウエアを読み込んだ後の管理装置の構成を示す模式図である。 図4は、第1の実施形態の情報処理システムの制御方法を示すフローチャート(その1)である。 図5は、第1の実施形態の情報処理システムの制御方法を示すフローチャート(その2)である。 図6は、第1の実施形態の情報処理システムの制御方法を示すフローチャート(その3)である。 図7は、管理機器情報テーブルの例を示す図である。 図8は、ラックの上端に配置された運用サーバのラック位置番号に1を記録した管理機器情報テーブルを示す図である。 図9は、サーバのシリアル番号を記録した管理機器情報テーブルを示す図である。 図10は、温度管理情報テーブルの一例を示す図である。 図11は、テーブル識別番号1のサーバを動作させた場合の温度管理情報テーブルを示す図である。 図12は、2回目のサブ処理終了後における温度管理情報テーブルを示す図である。 図13は、温度変化テーブルの一例を示す図である。 図14は、全サーバのラック位置番号を記載した後の管理機器情報テーブルを示す図である。 図15は、第2の実施形態の情報処理システムの概要を示す模式図である。 図16は、第2の実施形態の情報処理システムの制御方法を示すフローチャート(その1)である。 図17は、第2の実施形態の情報処理システムの制御方法を示すフローチャート(その2)である。 図18は、第2の実施形態の情報処理システムの制御方法を示すフローチャート(その3)である。 図19は、管理機器情報テーブルの例を示す図である。 図20は、サーバのシリアル番号を記録した管理機器情報テーブルを示す図である。 図21は、温度管理情報テーブルの一例を示す図である。 図22は、テーブル識別番号2のサーバを動作させた場合の温度管理情報テーブルを示す図である。 図23は、2回目のサブ処理終了後における温度管理情報テーブルを示す図である。 図24は、温度変化テーブルの一例を示す図である。 図25は、全サーバのラック位置番号を記載した後の管理機器情報テーブルを示す図である。 図26は、第3の実施形態の情報処理システムの概要を示す模式図である。 図27は、第3の実施形態の情報処理システムの制御方法を示すフローチャート(その1)である。 図28は、第3の実施形態の情報処理システムの制御方法を示すフローチャート(その2)である。 図29は、第3の実施形態の情報処理システムの制御方法を示すフローチャート(その3)である。 図30は、管理機器情報テーブルの例を示す図である。 図31は、サーバのシリアル番号を記録した管理機器情報テーブルを示す図である。 図32は、温度管理情報テーブルの一例を示す図である。 図33は、テーブル識別番号2のサーバを動作させた場合の温度管理情報テーブルを示す図である。 図34は、2回目のサブ処理終了後における温度管理情報テーブルを示す図である。 図35は、温度変化テーブルの一例を示す図である。 図36は、全サーバのラック位置番号を記載した後の管理機器情報テーブルを示す図である。 図37は、第4の実施形態の情報処理システムの概要を示す模式図である。 図38は、第4の実施形態の情報処理システムの制御方法を示すフローチャート(その1)である。 図39は、第4の実施形態の情報処理システムの制御方法を示すフローチャート(その2)である。 図40は、第4の実施形態の情報処理システムの制御方法を示すフローチャート(その3)である。 図41は、第4の実施形態の情報処理システムの制御方法を示すフローチャート(その4)である。 図42は、管理機器情報テーブルの例を示す図である。 図43は、ラックの上端に配置された運用サーバのラック位置番号に1を記録した管理機器情報テーブルを示す図である。 図44は、温度管理情報テーブルの一例を示す図である。 図45は、テーブル識別番号2のサーバを動作させた場合の温度管理情報テーブルを示す図である。 図46は、2回目のサブ処理終了後における温度管理情報テーブルを示す図である。 図47は、温度変化テーブルの一例を示す図である。 図48は、全電子装置のラック位置番号を記載した後の管理機器情報テーブルを示す図である。 図49は、第5の実施形態の情報処理システムの概要を示す模式図である。 図50は、第5の実施形態の情報処理システムの制御方法を示すフローチャート(その1)である。 図51は、第5の実施形態の情報処理システムの制御方法を示すフローチャート(その2)である。 図52は、第5の実施形態の情報処理システムの制御方法を示すフローチャート(その3)である。 図53は、管理機器情報テーブルの例を示す図である。 図54は、ラックの左端に配置された運用サーバのラック位置番号に1を記録した管理機器情報テーブルを示す図である。 図55は、サーバのシリアル番号を記録した管理機器情報テーブルを示す図である。 図56は、温度管理情報テーブルの一例を示す図である。 図57は、テーブル識別番号1のサーバを動作させた場合の温度管理情報テーブルを示す図である。 図58は、2回目のサブ処理終了後における温度管理情報テーブルを示す図である。 図59は、温度変化テーブルの一例を示す図である。 図60は、全サーバのラック位置番号を記載した後の管理機器情報テーブルを示す図である。
以下、実施形態について、添付の図面を参照して説明する。
(第1の実施形態)
図1は、第1の実施形態に係る情報処理システムの概要を示す模式図である。
本実施形態に係る情報処理システムは、管理装置11と、ラック12内に搭載された複数の運用サーバ13(以下、単に「サーバ」ともいう)とを有する。管理装置11と各運用サーバ13とはネットワーク20を介して接続されている。
図1では1台のラック12のみを図示しているが、本実施形態に係る情報処理システムには複数のラック12が含まれている。各ラック12にはそれぞれ複数の運用サーバ13が搭載されており、管理装置11はそれらのサーバ13とネットワーク20を介して接続されている。
運用サーバ13は、電子装置の一例である。また、ラック12は、筐体の一例である。図1では管理装置11をラック12の外に記載しているが、管理装置11をラック12内に配置してもよく、ラック12内の特定の運用サーバ13を管理装置11として使用してもよい。
各運用サーバ13には、室内のエアーを取り込んでサーバ13内の電子部品(CPU(Central Processing Unit)等)を冷却するファン14が設けられている。図1中の白抜き矢印は、ファン14によるエアーの流れ方向を示している。
以下、ラック12の面のうちエアーを取り込む面を吸気面と呼び、エアーを排出する面を排気面と呼ぶ。サーバ13内の電子部品を冷却することで温度が上昇したエアーは、ラック12の排気面からラック12の外に排出される。
図1ではファン14をサーバ13の筐体内に配置した例を示しているが、サーバ13の筐体の外側にファンを配置してもよい。
各サーバ13には、ラック12の吸気面側に配置されてラック12内に流入するエアーの温度を検出する温度センサ15aと、排気面側に配置されてサーバ13の温度を検出する温度センサ15bとが設けられている。
図2は、運用サーバ13の上面図である。温度センサ15aは例えば楕円Aで示す位置に配置され、温度センサ15bは例えば楕円Bで示す位置に配置される。
一般的なサーバには、これらの温度センサ15a,15bやBMC(Base Management Controller)16が標準で実装されており、吸気側のエアーの温度やサーバの温度をBMC16を介して外部装置に送信することができる。また、BMC16を介して外部装置からファン14を制御したり、サーバの電源を投入したり、遮断したりすることも可能である。
本実施形態では、運用サーバ13として上記の一般的なサーバを使用しており、温度センサ15a,15b及びBMC16を別途用意する必要はない。なお、図2中の符号13aはサーバ13に搭載されたCPU(発熱部)である。
管理装置11はコンピュータにより構成され、図1に示すように、CPU11aと、記憶装置17と、メモリ19とを有している。記憶装置17には専用のソフトウエアが実装されており、ソフトウエアを読む込むことで、図3に示すように、管理装置11は制御部18a、収集部18b及び対応部18cを備える。
後述するように、収集部18bは、温度センサ15a,15bからサーバ13の温度情報を収集する。対応部18cは、収集部18bで収集した温度情報の変化に基づいて各サーバ13と、各サーバ13に固有の識別情報(以下の例では、ラック12内の位置)とを対応させる。制御部18aは、サーバ13の動作を制御したり、予め設定された手順で処理を実行する。
図4〜図6は、第1の実施形態の情報処理システムの制御方法を示すフローチャートである。
なお、ここでは、ネットワーク管理者により、予め運用サーバ13毎にそれぞれ固有の管理ネットワークアドレスが設定されているものとする。また、メーカーにより、予め運用サーバ13毎にそれぞれ固有のシリアル番号(ID)が設定されており、管理装置11はBMC16を介して運用サーバ13からシリアル番号を取得可能であるものとする。更に、ラック12の上端(最上段)に配置されている運用サーバ13の管理ネットワークアドレスも、予め判明しているものとする。
まず、ステップS11において、管理装置11(制御部18a)は、メモリ19上に管理機器情報テーブルを作成する。管理機器情報テーブルは、例えば図7に示すように、テーブル識別番号、管理ネットワークアドレス、シリアル番号、及びラック位置番号の項目を有する。図7では、1台のラック12に5台の運用サーバ13が収納されている場合を示している。
次に、ステップS12に移行し、管理装置11(収集部18b)は、ネットワーク20を介して管理対象の全サーバ13にアクセスし、各サーバ13の管理ネットワークアドレスを取得する。そして、それらの管理ネットワークアドレスを、図7に示すように管理機器情報テーブルに記録する。
なお、図7に示す例では、管理ネットワークアドレスを検出した運用サーバ13に対し、管理ネットワークアドレスの順にテーブル識別番号を付与している。
次に、ステップS13に移行し、管理装置11(制御部18a)は、図8に示すように、ラック12の上端に配置された運用サーバ13のラック位置番号に1を記録する。
ラック位置番号1は、ラック12の上端(最上段)に配置されていることを示している。前述したように、ラック12の上端に配置された運用サーバ13の管理ネットワークアドレスは、予め判明している。この例では、管理ネットワークアドレスが「192.168.0.11」の運用サーバ13が、ラック12の上端に配置されているサーバである。
次に、ステップS14に移行し、管理装置11(収集部18b)は、ネットワーク20を介して各運用サーバ13にアクセスし、各サーバ13のシリアル番号(ID)を取得する。そして、図9に示すように、管理機器情報テーブルに、各サーバ13のシリアル番号を、テーブル識別番号及び管理ネットワークアドレスと対応付けて記録する。
次に、ステップS15に移行し、管理装置11(制御部18a)は、管理対象のサーバ13のうちから1台のサーバ13を選択する。ここでは、管理ネットワークアドレスの順にサーバ13を選択するものとする。従って、最初は管理ネットワークアドレスが「192.168.0.11」(テーブル識別番号1)のサーバ13が選択される。但し、サーバ13を選択する順番はこれに限定されない。
その後、ステップS16に移行し、サブ処理を実行する。以下、図5を参照してサブ処理について説明する。
まず、ステップS21において、管理装置11(収集部18b)は、ネットワーク20を介して管理対象の全サーバ13にアクセスし、各サーバ13の吸気温度Ta及び筐体内温度Tiを取得する。吸気温度Taは温度センサ15aの検出温度であり、筐体内温度Tiは温度センサ15bの検出温度である。
そして、管理装置11(制御部18a)は、運用サーバ13毎に、筐体内温度Tiと吸気温度Taとの差分ΔT(=Ti−Ta)を計算して、温度管理情報テーブルをメモリ19上に作成する。
図10は、温度管理情報テーブルの一例を示す図である。図10において、Ta,Ti,ΔTの添え字0は、1回目のサブ処理における測定値(初期値)であることを示している。
この図10に示すように、温度管理情報テーブルでは、テーブル識別番号毎に、サーバ13の吸気温度Ta及び筐体内温度Tiと、それらの差分ΔTとが記録される。
次に、ステップS22に移行し、管理装置11(制御部18a)は、ネットワーク20及びBMC16を介して、選択されたサーバ13(最初は、テーブル識別番号1のサーバ)のファン14を停止状態にする。
ファン14を停止状態にしなくてもよいが、次のステップでサーバ14を動作させた場合に筐体内温度Tiが上昇する時間を短縮するために、本実施形態ではステップS22においてファン14を停止状態にしている。更に、筐体内温度Tiが上昇する時間をより短縮するため、サーバ14が有するCPUに対してより負荷がかかるような特定のプログラムを実行させてもよい。
次に、ステップS23に移行し、管理装置11(制御部18a)は、ネットワーク20及びBMC16を介して選択されたサーバ13の電源を投入し、サーバ13を動作させる。サーバ13を動作させることにより、当該サーバ13のCPU及びI/O(Input/Output)が発熱して、筐体内温度Tiが上昇する。なお、CPU及びI/Oはいずれも発熱部の一例である。
次に、ステップS24に移行し、管理装置11(制御部18a)は、選択されたサーバ13の差分ΔTが初期値から所定の温度以上(この例では10℃以上)高くなるまで待機(ループ)する。そして、選択されたサーバ13の差分ΔTが初期値から所定の温度以上高くなると、ステップS25に移行する。
ステップS25において、管理装置11(制御部18a)は、ネットワーク20を介して管理対象の全サーバ13にアクセスし、各サーバ13の吸気温度Ta及び筐体内温度Tiを取得する。また、管理装置11(制御部18a)は、管理対象の全サーバ13の吸気温度Taと筐体内温度Tiとの差分ΔTを計算する。そして、管理装置11(制御部18a)は、それらの値を温度管理情報テーブルに記憶する。
図11は、テーブル識別番号1のサーバ13を動作させた場合の吸気温度Ta1、筐体内温度Ti1及び差分ΔT1を記録した温度管理情報テーブルを示している。
次に、ステップS26に移行し、管理装置11(制御部18a)は、ネットワーク20及びBMC16を介して、選択されたサーバ13のファン14の回転数を最大に制御する。また、ステップS27において、管理装置11(制御部18a)は、選択されたサーバ13の電源を遮断する。
なお、ステップS26でファン14の回転数を最大にするのは、サーバ13の筐体内温度Tiが初期値(電源を投入する前の筐体内温度Ti)まで下がる時間を短縮するためである。また、ステップS27において、サーバ13の電源を遮断する替りに、サーバ13をスリープ状態又はアイドル状態にしてもよい。
次に、ステップS28に移行し、管理装置11(制御部18a)は、ステップS23で動作させたサーバ13のΔTの値が初期値(動作させる前のΔT)と同程度になるまで待機(ループ)する。そして、動作させたサーバ13のΔTの値が初期値と同程度になると、ステップS29に移行し、当該サーバ13のファン14を通常制御(例えば、筐体内温度Tiに応じた回転数の制御)に戻す。そして、サブ処理を終了し、図4に示すフローチャートのステップS17に移行する。
ステップS17において、管理装置11(制御部18a)は、管理対象の全サーバ13に対しサブ処理が終了したか否かを判定する。そして、管理対象の全サーバ13に対しサブ処理が終了していないと判定した場合(NOの場合)はステップS15に移行して、サブ処理が終了していないサーバ13のうちから次のサーバ13を選択する。その後、ステップS16において、図5に示すサブ処理(ステップS21〜ステップS29)を実施する。
図12は、1回目及び2回目のサブ処理における吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、特定のサーバ(ステップS15で選択されたサーバ)を動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とを示している。
この図12に示すように、サブ処理を実施する毎に、吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、サーバを動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とが、温度管理情報テーブルに記録される。
一方、ステップS17で管理対象の全サーバ13に対しサブ処理が終了していると判定した場合(YESの場合)は、ステップS18に移行する。そして、管理装置11(制御部18a)は、温度管理情報テーブルから温度変化テーブルを作成し、記憶装置17に記憶する。
図13は、温度変化テーブルの一例を示す図である。この図13に示すように、温度変化テーブルには、サブ処理を実行する毎に、特定のサーバ(ステップS15で選択されたサーバ)を動作させた場合の全サーバ13の差分ΔTの値が記載される。
管理装置11は、温度変化テーブルを作成すると、次に図6のフローチャートに示す処理を開始する。
すなわち、ステップS31において、管理装置11(対応部18b)は、記憶装置17からメモリ19に温度変化テーブルを読み出す。また、変数Nの値を1に設定する(N←1)。
次に、ステップS32に移行し、管理装置11(対応部18b)は、温度変化テーブルを参照し、ラック12の上端に配置されたサーバを動作させた場合に差分ΔTがしきい値以上変化したサーバを抽出する。
本実施形態では、しきい値を、2℃よりも若干低い値としている。図13に示す温度変化テーブルでは、テーブル識別番号1のサーバを動作させた場合に、テーブル識別番号5のサーバの差分ΔTがしきい値以上変化している。従って、管理装置11(対応部18b)は、テーブル識別番号5のサーバを抽出することになる。
次に、ステップS33に移行し、管理装置11(対応部18b)は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS34に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS33からステップS34に移行した場合、管理装置11(対応部18b)は、N+1を演算して得た値を、新たにNとする(N←N+1)。そして、ステップS32で抽出されたサーバのラック位置番号をNに決定し、管理機器情報テーブルに記録する。
前述したようにNの初期値は1であるので、ステップS34においてNの値は2となる。従って、ここでは、ステップS32で抽出されたテーブル識別番号5のサーバ13のラック位置番号は「2」となる。すなわち、テーブル識別番号5のサーバ13は、ラック12の上から2番目に配置されたサーバと判定される。
次に、ステップS35に移行し、管理装置11(対応部18b)は、ステップS34でラック位置番号を決定したサーバ13を動作させた場合に差分ΔTの値がしきい値以上変化したサーバ(但し、ラック位置番号が未決定のサーバ)を抽出する。
図13に示す温度管理情報テーブルでは、テーブル識別番号1のサーバとテーブル識別番号3のサーバとが、テーブル識別番号5のサーバを動作させた場合に差分ΔTの値がしきい値以上変化している。このうち、テーブル識別番号1のサーバのラック位置番号は既に「1」に決定しているので、ステップS35において抽出されるサーバは、テーブル識別番号3のサーバとなる。
次に、ステップS36に移行し、管理装置11(対応部18b)は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS37に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS36からステップS37に移行した場合、管理装置11は、N+1を演算して得た値を新たにNに設定する(N←N+1)。そして、ステップS35で抽出されたサーバのラック位置番号をNとして、管理機器情報テーブルに記録する。
先にステップS34においてNの値は2になっているので、ステップS37でNの値は3になる。従って、ここではテーブル識別番号3のサーバのラック位置番号は「3」になる。すなわち、テーブル識別番号3のサーバ13は、ラック12の上から3番目に配置されたサーバと判定される。
次に、ステップS38に移行し、管理装置11(対応部18b)は、全てのサーバ13のラック位置番号が決定したか否かを判定する。そして、全てのサーバ13のラック位置番号が決定していないと判定した場合(NOの場合)は、ステップS35に移行して、次のサーバを抽出し、ステップS37において、抽出されたサーバのラック位置番号を決定する。
このように、ステップS35からステップS38のループを繰り返すことにより、管理対象の全サーバ13のラック位置番号が決定し、全サーバ13のラック位置番号が管理機器情報テーブルに記録される。図14は、全サーバ13のラック位置番号を記載した後の管理機器情報テーブルを示している。
ステップS38で管理対象の全サーバ13のラック位置番号が決定したと判定した場合(YESの場合)、管理装置11は処理を終了(正常終了)する。
本実施形態では、サーバ13に標準で実装されている温度センサ15a,15b及びBMC16を使用し、運用サーバ13とそのラック12内の搭載位置とを自動的に対応付ける。この場合、本実施形態では、位置情報を記憶したモジュールや位置情報を取得するセンサ、又はPDU等の特別な装置が不要であり、汎用性が高く、設備コストが比較的少なくてすむという効果を奏する。
管理装置11やサーバ13の性能等に依存するが、本実施形態では1台のサーバ13の位置を決定するのに要する時間は6分間程度(但し、電源投入による起動時間を除く)である。また、複数のラック12において、それらのラック12内に搭載されている電子装置(サーバ13等)の位置を決定する処理を、並行して実施できる。
なお、上述の実施形態では、ラック12の上端(最上段)に配置されたサーバ13の管理ネットワークアドレスが予め判明している場合について説明した。しかし、開示の技術は、ラック12の下端(最下段)に配置されたサーバ13の管理ネットワークアドレスが予め判明している場合も適用できる。その場合、後述する第3の実施形態のように、各サーバ13のラック位置番号は下から順に決定される。
また、上述の実施形態では電子装置が運用サーバの場合について説明したが、電子装置はサーバに限定されるものではなく、電子装置の一部又は全部がストレージ装置又はスイッチ装置等であってもよい。
(第2の実施形態)
図15は、第2の実施形態の情報処理システムの概要を示す模式図である。図15において、図1と同一物には同一符号を付している。
本実施形態では、図15に示すように、ラック12の上端(最上段)にネットワークスイッチ21が搭載されている。そして、ラック12の2段目から6段目に、それぞれ運用サーバ13が搭載されている。
管理装置11は、ネットワークスイッチ21を介して各運用サーバ13に接続されている。ネットワークスイッチ21には、ファン22と、吸気側の温度を検出する温度センサ23aと、サーバ13の温度を検出する温度センサ23bとが設けられている。
以下、説明の便宜上、ネットワークスイッチ21及び運用サーバ13を、併せて電子装置と呼ぶ。
図16〜図18は、第2の実施形態の情報処理システムの制御方法を示すフローチャートである。
なお、ここでは、ネットワーク管理者により、予め各電子装置(ネットワークスイッチ21及びサーバ13)にそれぞれ固有の管理ネットワークアドレスが設定されているものとする。また、メーカーにより、予め電子装置毎にそれぞれ固有のシリアル番号(ID)が設定されており、管理装置11は電子装置にアクセスしてそれらの電子装置からシリアル番号を取得可能であるものとする。
更に、ラック12の上端にはネットワークスイッチ21が配置されていることが判明しており、ネットワークスイッチ21の管理ネットワークアドレスも判明しているものとする。ここでは、ネットワークスイッチ21の管理ネットワークアドレスは「192.168.0.1」であるとする。
まず、ステップS41において、管理装置11は、メモリ19上に管理機器情報テーブルを作成する。管理機器情報テーブルは、例えば図19に示すように、テーブル識別番号、管理ネットワークアドレス、シリアル番号、及びラック位置番号の項目を有する。
次に、ステップS42に移行し、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の管理ネットワークアドレスを取得する。そして、それらの管理ネットワークアドレスを、図19に示すように管理機器情報テーブルに記録する。
図19に示す例では、ネットワークスイッチ21のテーブル識別番号を1としている。また、管理ネットワークアドレスを検出した運用サーバ13に対し、管理ネットワークアドレスの順にテーブル識別番号を2から6まで付与している。
次に、ステップS43に移行し、管理装置13は、ラック12の上端に配置されたネットワークスイッチ21のラック位置番号に1を記録する。
次に、ステップS44に移行し、管理装置11は、ネットワーク20を介して各電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置のシリアル番号(ID)を取得する。そして、図20に示すように、管理機器情報テーブルに、各電子装置のシリアル番号を、テーブル識別番号及び管理ネットワークアドレスと対応付けて記録する。
次に、ステップS45に移行し、管理装置11は、管理対象のサーバ13のうちから1台のサーバ13を選択する。ここでは、管理ネットワークアドレスの順にサーバ13を選択するものとする。従って、最初は管理ネットワークアドレスが「192.168.0.11」(テーブル識別番号2)のサーバ13が選択される。
その後、ステップS46に移行し、サブ処理を実行する。以下、図17を参照してサブ処理について説明する。
まず、ステップS51において、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の吸気温度Ta及び筐体内温度Tiを取得する。
そして、管理装置11は、電子装置毎に、筐体内温度Tiと吸気温度Taとの差分ΔT(=Ti−Ta)を計算して、温度管理情報テーブルをメモリ19上に作成する。
図21は、温度管理情報テーブルの一例を示す図である。この図21に示すように、温度管理情報テーブルでは、テーブル識別番号毎に、電子装置(ネットワークスイッチ21及び運用サーバ13)の吸気温度Ta及び筐体内温度Tiと、それらの差分ΔTとが記録される。
次に、ステップS52に移行し、管理装置11は、ネットワーク20及びBMC16を介して、選択されたサーバ13(最初は、テーブル識別番号2のサーバ)のファン14を停止状態にする。
次に、ステップS53に移行し、管理装置11は、ネットワーク20及びBMC16を介して選択されたサーバ13の電源を投入し、当該サーバ13を動作させる。サーバ13を動作させることにより、当該サーバ13のCPU及びI/Oが発熱して、筐体内温度Tiが上昇する。
次に、ステップS54に移行し、管理装置11は、選択されたサーバ13の差分ΔTが初期値から所定の温度以上(この例では10℃以上)高くなるまで待機(ループ)する。そして、選択されたサーバ13の差分ΔTが初期値から所定の温度以上高くなると、ステップS55に移行する。
ステップS55において、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の吸気温度Ta及び筐体内温度Tiを取得する。また、管理装置11は、各電子装置の筐体内温度Tiと吸気温度Taとの差分ΔTを計算する。そして、管理装置11は、それらの値を温度管理情報テーブルに記憶する。
図22は、テーブル識別番号2のサーバ13を動作させた場合の吸気温度Ta1、筐体内温度Ti1及び差分ΔT1を記録した温度管理情報テーブルを示している。
次に、ステップS56に移行し、管理装置11は、ネットワーク20及びBMC16を介して、選択されたサーバ13のファン14の回転数を最大に制御する。また、ステップS57において、管理装置11は、選択されたサーバ13の電源を遮断する。
次に、ステップS58に移行し、管理装置11は、ステップS53で電源を投入したサーバ13のΔTの値が初期値(動作させる前のΔT)と同程度になるまで待機(ループ)する。そして、電源を投入したサーバ13のΔTの値が初期値と同程度になると、ステップS59に移行し、当該サーバ13のファン14を通常制御(例えば、筐体内温度Tiに応じた回転数の制御)に戻す。そして、サブ処理を終了し、図16に示すフローチャートのステップS47に移行する。
ステップS47において、管理装置11は、管理対象の全サーバ13に対しサブ処理が終了したか否かを判定する。そして、管理対象の全サーバ13に対しサブ処理が終了していないと判定した場合(NOの場合)はステップS45に移行して、サブ処理が終了していないサーバ13のうちから次のサーバ13を選択する。その後、ステップS46において、図17に示すサブ処理(ステップS51〜ステップS59)を実施する。
図23は、1回目及び2回目のサブ処理における吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、特定のサーバ(ステップS45で選択されたサーバ)を動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とを示している。
この図23に示すように、サブ処理を実施する毎に、吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、サーバを動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とが、温度管理情報テーブルに記録される。
一方、ステップS47で管理対象の全サーバ13に対しサブ処理が終了していると判定した場合(YESの場合)は、ステップS48に移行する。そして、管理装置11は、温度管理情報テーブルから温度変化テーブルを作成し、記憶装置17に記憶する。
図24は、温度変化テーブルの一例を示す図である。この図24に示すように、温度変化テーブルには、サブ処理を実行する毎に、特定のサーバ(ステップS45で選択されたサーバ)を動作させた場合の電子装置の差分ΔTの値が記載される。
管理装置11は、温度変化テーブルを作成すると、次に図18のフローチャートに示す処理を開始する。
すなわち、ステップS61において、管理装置11は、記憶装置17からメモリ19に温度変化テーブルを読み出す。また、変数Nの値を1に設定する(N←1)。
次に、ステップS62に移行し、管理装置11は、温度変化テーブルを参照し、ラック12の上端に配置されたネットワークスイッチ21のΔTがしきい値を超えたときに動作させたサーバを抽出する。
本実施形態では、しきい値を、2℃よりも若干低い値としている。図24に示す温度変化テーブルでは、テーブル識別番号2のサーバを動作させた場合に、ネットワークスイッチ21のΔTがしきい値以上変化している。従って、管理装置11は、テーブル識別番号2のサーバを抽出することになる。
次に、ステップS63に移行し、管理装置11は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS64に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS63からステップS64に移行した場合、管理装置11は、N+1を演算して得た値を、新たにNとする(N←N+1)。そして、ステップS62で抽出されたサーバのラック位置番号をNに決定し、管理機器情報テーブルに記録する。
前述したようにNの初期値は1であるので、ステップS64においてNの値は2となる。従って、ここでは、ステップS62で抽出されたテーブル識別番号2のサーバ13のラック位置番号は「2」となる。すなわち、テーブル識別番号2のサーバ13は、ラック12の上から2番目に配置されたサーバと判定される。
次に、ステップS65に移行し、管理装置11は、ステップS64でラック位置番号を決定したサーバ13を動作させた場合に差分ΔTの値がしきい値以上変化したサーバ(但し、ラック位置番号が未決定のサーバ)を抽出する。
図24に示す温度管理情報テーブルでは、テーブル識別番号2のサーバを動作させた場合に、テーブル識別番号6のサーバの差分ΔTの値がしきい値以上変化している。従って、ステップS65において抽出されるサーバは、テーブル識別番号6のサーバとなる。
次に、ステップS66に移行し、管理装置11は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS67に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS66からステップS67に移行した場合、管理装置11は、N+1を演算して得た値を新たにNに設定する(N←N+1)。そして、ステップS65で抽出されたサーバのラック位置番号をNとして、管理機器情報テーブルに記録する。
先にステップS64においてNの値は2になっているので、ステップS67でNの値は3になる。従って、ここではテーブル識別番号6のサーバのラック位置番号は「3」になる。すなわち、テーブル識別番号6のサーバ13は、ラック12の上から3番目に配置されたサーバと判定される。
次に、ステップS68に移行し、管理装置11は、全てのサーバ13のラック位置番号が決定したか否かを判定する。そして、全てのサーバ13のラック位置番号が決定していないと判定した場合(NOの場合)は、ステップS65に移行して、次のサーバを抽出し、ステップS67において、抽出されたサーバのラック位置番号を決定する。
このように、ステップS65からステップS68のループを繰り返すことにより、管理対象の全サーバ13のラック位置番号が決定し、全サーバ13のラック位置番号が管理機器情報テーブルに記録される。図25は、全サーバ13のラック位置番号を記載した後の管理機器情報テーブルを示している。
ステップS68で管理対象の全サーバ13のラック位置番号が決定したと判定した場合(YESの場合)、管理装置11は処理を終了(正常終了)する。
本実施形態においても、サーバ13に標準で実装されている温度センサ15a,15b及びBMC16を使用し、運用サーバ13とそのラック12内の搭載位置とを自動的に対応付ける。この場合、本実施形態では、位置情報を記憶したモジュールや位置情報を取得するセンサ、又はPDU等の特別な装置が不要であり、汎用性が高く、設備コストが比較的少なくてすむという効果を奏する。
(第3の実施形態)
図26は、第3の実施形態の情報処理システムの概要を示す模式図である。図26において、図15と同一物には同一符号を付している。
本実施形態では、図26に示すように、ラック12の下端(6段目)にネットワークスイッチ21が搭載されている。そして、ラック12の1段目(上端)から5段目に、それぞれ運用サーバ13が搭載されている。
図27〜図29は、第3の実施形態の情報処理システムの制御方法を示すフローチャートである。
なお、ここでも、ネットワーク管理者により、予め各電子装置(ネットワークスイッチ21及びサーバ13)にそれぞれ固有の管理ネットワークアドレスが設定されているものとする。また、メーカーにより、予め電子装置毎にそれぞれ固有のシリアル番号(ID)が設定されており、管理装置11は電子装置にアクセスしてそれらの電子装置からシリアル番号を取得可能であるものとする。
更に、ラック12の下端にはネットワークスイッチ21が配置されていることが判明しており、ネットワークスイッチ21の管理ネットワークアドレスも判明しているものとする。ネットワークスイッチ21の管理ネットワークアドレスは「192.168.0.1」であるとする。
まず、ステップS71において、管理装置11は、メモリ19上に管理機器情報テーブルを作成する。管理機器情報テーブルは、例えば図30に示すように、テーブル識別番号、管理ネットワークアドレス、シリアル番号、及びラック位置番号の項目を有する。
次に、ステップS72に移行し、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の管理ネットワークアドレスを取得する。そして、それらの管理ネットワークアドレスを、図30に示すように管理機器情報テーブルに記録する。
図30に示す例では、ネットワークスイッチ21のテーブル識別番号を1としている。また、管理ネットワークアドレスを検出した運用サーバ13に対し、管理ネットワークアドレスの順にテーブル識別番号を2から6まで付与している。
次に、ステップS73に移行し、管理装置13は、ラック12の下端(6段目)に配置されたネットワークスイッチ21のラック位置番号に6を記録する。
次に、ステップS74に移行し、管理装置11は、ネットワーク20を介して各電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置のシリアル番号(ID)を取得する。そして、図31に示すように、管理機器情報テーブルに、各電子装置のシリアル番号を、テーブル識別番号及び管理ネットワークアドレスと対応付けて記録する。
次に、ステップS75に移行し、管理装置11は、管理対象のサーバ13のうちから1台のサーバ13を選択する。ここでは、管理ネットワークアドレスの順にサーバ13を選択するものとする。従って、最初は管理ネットワークアドレスが「192.168.0.11」(テーブル識別番号2)のサーバ13が選択される。
その後、ステップS76に移行し、サブ処理を実行する。以下、図28を参照してサブ処理について説明する。
まず、ステップS81において、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の吸気温度Ta及び筐体内温度Tiを取得する。
そして、管理装置11は、電子装置毎に、筐体内温度Tiと吸気温度Taとの差分ΔT(=Ti−Ta)を計算して、温度管理情報テーブルをメモリ19上に作成する。
図32は、温度管理情報テーブルの一例を示す図である。この図32に示すように、温度管理情報テーブルでは、テーブル識別番号毎に、電子装置(ネットワークスイッチ21及び運用サーバ13)の吸気温度Ta及び筐体内温度Tiと、それらの差分ΔTとが記録される。
次に、ステップS82に移行し、管理装置11は、ネットワーク20及びBMC16を介して、選択されたサーバ13(最初は、テーブル識別番号2のサーバ)のファン14を停止状態にする。
次に、ステップS83に移行し、管理装置11は、ネットワーク20及びBMC16を介して選択されたサーバ13の電源を投入し、当該サーバ13を動作させる。サーバ13を動作させることにより、当該サーバ13のCPU及びI/Oが発熱して、筐体内温度Tiが上昇する。
次に、ステップS84に移行し、管理装置11は、選択されたサーバ13の差分ΔTが初期値から所定の温度以上(この例では10℃以上)高くなるまで待機(ループ)する。そして、選択されたサーバ13の差分ΔTが初期値から所定の温度以上高くなると、ステップS85に移行する。
ステップS85において、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の吸気温度Ta及び筐体内温度Tiを取得する。また、管理装置11は、各電子装置の筐体内温度Tiと吸気温度Taとの差分ΔTを計算する。そして、管理装置11は、それらの値を温度管理情報テーブルに記憶する。
図33は、テーブル識別番号2のサーバ13を動作させた場合の吸気温度Ta1、筐体内温度Ti1及び差分ΔT1を記録した温度管理情報テーブルを示している。
次に、ステップS86に移行し、管理装置11は、ネットワーク20及びBMC16を介して、選択されたサーバ13のファン14の回転数を最大に制御する。また、ステップS87において、管理装置11は、選択されたサーバ13の電源を遮断する。
次に、ステップS88に移行し、管理装置11は、ステップS83で動作させたサーバ13のΔTの値が初期値(動作させる前のΔT)と同程度になるまで待機(ループ)する。そして、動作させたサーバ13のΔTの値が初期値と同程度になると、ステップS89に移行し、当該サーバ13のファン14を通常制御(例えば、筐体内温度Tiに応じた回転数の制御)に戻す。そして、サブ処理を終了し、図27に示すフローチャートのステップS77に移行する。
ステップS77において、管理装置11は、管理対象の全サーバ13に対しサブ処理が終了したか否かを判定する。そして、管理対象の全サーバ13に対しサブ処理が終了していないと判定した場合(NOの場合)はステップS75に移行して、サブ処理が終了していないサーバ13のうちから次のサーバ13を選択する。その後、ステップS76において、図28に示すサブ処理(ステップS81〜ステップS89)を実施する。
図34は、1回目及び2回目のサブ処理における吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、特定のサーバ(ステップS75で選択されたサーバ)を動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とを示している。
この図34に示すように、サブ処理を実施する毎に、吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、サーバを動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とが、温度管理情報テーブルに記録される。
一方、ステップS77で管理対象の全サーバ13に対しサブ処理が終了していると判定した場合(YESの場合)は、ステップS78に移行する。そして、管理装置11は、温度管理情報テーブルから温度変化テーブルを作成し、記憶装置17に記憶する。
図35は、温度変化テーブルの一例を示す図である。この図35に示すように、温度変化テーブルには、サブ処理を実行する毎に、特定のサーバ(ステップS75で選択されたサーバ)を動作させた場合の電子装置の差分ΔTの値が記載される。
管理装置11は、温度変化テーブルを作成すると、次に図29のフローチャートに示す処理を開始する。
すなわち、ステップS91において、管理装置11は、記憶装置17からメモリ19に温度変化テーブルを読み出す。また、変数Nの値を6に設定する(N←6)。
次に、ステップS92に移行し、管理装置11は、温度変化テーブルを参照し、ラック12の下端に配置されたネットワークスイッチ21のΔTがしきい値を超えたときに動作させたサーバを抽出する。
本実施形態では、しきい値を、2℃よりも若干低い値としている。図35に示す温度変化テーブルでは、テーブル識別番号3のサーバを動作させた場合に、ネットワークスイッチ21(テーブル識別番号1)のΔTがしきい値以上変化している。従って、管理装置11は、テーブル識別番号3のサーバを抽出することになる。
次に、ステップS93に移行し、管理装置11は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS94に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS93からステップS94に移行した場合、管理装置11は、N−1を演算して得た値を、新たにNとする(N←N−1)。そして、ステップS92で抽出されたサーバのラック位置番号をNに決定し、管理機器情報テーブルに記録する。
前述したようにNの初期値は6であるので、ステップS94においてNの値は5となる。従って、ここでは、ステップS92で抽出されたテーブル識別番号3のサーバ13のラック位置番号は「5」となる。すなわち、テーブル識別番号3のサーバ13は、ラック12の上から5番目に配置されたサーバと判定される。
次に、ステップS95に移行し、管理装置11は、ステップS94でラック位置番号を決定したサーバ13を動作させた場合に差分ΔTの値がしきい値以上変化したサーバ(但し、ラック位置番号が未決定のサーバ)を抽出する。
図35に示す温度管理情報テーブルでは、テーブル識別番号3のサーバを動作させた場合に、テーブル識別番号5のサーバの差分ΔTの値がしきい値以上変化している。従って、ステップS95において抽出されるサーバは、テーブル識別番号5のサーバとなる。
次に、ステップS96に移行し、管理装置11は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS97に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS96からステップS97に移行した場合、管理装置11は、N−1を演算して得た値を新たにNに設定する(N←N−1)。そして、ステップS95で抽出されたサーバのラック位置番号をNとして、管理機器情報テーブルに記録する。
先にステップS94においてNの値は5になっているので、ステップS97でNの値は4になる。従って、ここではテーブル識別番号5のサーバのラック位置番号は「4」になる。すなわち、テーブル識別番号5のサーバ13は、ラック12の上から4番目に配置されたサーバと判定される。
次に、ステップS98に移行し、管理装置11は、全てのサーバ13のラック位置番号が決定したか否かを判定する。そして、全てのサーバ13のラック位置番号が決定していないと判定した場合(NOの場合)は、ステップS95に移行して、次のサーバを抽出し、ステップS97において、抽出されたサーバのラック位置番号を決定する。
このように、ステップS95からステップS98のループを繰り返すことにより、管理対象の全サーバ13のラック位置番号が決定し、全サーバ13のラック位置番号が管理機器情報テーブルに記録される。図36は、全サーバ13のラック位置番号を記載した後の管理機器情報テーブルを示している。
ステップS98で管理対象の全サーバ13のラック位置番号が決定したと判定した場合(YESの場合)、管理装置11は処理を終了(正常終了)する。
本実施形態においても、サーバ13に標準で実装されている温度センサ15a,15b及びBMC16を使用し、運用サーバ13とそのラック12内の搭載位置とを自動的に対応付ける。この場合、本実施形態では、位置情報を記憶したモジュールや位置情報を取得するセンサ、又はPDU等の特別な装置が不要であり、汎用性が高く、設備コストが比較的少なくてすむという効果を奏する。
(第4の実施形態)
図37は、第4の実施形態の情報処理システムの概要を示す模式図である。図37において、図15と同一物には同一符号を付している。
本実施形態では、図37に示すように、ラック12の中段にネットワークスイッチ21が搭載されている。そして、それ以外の段にはそれぞれ運用サーバ13が搭載されている。
管理装置11は、ネットワークスイッチ21を介して各運用サーバ13に接続されている。ネットワークスイッチ21には、ファン22と、吸気側の温度を検出する温度センサ23aと、サーバ13の温度を検出する温度センサ23bとが設けられている。
図38〜図41は、第4の実施形態の情報処理システムの制御方法を示すフローチャートである。
なお、ここでも、ネットワーク管理者により、予め各電子装置(ネットワークスイッチ21及びサーバ13)にそれぞれ固有の管理ネットワークアドレスが設定されているものとする。また、メーカーにより、予め電子装置毎にそれぞれ固有のシリアル番号(ID)が設定されており、管理装置11は電子装置にアクセスしてそれらの電子装置からシリアル番号を取得可能であるものとする。
更に、ラック12の上端(最上段)に配置されている運用サーバ13の管理ネットワークアドレスは判明しているものとする。ここでは、ラック12の上端(最上段)に配置されている運用サーバ13の管理ネットワークアドレスは「192.168.0.11」であるとする。
まず、ステップS101において、管理装置11は、メモリ19上に管理機器情報テーブルを作成する。管理機器情報テーブルは、例えば図42に示すように、テーブル識別番号、管理ネットワークアドレス、シリアル番号、及びラック位置番号の項目を有する。
次に、ステップS102に移行し、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の管理ネットワークアドレスを取得する。そして、それらの管理ネットワークアドレスを、図42に示すように管理機器情報テーブルに記録する。
次に、ステップS103に移行し、管理装置13は、図43に示すように、ラック12の上端に配置された運用サーバ13のラック位置番号に1を記録する。前述したように、ラック12の上端に配置された運用サーバ13の管理ネットワークアドレスは、予め判明している。図43の管理機器情報テーブルでは、テーブル識別番号2のサーバ13がラック12の上端に配置されたサーバである。
次に、ステップS104に移行し、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置のシリアル番号(ID)を取得する。そして、図43に示すように、管理機器情報テーブルに、各電子装置のシリアル番号を、テーブル識別番号及び管理ネットワークアドレスと対応付けて記録する。
次に、ステップS105に移行し、管理装置11は、管理対象のサーバ13のうちから1台のサーバ13を選択する。ここでは、管理ネットワークアドレスの順にサーバ13を選択するものとする。従って、最初は管理ネットワークアドレスが「192.168.0.11」(テーブル識別番号2)のサーバ13が選択される。
その後、ステップS46に移行し、サブ処理を実行する。以下、図39を参照してサブ処理について説明する。
まず、ステップS111において、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の吸気温度Ta及び筐体内温度Tiを取得する。
そして、管理装置11は、電子装置毎に、筐体内温度Tiと吸気温度Taとの差分ΔT(=Ti−Ta)を計算して、温度管理情報テーブルをメモリ19上に作成する。
図44は、温度管理情報テーブルの一例を示す図である。この図44に示すように、温度管理情報テーブルでは、テーブル識別番号毎に、電子装置(ネットワークスイッチ21及び運用サーバ13)の吸気温度Ta及び筐体内温度Tiと、それらの差分ΔTとが記録される。
次に、ステップS112に移行し、管理装置11は、ネットワーク20及びBMC16を介して、選択されたサーバ13(最初は、テーブル識別番号2のサーバ)のファン14を停止状態にする。
次に、ステップS113に移行し、管理装置11は、ネットワーク20及びBMC16を介して選択されたサーバ13の電源を投入し、当該サーバ13を動作させる。サーバ13を動作させることにより、当該サーバ13のCPU及びI/Oが発熱して、筐体内温度Tiが上昇する。
次に、ステップS114に移行し、管理装置11は、選択されたサーバ13の差分ΔTが初期値から所定の温度以上(この例では10℃以上)高くなるまで待機(ループ)する。そして、選択されたサーバ13の差分ΔTが初期値から所定の温度以上高くなると、ステップS115に移行する。
ステップS115において、管理装置11は、ネットワーク20を介して管理対象の電子装置(ネットワークスイッチ21及び運用サーバ13)にアクセスし、各電子装置の吸気温度Ta及び筐体内温度Tiを取得する。また、管理装置11は、各電子装置の筐体内温度Tiと吸気温度Taとの差分ΔTを計算する。そして、管理装置11は、それらの値を温度管理情報テーブルに記憶する。
図45は、テーブル識別番号2のサーバ13を動作させた場合の吸気温度Ta1、筐体内温度Ti1及び差分ΔT1を記録した温度管理情報テーブルを示している。
次に、ステップS116に移行し、管理装置11は、ネットワーク20及びBMC16を介して、選択されたサーバ13のファン14の回転数を最大に制御する。また、ステップS117において、管理装置11は、選択されたサーバ13の電源を遮断する。
次に、ステップS118に移行し、管理装置11は、ステップS113で動作させたサーバ13のΔTの値が初期値(動作させる前のΔT)と同程度になるまで待機(ループ)する。そして、動作させたサーバ13のΔTの値が初期値と同程度になると、ステップS119に移行し、当該サーバ13のファン14を通常制御(例えば、筐体内温度Tiに応じた回転数の制御)に戻す。そして、サブ処理を終了し、図38に示すフローチャートのステップS107に移行する。
ステップS107において、管理装置11は、管理対象の全サーバ13に対しサブ処理が終了したか否かを判定する。そして、管理対象の全サーバ13に対しサブ処理が終了していないと判定した場合(NOの場合)はステップS105に移行して、サブ処理が終了していないサーバ13のうちから次のサーバ13を選択する。その後、ステップS106において、図39に示すサブ処理(ステップS111〜ステップS119)を実施する。
図46は、1回目及び2回目のサブ処理における吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、特定のサーバ(ステップS105で選択されたサーバ)を動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とを示している。
この図46に示すように、サブ処理を実施する毎に、吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、サーバを動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とが、温度管理情報テーブルに記録される。
一方、ステップS107で管理対象の全サーバ13に対しサブ処理が終了していると判定した場合(YESの場合)は、ステップS108に移行する。そして、管理装置11は、温度管理情報テーブルから温度変化テーブルを作成し、記憶装置17に記憶する。
図47は、温度変化テーブルの一例を示す図である。この図47に示すように、温度変化テーブルには、サブ処理を実行する毎に、特定のサーバ(ステップS105で選択されたサーバ)を動作させた場合の各電子装置の差分ΔTの値が記載される。
管理装置11は、温度変化テーブルを作成すると、次に図40,図41のフローチャートに示す処理を開始する。
すなわち、ステップS121において、管理装置11は、記憶装置17からメモリ19に温度変化テーブルを読み出す。また、変数Nの値を1に設定する(N←1)。
次に、ステップS122に移行し、管理装置11は、温度変化テーブルを参照し、ラック12の上端に配置されたサーバ13(テーブル識別番号2のサーバ)を動作させた場合にΔTがしきい値を超えた電子装置を抽出する。
本実施形態では、しきい値を、2℃よりも若干低い値としている。図47に示す温度変化テーブルでは、テーブル識別番号2のサーバを動作させた場合に、テーブル識別番号6のサーバ13のΔTがしきい値以上変化している。従って、管理装置11は、テーブル識別番号6のサーバを抽出することになる。
次に、ステップS123に移行し、管理装置11は、抽出された電子装置が1台か否かを判定する。抽出された電子装置が1台の場合(YESの場合)はステップS124に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS123からステップS124に移行した場合、管理装置11は、N+1を演算して得た値を、新たにNとする(N←N+1)。そして、ステップS122で抽出された電子装置のラック位置番号をNに決定し、管理機器情報テーブルに記録する。
前述したようにNの初期値は1であるので、ステップS124においてNの値は2となる。従って、ここでは、ステップS122で抽出されたテーブル識別番号6の電子装置のラック位置番号は「2」となる。すなわち、テーブル識別番号6の電子装置は、ラック12の上から2番目に配置されていると判定される。
次に、ステップS125に移行し、管理装置11は、ステップS122で抽出された電子装置がサーバ13であるか否かを判定する。この判定には、管理ネットワークアドレス又はシリアル番号が使用される。
例えば、管理装置11には、予め運用サーバ13及びネットワークスイッチ21に割り当てられる管理ネットワークアドレスが記憶されている。従って、管理装置11は、管理ネットワークアドレスから、テーブル識別番号6の電子装置は運用サーバ13であると判定できる。ステップS135において、抽出された電子装置がサーバであると判定した場合(YESの場合)、ステップS125からステップS126に移行する。
ステップS126において、管理装置11は、ラック位置番号が決定したサーバ(テーブル識別番号6のサーバ)を動作させた場合に温度変化した電子装置のうち、ラック位置番号が未定の電子装置を抽出する。図47の例では、テーブル識別番号6のサーバ13を動作させた場合に、テーブル識別番号1とテーブル識別番号2の電子装置のΔT値がしきい値以上変化している。このうち、テーブル識別番号2の電子装置のラック位置は「1」に決定されているので、ステップS126において抽出される電子装置はテーブル識別番号1の電子装置となる。
その後、ステップS127において、管理装置11は、抽出された電子装置が1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS128に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS127からステップS128に移行した場合、管理装置11は、N+1を演算して得た値を新たにNに設定する(N←N+1)。そして、ステップS127で抽出された電子装置のラック位置番号をNとして、管理機器情報テーブルに記録する。
先にステップS124においてNの値は2になっているので、ステップS128でNの値は3になる。従って、ここではテーブル識別番号1の電子装置のラック位置番号は「3」になる。すなわち、テーブル識別番号1の電子装置は、ラック12の上から3番目に配置されていると判定される。
次に、ステップS129に移行し、管理装置11は、全ての電子装置のラック位置番号が決定したか否かを判定する。そして、全ての電子装置のラック位置番号が決定していないと判定した場合(NOの場合)は、ステップS125に移行して、次の電子装置を抽出する。
今までの説明では、テーブル識別番号1,6.2の電子装置のラック位置番号は決定しているものの、テーブル識別番号3,4,5の電子装置のラック位置番号が決定していない。従って、ステップS129からステップS125に移行する。
なお、ステップS129で全ての電子装置のラック位置番号が決定していると判定した場合、ネットワークスイッチ21が検出されていないことになるので、何らかの異常が発生したものとして処理を終了(異常終了)する。
ステップS126でテーブル識別番号1の電子装置を抽出し、ステップS129からステップS125に移行した場合、管理装置11では管理ネットワークアドレス又はシリアル番号から、抽出された電子装置がネットワークスイッチ21であると判定する。従って、ステップS125からステップS131に移行する。
ステップS131において、管理装置11は、ラック位置番号が未定のサーバ13であって、テーブル識別番号1の電子装置(ネットワークスイッチ21)のΔTにしきい値以上の変化を与えたサーバを抽出する。図47に示す例では、テーブル識別番号4とテーブル識別番号6のサーバがテーブル識別番号1の電子装置のΔTにしきい値以上の変化を与えている。そのうち、テーブル識別番号6のサーバのラック位置番号は既に「2」に決定しているので、ステップS131ではテーブル識別番号4のサーバが抽出される。
次に、ステップS132に移行し、管理装置11は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS133に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS133において、管理装置11は、N+1を演算して得た値を新たにNに設定する(N←N+1)。そして、ステップS132で抽出されたサーバのラック位置番号をNとして、管理機器情報テーブルに記録する。
先にステップS128においてNの値は3になっているので、ステップS133でNの値は4になる。従って、テーブル識別番号4のサーバのラック位置番号は「4」になる。
次に、ステップS134に移行し、管理装置11は、ステップS133でラック位置番号を決定したサーバを動作させた場合にΔTの値がしきい値以上変化した電子装置(但し、ラック位置意番号が未決定の電子装置)を抽出する。
図47に示す管理情報テーブルでは、テーブル識別番号1の電子装置とテーブル識別番号5の電子装置とが、テーブル識別番号4のサーバを動作させた場合にΔTの値がしきい値以上変化している。このうち、テーブル識別番号1の電子装置のラック位置番号は既に「3」に決定しているので、ステップS134で抽出される電子装置は、テーブル識別番号5の電子装置となる。
次に、ステップS135に移行し、管理装置11は、抽出された電子装置が1台か否かを判定する。抽出された電子装置が1台の場合(YESの場合)はステップS136に移行し、抽出された電子装置が0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
次に、ステップS136において、管理装置11は、N+1を演算して得た値を新たにNに設定する(N←N+1)。そして、ステップS134で抽出された電子装置のラック位置番号をNとして、管理機器情報テーブルに記録する。
先にステップS133においてNの値は4になっているので、ステップS136でNの値は5になる。従って、テーブル識別番号5の電子装置(サーバ13)のラック位置番号は「5」になる。
次に、ステップS137に移行し、管理装置11は、管理対象の全ての電子装置のラック位置番号が決定したか否かを判定する。そして、管理対象の全ての電子装置のラック位置番号が決定していないと判定した場合(NOの場合)は、ステップS134に移行して、次にラック位置番号を決定する電子装置を抽出し、ステップS136においてラック位置番号を決定する。このようにして、管理対象の全ての電子装置のラック位置が決定する。管理装置は、ステップS137で管理対象の全ての電子装置のラック位置が決定したと判定すると、処理を終了(正常終了)する。
図48は、電子装置(ネットワークスイッチ21及び運用サーバ13)のラック位置番号を記載した後の管理機器情報テーブルを示している。
本実施形態においても、サーバ13に標準で実装されている温度センサ15a,15b及びBMC16を使用し、運用サーバ13とそのラック12内の搭載位置とを自動的に対応付ける。この場合、本実施形態では、位置情報を記憶したモジュールや位置情報を取得するセンサ、又はPDU等の特別な装置が不要であり、汎用性が高く、設備コストが比較的少なくてすむという効果を奏する。
(第5の実施形態)
図49は、第5の実施形態の情報処理システムの概要を示す模式図である。図49において、図1と同一物には同一符号を付している。
本実施形態では、図47に示すように、ラック12内に、5台のサーバ13が横方向に並んで搭載されている。各サーバ13には、第1の実施形態と同様に、ファン14、温度センサ15a,15b及びBMC16(図1参照)が設けられている。管理装置11は、それらのサーバ13とネットワーク20を介して接続されている。
図50〜図52は、第5の実施形態の情報処理システムの制御方法を示すフローチャートである。
なお、ここでも、ネットワーク管理者により、予め運用サーバ13毎にそれぞれ固有の管理ネットワークアドレスが設定されているものとする。また、メーカーにより、予め運用サーバ13毎にそれぞれ固有のシリアル番号(ID)が設定されており、管理装置11はBMC16を介して運用サーバ13からシリアル番号を取得可能であるものとする。更に、ラック12の左端に配置されている運用サーバ13の管理ネットワークアドレスも、予め判明しているものとする。
まず、ステップS141において、管理装置11は、メモリ19上に管理機器情報テーブルを作成する。管理機器情報テーブルは、例えば図53に示すように、テーブル識別番号、管理ネットワークアドレス、シリアル番号、及びラック位置番号の項目を有する。
次に、ステップS142に移行し、管理装置11は、ネットワーク20を介して管理対象の全サーバ13にアクセスし、各サーバ13の管理ネットワークアドレスを取得する。そして、それらの管理ネットワークアドレスを、図53に示すように管理機器情報テーブルに記録する。
図53に示す例では、管理ネットワークアドレスを検出した運用サーバ13に対し、管理ネットワークアドレスの順にテーブル識別番号を付与している。
次に、ステップS143に移行し、管理装置11は、図8に示すように、ラック12の左端に配置された運用サーバ13のラック位置番号に1を記録する。
ラック位置番号1は、ラック12の左端に配置されていることを示している。前述したように、ラック12の左端に配置された運用サーバ13の管理ネットワークアドレスは、予め判明している。この例では、管理ネットワークアドレスが「192.168.0.11」の運用サーバ13が、ラック12の左端に配置されているサーバである。
次に、ステップS144に移行し、管理装置11は、ネットワーク20を介して各運用サーバ13にアクセスし、各サーバ13のシリアル番号(ID)を取得する。そして、図55に示すように、管理機器情報テーブルに、各サーバ13のシリアル番号を、テーブル識別番号及び管理ネットワークアドレスと対応付けて記録する。
次に、ステップS145に移行し、管理装置11は、管理対象のサーバ13のうちから1台のサーバ13を選択する。ここでは、管理ネットワークアドレスの順にサーバ13を選択するものとする。従って、最初は管理ネットワークアドレスが「192.168.0.11」(テーブル識別番号1)のサーバ13が選択される。
その後、ステップS146に移行し、サブ処理を実行する。以下、図51を参照してサブ処理について説明する。
まず、ステップS151において、管理装置11は、ネットワーク20を介して管理対象の全サーバ13にアクセスし、各サーバ13の吸気温度Ta及び筐体内温度Tiを取得する。そして、管理装置11は、運用サーバ13毎に、筐体内温度Tiと吸気温度Taとの差分ΔT(=Ti−Ta)を計算して、温度管理情報テーブルをメモリ19上に作成する。
図56は、温度管理情報テーブルの一例を示す図である。この図56に示すように、温度管理情報テーブルでは、テーブル識別番号毎に、サーバ13の吸気温度Ta及び筐体内温度Tiと、それらの差分ΔTとが記録される。
次に、ステップS152に移行し、管理装置11は、ネットワーク20を介して、選択されたサーバ13(最初は、テーブル識別番号1のサーバ)のファン14を停止状態にする。
次に、ステップS153に移行し、管理装置11は、ネットワーク20を介して選択されたサーバ13の電源を投入し、当該サーバ13を動作させる。サーバ13を動作させることにより、当該サーバ13のCPU及びI/Oが発熱して、筐体内温度Tiが上昇する。
次に、ステップS154に移行し、管理装置11は、選択されたサーバ13の差分ΔTが初期値から所定の温度以上(この例では10℃以上)高くなるまで待機(ループ)する。そして、選択されたサーバ13の差分ΔTが初期値から所定の温度以上高くなると、ステップS155に移行する。
ステップS155において、管理装置11は、ネットワーク20を介して管理対象の全サーバ13にアクセスし、各サーバ13の吸気温度Ta及び筐体内温度Tiを取得する。また、管理装置11は、管理対象の全サーバ13の吸気温度Taと筐体内温度Tiとの差分ΔTを計算する。そして、管理装置11は、それらの値を温度管理情報テーブルに記憶する。
図57は、テーブル識別番号1のサーバ13を動作させた場合の吸気温度Ta1、筐体内温度Ti1及び差分ΔT1を記録した温度管理情報テーブルを示している。
次に、ステップS156に移行し、管理装置11は、ネットワーク20を介して、選択されたサーバ13のファン14の回転数を最大に制御する。また、ステップS157において、管理装置11は、選択されたサーバ13の電源を遮断する。
次に、ステップS158に移行し、管理装置11は、ステップS153で動作させたサーバ13のΔTの値が初期値(動作させる前のΔT)と同程度になるまで待機(ループ)する。そして、動作させたサーバ13のΔTの値が初期値と同程度になると、ステップS159に移行し、当該サーバ13のファン14を通常制御(例えば、筐体内温度Tiに応じた回転数の制御)に戻す。そして、サブ処理を終了し、図50に示すフローチャートのステップS147に移行する。
ステップS147において、管理装置11は、管理対象の全サーバ13に対しサブ処理が終了したか否かを判定する。そして、管理対象の全サーバ13に対しサブ処理が終了していないと判定した場合(NOの場合)はステップS145に移行して、サブ処理が終了していないサーバ13のうちから次のサーバ13を選択する。その後、ステップS146において、図51に示すサブ処理(ステップS151〜ステップS159)を実施する。
図58は、1回目及び2回目のサブ処理における吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、特定のサーバ(ステップS145で選択されたサーバ)を動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とを示している。
この図58に示すように、サブ処理を実施する毎に、吸気温度Ta、筐体内温度Ti及び差分ΔTの初期値と、サーバを動作させた場合の吸気温度Ta、筐体内温度Ti及び差分ΔTの値とが、温度管理情報テーブルに記録される。
一方、ステップS147で管理対象の全サーバ13に対しサブ処理が終了していると判定した場合(YESの場合)は、ステップS148に移行する。そして、管理装置11は、温度管理情報テーブルから温度変化テーブルを作成し、記憶装置17に記憶する。
図59は、温度変化テーブルの一例を示す図である。この図59に示すように、温度変化テーブルには、サブ処理を実行する毎に、特定のサーバ(ステップS145で選択されたサーバ)を動作させた場合の全サーバ13の差分ΔTの値が記載される。
管理装置11は、温度変化テーブルを作成すると、次に図52のフローチャートに示す処理を開始する。
すなわち、ステップS161において、管理装置11は、記憶装置17からメモリ19に温度変化テーブルを読み出す。また、変数Nの値を1に設定する(N←1)。
次に、ステップS162に移行し、管理装置11は、温度変化テーブルを参照し、ラック12の左端に配置されたサーバを動作させた場合に差分ΔTがしきい値以上変化したサーバを抽出する。
本実施形態では、しきい値を、2℃よりも若干低い値としている。図59に示す温度変化テーブルでは、テーブル識別番号1のサーバを動作させた場合に、テーブル識別番号5のサーバの差分ΔTがしきい値以上変化している。従って、管理装置11は、テーブル識別番号5のサーバを抽出することになる。
次に、ステップS163に移行し、管理装置11は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS164に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS163からステップS164に移行した場合、管理装置11は、N+1を演算して得た値を、新たにNとする(N←N+1)。そして、ステップS162で抽出されたサーバのラック位置番号をNに決定し、管理機器情報テーブルに記録する。
前述したようにNの初期値は1であるので、ステップS164においてNの値は2となる。従って、ここでは、ステップS162で抽出されたテーブル識別番号5のサーバ13のラック位置番号は「2」となる。すなわち、テーブル識別番号5のサーバ13は、ラック12の左から2番目に配置されたサーバと判定される。
次に、ステップS165に移行し、管理装置11は、ステップS164でラック位置番号を決定したサーバ13を動作させた場合に差分ΔTの値がしきい値以上変化したサーバ(但し、ラック位置番号が未決定のサーバ)を抽出する。
図59に示す温度管理情報テーブルでは、テーブル識別番号1のサーバとテーブル識別番号3のサーバとが、テーブル識別番号5のサーバを動作させた場合に差分ΔTの値がしきい値以上変化している。このうち、テーブル識別番号1のサーバのラック位置番号は既に「1」に決定しているので、ステップS165において抽出されるサーバは、テーブル識別番号3のサーバとなる。
次に、ステップS166に移行し、管理装置11は、抽出されたサーバが1台か否かを判定する。抽出されたサーバが1台の場合(YESの場合)はステップS167に移行し、抽出されたサーバが0又は2台以上の場合(NOの場合)は、何らかの原因で異常が発生したとして処理を終了(異常終了)する。
ステップS166からステップS167に移行した場合、管理装置11は、N+1を演算して得た値を新たにNに設定する(N←N+1)。そして、ステップS165で抽出されたサーバのラック位置番号をNとして、管理機器情報テーブルに記録する。
先にステップS164においてNの値は2になっているので、ステップS167でNの値は3になる。従って、ここではテーブル識別番号3のサーバのラック位置番号は「3」になる。すなわち、テーブル識別番号3のサーバ13は、ラック12の左から3番目に配置されたサーバと判定される。
次に、ステップS168に移行し、管理装置11は、全てのサーバ13のラック位置番号が決定したか否かを判定する。そして、全てのサーバ13のラック位置番号が決定していないと判定した場合(NOの場合)は、ステップS165に移行して、次のサーバを抽出し、ステップS167において、抽出されたサーバのラック位置番号を決定する。
このように、ステップS165からステップS168のループを繰り返すことにより、管理対象の全サーバ13のラック位置番号が決定し、全サーバ13のラック位置番号が管理機器情報テーブルに記録される。図60は、全サーバ13のラック位置番号を記載した後の管理機器情報テーブルを示している。
ステップS168で管理対象の全サーバ13のラック位置番号が決定したと判定した場合(YESの場合)、管理装置11は処理を終了(正常終了)する。
本実施形態においても、サーバ13に標準で実装されている温度センサ15a,15b及びBMC16を使用し、運用サーバ13とそのラック12内の搭載位置とを自動的に対応付ける。この場合、本実施形態では、位置情報を記憶したモジュールや位置情報を取得するセンサ、又はPDU等の特別な装置が不要であり、汎用性が高く、設備コストが比較的少なくてすむという効果を奏する。
以上の諸実施形態に関し、更に以下の付記を開示する。
(付記1)温度情報を測定する温度センサをそれぞれ備える複数の電子装置と、前記複数の電子装置を制御する管理装置とを有する情報処理システムにおいて、
前記管理装置は、
前記複数の電子装置のうち、いずれか1台の電子装置の電源を投入する制御部と、
前記複数の電子機器の各々が備える前記温度センサからの温度情報を収集する収集部と、
前記収集部が収集した前記複数の電子機器の各々の温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる対応部とを有する情報処理システム。
(付記2)前記複数の電子装置は共通の筐体内に一方向に並んで配置され、
前記識別情報は、前記筐体内における前記電子装置の位置を示す情報であることを特徴とする付記1に記載の情報処理システム。
(付記3)前記制御部は、前記筐体内に一方向に並んで配置された前記複数の電子装置のうち最も外側に配置された電子装置を最初に選択して動作させることを特徴とする付記2に記載の情報処理システム。
(付記4)前記制御部は、
前記電源を投入した電子装置の前記温度センサから前記収集部が収集した温度が所定の温度を超えると、当該電子装置の電源を遮断することを特徴とする付記1乃至3のいずれか1項に記載の情報処理システム。
(付記5)前記複数の電子装置はそれぞれ前記電子装置内にエアーを通流させるファンを有し、
前記制御部は、
前記電源を投入した電子装置が動作している間、前記ファンを停止することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。
(付記6)前記温度センサとして、前記電子装置内に流入するエアーの温度を検出する第1のセンサと、前記電子装置の温度を検出する第2のセンサとを有することを特徴とする付記1乃至5のいずれか1項に記載の情報処理システム。
(付記7)前記複数の電子装置のうちの一部又は全部が、サーバであることを特徴とする付記1乃至6のいずれか1項に記載の情報処理システム。
(付記8)前記複数の電子装置のうちの1つがネットワークスイッチであることを特徴とする付記1乃至6のいずれか1項に記載の情報処理システム。
(付記9)前記筐体内に一方向に並んで配置された前記複数の電子装置のうち最も外側に配置された電子装置がネットワークスイッチであることを特徴とする付記1乃至6のいずれか1項に記載の情報処理システム。
(付記10)前記電子装置は、動作にともなって発熱する発熱部を備えることを特徴とする付記1乃至6のいずれか1項の情報処理システム。
(付記11)複数の電子装置のうちから1台の電子装置を選択し、選択した電子装置の動作を制御する制御部と、
前記複数の電子装置のそれぞれに配置された温度センサから温度情報を収集する収集部と、
前記収集部で収集した前記温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる対応部と
を有することを特徴とする管理装置。
(付記12)温度情報を測定する温度センサをそれぞれ備える複数の電子装置と、前記複数の電子装置を制御する管理装置とを有する情報処理システムの制御方法において、
前記管理装置が有する制御部が、前記複数の電子装置のうち、いずれか1台の電子装置の電源を投入し、
前記管理装置が有する収集部が、前記複数の電子装置の各々が備える温度センサからの温度情報を収集し、
前記管理装置が有する対応部が、前記収集部が収集した前記複数の電子装置の各々の温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる情報処理システムの制御方法。
(付記13)筐体と、
前記筐体内に一方向に並んで配置された複数の電子装置と、
前記複数の電子装置のそれぞれに配置された温度センサと、
前記複数の電子装置に接続して前記複数の電子装置を個別に制御可能な管理装置とを有し、
前記管理装置は、
前記複数の電子装置に接続してそれぞれの電子装置に固有のIDを取得し、前記複数の電子装置から順番に1台の電子装置を選択して選択した電子装置を動作させ、前記温度センサから前記複数の電子装置の温度変化を取得し、その結果に基づいて前記複数の電子装置のIDと前記筐体内における前記電子装置の位置とを対応させる
ことを特徴とする情報処理システム。
(付記14)筐体と、前記筐体内に一方向に並んで配置された複数の電子装置と、前記複数の電子装置のそれぞれに配置された温度センサと、前記複数の電子装置に接続して前記複数の電子装置を個別に制御可能な管理装置とを有する情報システムの制御方法であって、
前記管理装置が、前記複数の電子装置に接続してそれぞれの電子装置に固有のIDを取得する工程と、
前記管理装置が、前記複数の電子装置から順番に1台の電子装置を選択する工程と、
前記管理装置が、前記選択した電子装置を動作させ、前記温度センサから前記複数の電子装置の温度変化を取得する工程と、
前記管理装置が、取得した前記複数の電子装置の温度変化に基づいて前記複数の電子装置のIDと前記筐体内における前記電子装置の位置とを対応させる工程と、
を有することを特徴とする情報処理システムの制御方法。
11…管理装置、11a…CPU、12…ラック、13…運用サーバ、14,22…ファン、15a,15b,23a,23b…温度センサ、16…BMC、17…記憶装置、18a…制御部、18b…収集部、18c…対応部、19…メモリ、20…ネットワーク、21…ネットワークスイッチ。

Claims (7)

  1. 温度情報を測定する温度センサをそれぞれ備える複数の電子装置と、前記複数の電子装置を制御する管理装置とを有する情報処理システムにおいて、
    前記管理装置は、
    前記複数の電子装置のうち、いずれか1台の電子装置の電源を投入する制御部と、
    前記複数の電子機器の各々が備える前記温度センサからの温度情報を収集する収集部と、
    前記収集部が収集した前記複数の電子機器の各々の温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる対応部とを有する情報処理システム。
  2. 前記複数の電子装置は共通の筐体内に一方向に並んで配置され、
    前記識別情報は、前記筐体内における前記電子装置の位置を示す情報であることを特徴とする請求項1に記載の情報処理システム。
  3. 前記制御部は、
    前記電源を投入した電子装置の前記温度センサから前記収集部が収集した温度が所定の温度を超えると、当該電子装置の電源を遮断することを特徴とする請求項1又は2に記載の情報処理システム。
  4. 前記複数の電子装置はそれぞれ前記電子装置内にエアーを通流させるファンを有し、
    前記制御部は、
    前記電源を投入した電子装置が動作している間、前記ファンを停止することを特徴とする請求項1乃至3のいずれか1項に記載の情報処理システム。
  5. 前記電子装置は、動作にともなって発熱する発熱部を備えることを特徴とする請求項1乃至4のいずれか1項の情報処理システム。
  6. 複数の電子装置のうちから1台の電子装置を選択し、選択した電子装置の動作を制御する制御部と、
    前記複数の電子装置のそれぞれに配置された温度センサから温度情報を収集する収集部と、
    前記収集部で収集した前記温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる対応部と
    を有することを特徴とする管理装置。
  7. 温度情報を測定する温度センサをそれぞれ備える複数の電子装置と、前記複数の電子装置を制御する管理装置とを有する情報処理システムの制御方法において、
    前記管理装置が有する制御部が、前記複数の電子装置のうち、いずれか1台の電子装置の電源を投入し、
    前記管理装置が有する収集部が、前記複数の電子装置の各々が備える温度センサからの温度情報を収集し、
    前記管理装置が有する対応部が、前記収集部が収集した前記複数の電子装置の各々の温度情報の変化に基づいて、各電子装置と、各電子装置をそれぞれ識別する識別情報とを対応させる情報処理システムの制御方法。
JP2015092495A 2015-04-30 2015-04-30 情報処理システム及び情報処理システムの制御方法 Pending JP2016212472A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015092495A JP2016212472A (ja) 2015-04-30 2015-04-30 情報処理システム及び情報処理システムの制御方法
US15/071,843 US20160324038A1 (en) 2015-04-30 2016-03-16 Control method, information processing system, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015092495A JP2016212472A (ja) 2015-04-30 2015-04-30 情報処理システム及び情報処理システムの制御方法

Publications (1)

Publication Number Publication Date
JP2016212472A true JP2016212472A (ja) 2016-12-15

Family

ID=57205441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015092495A Pending JP2016212472A (ja) 2015-04-30 2015-04-30 情報処理システム及び情報処理システムの制御方法

Country Status (2)

Country Link
US (1) US20160324038A1 (ja)
JP (1) JP2016212472A (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7877590B2 (en) * 2007-08-13 2011-01-25 International Business Machines Corporation Consistent data storage subsystem configuration replication
US9274805B2 (en) * 2012-02-24 2016-03-01 Qualcomm Incorporated System and method for thermally aware device booting

Also Published As

Publication number Publication date
US20160324038A1 (en) 2016-11-03

Similar Documents

Publication Publication Date Title
CN104863881B (zh) 电子设备中风扇转速的控制方法及装置
DK2985563T3 (en) Apparatus for controlling a cooling system
CN104572399B (zh) 一种温度控制方法及电子设备
US6881142B1 (en) Intelligent networked fan assisted tiles for adaptive thermal management of thermally sensitive rooms
US7673132B2 (en) Multi-tiered boot list
CN104182017B (zh) 一种服务器的智能散热控制系统及控制方法
US10642770B2 (en) Building management system with dynamic master controller selection
EP1875139B1 (en) Intelligent fan assisted tiles for adaptive environmental management
US10375854B2 (en) Liquid cooling system and control method thereof
US20130090769A1 (en) Methods of operating an hvac system, an hvac system and a controller therefor employing a self-check scheme and predetermined operating procedures associated with operating units of an hvac system
TW201743210A (zh) 風扇故障偵測及回報
JP2013165270A (ja) サーバーの温度制御システム
CN106155813B (zh) 管理计算系统中的计算设备
JP5874484B2 (ja) 処理システム、機器管理装置、及びプログラム
US20130135820A1 (en) Server rack system for managing fan rotation speed
JP2019036939A (ja) 運用データをネットワーク装置から決定する方法、及び運用データをネットワーク装置へ送信する方法
US20220408590A1 (en) Fan controller for fans of a multi-node computer system
CN115666097A (zh) 机房温度控制方法及装置、存储介质及电子设备
JP6589299B2 (ja) 冷却制御装置、回路基板、冷却方法及びプログラム
JP2016212472A (ja) 情報処理システム及び情報処理システムの制御方法
TWI630325B (zh) 機櫃風扇控制方法及模組
US11748674B2 (en) System and method for health reporting in a data center
CN111059728B (zh) 一种空调控制方法、装置、存储介质及空调
US20130145189A1 (en) Server system capable of decreasing power consumption and method thereof
JP7392104B2 (ja) ファン制御装置および設定方法