JP5874484B2 - 処理システム、機器管理装置、及びプログラム - Google Patents

処理システム、機器管理装置、及びプログラム Download PDF

Info

Publication number
JP5874484B2
JP5874484B2 JP2012068350A JP2012068350A JP5874484B2 JP 5874484 B2 JP5874484 B2 JP 5874484B2 JP 2012068350 A JP2012068350 A JP 2012068350A JP 2012068350 A JP2012068350 A JP 2012068350A JP 5874484 B2 JP5874484 B2 JP 5874484B2
Authority
JP
Japan
Prior art keywords
server
information
electronic device
rack
connection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012068350A
Other languages
English (en)
Other versions
JP2013200690A (ja
Inventor
児玉 宏喜
宏喜 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012068350A priority Critical patent/JP5874484B2/ja
Priority to US13/740,716 priority patent/US9253039B2/en
Publication of JP2013200690A publication Critical patent/JP2013200690A/ja
Application granted granted Critical
Publication of JP5874484B2 publication Critical patent/JP5874484B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0866Checking the configuration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/004Error avoidance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements

Description

本発明は、サーバ等の処理を行う電子機器をネットワーク(ネットワーク機器)に接続して用いるための技術に関する。
近年、サーバ等の処理を行う電子機器を設置・運用する施設(例えばデータセンター。以降、その施設の総称として「データセンター」を用いる)が増えている。通常、データセンターは、外部からの利用が想定されている。それにより、データセンターは、外部とネットワークを介して接続され、データセンター内に設置された各サーバもネットワークと接続されている。現在、大規模のデータセンターでは、数千〜数万台のサーバが運用・管理されている。
多数のサーバを設置する場合、単位面積当たりのサーバの設置数はより多くすることが望まれる。このことから、データセンターでは、複数台のサーバを収納可能な収納装置(例えばラック。以降、その収容装置の総称として「ラック」を用いる)が用いられるのが普通となっている。そのラックには、収納されたサーバと接続させるネットワーク機器(以降「スイッチ」と表記)も搭載されるのが普通である。
データセンターでは、顧客のサーバを新たに預かる、或いは顧客にサーバを新たに貸し出す、といった理由から、サーバの増設を行う場合がある。従来、サーバの増設、つまり新たなサーバの設置は、ラック単位で行われていた。これは、誤った配線により、運用(動作)中のサーバが使用するネットワークにトラブルを発生させないようにするためである。言い換えれば、運用中のサーバによるサービスが提供できなくなる状況となるのを回避するためである。それにより、従来は、使用中のネットワークとは切り離した状態で、ラックの設置、設置したラックへのサーバの収納(搭載)、収納したサーバの配線(サーバとネットワーク機器等との間のケーブルによる接続)、等を行っていた。実際のネットワークとの接続は、ラック単位でサーバの配線が適切か否かを確認する試験を行い、その試験によって、その配線が適切と確認できた場合に行うようになっているのが普通である。
データセンターでのサーバの設置は、基本的に顧客に依存する。つまり、既存の各ラックに収納されているサーバの種類、及びその数は、各顧客からの要求、及びその経緯に依存する。新たに設置するラックに収納するサーバの種類、及びその数も、顧客からの要求に依存する。このようなことから、ラック単位でのサーバの増設は、単位面積当たりのサーバの設置数、つまり設置効率(データセンターにおける空間利用効率)を大きく低下させる可能性が高い。その設置効率の低下を抑えるうえでは、運用中のサーバが使用するネットワークにトラブルが発生しないようにしつつ、サーバを個別に設置することが望まれる。
WO2005/006190 特開2003−303019号公報 特開2008−97650号公報
1側面では、本発明は、運用中の電子機器(サーバ等)が使用するネットワークにトラブルが発生しないように電子機器を個別に設置するための技術を提供することを目的とする。
本発明を適用した1システムでは、処理を実行させる電子機器をケーブルによりネットワーク機器に接続させることを前提とし、新たに設置すべき電子機器である第1の電子機器を設置する場合に、該第1の電子機器をケーブルにより接続させるべきネットワーク機器の接続箇所を表す接続情報を取得する情報取得手段と、第1の電子機器とケーブルにより接続されたネットワーク機器の接続箇所を特定する接続箇所特定手段と、情報取得手段が取得した接続情報を参照し、接続箇所特定手段により特定されたネットワーク機器の接続箇所が適切か否か判定する設置判定手段と、を具備する。
本発明を適用した場合には、運用中の電子機器(サーバ等)が使用するネットワークにトラブルが発生しないように電子機器を個別に設置することができる。
本実施形態による処理システムの構成例を説明する図である。 ラックの構成を説明する図である。 新たに設置されるサーバを特定するための方法を説明する図である。 PDUの構成例を説明する図である。 サーバの構成例を説明する図である。 サーバ情報データベースの内容例を説明する図である。 配置管理情報データベースの内容例を説明する図である。 新たにサーバを設置する場合に、コンソール(管理者)、ラック中央管理装置、ラック管理装置、情報読取装置、スイッチ、新たに設置されるサーバ、PDU、及び保守者がそれぞれ行う動作の流れを表すシーケンス図である。 新たにサーバを設置する場合に、コンソール(管理者)、ラック中央管理装置、ラック管理装置、情報読取装置、スイッチ、新たに設置されるサーバ、PDU、及び保守者がそれぞれ行う動作の流れを表すシーケンス図である(続き)。 配置決定処理のフローチャートである。 本実施形態によるサーバの配置の決定方法を説明する図である。
以下、本発明の実施形態について、図面を参照しながら詳細に説明する。
図1は、本実施形態による処理システムの構成例を説明する図である。
本実施形態による処理システムは、サーバが多数、設置される施設(データセンター)に構築された、そのサーバを用いてサービスを提供するためのシステムである。図1に表すように、その処理システムは、ラック中央管理装置1、複数のラック2(2−1〜2−N)、ネットワーク3、空調設備4、及びコンソール5を備えている。
各ラック2は、ラック管理装置20、PDU(Power Distribution Unit)21、情報読取装置22、及びスイッチ23を備え、複数のサーバ24(24−1〜24−M)を収納(搭載)可能である。各ラック2のラック管理装置20は、上記ラック中央管理装置1と例えば専用線により接続されている。
上記スイッチ23は、データセンター内に敷設されたネットワーク(例えばLAN(Local Area Network))3と接続されたネットワーク機器であり、ラック2に収納された各サーバ24、及びラック監視装置20はそのスイッチ23と接続されている。それにより、スイッチ23は、ラック2に搭載されたサーバ24間、各サーバ24とネットワーク3間等のデータ転送を実現させる。
図1には、ラック2に搭載される電子機器としてサーバ24を表しているが、その電子機器は、ルータ、或いはハブ等のネットワーク(通信)機器であっても良い。その電子機器は、複数のハードディスク装置(HD)等を搭載したディスクアレイであっても良い。このようなことから、ラック2の搭載対象となる電子機器の種類、その電子機器が行う処理の内容は、サーバ24のようなものに限定されない。ここでは混乱を避けるために、電子機器としてはサーバ24のみを想定する。
上記ラック管理装置20は、ラック2に搭載された各機器、つまりサーバ24、PDU21、情報読取装置22、及びスイッチ23の動作を管理する。各ラック2のラック管理装置20は、ラック中央管理装置1と専用線により接続されている。それにより、各ラック2のラック管理装置20は、ラック中央管理装置1からの指示に従って、搭載された各機器を管理する。
電子機器は、高温になると、誤動作、或いは障害が発生しやすくなる。温度は、電子機器の寿命にも影響を与える。このことから、各サーバ24は、内部の温度を測定し、測定された温度をラック管理装置20に通知するようになっている。
図5は、サーバの構成例を説明する図である。サーバ24は、例えば図5に表すように、CPU51、FWH(FirmWare Hub)52、メモリ(メモリモジュール)53、NIC(Network Interface Card)54、ハードディスク装置(HD)55、ファン56、ファン駆動回路57、コントローラ58、BMC(Baseboard Management Controller)59、温度センサ60、及び電源スイッチ32を備えている。このような構成は1例であり、サーバ24の構成として限定されるものではない。
FWH52は、BIOS(Basic Input/Output System)を格納したメモリである。このBIOSは、CPU51によってメモリ53に読み出され実行される。ハードディスク装置25には、OS(Operating System)、及び各種アプリケーション・プログラム(以降「アプリ」と略記)が格納されており、CPU51は、BIOSの起動が完了した後、コントローラ58を介してハードディスク装置55からOSを読み出して実行することができる。NIC54を介した通信は、BIOSの起動によって可能となる。
BMC59は、サーバ24の管理用の装置である。BMC59は、通信機能を備え、スイッチ23を介してラック管理装置20と通信を行うことができる。それにより、BMC59は、ラック管理装置20からの指示に従って、自サーバ24の稼動/停止、つまり電源のオン/オフを制御することができる。BMC59は、その電源のオン/オフを、電源スイッチ32への操作に応じて行う。BMC59は、温度センサ60により測定された温度(内部温度)を、ラック管理装置20からの指示に従って、或いは予め定められた設定に従って、ラック管理装置20に通知する。
ラック中央管理装置1は、処理システム(データセンター)全体を管理するための装置である。ラック中央管理装置1は、各ラック2のラック管理装置20から通知される各サーバ24の温度を空調設備4の制御に反映させる。それにより、ラック中央管理装置1は、設置された全てのサーバ24が正常に動作するように、データセンター内の温度を調節する。
ラック中央管理装置1は、図1に表すように、3つの通信部11〜13、処理部14、及び記憶部15を備えている。
通信部11は、各ラック2のラック管理装置20との通信を実現させる。通信部12は、コンソール5との通信を実現させる。通信部13は、空調設備4との通信を実現させる。
処理部14は、各通信部11〜13が行った通信に対応する処理を行う。記憶部15は、処理部14が処理の実行に必要なデータ、及びその処理によって生成したデータの保存のための装置である。
処理部14は、図1に表すように、通信処理部14a、空調制御部14b、及び配置決定部14cを備えている。
通信処理部14aは、各通信部11〜13を介した通信のための処理を行う。空調制御部14bは、各ラック2のラック管理装置20から送信された各サーバ24の温度に応じて空調設備4を制御する。それにより、空調制御部14bは、各サーバ24が安定して動作するように、データセンター内の温度を調節する。
上記のように、データセンターでは、顧客のサーバを新たに預かる、或いは顧客にサーバを新たに貸し出す、といった理由から、サーバの増設を行う場合がある。サーバを新たに設置する場合、データセンターはそのサーバを用いたサービスが提供できるようにプロビジョニングを行わなければならない。そのプロビジョニングでは、新たに設置すべきサーバの配置(設置場所)を決定しなければならない。配置決定部14cは、増設等の理由により新たに設置すべきサーバ24を設置するうえで適切な配置を決定する。
サーバ24の配置の決定は、以下のようにして行われる。ここでサーバ24の配置を決定する方法について、図11を参照して具体的に説明する。
この図11において、ラック2には2A〜2Dの何れか付している。サーバ24には24A、或いは24Bを付している。それにより、図11には、間隔を設けて、4つのラック2A〜2Dを横に並べたラック群を4つ設置した場合に、各ラック2A〜2Dに収納されるサーバ24A及び24Bの配置を表している。
ラック2に搭載可能なサーバ24の種類は様々である。サーバ24の種類によって、その高さ(ラック2に収納した際の垂直方向上の高さ。以降、特に断らない限り、高さとはその意味で用いる)も異なる。ラック2に収納可能なサーバ24の高さはU(ユニット)という単位で規定されるのが普通である。多くのサーバ24の種類は、1〜4Uの高さである。
図11に表す2種類のサーバ24A、及び24Bは、周辺温度の影響を考慮した場合の分類である。本実施形態では、その分類は、内部温度に着目して行っている。これは、以下のような理由からである。
近年、サーバの集積化が進み、その集積化に伴いサーバの消費電力が増大している。それにより、現在では、サーバの冷却が非常に重要視されており、冷却用の冷却機器(ファン等)はサーバにとって必須の部品となっている。
ファンによる部品の冷却に用いられる媒体は空気である。冷却機器としてファンを搭載したサーバは、前面の筐体に開口を設け、その開口から冷気を内部に取り込み、熱量の伝達によって高温となった空気を後面から排気するようになっているのが普通である。
特に高さが低いサーバでは、筐体内部に確保できる空間が小さい。その空間が小さくなるほど、部品の冷却に用いる空気量は確保し難くなり、適切な空気の流れも作り難くなる。このことから、高さの低いサーバほど、その内部温度は高くなり易い傾向がある。これは、サーバ内の温度は、そのサーバの消費電力、そのサーバに搭載される部品の種類、及びその数、等に必ずしも依存しないことを意味する。
サーバ内の温度は、取り込む冷気の温度、及び流量の他に、その周辺と筐体を介して伝達される熱量によって変化する。これは、サーバの近傍に発熱体、つまり他のサーバ等が配置されていた場合、その発熱体からの放熱によりその発熱体とサーバ間に存在する空気の温度が上昇するからである。その空気の温度の上昇に伴い、その空気と接する部分の筐体の温度は上昇し、サーバ内に取り込まれた冷気に伝達される熱量が増加して、その冷気によって除去される熱量は減少する。このようなことから、サーバの内部温度は、その配置、つまり近傍に位置する発熱体(他のサーバ)の存在によって変化する。
サーバの内部温度には、上限値が設定されている。その内部温度がサーバ周辺の発熱体の存在によって変化(上昇)することから、その内部温度、より正確には、その内部温度と温度上限値の差は、サーバの熱に対する余裕度を表す指標、或いはその目安とすることができる。それにより、本実施形態では、周辺温度が影響する度合い(影響度)を表す指標として、サーバの内部温度を採用している。その内部温度は、サーバを同じ条件で動作させた場合、つまり予め定めた温度の室内でサーバを動作させた場合に得られる温度である。そのような内部温度としては、シミュレーション(熱解析)結果、或いは製品化の過程で行われる試験結果を採用することができる。
図11に表すサーバ24A及び24Bは、上記のような内部温度により、サーバ24の周辺温度の影響度を2段階で評価した場合のものである。例えばサーバ24Aは影響度(内部温度)が高いと見なされたサーバ24であり、サーバ24Bはその影響度(内部温度)が低いと見なされたサーバ24である。影響度の評価は、2段階ではなく、3段階以上に分けて行っても良い。
図11に表す、各ラック2A〜2Dに収納されるサーバ24A及び24Bの配置は、空調設備4による冷気が床下から上に向かって流れることを想定した場合のものである。各ラック2A〜2Dとしては、横方向(各ラック2A〜2Dが並ぶ方向)に空気が流れるタイプ、つまり側面に仕切りのないタイプを想定している。
熱量の伝達によって高温となった空気には、密度が小さくなるために上昇する方向の力が働く。このため、ラック2に収納された各サーバ24には、その下に隣接するサーバ24からの放熱が最も影響を及ぼす。サーバ24の内部温度(部品温度)は、その内部に取り込まれた空気への熱量の伝達に伴うその空気の温度上昇に強く影響される。このことから、サーバ24の筐体の温度は、その内部温度と相関関係があるのが普通である。これらのことから、本実施形態では、図11に表すように、ラック2の上下方向にサーバ24A、サーバ24Bが交互に並ぶようにしている。影響度を3段階で評価する場合、サーバ24Bより影響度が小さいサーバ24をサーバ24Cと表記すると、下から上に向かって、サーバ24A→サーバ24B→サーバ24C→サーバ24A、の順序関係を満たすように各サーバ24A〜24Cをラック2に収納すれば良い。
側面に仕切りのないタイプのラック2では、サーバ24からの放熱によって高温となった空気の一部が隣のラック2に流れることになる。そのため、各ラック2におけるサーバ24の配置は、隣接する他のラック2でのサーバ24の配置を考慮して行うのが望ましい。このことから、本実施形態では、図11に表すように、隣接するラック2の同じ高さの位置に同じ影響度のサーバ24が並ばないようにさせている。
側面に仕切りのあるタイプのラック2では、サーバ24からの放熱によって高温となった空気の一部が隣のラック2に流れることはない。その仕切り自体の温度は、その仕切りに用いられる材質の特性から、ほぼ全体に渡って同じような温度となる。そのため、各ラック2におけるサーバ24の配置は、全て、下から上に向かって、サーバ24A→サーバ24B→サーバ24A、の順序で行えば良い。一番下にサーバ24Aを配置するのは、床下から冷気が供給される想定では、床に近い位置ほど、サーバ24内に取り込める空気の温度が低くなると期待できるからである。
上記のように、本実施形態では、サーバ24の影響度による順序関係を条件として設定し、新たに設定すべきサーバ24の配置(設置場所)は、その順序関係を満たす位置にサーバ24を収納可能なラック2としている。その順序関係を満たすようにサーバ24の配置を決定した場合、一部のサーバ24からの放熱量が小さくなって、内部温度が他のサーバ24と比較して異常に高い温度となるホットスポット化の程度は抑えられるようになる。ホットスポット化の抑制は、データセンターにおける冷却負荷を低減させ、冷却に要するコストをより小さくさせる。このようなことから、配置決定部14cは、その順序関係を満たす形に新たに設置すべきサーバ24を収容可能なラック2を特定し、そのサーバ24の配置を決定する。
隣接するラック2から流入する熱量の大きさは、図11に表す4つのラック2A〜2Dが全て同じ種類であっても、各ラック2A〜2Dで異なる。流入する熱量の大きさは、ラック2D>ラック2C>ラック2B>ラック2A、の関係となる。それにより、図11では、隣接するラック2から流入する熱量の大きさにより、2A〜2Dのうちの何れかの符号をラック2に付している。
このことから、サーバ24の配置の決定では、ラック2によって異なる他のラック2から流入する熱量を考慮するのが望ましい。そのためには、同じ種類のサーバ24であっても、オプションの追加の程度、或いは予想される負荷の大きさ、等に着目し、予想される内部温度が低いサーバ24を、熱の流入量の大きいラック2に収納させるようにすれば良い。つまり同じサーバ24Aと分類されるサーバ24を実際のハードウェア構成、或いは予想される負荷の大きさ等から更に細かく分類し、その分類結果を配置の決定に反映させるようにすれば良い。
配置決定部14cによる配置の決定は、記憶部15に記憶されたデータを参照して行われる。その記憶部15には、配置決定部14cが参照するデータとして、サーバ情報データベース(DB)15a、機器情報DB15b、配置管理情報DB15c、実行条件情報DB15d、及び境界条件DB15eが記憶されている。
サーバ情報DB15aは、サーバ24の種類毎に、そのサーバ24に係わる情報がまとめられたDBである。サーバ24に係わる情報としては、例えば図6に表すように、サーバ種別情報、消費電力情報(W)、内部温度情報(℃)、構成情報、冷却機器情報、及び高さ情報が存在する。
サーバ種別情報は、サーバ24の種類を表す。図6中に表記の「ZZZ」「XYZ」は、例えばサーバの種類を表す識別ID(IDentifier)を表している。消費電力情報は、そのサーバ24の最大消費電力値を表す。内部温度情報は、予め定めた条件下で動作させた場合の内部温度を表す。構成情報は、サーバ24に搭載された部品の種類、その組み合わせを表す。その部品としては、CPU、メモリ、I/O(Input/Output)機器(HD等の記憶装置を含む)、及びNIC等が対象である。
冷却機器情報は、そのサーバ24に搭載された冷却機器を表す。図6中に表記の「ファン」は、その冷却機器としてファンが搭載されていることを表している。高さ情報は、U単位でそのサーバ24の高さを表す。図6中に表記の「1」「2」はそれぞれ、対応するサーバ24の高さが1U、2Uであることを表している。
機器情報DB15bは、ラック2、及びサーバ24以外のラック2に搭載される機器に係わる情報がまとめられたDBである。機器としては、PDU21、及びスイッチ23が含まれる。
ラック2には、1Uサイズのサーバ24が収納可能な段が複数、設けられている。その段数は、ラック2の種類によって異なる。また、ラック2には、サーバ24以外に、PDU21、及びスイッチ23がそれぞれ1つ以上、搭載される。このことから、機器情報DB15bには、ラック2に係わる情報として、例えばラック2の種類毎に、そのラック2の種類を表す識別情報(以降「ラック種別情報」と表記)、搭載されるPDU21の数、そのPDU21を表す識別情報(以降「PDU種別情報」と表記)、搭載されるスイッチ数、そのスイッチ23を表す識別情報(以降「スイッチ種別情報」と表記)、が格納される。
PDU21は、ラック2に搭載されたサーバ24に電力を供給する装置である。PDU21は、AC(Alternating Current)電力を入力し、入力したAC電力をDC(Direct Current)電力に変換して出力する。
図4は、PDUの構成例を説明する図である。図4に表すように、PDU21は、通信部41、電力コントローラ42、及び複数の電力供給用の接続口43(43−1〜43−n)を備えている。
図1に表す構成では、通信部41はラック管理装置20との通信を可能にさせる。電力コントローラ42は、接続口43毎に、その接続口43からの電力供給を制御する。それにより、PDU21は、ラック管理装置20からの指示に従って、電力を供給すべき接続口43から供給すべき電力量を供給することができる。
機器情報DB15bには、上記のようなPDU21に係わる情報として、例えばPDU21の種類毎に、そのPDU種別情報、設けられた接続口数が格納される。スイッチ23は、不図示の通信用ケーブルが接続される複数のポートを備えている。このことから、機器情報DB15bには、スイッチ23に係わる情報として、例えばスイッチ23の種類毎に、そのスイッチ種別情報、設けられているポート数が格納される。
配置管理情報DB15cは、ラック2毎に、そのラック2に収納されているサーバ24、或いはそのラック2に新たに収納すべきサーバ24に係わる情報が格納されるDBである。
図7は、配置管理情報DBに格納される情報の内容例を説明する図である。図7に表す内容例は、1つのラック2用に格納された情報を抽出した場合のものである。その情報は、ラック2に係わる情報と、そのラック2に収納されたサーバ24に係わる情報と、に分けることができる。
ラック2に係わる情報としては、ラックID、ラック種別、PDU数、PDU種別、スイッチ数、及びスイッチ種別、の各情報が配置管理情報DB15cに格納される。
ラックID情報は、ラック2を一意に識別するための識別情報である。図7中に表記の「X」は、ラック2に割り当てられたID番号を表している。他のラック種別、PDU数、PDU種別、スイッチ数、及びスイッチ種別、の各情報は、上記機器情報DB15bから取得される情報である。
サーバ24に係わる情報としては、サーバID、サーバ種別、用途、位置、高さ、接続口、BMCポート番号、BMC MACアドレス、運用状況、NIC数、及びネットワーク、の各情報が配置管理情報DB15cに格納される。1つのサーバ24の配置管理情報は、それらの情報の集まりである。それらの情報において、サーバ種別、高さ、及びNIC数は上記サーバ情報DB15aから取得可能である。NIC数は、構成情報を参照して特定することができる。このことから、これらの情報についての説明は省略する。
サーバID情報は、サーバ24を一意に識別するための識別情報である。図7中に表記の「1」は、サーバ24に割り当てられたID番号を表している。用途情報は、サーバ24を使用する顧客を表す顧客情報を含む。図7中に表記の「顧客A」は、1顧客を表している。それにより、図7では、サーバIDが「1」と「N」のサーバ24が同じ顧客に使用されることを表している。
位置情報は、サーバ24が収納されている、或いはこれから収納すべきラック2上の位置を表す。図7に表記の「1」は、ラック2の最も低い段である1段目を表している。図7に表記の「8」は、ラック2の下から8番目の段を表している。2U以上の高さのサーバ24も存在することから、本実施形態では、位置情報は最も低い段を表す情報としている。それにより、サーバIDが「N」の高さが2Uのサーバ24は、ラック2の8段目と9段目の収納スペースに収納される。
接続口情報は、対応するサーバ24の電源ケーブルが接続されている、或いはこれから接続すべきPDU21の接続口43を表す。本実施形態では、サーバ24のBMC59とラック管理装置20とは、スイッチ23を介して通信を行うことを想定している。BMCポート番号情報は、BMC59と接続すべきスイッチ23のポート番号を表す。BMC MACアドレス情報は、BMC59に割り当てられたMACアドレスを表す。
運用状況情報は、状態情報、温度情報、及び負荷情報を含む。状態情報は、サーバ24の現在の状態を表す情報である。図7中に表記の「運用」は、対応するサーバ24が運用中であることを表している。図7中に表記の「設置」は、対応するサーバ24が新たに設置されることを表している。
温度情報、及び負荷情報は、既に収納されたサーバ24の状況を表す。そのため、新たに収納されるサーバ24では、温度情報、及び負荷情報は格納の対象外となっている。温度情報、及び負荷情報は、予め定めたタイミングで更新される。空調設備4の制御は、配置管理情報DB15cにサーバ24別に格納された温度情報を参照して行われる。
ネットワーク情報は、サーバ24に搭載されるNIC54毎に用意される情報であり、MACアドレス、IPアドレス、及びポート番号の各情報を含む。ポート番号情報は、対応するサーバ24のNIC54と通信ケーブルにより接続されている、或いはこれから接続すべきスイッチ23のポートを表す。
上記のような情報がラック2毎に格納される配置管理情報DB15cを参照することにより、配置決定部14cは、各ラック2に収納されているサーバ24の種類、その位置、及びその数を特定することができる。このことから、配置決定部14cは、新たに設置するサーバ24の配置として、図11に表すような順序関係を満たすことが可能なラック2、及びそのラック2上の位置を特定することができる。
ラック2の配置を表す情報は、例えば記憶部15にDB(ラック配置情報DB)の形で格納されている。図1では、そのDBは省略している。
管理者は、新たにサーバ24を設置する場合、サーバ24毎に、サーバID情報、サーバ種別情報、構成情報、用途情報、及びネットワーク情報をコンソール5から入力する。そのネットワーク情報は、NIC54毎に入力される。このとき、BMCポート番号情報、各ネットワーク情報中のポート番号情報等の接続に係わる情報の入力は対象外となる。配置決定部14cは、配置管理情報DB15cを参照して、サーバ24毎に配置を決定し、そのサーバ24に係わる情報を配置管理情報DB15cに登録する。
図7において、サーバIDとして「N」を表記したレコード(エントリ)は、その登録によって各種情報が格納されたものである。このため、運用状況情報中の状態情報が「設置」となっている。そのレコードに表すように、本実施形態では、サーバ24を収納すべき位置の他に、電源ケーブルを接続すべきPDU21の接続口43、通信ケーブルを接続すべきスイッチ23のポートを合わせて決定するようにしている。
モデル情報DB15dは、シミュレーションを実行するうえで用いるラック2、及びサーバ24の各モデルデータを格納したDBである。
データセンターの熱設計では、通常、サーバ24の吸気温度を予め定めた規定値以下に維持することが求められる。多数のサーバ24を単に設置するような場合、吸気温度、或いは流出入する熱量のばらつき等により、上記ホットスポット、つまり他より内部温度が上昇し易いサーバ24が発生する可能性が高い。このことから、図1に表すような処理システムを実際に構築する前に、データセンター全体を対象にしたシミュレーションが行われるのが普通である。これは、新たなデータの設置は増設のために行われる場合が殆どであることを意味する。
そのシミュレーションとしては、例えば各ラック2をデータセンターの室内とは別にモデル化し、各ラック2と室内との間で空気、及び熱量の流出入を計算し、それらの計算結果を室内における空気の温度・流速分布に反映させるという方法が考えられる。その方法では、ラック2のシミュレーションでは室内を境界条件として扱い、室内のシミュレーションでは各ラック2を境界条件として扱えば良い。このことから、本実施形態では、ラック2毎に、室内の境界条件を表す境界条件情報を保存している。境界条件DB15eは、その境界条件情報をラック2毎に保存したDBである。
図11に表すようにサーバ24を配置することにより、ホットスポットの発生は抑えることができる。しかし、新たにサーバ24を配置するラック2に、そのサーバ24の設置によってホットスポットが発生する可能性がある。このことから、本実施形態では、境界条件DB15eに格納された境界条件情報を用いて、新たなサーバ24の設置場所として選択したラック2を対象としたシミュレーションを行い、そのラック2が設置場所として適切か否かの確認を行うようにしている。それにより、配置決定部14cは、シミュレーションにより適切と確認された設置場所を最終的に決定する。
新たに設置するサーバ24の数が設置済みのサーバ24の数と比較して余り大きくない場合、それらのサーバ24を新たに設置しても、データセンターの室温の上昇分は僅かである。その室温を一定に維持させる場合、新たにサーバ24を設置することで発生する熱量分の除去が必要である。空調設備4は、その熱量分を更に除去するように制御される。このようなことから、上記境界条件は、定常状態時の内容を表していると見なすことができる。それにより、その境界情報を用いたシミュレーションであっても、新たにサーバ24を収納させるラック2の状態を高精度に特定できると考えられる。ラック2単位のシミュレーションのため、データセンター全体を対象にした場合と比較すると、計算量は大幅に抑えることができる。このことから、新たなサーバ24の設置をより迅速に行ううえでも有効である。
なお、ラック2を対象にしたシミュレーションでは、ラック2の内部空間を分割し、各分割した空間内の空気とサーバ24との間の熱量の流出入が計算される。新たに収納されるサーバ24と接する空間内の空気の温度は、そのサーバ24からの放熱によって、より高温となる。それにより、既に収納されているサーバ24の内部温度が上昇することとなる。
上記サーバ情報DB15a、機器情報DB15b、配置管理情報DB15c、実行条件情報DB15d、及び境界条件DB15eを記憶部15に記憶したラック中央管理装置1のハードウェア構成は、特に限定されるものではない。このことから、便宜的に、ラック中央管理装置1は図5に表すようなハードウェア構成と想定し、その符号を用いることとする。
ラック中央管理装置1が図5に表すようなハードウェア構成であった場合、記憶部15はハードディスク装置55に相当する。通信部11は、例えばBMC59によって実現される。通信部12及び13は、例えばNIC54によって実現される。処理部14は、FWH52に格納されたBIOS、及びハードディスク装置55に格納された複数のプログラムをCPU51が実行することで実現される。その複数のプログラムには、OS、空調設備4の制御用アプリケーション・プログラム(以降「空調制御アプリケーション」と表記)、新たに設置すべきサーバ24の配置を決定するアプリケーション・プログラム(以降「配置決定アプリケーション」と表記)、及びシミュレーション用のプログラム(以降「シミュレーション・ソフト」と表記)、が含まれる。配置決定アプリケーションは、シミュレーション・ソフトを用いて、ラック2の熱解析を行う。このことから、処理部14は、CPU51、FWH52、メモリ53、ハードディスク装置55、及びコントローラ58によって実現される。
図10は、配置決定処理のフローチャートである。この配置決定処理は、上記配置決定アプリケーションをCPU51が実行することで実現される処理である。ここで図10を参照し、配置決定処理について詳細に説明する。
上記のように、管理者は、新たにサーバ24を設置する場合、サーバ24毎に、サーバID情報、サーバ種別情報、構成情報、用途情報、及びポート番号を含まないネットワーク情報をコンソール5から入力する。配置決定処理は、その入力後、管理者がサーバ24の配置の決定の実行を指示することで実行される。図10では、1台のサーバ24の配置を決定する場合に実行される処理の流れを表している。新たに設置すべきサーバ24は以降「新サーバ24」と表記する。
先ず、CPU51は、入力された用途情報を用いて配置管理情報DB15cを参照し、その用途情報が表す顧客のサーバ24が収納されたラック2を特定する(S101)。そのようなラック2の特定を行うのは、同じ顧客が使用するサーバ24は同じラック2に収納するのを優先するためである。
次にCPU51は、管理者が入力したサーバ種別情報を用いてサーバ情報DB15aから対応する内部温度情報を抽出し、抽出した内部温度情報、及び入力された構成情報から、新サーバ24を評価し、その影響度を分類する(S102)。その後、CPU51は、サーバ情報DB15a、機器情報DB15b及び配置管理情報DB15cを参照して、特定したラック2に新サーバ24を収納可能な空きが有るか否か判定する(S103)。その空きが無い場合、S103の判定はNoとなってS109に移行する。その空きが有る場合、S103の判定はYesとなってS104に移行する。
S104では、CPU51は、分類した影響度、及び空きが有る収納スペースの周辺に存在する各サーバ24の影響度が図11に表すような順序関係を満たしているか否か判定する。ここでは、新サーバ24を既存のサーバ24から離して収納できる場合も含む。そのような順序関係を満たしていた場合、S104の判定はYesとなってS105に移行する。そのような順序関係を満たしていない場合、S104の判定はNoとなって上記S109に移行する。
S105では、CPU51は、実行条件情報DB15d及び境界条件DB15eを参照し、特定したラック2を対象に、熱解析のためのシミュレーションを行う。次にCPU51は、その熱解析の結果を参照し、新サーバ24が設置可能か否か、つまり新サーバ24の設置によってその新サーバ24、或いはその周辺に存在する何れかのサーバ24に熱問題が発生するか否か判定する(S106)。そのような熱問題が発生する可能性が高いような場合、S106の判定はNoとなって上記S109に移行する。そのような熱問題が発生しないと云えるような場合、S106の判定はYesとなってS107に移行する。
S107では、CPU51は、機器情報DB15b、及び配置管理情報DB15cを参照し、新サーバ24を接続すべきPDU21の接続口43、及びスイッチ23のポートの割り当てを行う。スイッチ23のポートの割り当てには、BMC59用、NIC54用の少なくとも2つが含まれる。次にCPU51は、配置決定結果、つまり新サーバ24を収納すべきラック2、その収納位置、割り当てたPDU21の接続口43、及びスイッチ23のポートを表す配置管理情報をコンソール5に出力する。それにより、管理者がコンソール5を介して配置決定結果を了承する操作を行った場合、CPU51は、配置管理情報を配置管理情報DB15cに格納すると共に、その配置管理情報を対応するラック2のラック管理装置20に送信する(以上S108)。その後、配置管理処理が終了する。
上記S103、S104、或いはS106の何れかの判定がNoとなって移行するS109では、CPU51は、新サーバ24を収納可能な空きの有る他のラック2の特定を行う。その後にCPU51は、そのようなラック2が有るか否か判定する(S110)。そのようなラック2が有った場合、S110の判定はYesとなって上記S104に移行し、それ以降の処理が同様に実行される。そのようなラック2が無い場合、S110の判定はNoとなってS111に移行する。このS110でのNoの判定は、新サーバ24を収容可能な空きの有るラック2が存在しない、そのような空きが有っても順序関係が満たされていない、或いはその順序関係が満たされていても設置するのが望ましくない、ということを意味する。
S111では、CPU51は、新サーバ24を収納可能な空きの有るラック2が無いか否か判定する。新サーバ24を収納可能なラック2が存在しない場合、S111の判定はYesとなる。それにより、CPU51は、新たにラック2を設置しない限り、新サーバ24の設置場所は存在しないとし(S113)、その結果の出力を行う(S108)。
新サーバ24を収納可能なラック2が存在する場合、S111の判定はNoとなってS112に移行する。S112では、CPU51は、例えば新サーバ24を収納可能な空きが有るラック2を特定し、特定したラック2のなかで最適な空きの有るラック2を選択する。その後、上記S105に移行する。そのようにして、本実施形態では、ラック2を増設することなく、新サーバ24を収納可能なラック2を確認するようにしている。
上記配置決定処理をCPU51が実行することで配置決定部14cによる新サーバ24の配置の決定が行われる。その決定結果は、配置管理情報の形で配置管理情報DB15cに格納され、配置管理情報DB15cに格納される配置管理情報は、対応するラック2のラック管理装置20に送信される。
ラック管理装置20は、自身が搭載されたラック2分の配置管理情報を保存し、収納されているサーバ24の管理に用いる。新たに受信した配置管理情報中の位置情報が表す位置にサーバ24が収納されていない場合、その配置管理情報は、新たに設置されるサーバ24が適切に設置されたか否かの確認に用いられる。
その確認のために、3種類の判定が行われる。3種類の判定とは、位置情報が表す位置にサーバ種別情報が表す種類のサーバ24が収納されたか否かの判定、接続口情報が表すPDU21の接続口43に電源ケーブルが接続されたか否かの判定、及びネットワーク情報中のポート番号情報が表すスイッチ23のポートに対応するNIC54が接続されたか否かの判定、である。その3種類の判定を行うことにより、新たに設置すべきサーバ24が適切に設置され、且つ各種ケーブルが適切に接続されたことを確認することができる。
新たに設置すべきサーバ24が適切に設置され、且つ各種ケーブルが適切に接続されたことが確認できる場合、そのサーバ24が収納されるラック2をネットワーク3と切り離さなくとも良いことになる。そのネットワーク3と接続させたスイッチ23も動作を停止させなくとも良い。このことから、本実施形態では、サーバ24を新たに収納させるために、そのサーバ24が収納されるラック2に既存のサーバ24を停止させないようにしている。言い換えれば、本実施形態では、処理システムの一部も停止させることなく、新たなサーバ24の設置を行えるようにしている。それにより、本実施形態では、サーバ24を個別にラック2に収納することによる設置効率の向上を可能にしつつ、既存のサーバ24、或いはネットワーク3の停止に伴う処理効率の低下を回避させている。
ラック管理装置20は、図1に表すように、5つの通信部201〜205、表示部206、処理部207、及び記憶部208を備えている。処理部207は、通信処理部207a、PDU制御部207b、スイッチ制御部207c、位置判定部207d、及び接続判定部207eを備えている。
通信部201は、ラック中央処理装置1との通信を実現させる。通信部202は、PDU21との通信を実現させる。通信部203は、情報読取装置22との通信を実現させる。通信部204は、スイッチ23との通信を実現させる。この通信部204は、主にスイッチ23の制御に用いられる。通信部205は、各サーバ24のBMC59との通信に用いられる。
処理部207の通信処理部207aは、通信部201〜205を用いた通信を実現させるための処理を行う。PDU制御部207bは、PDU21の制御に係わる処理を行う。スイッチ制御部207cは、スイッチ23の制御に係わる処理を行う。位置判定部207dは、ラック2に新たにサーバ24が収納された位置を判定する。接続判定部207eは、新たに収納されたサーバ24と各種ケーブルにより接続された箇所を判定する。
記憶部208は、ラック中央管理装置1から受信した配置管理情報の保存に用いられる。各サーバ24のBMC59から通知された温度は、スイッチ23及び通信部205を介して処理部207に入力され、対応する配置管理情報の運用状況情報中の温度情報として記憶部208に保存される。
上記のようなラック管理装置20のハードウェア構成は、特に限定されるものではない。このことから、ラック管理装置1と同様に、ラック管理装置20は図5に表すようなハードウェア構成と想定し、その符号を用いることとする。ラック管理装置20は、ラック中央管理装置1、及びサーバ24とは異なり、表示部206を備えている。その表示部206、及びCPU51からの指示に従って表示部206に表示を行わせるコントローラ71は、図5中、破線で表している。
ラック管理装置20が図5に表すようなハードウェア構成であった場合、記憶部208はハードディスク装置55に相当する。通信部201〜203及び205は、例えばBMC59によって全て実現させることができる。その場合、通信部204は、NIC54により実現させれば良い。処理部207は、FWH52に格納されたBIOS、及びハードディスク装置55に格納された複数のプログラムをCPU51が実行することで実現される。その複数のプログラムには、OS、及びラック2の管理用アプリケーション・プログラム(以降「ラック管理アプリケーション」と表記)が含まれる。このことから、処理部207は、CPU51、FWH52、メモリ53、ハードディスク装置55、及びコントローラ58によって実現される。
位置判定部207dによる位置判定は、情報読取装置22を用いて行われる。各ラック2は、例えば図2に表すような外観となっている。ラック管理装置20は、ラック2の筐体の最上部に配置され、スイッチ23はその下に配置されている。情報読取装置22は、ラック管理装置20の横に配置されている。
各ラック2には、上記のように、高さがU(ユニット)という単位で規定されるサーバ24が複数、収納可能であり、1Uサイズのサーバ24が収納可能な段が複数、設けられている。情報読取装置22は、段毎に、その段に収納されたサーバ24の種類を特定するための装置であり、図1に表すように、コントローラ22a、及びセンサ群22bを備えている。ラック2の各段には、センサ群22bを構成するセンサ22cが一つ配置されている。
本実施形態では、図3に表すように、側面の筐体に記録媒体31が設けられたサーバ24をラック2の搭載対象と想定している。ラック2の各段に配置されたセンサ22cは、サーバ24の筐体に設けられた記録媒体31に記録されている情報の読み取り用である。記録媒体31は特に限定するものではないが、記録媒体31には、サーバ24の種類を表すサーバ種別情報を記録させるようにしている。そのような記録媒体としては、例えばバーコードが印刷された媒体、RFID(Radio Frequency IDentification)タグ等を用いることができる。
高さが2U以上のサーバ24が新たに収納される場合がある。そのようなサーバ24に1つの記録媒体31を設ける場合、サーバ24に記録媒体31を設ける場所を決定しておく必要がある。その場所としては、サーバ24の最も下側、或いは上側の1Uの範囲内とすることが考えられる。
ラックとしては、冷却機器、つまりファン、或いはエアーコンディショナー等を備えたものもある。外観からの分類では、支柱だけが存在するようなもの、側面(サーバ24の挿入方向と直交する側の側面)に壁が存在するもの、気密構造となっているもの、等に分けることができる。ここでは、図1に表すように、ラック2としては冷却機器を備えていないものを想定している。
位置判定部207dは、例えば新たに収納されるサーバ24の配置管理情報の受信により、情報読取装置22のコントローラ22aに指示し、センサ22cによる記録媒体31の読み取りを可能にさせる。
情報読取装置22のコントローラ22aは、センサ群22bを構成する各センサ22cによる読み取り結果を監視する。それにより、コントローラ22aは、何れかのセンサ22cにより記録媒体31が新たに読み取られた場合に、その記録媒体31から読み取られたサーバ種別情報、及びそのサーバ種別情報を読み取ったセンサ22cの位置をラック管理装置20に送信する。位置判定部207aは、センサ22cの位置により、サーバ24が収納すべき場所に収納されたか否かの判定を行い、サーバ種別情報により、収納すべき種類のサーバ24が収納されたか否かの判定を行う。
サーバ24は、電力供給によりBMC59が動作を開始するようになっている。動作を開始したBMC59は、通信ケーブルを介したネットワーク(ネットワーク機器)との接続を認識した場合に、自身の存在を通知するためのメッセージをブロードキャストする。接続判定部207eは、このことを利用し、電源ケーブルが接続すべき接続口43に接続され、且つ、サーバ24のBMC59とラック管理装置20が適切に通信ケーブルにより接続されたことの確認を行う。
NIC54もBMC59と同様に、通信ケーブルを介したネットワーク(ネットワーク機器)との接続を認識することができる。その認識結果はCPU51に通知され、その通知によってCPU51は、NIC54に、自身の存在を通知するためのメッセージをブロードキャストさせる。接続判定部207eは、このことを利用し、新サーバ24がスイッチ23の接続すべきポートに接続されたか否かの確認を行う。
図8及び図9は、新たにサーバを設置する場合に、コンソール(管理者)、ラック中央管理装置、ラック管理装置、情報読取装置、スイッチ、新たに設置されるサーバ、PDU、及び保守者がそれぞれ行う動作の流れを表すシーケンス図である。保守者とは、新サーバ24を実際に設置する作業員である。図8及び図9を参照し、それらの動作、及びその流れについて具体的に説明する。図8中コンソールは「管理者」と表記している。
上記のように、管理者は、新サーバ24毎に、サーバID情報、サーバ種別情報、構成情報、用途情報、及びポート番号を含まないネットワーク情報をコンソール5から入力した後、配置決定を指示する。それにより、コンソール5は、それらの情報をラック中央管理装置1に送信する(S1)。ラック中央管理装置1は、それらの情報を受信し、新サーバ24の設置のためのプロビジョニングを行う(SB11)。図10に表す配置決定処理は、そのプロビジョニングのための1処理として実行される。配置決定処理の実行によって生成された配置管理情報は、新サーバ24の収納場所として選択されたラック2のラック管理装置20に送信される(S2)。
配置管理情報を受信したラック管理装置20は、その配置管理情報を記憶部208に保存する(SC1)。ラック管理装置20は、情報読取装置22のコントローラ22aにセンサ群22bによる情報の読み取りを指示することにより、新サーバ24のラック2への収納に対応させる。
新サーバ24の設置のために必要な情報は、例えば管理者から保守者に通知される。その通知により、保守者は、新サーバ24を用意し、指定されたラック2の指定された場所に新サーバ24を挿入する(S3)。その挿入により、新サーバ24に設けられた記録媒体31の情報がセンサ群22bの何れかのセンサ22cによって読み取られる(S4)。その結果、情報読取装置22のコントローラ22aは、ラック管理装置20に、読み取った情報(サーバ種別情報を含む)、及びその情報を読み取ったセンサ22cの位置情報を送信する(S5)。
ラック管理装置20は、情報読取装置22から受信したサーバ種別情報、及び位置情報が、受信した配置管理情報に一致するものか否かの判定を行う(SC2)。SC2の判定は、新サーバ24の種類が異なる、或いはその挿入位置が正しくない場合、Noとなる。その場合、ラック管理装置20は、挿入すべき新サーバ24の種類、或いは正しい挿入位置を表示部206に表示させることにより、保守者に行うべき作業を通知する(S6)。新サーバ24の種類が正しく、且つその挿入位置も正しい場合、SC2の判定はYesとなる。その場合、ラック管理装置20は、その旨を保守者、及びラック中央管理装置1に通知するための処理を行う(SC3)。保守者への通知は、表示部206を用いて行われ(S7)、ラック中央管理装置2への通知は、通信部201を介して行われる(S8)。SC2の処理により、位置判定部207dが実現される。
新サーバ24をラック2に収納させた保守者は、次に電源ケーブルをPDU21の指定された接続口43に接続させる(S9)。ラック管理装置20は、PDU21に指示し、配置管理情報に表された接続口43から新サーバ24のBMC59のみ動作する程度の電力を供給させる(S10)。それにより、新サーバ24には、PDU21の指定された接続口43に電源ケーブルが接続された場合に、制限された電力の供給が開始される(S11)。PDU制御部207bは、そのようなPDU21による電力供給の制御を実現させる。
保守者は、電源ケーブルの接続を行った後、通信ケーブルの接続を行う。その接続は、BMC59とスイッチ23の接続、NIC54とスイッチ23の接続、の順序で行うようにさせている。スイッチ23は、想定していない機器との接続が行われることを考慮して、その空きポートでのデータの転送をブロックするように設定されている。
BMC59は、電力の供給により、動作を開始する。それにより、保守者がBMC59をスイッチ23と接続すると(S12)、BMC59はスイッチ23との接続を認識し、上記メッセージを送信する(S13)。スイッチ23は、そのメッセージを受信した場合、そのメッセージ中のMACアドレスを、そのメッセージを受信したポートの番号と共に制御情報としてラック管理装置20に通知する(S14)。
ラック管理装置20は、その制御情報を通信部204により受信する。その制御情報を受信したラック管理装置20は、その制御情報が表すMACアドレス、及びポート番号が、受信した配置管理情報に一致するか否かの判定を行う(SC4)。SC4の判定は、新サーバ24が正しくない(同じ種類の別のサーバ24である)、或いは接続させたポートが正しくない場合、Noとなる。その場合、ラック管理装置20は、挿入すべき新サーバ24が異なる、或いは接続すべきポートを表示部206に表示させることにより、保守者に行うべき作業を通知する(S15)。新サーバ24が正しく、且つその接続ポートも正しい場合、SC4の判定はYesとなる。その場合、ラック管理装置20は、接続ポートのブロック解除を決定する(SC5)。それにより、ラック管理装置20は、その接続ポートのブロック解除をスイッチ23に指示する(S16)。また、ラック管理装置20は、PDU21に、新サーバ24がBIOSを起動できる程度の電力の供給を指示する(S17)。
上記接続判定部207eの機能の一部は、SC4の処理の実行によって実現される。スイッチ制御部207cの機能の一部は、SC5の処理の実行によって実現される。
BMC59とスイッチ23の接続を行った保守者は、次に、新サーバ24の電源スイッチ32を操作し、新サーバ24を起動させる(S18)。その後、保守者は、NIC54とスイッチ23の接続を行う(S19)。
電源スイッチ32への操作はBMC59によって認識され、BMC59は、BIOSの起動をCPU51に行わせる。このとき、BMC59は、供給されている電力量から、BIOSのみをCPU51に起動させる。
そのBIOSの起動により、NIC54も動作を開始する。それにより、NIC54とスイッチ23が接続されていた場合、NIC54は、その接続を認識し、その認識結果をCPU51に通知する。それにより、CPU51は、NIC54にメッセージをブロードキャストさせる(S20)。スイッチ23は、そのメッセージを受信すると、そのメッセージ中のMACアドレス、及びそのメッセージが受信されたポートを制御情報としてラック管理装置20に通知する(S21)。
ラック管理装置20は、その制御情報を通信部204により受信する。その制御情報を受信したラック管理装置20は、その制御情報が表すMACアドレス、及びポート番号が、受信した配置管理情報のネットワーク情報に一致するか否かの判定を行う(SC6)。SC6の判定は、事実上、SC4と同様に、接続させたポートが正しくない場合のみ、Noとなる。これは、SC4でYesと判定されていることから、新サーバ24が正しくない(同じ種類の別のサーバ24である)ことはありえないからである。このことから、その場合、ラック管理装置20は、接続すべきポートを表示部206に表示させることにより、保守者に行うべき作業を通知する(S22)。その接続ポートが正しい場合、SC6の判定はYesとなる。その場合、ラック管理装置20は、接続ポートのブロック解除(接続のみ)を決定し、その接続ポートのブロック解除をスイッチ23に指示する(S23)。
1つのNIC54の接続に係る処理は、接続ポートのブロック解除により終了する。サーバ24には、複数のNIC54を搭載させることができる。このことから、ラック管理装置20は、次にNIC54の接続が全て終了したか否か判定する(SC7)。配置管理情報中の全てのネットワーク情報による接続確認を行った場合、SC7の判定はYesとなり、SC8に移行する。接続確認に用いるべきネットワーク情報が残っていた場合、SC7の判定はNoとなり、次にスイッチ23から送信される制御情報に備える。
SC8では、ラック管理装置20は、接続ポートの全てのブロック解除を決定する。それにより、ラック管理装置20は、スイッチ23に、新サーバ24との接続が確認された全てのポートの制限を解除させ(S24)、PDU21には、電力供給を制限するキャッピングの解除を指示する(S25)。そのキャッピングの解除は、新サーバ24のBMC59によって認識されるS26)。その結果、BMC59は、CPU51にOSを起動させる。それにより、新サーバ24の運用が開始される。
ラック管理装置20は、ラック中央管理装置1に、接続完了を通知する(S27)。その通知により、ラック中央管理装置1は、対応する配置管理情報の運用状況情報中の状態情報を更新する(SB2)。図7の例では、対応する状態情報を「設置」から「運用」に変更する。その変更により、1台の新サーバ24の設置に係わる処理システムの処理が終了する。
上記接続判定部207eの機能の一部は、SC6、SC7の処理の実行によっても実現される。スイッチ制御部207cの機能の一部は、SC8の処理の実行によっても実現される。
なお、本実施形態では、サーバ24に記録媒体31を設けることにより、そのサーバ24がラック2に挿入された段階でそのサーバ24の種類を特定し、その種類が正しいか否か判定するようにしているが、その判定は別の方法により行うようにしても良い。例えばサーバ24の構成情報は、BMC59を介して取得することができる。このことから、サーバ24の種類が正しいか否かの判定は、BMC59から取得可能な構成情報を用いて行うようにしても良い。
また、本実施形態では、新サーバ24に供給する電力量を制御することにより、その新サーバ24が不適切な箇所に接続された場合に発生する悪影響を回避、或いは抑えて、スイッチ23から取得される情報を正しく接続されたか否かの判定に用いている。その判定は、サーバ24が実際に接続されたスイッチ23のポートを直接的に確認することで行うようにしても良い。配置管理情報については、ラック中央管理装置1が自動的に生成することにより、管理者の負担の軽減できるようにしているが、顧客の要望、或いはデータセンターの運用上の理由等から、その生成を管理者が必要に応じて行えるようにするか、或いは変更できるようにしても良い。
1 ラック中央管理装置
2 ラック
3 ネットワーク
4 空調設備
5 コンソール
11〜13、201〜205 通信部
14、297 処理部
14a、207a 通信処理部
14b 空調制御部
14c 配置決定部
15、208 記憶部
20 ラック管理装置
21 PDU
22 情報読取装置
23 スイッチ
24 サーバ
207b PDU制御部
207c スイッチ制御部
207d 位置判定部
207e 接続判定部

Claims (8)

  1. 複数の電子機器と前記複数の電子機器のうち少なくとも2つの電子機器の間におけるデータ転送を行うネットワーク機器とが設置され、処理を実行させる電子機器をケーブルにより前記ネットワーク機器に接続させた処理システムにおいて、
    新たに設置すべき電子機器である第1の電子機器を設置する場合に、前記ネットワーク機器の接続箇所のうち、該第1の電子機器を設置することによって該第1の電子機器の周辺の電子機器に熱問題が発生する可能性が低い設置場所と対応付けられている、該第1の電子機器を前記ケーブルにより接続させるべき接続箇所を表す接続情報を取得する情報取得手段と、
    前記第1の電子機器と前記ケーブルにより接続された前記ネットワーク機器の接続箇所を特定する接続箇所特定手段と、
    前記情報取得手段が取得した前記接続情報を参照し、前記接続箇所特定手段により特定された前記ネットワーク機器の接続箇所が適切か否か判定する設置判定手段と、
    を具備することを特徴とする処理システム。
  2. 前記設置判定手段による判定結果を基に、前記第1の電子機器が接続されるネットワーク機器の動作を制御する運用制御手段、
    を更に具備することを特徴とする請求項1記載の処理システム。
  3. 前記電子機器を収納可能な収納スペースを複数、備えた収納装置に実際に電子機器が収納された収納スペースの位置を特定するための位置特定手段、を更に具備し、
    前記第1の電子機器が前記収納装置に設置される場合に、
    前記情報取得手段は、前記収納装置に前記第1の電子機器を収納すべき収納スペースの位置を表す位置情報を更に取得し、
    前記設置判定手段は、前記情報取得手段が取得した前記位置情報を参照し、前記位置特定手段により特定された前記第1の電子機器が前記収納装置に収納された収納スペースの位置が適切か否かの判定を併せて行う、
    ことを特徴とする請求項1、または2記載の処理システム。
  4. 前記位置特定手段は、前記収納装置に収納された電子機器の種類を特定し、
    前記第1の電子機器が前記収納装置に設置される場合に、
    前記情報取得手段は、前記収納装置に収納すべき前記第1の電子機器の種類を表す種類情報を更に取得し、
    前記設置判定手段は、前記情報取得手段が取得した前記種類情報を参照し、前記位置特定手段により特定された前記第1の電子機器の種類が適切か否かの判定を併せて行う、
    ことを特徴とする請求項3記載の処理システム。
  5. 前記電子機器を収納可能な収納スペースを複数、備えた収納装置に実際に収納された電子機器の種類を特定するための種類特定手段、を更に具備し、
    前記第1の電子機器が前記収納装置に設置される場合に、
    前記情報取得手段は、前記収納装置に収納すべき前記第1の電子機器の種類を表す種類情報を更に取得し、
    前記設置判定手段は、前記情報取得手段が取得した前記種類情報を参照し、前記種類特定手段により特定された前記第1の電子機器の種類が適切か否かの判定を併せて行う、
    ことを特徴とする請求項1、または2記載の処理システム。
  6. 前記第1の電子機器を設置する場合に、該第1の電子機器を収納させるべき収納装置の収納スペースの位置、及び前記ケーブルにより接続させるべき接続箇所のうちの少なくとも1つを決定する設置内容決定手段、
    を更に具備することを特徴とする請求項1〜5の何れか1項に記載の処理システム。
  7. 複数の電子機器と前記複数の電子機器のうち少なくとも2つの電子機器の間におけるデータ転送を行うネットワーク機器とが設置され、処理を実行させる電子機器をケーブルにより前記ネットワーク機器に接続させた処理システムに適用される機器管理装置であって、
    新たに設置すべき電子機器である第1の電子機器を設置する場合に、前記ネットワーク機器の接続箇所のうち、該第1の電子機器を設置することによって該第1の電子機器の周辺の電子機器に熱問題が発生する可能性が低い設置場所と対応付けられている、該第1の電子機器を前記ケーブルにより接続させるべき接続箇所を表す接続情報を取得する情報取得手段と、
    前記第1の電子機器と前記ケーブルにより接続された前記ネットワーク機器の接続箇所を特定する接続箇所特定手段と、
    前記情報取得手段が取得した前記接続情報を参照し、前記接続箇所特定手段により特定された前記ネットワーク機器の接続箇所が適切か否か判定する設置判定手段と、
    を具備することを特徴とする機器管理装置。
  8. 複数の電子機器と前記複数の電子機器のうち少なくとも2つの電子機器の間におけるデータ転送を行うネットワーク機器とが設置され、処理を実行させる電子機器をケーブルにより前記ネットワーク機器に接続させた処理システムに適用されるコンピュータに、
    新たに設置すべき電子機器である第1の電子機器を設置する場合に、前記ネットワーク機器の接続箇所のうち、該第1の電子機器を設置することによって該第1の電子機器の周辺の電子機器に熱問題が発生する可能性が低い設置場所と対応付けられている、該第1の電子機器をケーブルにより接続させるべき接続箇所を表す接続情報を取得し、
    前記第1の電子機器と前記ケーブルにより接続された前記ネットワーク機器の接続箇所を特定し、
    前記接続情報を参照し、前記特定された前記ネットワーク機器の接続箇所が適切か否か判定する、
    処理を実行させるプログラム。
JP2012068350A 2012-03-23 2012-03-23 処理システム、機器管理装置、及びプログラム Expired - Fee Related JP5874484B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012068350A JP5874484B2 (ja) 2012-03-23 2012-03-23 処理システム、機器管理装置、及びプログラム
US13/740,716 US9253039B2 (en) 2012-03-23 2013-01-14 Device management system and device management apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012068350A JP5874484B2 (ja) 2012-03-23 2012-03-23 処理システム、機器管理装置、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013200690A JP2013200690A (ja) 2013-10-03
JP5874484B2 true JP5874484B2 (ja) 2016-03-02

Family

ID=49213419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012068350A Expired - Fee Related JP5874484B2 (ja) 2012-03-23 2012-03-23 処理システム、機器管理装置、及びプログラム

Country Status (2)

Country Link
US (1) US9253039B2 (ja)
JP (1) JP5874484B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10114431B2 (en) * 2013-12-31 2018-10-30 Microsoft Technology Licensing, Llc Nonhomogeneous server arrangement
US9692649B2 (en) * 2014-02-26 2017-06-27 International Business Machines Corporation Role assignment for servers in a high performance computing system based on measured performance characteristics
JP6357946B2 (ja) * 2014-07-25 2018-07-18 富士通株式会社 出力プログラム,出力装置,及び出力方法
CN106301872A (zh) * 2015-06-25 2017-01-04 伊姆西公司 确定数据中心的服务器位置的方法和设备
JP6463660B2 (ja) * 2015-09-17 2019-02-06 富士通株式会社 移動管理装置、移動管理方法及び移動管理プログラム
CN110113219A (zh) * 2019-05-29 2019-08-09 山东浪潮人工智能研究院有限公司 一种服务器位置信息管理方法
US20220413875A1 (en) * 2021-06-29 2022-12-29 Nvidia Corporation Rack component detection and communication
US11832416B1 (en) 2022-09-06 2023-11-28 Nvidia Corporation Motile tracking of datacenter components

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6020354A (ja) * 1983-07-14 1985-02-01 Hitachi Maxell Ltd 検索装置
US4644541A (en) * 1985-01-18 1987-02-17 Pitney Bowes Inc. Diagnostic test for programmable device in a mailing machine
WO1996029640A1 (fr) * 1995-03-20 1996-09-26 Hitachi, Ltd. Procede d'exploitation automatique d'un systeme decentralise
JPH10161967A (ja) * 1996-10-03 1998-06-19 Nikon Corp 情報処理装置、情報処理方法、および、記録媒体
US6175798B1 (en) * 1999-12-03 2001-01-16 Kelsey-Hayes Company Algorithm for verification of correct ABS controller installation
CA2299824C (en) * 2000-03-01 2012-02-21 Spicer Corporation Network resource control system
US6631063B2 (en) * 2001-06-05 2003-10-07 Hector P. Ortiz System for monitoring electrical circuit operation
US6968414B2 (en) * 2001-12-04 2005-11-22 International Business Machines Corporation Monitoring insertion/removal of server blades in a data processing system
JP3776054B2 (ja) 2002-04-09 2006-05-17 日本政策投資銀行 装置監視システム及び装置監視方法
EP1359504A1 (de) * 2002-05-03 2003-11-05 SAUER & Partner GmbH Verfahren zur Konfiguration bzw. Steuerung einer elektronisch steuerbaren, modularen Anlage
JPWO2005006190A1 (ja) 2003-07-11 2006-08-24 富士通株式会社 ラック管理システム,管理端末,構成記録装置およびラック装置
US7131019B2 (en) * 2003-09-08 2006-10-31 Inventec Corporation Method of managing power of control box
US20050075937A1 (en) * 2003-10-03 2005-04-07 Bresniker Kirk Michael Rack equipment management information coordination system and method
US7039539B2 (en) 2003-10-07 2006-05-02 Hewlett-Packard Development Company, L.P. Rack equipment environmental condition adjustment system and method
US20050114474A1 (en) * 2003-11-20 2005-05-26 International Business Machines Corporation Automatic configuration of the network devices via connection to specific switch ports
JP4591149B2 (ja) * 2005-03-29 2010-12-01 日本電気株式会社 クラスタシステム、ブレードサーバの電源制御方法及びそのプログラム
US7613807B2 (en) * 2005-07-04 2009-11-03 Hewlett-Packard Development Company, L.P. System, method, and apparatus for discovering a new server connected within an automated data center
US7307837B2 (en) * 2005-08-23 2007-12-11 International Business Machines Corporation Method and apparatus for enforcing of power control in a blade center chassis
JP2007122329A (ja) * 2005-10-27 2007-05-17 Toppan Printing Co Ltd ラック利用状態管理装置、ラック図生成装置、ラック利用状態管理方法及びプログラム
US20070220228A1 (en) * 2006-03-15 2007-09-20 Inventec Corporation Computer memory configuration inspection method and system
JP4501946B2 (ja) * 2007-02-23 2010-07-14 日本電気株式会社 ディスクアレイ装置およびディスクコントローラ用制御プログラム
US20080222732A1 (en) * 2007-03-06 2008-09-11 Microsoft Corporation Computer manufacturer and software installation detection
US7857214B2 (en) * 2007-04-26 2010-12-28 Liebert Corporation Intelligent track system for mounting electronic equipment
US20080319570A1 (en) * 2007-06-25 2008-12-25 Van Schoiack Michael M System and method for fastener installation
JP5038234B2 (ja) * 2008-05-26 2012-10-03 株式会社グローバルエンジニアリング サーバーコンピュータの温度監視方法、及びその装置
US20100042852A1 (en) * 2008-08-18 2010-02-18 Huawei Technologies Co., Ltd. Power-on protection method, module and system
JP5531465B2 (ja) * 2009-06-30 2014-06-25 日本電気株式会社 情報システム、制御装置、そのデータ処理方法およびプログラム
JP2011145827A (ja) * 2010-01-13 2011-07-28 Hitachi Omron Terminal Solutions Corp 仮想バスシステム、およびデバイス管理方法
JP2012146235A (ja) * 2011-01-14 2012-08-02 Nec Corp 設置位置情報管理システム、ラック、管理対象機器および設置位置情報管理方法
US8531983B2 (en) * 2011-02-28 2013-09-10 Tellabs Operations, Inc. System and method for identifying a length of an installed fiber cable
US8793351B2 (en) * 2011-05-24 2014-07-29 Facebook, Inc. Automated configuration of new racks and other computing assets in a data center

Also Published As

Publication number Publication date
JP2013200690A (ja) 2013-10-03
US9253039B2 (en) 2016-02-02
US20130254428A1 (en) 2013-09-26

Similar Documents

Publication Publication Date Title
JP5874484B2 (ja) 処理システム、機器管理装置、及びプログラム
US9923766B2 (en) System and method for providing a data center management controller
US7761622B2 (en) Centralized server rack management using USB
JP6179196B2 (ja) データセンター
US9423854B2 (en) System and method for server rack power management
US9430010B2 (en) System and method for server rack power mapping
US9732972B2 (en) Information processing device and controlling method
US10146280B2 (en) Reconfiguration of computing device and/or non-volatile memory devices based on thermal analysis
US20140124168A1 (en) Closed-loop Cooling System for High-Density Clustered Computer System
US20150250076A1 (en) Data center, computer-readable recording medium having stored therein controlling program for control apparatus and controlling method for data center
US20060161972A1 (en) System and method for license management in blade server system
CN106814826B (zh) 控制服务器机柜中气流的系统及方法
US20150256409A1 (en) System and Method for Providing U-Space Aligned Intelligent VLAN and Port Mapping
US9619422B2 (en) Server system and method for transferring at least one chassis-specific configuration value
US20120136502A1 (en) Fan speed control system and fan speed reading method thereof
JP2011069525A (ja) 空調制御装置、空調制御方法および空調制御プログラム
US9699933B2 (en) System and method for providing AC jumper management and identifying AC jumper topology
US20150256406A1 (en) System and Method for Providing a U-Space Aligned KVM/Ethernet Management Switch/Serial Aggregator Controller
US10506743B2 (en) Systems and methods of automated open-loop thermal control
CN104615447A (zh) 一种整机柜服务器监控管理软件复用方法
US20150253794A1 (en) System and Method for Server Rack and Data Center Cooling
US20150257311A1 (en) System and Method for Closed-Loop Thermal Control Utilizing a Smart Floor Tile
US20160337446A1 (en) Managing computing devices in a computing system
CN103136006A (zh) 更新固件的方法
JP6589299B2 (ja) 冷却制御装置、回路基板、冷却方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151203

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160104

R150 Certificate of patent or registration of utility model

Ref document number: 5874484

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees