JP2009076062A - 情報システムにおける熱管理のための方法および装置 - Google Patents

情報システムにおける熱管理のための方法および装置 Download PDF

Info

Publication number
JP2009076062A
JP2009076062A JP2008201783A JP2008201783A JP2009076062A JP 2009076062 A JP2009076062 A JP 2009076062A JP 2008201783 A JP2008201783 A JP 2008201783A JP 2008201783 A JP2008201783 A JP 2008201783A JP 2009076062 A JP2009076062 A JP 2009076062A
Authority
JP
Japan
Prior art keywords
computers
section
information system
information
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008201783A
Other languages
English (en)
Inventor
Takashi Arakawa
敬史 荒川
Yoshiki Kano
義樹 加納
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/898,948 external-priority patent/US7818499B2/en
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2009076062A publication Critical patent/JP2009076062A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • G06F1/3221Monitoring of peripheral devices of disk drive devices
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Power Sources (AREA)
  • Air Conditioning Control Device (AREA)

Abstract

【課題】効率的な冷却および電力消費を達成する、情報システムに配置されている情報処理機器の熱管理のための方法および装置を提供する。
【解決手段】情報システムがいくつかのセクションに分割され、第1のセクションに1つまたは複数の第1のコンピュータが配置され、第2のセクションに1つまたは複数の第2のコンピュータが配置され、第1のセクションの温度状態を感知する第1の温度センサ、および第2のセクションの温度状態を感知する第2の温度センサを含む。第1および第2の温度状態から決定された熱分布が熱分布の所定のルールに適合しないとき、情報システムは、熱分布をルールに適合させるために、第1のコンピュータの処理負荷の一部分を第2のコンピュータに再配置するように、またその逆も同様に行うように構成する。
【選択図】図40

Description

[0001] 本出願は、その全開示が参照により本明細書に組み込まれる、2007年9月18日出願の米国特許出願第11/898,948号の一部継続出願である。
[0003] 本発明は、一般に、データ処理、通信、ストレージシステムなどの情報システムに関する。
[0005] いくつかの要因が、データセンターおよび他の情報施設の運営費を著しく増やしつつある。これらの要因には、絶えず増え続ける追加のデータ記憶容量の需要、増え続ける処理能力の需要、エネルギー価格の増加、およびより多くの電気を消費し、より多くの冷却能力を必要としているコンピュータおよびストレージシステムなどがある。その結果、データセンターおよび他の情報システムにおける機器の密度および電力消費が急速に増加している。これらの要因の対処を試みるために、寄せ集めの解決策が採用されている。例えば、使用可能な床面積をよりよく使用するために、機器をより高密度に単一のエリアに詰め込もうとする企業もあれば、過熱問題を低減するために、機器を広げようとする企業もある。それにも関わらず、現在の傾向が続く場合、機器の密度の増加、およびシステムの規模の急速な成長のために、多くの情報システムでは、必要を満たすには電力および冷却能力がまもなく足りなくなる。
[0006] 高密度のデータストレージおよび処理環境でのコンピュータ機器における適切な温度の維持が、この機器の故障を回避するのに必要である。機器を冷却するための空気の調整および循環は、一般の情報システムで消費される電力の約半分を占めるため、電力消費を低減するための1つの解決策は、機器によって生成された熱のよりよい管理、および情報システムにおける機器のより効率的な冷却を介するものである。
[0007] さらに、情報システムにおける主な機器は、現在、機器における負荷に基づいて電力消費を制御することを含む能力を有する。例えば、プロセッサは、高い処理負荷(すなわち高負荷)を必要とするプログラムを処理するとき、大量の電力を消費し得る。しかし、プロセッサに処理負荷がほとんどない(すなわち低負荷)とき、プロセッサは、そのクロック速度(動作周波数)を減速することを含む、アイドルモードへのシフトによって、電力消費を低減することができる。したがって、情報システムにおけるサーバや他の構成要素など、一部の機器は、各構成要素の負荷に従って電力消費を制御することができる。
[0008] 関連技術には、その全開示が参照により本明細書に組み込まれる、Frenchらの「Techniques for Cooling a Set of Circuit Boards within a Rack Mount Cabinet」という名称の米国特許第6,987,673号明細書がある。しかし、背景技術は、情報システムにおける熱源の場所の管理および制御の技術を開示していない。情報システムにおける特定の場所で生成された熱の量の管理および制御は、より効率的な冷却を達成するのを助けることができ、それによって、消費される電気量を低減することができる。したがって、機器の密度が高い施設における熱分布の管理および制御のよりよい方法が必要である。
[0009] 一部の実施形態では、本発明は、それだけには限定されないが、データセンターおよび他のタイプの施設を含む、情報システムに配置されている情報処理機器の熱管理のための方法および装置を提供する。一部の実施形態では、効率的な冷却を実現するために、システムの設計に従って、およびシステムにおける機器および冷却システムの配列に従って、ルールがシステムに指定され得る。一部の実施形態では、システムは、ルールと異なる熱分布を検出すると、熱分布を調整することができ、それによって、より効率的な冷却および電力消費を達成することができる。好ましい実施形態の以下の詳細な説明に鑑みて、当業者には本発明のこれらおよび他の特徴および利点がわかるようになる。
[0010] 添付の図面は、上述した一般的な説明、および後述する好ましい実施形態の詳細な説明とともに、現在企図されている本発明の最良の態様の好ましい実施形態の原理を示し、説明するのに役立つ。
[0058] 本発明の以下の詳細な説明において、本開示の一部分を形成し、本発明がそれによって実施される特定の実施形態が、限定ではなく例として示されている添付の図面が参照される。図面において、いくつかの図面を通して、同様の数字は、ほぼ同じ構成要素を示す。さらに、詳細な説明は、以下に記載され、図面に示されているように、様々な実施形態を提供するが、本発明は、本明細書に記載され、示されている実施形態に限定されるものではなく、当業者にわかる、または当業者にわかるようになる他の実施形態に拡張することができることに留意されたい。さらに、図面、上記の説明、および以下の説明は、例にすぎず、いかなる方法によっても、本発明または本出願の範囲を限定するものではない。
[0059] 本発明の実施形態は、熱測定手段、ボリューム移行手段(volume migration means)、およびボリューム位置管理手段を有する1つまたは複数のストレージシステム、1つまたは複数のホストコンピュータ、および1つの管理コンピュータを含む情報システムを開示する。例えば、アクセス頻度が高いハードディスクドライブ(HDD)は、アクセス頻度が低いHDDと比べて、ストレージシステムにおいてより多くの熱を生成する。というのは、前者は、スピンドルおよびヘッドアームのためのモータの連続稼働を必要とし、後者は、停止または減速することができるからである。したがって、本発明の実施形態は、アクセス頻度または他のデータ構成および分布測定基準に基づいて、ストレージシステムにおける熱分布のためのルールを確立する。効率的な冷却を実現するために、情報システム施設のユーザまたは管理者は、施設の設計および施設内の機器および冷却システムの配列に従って、1つまたは複数のルールを指定することができる。
[0060] 例えば、一部の実施形態下で、システムは、ルールとは異なる熱分布をシステムにおいて検出すると、システムにおけるボリュームの物理的な位置を変更することによって、熱分布を自動的に調整することができ、それによって、冷却の効率を向上させ、電力消費を低減することができる。さらに、一部の実施形態では、熱分布の管理が複数のストレージシステム(ノード)間で実行される。ユーザまたは管理者は、同じ施設における複数のストレージシステムに熱分布のルールを指定することができる。ストレージシステムのうちの1つが、ルールからの熱分布の変化を検出すると、そのストレージシステムは、複数のストレージシステム内のボリュームの物理的な位置を変更することによって、熱分布を調整することができ、これによって、1つまたは複数のルールに基づいて、施設全体にわたる熱分布の最適化が可能になる。さらに、本発明の一部の実施形態は、よりよい熱分布管理を達成するために、新しいボリュームの割り振りを管理するプロセスを含む。
[0061] さらに別の実施形態では、熱分布の管理が複数のコンピュータ間で行われる。ユーザまたは管理者は、情報システムにおけるコンピュータを含むシステムに、熱分布のルールを指定することができる。管理コンピュータは、ルール外の熱分布の変化を検出すると、例えばコンピュータ間の負荷の物理的な位置を変更することなどによって熱分布を調整しようと試みる旨の指示を送信することができる。上記の方法によって、サーバまたは他のタイプのホストなどのコンピュータについての指定されたルールに基づく熱分布の最適化を行うことができる。
[0062] さらに別の実施形態では、熱分布の管理が、コンピュータ、ストレージシステム、およびネットワークスイッチを含む情報システムにおいて行われる。ユーザまたは管理者は、情報システム全体に熱分布のルールを指定することができる。管理コンピュータがルールから離れた熱分布の変化を検出すると、システムは、コンピュータの処理負荷、ストレージシステムへのI/O負荷、システムにおけるスイッチへのトランザクション負荷など、機器への負荷の物理的な位置を変更することによって、熱分布を調整することができる。上述した方法によって、情報システム全体についての指定されたルールに基づく熱分布の最適化を行うことができる。
[0063] 第1の実施形態−システム構成
[0064] 図1は、本発明の第1の実施形態が適用され得る情報システム構成を示す。図1の情報システムは、1つまたは複数のホストコンピュータ500および1つの管理コンピュータ520と通信する1つまたは複数のストレージシステム100を含む。ストレージシステム100は、複数の記憶装置へのデータのアクセスおよび格納を制御するアレイコントローラ110を含んでおり、記憶装置は、好ましい実施形態では、ハードディスクドライブ(HDD)610である。しかし、他の実施形態において、記憶装置は、固体装置、光学装置などでもよい。アレイコントローラ110は、メインプロセッサ111、スイッチ112、ホストインターフェイス113、パスコントローラ114、メモリ200、キャッシュ300、およびバックエンドパス601を介してディスクドライブ610と通信するための1つまたは複数のディスクコントローラ400を含む。バックエンドパス601は、ファイバチャネル上のSCSI、SATA、SAS、iSCSIなどを使用することができる。
[0065] メインプロセッサ111は、ホストコンピュータ500から受信された入力/出力(I/O)操作の処理、記憶装置610へのデータの格納およびそこからのデータの取り出し、および他のストレージシステム管理機能など、アレイコントローラ110に対して様々なプロセスを行う。メインプロセッサ111およびストレージシステム100の他の構成要素は、本発明の実施形態を実行するために、複数のプログラムおよびデータ構造を使用し、これらは、メモリ200または他のコンピュータ可読媒体に格納され得る。データ構造は、パリティグループ情報201、アクセス情報202、ボリューム情報203、エリア情報204、熱情報205、および移行情報206を含み、これらについてはそれぞれ、以下でさらに説明する。メインプロセッサ111は、それぞれ以下でさらに説明する読み取り/書き込みプロセスプログラム211、位置管理プログラム212、および移行プログラム213を含むメモリ200または他のコンピュータ可読媒体に格納されている1つまたは複数のプログラムを実行することによって、本発明のプロセスを実行する。
[0066] ホスト500および管理コンピュータ520は、ファイバチャネル、iSCSI(IP)、または他のネットワークタイプでもよいストレージエリアネットワーク(SAN)901を介して、ホストインターフェイス113と通信するために接続される。ホスト500および管理コンピュータ520は、Ethernet(登録商標)や他のネットワークタイプであり得るローカルエリアネットワーク(LAN)および/または広域ネットワーク(WAN)903を介して互いに通信するために接続される。管理端末520は、インターネットプロトコルまたは他のネットワークタイプでもよく、LAN903と同じものまたは別個のネットワークでもよい、帯域外(管理)ネットワーク902を介して、アレイコントローラ110にも接続され得る。また、ストレージシステムは、第2の実施形態で説明するノードネットワーク904によって接続されるパスコントローラ114も有し得る。コンピュータとしての機能を有するために、ホスト500および管理コンピュータ520はそれぞれ、プロセッサおよびメモリ(図1には図示せず)などの一般のコンピューティングリソースを有する。各ホスト500は、I/O要求をストレージシステム100に送信するアプリケーションソフトウェア501を含んでいてもよく、また、オペレーティングシステムソフトウェア、ファイルシステム(図示せず)などを含んでいてもよい。さらに、管理コンピュータ520は、管理ソフトウェア521を含んでおり、熱情報522を含んでいてもよく、これらについては、以下でさらに説明する。
[0067] 複数の論理ボリューム620(論理ユニット)は、例えばアプリケーションデータなどを格納するためにホスト500によって使用するなど、ストレージリソースとして、ストレージシステム100によって提供され得る。ボリューム620は、HDD610における物理ストレージエリアの集まりから作られる。ボリューム620は、パリティコードを格納することによって、すなわち複数のディスクドライブ610の集まりの上に形成されたボリュームにRAID(Redundant Array of Independent Disk)構成を使用することによって保護され得る。1つまたは複数のボリュームの提供に使用できるRAID構成のディスクドライブ610のこうした集まりは、アレイグループ、またはパリティグループ600と呼ばれる。本発明の実施形態において、管理者の選好、ストレージシステムの意図される用途などに応じて、様々なパリティグループ構成(RAID構成)および各パリティグループにおける様々なディスク数を適用することができる。ホスト500は、ボリューム620のうちの1つまたは複数にデータを格納することができ、ボリューム内のデータを使用することができる。言い換えれば、ホスト500は、データをボリューム620に書き込み、ボリューム620からデータを読み取り、ホスト500上でアプリケーション501を稼働させることができる。
[0068] 図2に示されているように、本発明の実施形態によるディスクドライブ610のうちの1つまたは複数は、ディスク内コントローラ611、および磁気記憶媒体612に加えて、外部温度センサ613を含み得る。例えば、一部の実施形態によれば、各パリティグループ内の1つのディスクドライブが外部温度センサ613を備えていてもよい。ディスク内コントローラ611は、ディスクコントローラ400から受信された読み取り要求および書き込み要求を処理し、それぞれ読み取り要求および書き込み要求に従って、データを磁気媒体612から転送したり、そこに格納したりする。さらに、ディスク内コントローラ611は、外部温度センサ613からディスクドライブ610の近くの温度に関する情報を取得し、この温度情報をアレイコントローラ110に送信する。構成の別の例によれば、温度センサ613は、例えばパリティグループのエンクロージャや、ストレージシステム100の他の場所の中のパリティグループに近い他の機器に配置され、ストレージシステム内の特定のパリティグループまたは他のディスク、ディスク群、個々のストレージキャビネットなどの温度に関する温度情報を、アレイコントローラ110に送信することができる。
[0069] アレイコントローラ110は、パリティグループ情報201を参照することによって、ストレージシステム100内のパリティグループ600を管理する。図3は、パリティグループ情報201のデータ構造の一例を示す。図3に示されているように、パリティグループ情報201は、パリティグループ識別子(ID)2011、各パリティグループ600内のディスク数2012、ディスク構成のタイプ(RAIDタイプ)2013、各パリティグループ600内の個々のディスクを識別するディスクID2014、各ディスクの容量2015を含み得る。
[0070] 各ホスト500にボリュームを提供するために、アレイコントローラ110は、アクセス情報202およびボリューム情報203を維持する。アレイコントローラ110は、SAN901を介してホスト500から読み取りコマンドや書き込みコマンドなどのI/O操作を受信し、コマンドによって対象とされたボリュームからデータを読み取ったり、そこにデータを格納したりする。さらに、アレイコントローラ110は、読み取りアクセスおよび書き込みアクセスの量(すなわちアクセス負荷)をアクセス情報202に記録し、維持する。
[0071] 図4は、アクセス情報202のデータ構造の一例を示す。アクセス情報202は、ボリュームID2021、負荷測定タイプ2022、および負荷測定タイプのうちの1つまたは複数に従って、そのボリュームについて測定されたアクセス負荷2023を含む。例えば、図4において、ボリュームごとのアクセス負荷は、単位時間当たりの平均アクセス数および単位時間当たり転送されるデータ量によって表される。つまり、1時間の間の1秒当たりの平均I/O操作(iop)、および1秒当たり転送される平均MB(MB/s)が、ボリュームごとにアクセス情報202に記録され得る。
[0072] 図5は、ボリューム情報203のデータ構造例を示す。図5に示されるように、ボリューム情報203は、どのパリティグループにおいてボリュームが形成されるかを識別するパリティグループID2031、ボリュームID2032、開始論理ブロックアドレス(LBA)2033、およびボリュームに割り振られる容量2034を含む。ボリューム情報203は、各ボリュームと、パリティグループ600のうちの1つにおけるボリュームの物理領域との間のマッピングを維持する。また、ボリューム情報203は、各パリティグループ600の未使用の領域についての情報も維持する。アレイコントローラ110は、ボリューム情報203を使用することによって、ボリュームまたは未使用の領域を探すことができる。
[0073] 本発明の一部の実施形態では、ストレージシステム100における各パリティグループ600の物理的な位置は、「行」および「列」に従って指定することができる。図6は、互いに対してその位置を示すパリティグループ600の物理的な構成の一例を示す。また、図6は、各パリティグループ600の物理的な位置と行/列との間の関係(すなわち行および列の位置)も示す。例えば、パリティグループ1−2の行は、「行1」、パリティグループ1−2の列は、「列2」である。
[0074] アレイコントローラ110は、エリア情報204を使用することによって、すべてのパリティグループ600間で熱分布のルールを実施することができる。図7は、エリア情報204のデータ構造の一例を示す。図7の実施形態では、パリティグループ600は、エリア名フィールド2041に入力されているように、2つのエリアのうちの一方(すなわち「高い」または「低い」)に分けられる。エリア情報204における条件2042に関して、「T」は、各パリティグループ204の目標温度を示し、「A」は、すべてのパリティグループ600の平均温度から決定された温度の境界を示す。アレイコントローラ110は、パリティグループのそれぞれについて集められた後述する熱情報205を参照することによって、境界として使用される平均温度「A」を決定(すなわち計算)し、次いで、すべてのパリティグループの平均温度を決定することができる。図7および図8A〜8Bのルールによって、パリティグループの半分が平均温度を上回り、半分が下回るようにすることができ、それによって、すべてのパリティグループの温度を正規化することができる。エリア情報204内のパリティグループID2043は、各エリア2041に属するパリティグループ600を示す。
[0075] この例では、各パリティグループ600が属するエリアは、ルールによって決定され、図8Aにそのプロセスが示されている。図8Aにおいて、「R」は、パリティグループ600の行を意味し、「C」は、パリティグループ600の列を意味する。図7および図8A〜8Bに示されるように、この例では、「高い」パリティグループ600および「低い」パリティグループ600の配列が均等化または均質化される。後述するように、これによって、ストレージシステム内の熱分布(すなわち温度)の均等化が達成される。例えば、ステップ1001は、row mod2=1かどうかを決定する。次いで、プロセスは、ステップ1002またはステップ1003に進んで、column mod2=1かどうかを決定する。その結果、YES、YESの回答またはNO、NOの回答は、パリティグループが「低」温エリアとして分類されることを意味し、YES、NOの回答またはNO、YESの回答は、パリティグループが「高」温エリアとして分類されることを意味する。
[0076] 図7および図8A〜8Bに示される特定の例において、このルールの結果、図8Bに示されるように、「低」温エリアが「高」温エリアによって結合され、その逆も同様である市松模様が得られる。他のルールまたはシステムの配列において、例えば、外部位置に「高い」エリアを有し、中央位置に「低い」エリアを有するなど、他のパターンがより効率的である場合がある。一般の空冷方法を使用したデータセンターや他の施設などの冷却環境の場合、不均質な熱分布は、効率の悪さをもたらす。というのは、最も高温のエリアをある最低温度に保つために、エリア全体の1つまたは複数の部分における過冷却が必要だからである。一方、各高温パリティグループが低温パリティグループによって結合され、その逆も同様である、図8Bに示されている配列によって、熱分布が、パリティグループを作り上げる記憶装置にわたって均等化される。すべての構成要素にわたる熱分布の均等化は、上述した効率の悪さを回避し、全体的な冷却負荷が低減するため、より効率的な冷却を達成する。また、このことは、局部的な高温によるディスクドライブ600のうちの1つまたは複数の局部的な故障も回避する。さらに、代替の方法として、境界温度「A」は、アレイコントローラ110によって計算されるのではなく、管理コンピュータ520からユーザによって指定されてもよい。
[0077] 温度の監視
[0078] 上述したように、アレイコントローラ110は、各ディスクドライブ600またはパリティグループ600の温度情報を集める。アレイコントローラ110は、熱情報205に温度情報を記録し、維持する。図9は、熱情報205のデータ構造の一例を示す。図9に示されているように、アレイコントローラ110は、温度センサ613から入力を集める、または受信することによって、所定の時間間隔で、各パリティグループ600の温度を記録する。ユーザは、管理コンピュータ520を介して温度情報を集めるための時間間隔を指定することができる。アレイコントローラ110は、パリティグループ600に属するディスクドライブ610の温度の平均を取ることによって、パリティグループ600の温度を取得することができ、または、単一の温度センサ613が各パリティグループなどに割り当てられてもよい。熱情報205は、いくつかのユーザ決定を容易にする、または有効にするために、管理コンピュータ520に転送され、熱情報522としてユーザに表示され得る。
[0079] 適切な熱分布を維持するためのプロセス
[0080] 図10は、ストレージシステム100において望ましい熱分布を維持するためのプロセス例を示す。図10に記載されているプロセスをたどることによって、ストレージシステム100は、エリア情報204によって定義されているルールに従って適切な熱分布を達成することができ、したがって高温の箇所が回避される。
[0081] ステップ1101で、アレイコントローラ110は、所定の周期間隔で、または温度センサ613のうちの1つが所定の温度を上回る温度を示した場合の警告に応答して、熱情報205をチェックする。
[0082] ステップ1102で、アレイコントローラ110は、ボリューム情報203、エリア情報204、および熱情報205を使用することによって、各パリティグループ600の温度をチェックする。アレイコントローラ110は、エリア情報204に記載されている条件が維持されているかどうかを確認する。
[0083] ステップ1103で、この条件に基づく熱分布がエリア情報204に従って維持されている場合、プロセスが終了する。そうでない場合、プロセスは、ステップ1104に進んで、是正処置を取る。
[0084] ステップ1104で、アレイコントローラ110は、適切な熱分布を達成するために移動すべき1つまたは複数のボリュームを選択する。このステップの詳細については、以下でさらに説明する。
[0085] ステップ1105で、アレイコントローラ110は、条件を満たすためにボリュームの宛先を移動する必要があるため、未使用の場所を探す。アレイコントローラ110が、要件を満たす未使用の場所を見つけることができる場合、プロセスはステップ1107に進む。一方で、すべての要件を満たす未使用の場所がない場合、プロセスは、ステップ1106に進む。
[0086] ステップ1106で、アレイコントローラ110は、エリア情報204に記載されているカテゴリに基づくベストエフォートの決定(best-effort determination)によって、未使用の場所をボリュームの宛先として選択する。ベストエフォートの決定の一例として、アレイコントローラ110は、条件が満たされていない場合でさえ、熱分布を条件に近づけることができる未使用の場所を選択することができる。別の例として、アレイコントローラ110は、最低限の向上しかない場合、任意の変更(すなわち操作)を行わないよう決定することができる。
[0087] ステップ1107で、アレイコントローラ110は、選択されたボリュームを、選択された未使用の場所に移動させ、プロセスが終了する。移行プロセスの詳細については、以下で説明する。
[0088] ステップ1104で、アレイコントローラ110は、「低い」(すなわち「T」が「A」以上である)に指定された条件より高温の「低い」パリティグループ600(すなわち、エリア情報204に従って「低い」エリアに属するパリティグループ)を見つけると、アクセス情報202を参照することによって、そのパリティグループ600内で最大の負荷を有するボリュームを選択する。次いで、ステップ1105で、アレイコントローラ110は、「高い」パリティグループ600(すなわち、「高い」エリアにあるものとして分類されたパリティグループ)のうちの1つにおける未使用の場所を、ボリュームの移行の対象の宛先として選択する。最大負荷を有するボリューム(すなわち、大量のI/O操作のために、大量の熱を発生させる物)を「高い」パリティグループ600に移動させることによって、「低い」パリティグループにおける熱が低減され、代わりに、このボリュームが、図7および図8のルールによって確立された熱分布パターンに従って、より高い熱を有することができるパリティグループに配置される。あるいは、アレイコントローラ110が同じサイズ(割り振られた容量)を有するボリュームを見つけることができる場合、未使用の場所に移動する代わりに、アレイコントローラ110は、「低い」パリティグループにあるボリュームを、「高い」パリティグループ600のうちの1つにある低い負荷を有するボリュームと交換することができる。
[0089] ステップ1104で、アレイコントローラ110が「高い」の条件より低温の「高い」パリティグループ600(すなわち、エリア情報204に従って「高い」エリアに属するパリティグループ)を見つけると、アクセス情報202を参照することによって、そのパリティグループ600内で最小の負荷を有するボリュームを選択するように、アレイコントローラ110を構成することができる。次いで、ステップ1105で、アレイコントローラ110は、「低い」パリティグループ600(すなわちエリア情報204に従って「低い」エリアに属する)のうちの1つにおける未使用の場所を、移行の対象の宛先として選択する。ステップ1107で、ボリュームを移動させることによって、特定の「高い」パリティグループ600において未使用の場所が作成され、これは、高負荷のボリュームを未使用の場所に移行することができることを意味する。したがって、熱分布は、図7および図8A〜8Bに示されているように、ルールによって記載されている分布に自動的に調整される。あるいは、アレイコントローラ110が同じサイズ(割り振られた容量)を有するこうしたボリュームを見つけることができる場合、単に使用頻度の低いボリュームを、「低い」パリティグループのうちの1つにおける未使用の場所に移動するだけではなく、アレイコントローラ110は、使用頻度の低いボリュームを、「低い」パリティグループ600のうちの1つに配置されている高負荷のボリュームと自動的に交換することができる。
[0090] さらに、ステップ1101でシステムの定期検査を行うための間隔に関して、ユーザは、管理コンピュータ520から間隔を指定したり、必要に応じて間隔を変更したりすることができる。上記のプロセスによって、指定されたルールによるストレージシステム100内の熱分布の管理が達成される。代替の方法として、パリティグループ600の代わりに他の単位のエリアを使用することができ、ストレージシステム内のディスクドライブの位置、ボリュームの作成の方法などに応じて、こうした多くの変形が可能である。さらに、別の代替の方法として、管理ソフトウェア521は、上述した情報を有することによって、また、各パリティグループにおける使用可能な容量、特定のボリュームについての所望の性能など、他の要因を考慮に入れることによって、ボリュームの場所の調整を管理し、指示することができる。さらに、一部の実施形態において、パリティグループを使用する代わりに、個々の記憶装置においてボリュームを形成することができる。この場合、1つまたは複数の第1の記憶装置が、「高」温の装置と指定され、1つまたは複数の第2の記憶装置が、「低」温の装置と指定され得る。熱分布パターンおよびルールを、パリティグループについて上述したのと同じ方法で、こうした個々の記憶装置に適用することができる。
[0091] ボリュームの移行のプロセス
[0092] 図11は、ストレージシステムにおける熱分布を正規化するために、上述したボリュームの移行を実行するためのプロセス例を示す。プロセスを実行する際に、アレイコントローラ110は、移行情報206を使用する。図12は、移行情報206のデータ構造の一例を示す。移行情報206は、移動すべきボリュームのボリュームID2061、宛先として選択された未使用の場所に関する宛先情報2062、およびコピーの進捗を示すコピーポインタ(LBA)2063を含む。宛先情報2062は、パリティグループ2064、ボリュームの開始アドレス(LBA)2065、およびボリュームの容量2066を含む。
[0093] ステップ1201で、アレイコントローラ110は、ボリュームID2061、宛先のパリティグループ2064、宛先の開始アドレス2065、および容量2066を含めて、移動すべきボリュームについての移行情報206への入力を行う。
[0094] ステップ1202で、アレイコントローラ110は、宛先として選択された場所にボリューム内のデータをコピーし始める。データのコピーが進むにつれて、移行情報206内のコピーポインタ2063は、更新され、前方に移動される。
[0095] ステップ1203で、宛先へのデータのコピーの完了後、アレイコントローラ110は、ボリューム情報203を更新して、ボリュームと、ボリュームが移行された物理的な位置との間のマッピングを変更する。これによって、ホスト500には気付かれずにボリュームが移行される。ボリューム情報が更新された後、アレイコントローラ110は、ボリューム情報203から元のボリュームの入力を削除する。
[0096] 移行中のボリュームへの読み取り/書き込みアクセスのプロセス
[0097] 図13は、書き込み要求が移行中のボリュームを対象とするときに行われる書き込み要求のプロセス例を示す。
[0098] ステップ1301で、アレイコントローラ110は、SAN901を介して、ホスト500から書き込み操作を受信する。
[0099] ステップ1302で、アレイコントローラ110は、ボリューム情報203および移行情報206を参照して、ボリュームのマッピングを決定し、ボリュームが移行を受けているかどうかを決定する。
[0100] ステップ1303で、移行情報206に記録されたボリュームID2061の参照の結果、アレイコントローラ110は、書き込みコマンドの対象であるボリュームが移行中であるかどうかを決定することができ、そうである場合、プロセスは、ステップ1304に進む。一方、対象のボリュームが現在移行中でない場合、プロセスは、ステップ1306に進む。
[0101] ステップ1304で、移行情報206内のコピーポインタ2063の参照の結果、アレイコントローラ110は、対象のボリューム内に書かれる対象の領域が、移行プロセスの一部としてすでにコピーしたかどうかを決定する。ボリュームの対象領域が新しいエリアにすでにコピーされている場合、プロセスは、ステップ1305に進む。そうでない場合、プロセスは、ステップ1306に進む。
[0102] ステップ1305で、アレイコントローラ110は、受信された書き込みデータを、宛先ボリュームの対応する領域に格納する。書き込みデータは、SAN901を介してホスト500から転送され、宛先ボリュームに格納する前に、一時的にキャッシュ300に格納されてもよい。
[0103] ステップ1306で、アレイコントローラ110は、書き込みデータを、コマンドによって指定されたボリュームに格納する。
[0104] ステップ1307で、アレイコントローラ110は、書き込みコマンドのプロセスの完了をホスト500に報告する。したがって、書き込みコマンドが、移行プロセスにおいてすでにコピーされたボリュームの一部分を指定しているとき、上記のプロセスを実行することによって、書き込みデータは、指定された対象のボリュームおよび宛先ボリュームの両方に格納される。
[0105] ホスト500から受信された読み取り操作では、アレイコントローラ110は、SAN901を介してホスト500から読み取り要求を受信し、ボリューム情報203を参照して、ボリュームの対象部分の物理的な位置を決定する。例えば、ボリュームが元のパリティグループ内にあることをボリューム情報が示す場合、移行は完了しておらず、データは、元の場所から読み取ることができる。一方、移行が完了している場合、ボリューム情報が変更されており、ボリューム情報は、宛先のパリティグループ内のボリュームにマッピングされる。アレイコントローラ110は、読み取りコマンドで指定されている領域に格納されているデータを取得し、そのデータを、SAN901を介してホスト500に転送する。
[0106] エリア情報の追加の例
[0107] 図14は、熱分布のルールの別の例によるエリア情報204’のデータ構造の別の例を示している。図14において、一連の列は、「低い」パリティグループ600に属し、別の一連の列は、「高い」パリティグループ610に属している。図15に示すように、このルールは、パリティグループの一部分がパリティグループの別の部分より多い量の熱を生成することを目的とする、熱の意図的な空間的局部化(spatial localization)を作り出す。主に最も多い熱を生成することを意図したパリティグループに集中冷却を向けることによって、熱生成および集中冷却のこの局部化は、より低い電力消費を冷却に使用して、高効率の冷却を実現する。さらに、図16は、図14のエリア情報204’をどのように複数のストレージシステム100に適用すれば、集中(強制)冷却用空気が、より低い熱生成を有するものとして指定されたパリティグループではなく、より高い熱生成を有するものとして指定されたパリティグループを通るように向けられ、これによって、システム全体のより効率的な冷却を達成することができるかを示す。低温のエリアからの高温のエリアの分離、例えば、「暖気通路」と「冷気通路」との切り離しは、効率の良い冷却を実現するための1つの方法である。こうした分離を達成するために、上述したプロセスを適用することができる。
[0108] 熱情報の追加の例
[0109] 図17は、熱情報205’の別の例を示す。この熱情報205’には、図9に関連して上述したように、瞬間の温度のみではなく、記録され、維持される、所定の期間にわたって測定された最大(最高)温度、最小(最低)温度、および平均温度についての入力を含むタイプフィールド2053が含まれる。管理コンピュータ520を使用することによって、ユーザは、特定のパリティグループが熱分布について指定されたルールに適合しているかどうかを決定する際に、上述した決定に使用される値のタイプを選択することができる。
[0110] 第2の実施形態−システム構成
[0111] 図18は、本発明の第2の実施形態が実行され得るシステム構成の一例を示す。図18のシステム構成において、複数のストレージシステム100(ストレージノードとも呼ばれる)は、例えば、ファイバチャネル、インターネットプロトコル、インフィニバンドなどとすることができ、パスコントローラ114(図1参照)を介してアクセスされるノードネットワーク904を介して互いに通信するために接続される。ストレージシステム100のそれぞれは、第1の実施形態におけるストレージシステム100の上述したデータ構造およびプログラムを含むアレイコントローラ110(図1参照)、ディスクドライブなど、同等の構成要素を有するように構成することができる。
[0112] また、ストレージシステム100は、SAN901(ファイバチャネル、iSCSI(IP)など)を介して、および第1の実施形態で上述したように、帯域外ネットワーク902(インターネットプロトコルなど)および/またはLAN903によって、ホスト500および管理コンピュータ520にも接続される。アプリケーションソフトウェア501、オペレーティングシステム502、およびファイルシステム503に加えて、各ホスト500は、I/Oパス制御ソフトウェア504を含む。
[0113] それぞれのストレージシステム100上のアレイコントローラ110は、SAN901を介して、ホスト500から読み取りコマンドおよび書き込みコマンドを受信し、コマンドに従ってデータを取り出したり格納したりすることができる。さらに、各アレイコントローラ110は、どのボリュームが最高および最低のアクセス負荷を有するかを各ノードがわかるように、図4に関連して上述したように、読み取りアクセスおよび書き込みアクセスの量(すなわち、負荷)をアクセス情報202に記録し、維持する。また、第1の実施形態において図2を参照して説明した温度センサ613は、1つまたは複数のディスクドライブ610、他の機器、または各ストレージシステム100のエンクロージャに配置され、各ストレージシステム100の各アレイコントローラ110に温度情報を送信するように構成されている。
[0114] 図19は、この実施形態におけるボリューム情報203’のデータ構造の一例を示す。図19は、第1の実施形態の場合のようにパリティグループに従ってボリュームを識別するのではなく、ストレージノード100と、ノードに配置されているボリュームとの間の関係を示す。したがって、ボリューム情報203’は、ボリュームID2032および容量2034に加えて、ノードIDの入力2035を含む。
[0115] この実施形態において、各ストレージシステムノード100の物理的な位置を、「行」および「列」によって指定することもできる。図20は、ストレージノードの物理的な構成(すなわち位置)の一例を示す。また、図20は、各ノードの物理的な位置とそのノードの行および列との間の関係を示す。例えば、ノード1−2の行は、行「1」、ノード1−2の列は、列「2」である。
[0116] エリア情報および熱分布を管理するためのプロセス
[0117] ストレージノード100のうちの少なくとも1つは、エリア情報204”を使用することによって、すべてのストレージノード100間の熱分布についてのルールを有することができる。例えば、1つのノードは、ノード100間の熱分布が指定されたルールに従っているかどうかを決定するように構成された管理ノードとすることができる。図21は、この実施形態で使用できるエリア情報204”の一例を示し、エリア情報204”は、パリティグループの入力2043の代わりに、割り当てられた行および列による、ノードIDの入力2044を含む。図21において、ストレージノードは、2つのエリア、すなわち「高い」エリアと「低い」エリアとに分けられる。エリア情報204”内の条件2042に関して、「T」は、各ノードの目標温度を示し、「A」は、すべてのストレージノード100の平均温度から決定された温度の境界を示す。例えば、管理ノードとして指定されたノードなど、ノード100のうちの1つの上のアレイコントローラ110の1つは、温度情報が、パリティグループ当たりではなく、ノード当たりで集められることを除いて、図9および図17との関連で上述したものに似ている熱情報205を参照することによって、境界温度「A」を決定(すなわち計算)することができる。
[0118] 図22に示されるように、この例では、「高い」ノードおよび「低い」ノードの配列は、「高」温および「低」温のノード100の市松模様のタイプのパターンに配列することによって、図7および図8A〜8Bを参照して上述したものに似た方法で、均等化または正規化される。この情報に加えて、第1の実施形態について上述した熱分布管理プロセス(図10で説明したボリュームの温度および移行を監視することを含む)を、パリティグループの代わりにノードに適用することによって、ストレージノード100間の熱分布(すなわち温度)の均等化が達成される。例えば、「低」温のノードとして指定された特定のストレージシステムノードが「A」より大きい温度を有する場合、そのノードは、高いアクセス負荷を有する1つまたは複数のボリュームを、1つまたは複数のボリュームを収容するのに十分な容量を有する「高」温のノードとして指定された別のノードに転送するよう指示される。第1の実施形態において説明したように、熱分布の均等化は、それを必要としない過冷却エリアによってもたらされる効率の悪さを避け、それによって、より効率の良い全体的な冷却を達成する。
[0119] 上記のプロセスによって、指定されたルールによる複数のストレージシステム100に関する熱分布の管理が達成される。代替の方法として、管理コンピュータ520上の管理ソフトウェア521は、ノード100のうちの1つに対してこのプロセスを実行する代わりに、上述した情報を受信し、処理することによって、複数のノード100間のボリュームの位置の調整を管理し、指示することができる。さらに、ボリュームを効率よく移動させ、特定のホスト500によって使用されるボリュームにアクセスするために適切な通信パスを、ホスト500と正しいアレイコントローラ110との間で維持するために、I/Oパス制御ソフトウェア504が使用されてもよい。
[0120] エリア情報の追加の例
[0121] 図23は、第2の実施形態に適用され得る熱分布のルールの別の例を示すエリア情報204’’’の別の例を示す。図23のエリア情報204’’’に従って、図24に示されるように、一連のノードの列は、「低い」ノードと指定され、別の一連のノードの列は、「高い」ノードと指定される。図24の配列は、意図的に空間的に局部化された熱の集中を作り出す。うまく計画されたデータセンター空間内の熱集中に冷却用空気を集めることによって、加熱および冷却の局部化により、冷却を必要とする機器の冷却の効率がよりよくなり、それによって、電力消費が低減される。
[0122] 第3の実施形態
[0123] エリア情報204に記載された熱分布のルールを、新しいボリュームの割り振りに適用することができる。図25は、新しいボリュームを割り振るためのプロセスの一例を示す。図25のプロセスが適用されるシステム構成は、第1の実施形態または第2の実施形態で記載したシステム構成とすることができる。
[0124] ステップ1401で、ユーザまたはホスト500は、ボリュームの容量および予想される負荷(例えば、予想されるiopまたはMB/s)の指定を含めて、管理コンピュータ520に新しいボリュームを割り振るよう指示する。
[0125] ステップ1402で、管理コンピュータ520は、容量および予想される負荷を指定することによって、アレイコントローラ110にボリュームを割り振るよう指示する。第2の実施形態の場合、管理コンピュータ520は、管理ノードとして働くことができるノード100のうちの1つにおけるアレイコントローラを選択することができる。あるいは、ユーザまたはホストからアレイコントローラのうちの1つに直接、新しいボリュームを割り振るよう指示してもよく、それによって管理コンピュータ520を省略することができる。
[0126] ステップ1403で、アレイコントローラ110は、指定された負荷を予想される温度に変換する。例えば、アレイコントローラ110は、ある位置に指定された負荷を有するボリュームが追加される場合、その位置の予想される温度の推定にアクセス情報202および熱情報205を使用することができる。この場合、アレイコントローラ110は、アクセス情報202および熱情報205に集められたデータの対応関係をチェックすることによって、負荷と、結果として得られた温度との間の関係情報を取得し、次いで、指定された負荷からの予想される温度の取得に、この関係情報を適用する。
[0127] ステップ1404で、アレイコントローラ110は、ボリューム情報203、エリア情報204、および熱情報205を使用することによって、ボリュームに使用可能な(未使用の)場所、そうでない場合は、ボリュームに適切な場所を探す。言い換えれば、アレイコントローラ110は、熱分布の該当するルールに従って、使用可能な十分な容量も有する場所を探す。
[0128] ステップ1405で、アレイコントローラ110が新しいボリュームに適した場所を見つけた場合、このプロセスは、ステップ1406に進む。そうでない場合、プロセスは、ステップ1407に進む。
[0129] ステップ1406で、アレイコントローラ110は、その場所にボリュームを割り振り、それに応じてボリューム情報203を更新する。
[0130] ステップ1407で、アレイコントローラ110は、新しいボリュームに適切な場所を得ていないことを管理コンピュータ520に報告する。
[0131] ステップ1408で、アレイコントローラ110は、熱分布のルールに従って、次善として、ボリュームの場所を選択する。次いで、アレイコントローラ110は、その場所にボリュームを割り振り、それに応じてボリューム情報203を更新する。
[0132] ステップ1409で、アレイコントローラ110は、新しいボリュームの準備の完了、並びに場所、パス、およびLUN(論理装置番号)などの新しいボリュームに関する情報を、管理コンピュータ520またはホスト500に報告する。
[0133] ステップ1410で、ホスト500は、新しいボリュームを使用し始める。したがって、上記の方法により、エリア情報204内に記載されている熱分布のルールに従って、新しいボリュームを割り振ることができる。上記のプロセスでは、予想される負荷を指定する代わりに、予想される温度を管理コンピュータ520またはホスト500によって指定することができ、また、代替の方法として、負荷と温度との間の変換を、管理コンピュータ520またはホスト500などによって行うことができる。
[0134] 本発明の実施形態によって、ストレージシステムまたはいくつかのストレージシステムを有する施設におけるより効率的な冷却が可能になる。ストレージシステムまたは施設のユーザまたは管理者は、施設の設計、および施設内の機器および冷却システムの配列に従って、好ましい熱分布のルールを指定することができる。一部の実施形態では、本発明のシステムが現在実施されているルールとは異なる熱分布を検出すると、システムは、ボリュームを移動させることによって熱分布を調整する。したがって、本発明の実施形態は、ストレージシステムに関する熱分布の様々なルールを定義し、データセンターや他の施設など、情報システムにおいてより効率的な冷却を達成するためのルールに基づいて熱分布を調整する能力を含む。
[0135] 第4の実施形態−システム構成
[0136] 第4の実施形態は、データセンター、通信施設など、情報システム全体における熱の制御を対象とし得る。図26は、本発明の第4の実施形態が適用され得る情報システム構成の一例を示しているが、本発明は、任意の特定の構成に限定されない。図26の情報システムは、第4の実施形態においてサーバコンピュータであり得る1つまたは複数のホストコンピュータ500、およびこれについても上記の実施形態で説明した1つの管理コンピュータ520と通信する1つまたは複数のストレージシステム100を含む。図26に示すように、1つまたは複数のクライアントコンピュータ510は、1つまたは複数のスイッチ910を含むように構成されたLAN/WAN903を介して、サーバコンピュータ500と通信する。一部の実施形態において、クライアントコンピュータ510は、サーバコンピュータ500のうちの1つまたは複数に、処理すべき要求を送信するように構成されており、次いで、その要求を受信したサーバコンピュータ500は、場合によっては、必要に応じて、ストレージシステム100のうちの1つまたは複数にアクセスし、要求の結果を要求側クライアント510に戻すことによって、プロセスの結果で応答することができる。
[0137] 図1〜25の実施形態において上述したように、熱分布の冷却で使用する情報システムにおける機器の温度を監視するために、温度センサが含まれていてもよい。例えば、図26に示されているように、各ホストコンピュータ500は、そのハウジングの内側または外側、またはその近くに配置されている温度センサ513を含んでいてもよい。同様に、各ストレージシステム100は、上記の実施形態で上述したように、1つまたは複数の温度センサ613を含んでいてもよく、温度センサ613は、そのハウジングの内側または外側、またはその近くに配置されていてもよい。さらに、各スイッチ910も、そのハウジングの内側または外側、またはその近くに配置されている温度センサ913を含んでいてもよい。さらに、温度センサは、図26に、各機器に関連するものとして示されているが、さらに、または代わりに、以下でさらに説明するように、情報処理施設の特定の物理エリアまたはセクションに関連付けられてもよい。
[0138] 図27に示されるように、管理コンピュータ520は、メモリ530、プロセッサ541、LAN902およびLAN903に接続するためのネットワークインターフェイス542、およびSAN901に接続するためのSANインターフェイス543を含む。管理コンピュータ520上で、プロセッサ541は、メモリ530または他のコンピュータ可読媒体に格納され得る複数のプログラムおよびデータ構造を使用することによって、後述するものなど、様々なプロセスを行う。これらの実施形態のデータ構造は、構成情報531、負荷情報532、項目移動情報533、エリア情報534、熱情報535、および要求割当情報536を含み、そのそれぞれについて、以下でさらに説明する。プロセッサ541は、メモリ530または他のコンピュータ可読媒体に格納されており、以下でさらに説明する負荷位置管理プログラム538およびオペレーティングシステム(OS)537を含む1つまたは複数のプログラムを実行することによって、本発明の実施形態のプロセスを行う。管理コンピュータ520は、ホストコンピュータ500のうちの1つ、または個別の専用コンピュータとすることができる。
[0139] 図28は、構成情報531のデータ構造例を示しており、これは、セクションについての入力5311、および機器についての対応する入力5312を含む。構成情報531は、情報システムまたは施設の各エリアまたはセクション5311における機器5312の位置を記載する。言い換えれば、構成情報531は、特定の機器と、特定の機器が配置される情報システムの特定のセクションとの間の関係を維持する。1つの可能なセクション構成の一例が、図29および30に示されている。図29において、ラック590は、行および列に従って1−1から3−3まで番号が付けられたいくつかのセクション525、すなわち、示された実施形態において、行1から行3まで、および列1から列3までの合計9つの別個のセクションに分割されているが、様々な構成に従って、任意の数のセクションを作成することができる。図29の実施形態において、構成情報531にも登録されているように、各セクション525に3つのコンピュータ500が配置されているが、本発明は、セクション当たりの機器の任意の特定の数に限定されない。図30に示されるように、セクション525を、通路を形成する一列に並んだ複数のラックとして画定することもできる。例えば、いくつかのコンピュータ500または他のいくつかの機器が、図30の各セクション525に含まれていてもよい。図29および図30の実施形態において、各セクション525は、様々な機器上の任意の温度センサ513、613、913の代わりに、またはそれに加えて、温度センサ713を含み得る。センサ713の代わりに、当然、温度センサ513、613、913を提供することができ、これらのセンサの出力を平均し、またはそうでなければ使用して、情報システムの各セクション525における温度を決定することができる。
[0140] 図46は、「低」温エリアまたは「高」温エリアなどのエリア名5341、条件5342、およびセクションID5343を含むエリア情報534のデータ構造例を示す。これらの実施形態では、エリア情報534は、上記の実施形態で上述した図7、14、21、および23のエリア情報204に似た方法で定義され得る。例えば、図31に示すように、熱分布ルールは、図23に関連して上述した定義と似た、図46に示されるエリア定義に対応する定義を使用することによって指定することができる。図31および図46に示されるように、高温エリアとして指定され、特別な強制冷却を受けるセクションもあれば、強制冷却を必要としない低温エリアとして指定されるセクションもあり得る。また、それだけには限定されないが、図7、14、および21に関連して上述したものなどを含む他の定義が、熱分布の他のルールとして適用されてもよい。例えば、図7および図8に示されているものなど、高いセクションおよび低いセクションの市松模様に似た構成が使用されてもよく、図14〜図16に示されているものなどの構成が使用されてもよく、図21〜図24に示されているものなどの構成が使用されてもよく、または他の様々な構成が使用されてもよい。さらに、「高い」および「低い」エリアが指定される必要はなく、代わりに、指定された範囲内の温度を単に均等化しようとするために、機器間の負荷が調整されてもよい。
[0141] 図47は、セクションID5351および温度5352を含む熱情報535のデータ構造例を示す。熱情報535は、データセンターにおける各セクションまたは各機器の温度を監視することによって、図9に関連するものなど、上記の実施形態で上述したように維持される。すなわち、各セクションは、上述したように、温度センサ713および/または513など、1つまたは複数の温度センサを有し、管理コンピュータ520は、LAN902またはLAN903を介して温度センサから入力を集める、または受信することによって、各セクションの温度を熱情報535に記録する。熱情報535は、図9に示した熱情報205に関して上述したように、ある周期間隔での各セクションの温度を含んでもよい。
[0142] 負荷を再配置するための方法
[0143] 情報システムにおける熱分布を管理するために、情報システムの様々なエリアの温度は、所望の熱分布パターンが達成されるように、情報システムにおけるこうしたエリアおよび他のエリアにおける様々な機器の間に機器の負荷を転送することによって調整され得る。以下の説明では、機器への負荷の再配置を管理するための3つの方法例を記載するが、本発明は、任意の特定の方法に限定されない。例えば、代替の方法では、アプリケーションがあるコンピュータ500から別のコンピュータに移行され、コンピュータ500が情報システムの他のセクションなどに、物理的に再配置されてもよい。
[0144] 負荷を再配置するまたは分散するための方法の第1の例は、仮想マシンソフトウェアを使用することによる、VM(仮想マシン)の移行によるものである。図32は、この方法が適用され得る構成の一例を示す。図32は、「Server#1」および「Server#10」の名前を有する1対のコンピュータ500を含む、図26に示された情報システムの一部分を示す。図32において、コンピュータ500はそれぞれ、1つまたは複数の仮想マシンVM711を稼働することができるハイパーバイザ710を含む。ハイパーバイザ710は、カリフォルニア州パロアルトのVMware Inc.から入手可能なVMware ESX Server、ワシントン州レドモンドのMicrosoft Corp.から入手可能なMS Virtual ServerおよびHyper−Vなどの仮想マシンソフトウェアであり、いくつかの異なる種類のオペレーティングシステムの複数の仮想サーバ環境を提供することができ、したがって、複数のオペレーティングシステムが単一のコンピュータ500のハードウェア上で稼働することができる。これに加えて、ハイパーバイザ710は、第1のサーバハードウェアから、他のサーバハードウェア上のハイパーバイザ710と連係している異なるサーバハードウェアに、稼働中の仮想マシンを動的に移行することができる機能を提供する。
[0145] この例では、各VM711は、OSおよびアプリケーションソフトウェアがそこで稼働することができる仮想の独立したサーバ環境である。VM711は、あるコンピュータ500から別のコンピュータ500に再配置されると、再配置されたVM711で実行されているプロセスの処理負荷も、宛先コンピュータ500に再配置される。コンピュータ500とVM711との間の関係を管理するために、管理コンピュータ520は、様々なVM711および様々なサーバコンピュータ500上のその位置に関する情報を、コンピュータ500から集める。この情報は、管理コンピュータ520がLAN903を介して様々なコンピュータ500に問い合わせを送信し、項目移動情報533に集められた情報を維持することによって取得され得る。図33は、サーバID5331およびVM ID5332を含む項目移動情報533の一例を示す。図32および図33は、Server#1における処理負荷を低減し、それによって、Server#1によって生成された熱の量を低減するために、VM#3がServer#1からServer#10に動的に再配置されたことを示す一例を示す。
[0146] 負荷を再配置するまたは分散するための方法の第2の例は、クラスタリングソフトウェアを使用することによる、プロセスの移行によるものである。図34は、この方法が適用され得る構成の一例を示す。図34は、「Server#」および「Server#10」の名前を有する1対のコンピュータ500を含む、図26に示された情報システムの一部分を示す。図34において、コンピュータ500は、オペレーティングシステム(OS)720、クラスタリングソフトウェア730、およびプロセス731を含む。ワシントン州レドモンドのMicrosoft Corp.から入手可能なMS Windows(登録商標) Server Computer Cluster、カリフォルニア州クパチーノのSymantec Corp.から入手可能なVeritas Cluster Serverなどのクラスタリングソフトウェア730は、高可用性および、各コンピュータ500上の作業負荷の制御を実現するように、複数のコンピュータ500の連係操作を提供することができる。
[0147] クラスタリングソフトウェア730の機能に含まれている、例えば、コンピュータ500における要求の処理などのプロセス731(すなわちジョブ)は、他のコンピュータ500と連係している別のコンピュータ500に引き渡すことができる。プロセス731が、あるコンピュータ500から別のコンピュータ500に再配置されると、プロセスの負荷も、宛先コンピュータ500に再配置され、それによって、元のコンピュータ500における負荷を低減する。コンピュータ500と様々なプロセス731との間の関係を管理するために、管理コンピュータ520は、様々なプロセス731および様々なサーバコンピュータ500上のその位置に関する情報を集める。この情報は、管理コンピュータ520がLAN903を介して様々なコンピュータ500に問い合わせを送信し、項目移動情報533’に集められた情報を維持することによって取得され得る。図35は、サーバID5331およびプロセスID5333を含む項目移動情報533’の一例を示す。図34および図35はさらに、Server#1における処理負荷を低減し、それによって、Server#1によって生成された熱の量を低減するために、Process#3がServer#1からServer#10に動的に再配置されたことを示す一例を示す。
[0148] 負荷を再配置するまたは分散するための方法の第3の例は、機器上の負荷を管理するためのスイッチ910上の要求割当制御の使用によるものである。図36は、この方法が適用され得る構成の一例を示す。図36は、要求割当情報911および要求割当プログラム912を含む1対のスイッチ910を含む、図26に示されている情報システムの一部分を示す。特にWebサービスに適用可能であるこの方法下で、スイッチは、クライアントから受信する要求を、情報システム内の特定のコンピュータ500に割り当てることができる。追加の情報として、読者は、例えば、その全開示が参照により本明細書に組み込まれる、「Catalyst 6500 Series Switch Content Switching Module Configuration Note Software Release 4.2(x)」、Cisco Systems,Inc.,San Jose,CA,USA、2006年12月などを参照されたい。
[0149] 図37および図38は、本発明の一部の実施形態に適用され得る要求割当情報911の2つの例を示す。要求割当情報911の第1の例は、図37に示されるように、サーバID9111および要求割当率9112を含む。図37の要求割当情報911は、クライアント510からコンピュータ500への要求の配布率を定義する、すなわち、要求の何パーセントが各コンピュータ500に向けられるかを定義するために、スイッチ911によって使用され得る。各コンピュータ500が受信する要求の割合を調整することによって、各コンピュータ500における処理負荷を制御することができる。要求割当情報911’の第2の例は、図38に示されるように、サーバID9121および帯域幅9122を含む。図38の要求割当情報911’は、クライアント510からコンピュータ500への要求に関する通信についての帯域幅の上限を定義する。例えば、要求割当情報911に記載されている帯域幅の上限は、各サーバによって使用することができる最大量の帯域幅とすることができる。各コンピュータ500が使用することができる帯域幅の量を調整することによって、各コンピュータ500における処理負荷を制御することができる。一般に、第1の要求割当情報911または第2の要求割当情報911’のいずれかが使用されるが、一部の状況では、両方が使用されてもよく、または、一部の状況において、割当率の割合および/または帯域幅に加えて、またはその代替として、他の条件が要求割当情報に使用されてもよい。
[0150] 各スイッチ910上の要求割当プログラム912は、要求割当情報911に維持される条件に従って、クライアント510からコンピュータ500への要求の割当を調整することによって、コンピュータ500における負荷を制御することができる。この制御を行うために、スイッチ910は、各コンピュータ500のインターフェイスを対象として働かせる代わりに、クライアントから要求を受信する対象となるように、仮想インターフェイス(例えばIPアドレスおよびポート番号など)を提供する。したがって、クライアント510は、スイッチによって提供された仮想インターフェイスに要求を送信し、次いで、要求割当プログラム912は、コンピュータ500のうちの1つに要求を転送する(割り当てる)。言い換えれば、スイッチ910は、コンピュータ500を統合する仮想インターフェイスを提供する。要求割当情報911において定義された条件(すなわち、要求の割合または帯域幅)を変更することによって、各コンピュータ500における負荷を変更することができる。また、LAN903における複数のスイッチ910間の通信によって、複数のスイッチ910間で、制御を行うこともできる。あるいは、要求割当情報911および要求割当プログラム912をコンピュータ500に実装することができ、したがって、コンピュータ500は、要求の処理に関する負荷の分散を制御する能力を有する。
[0151] 負荷の監視
[0152] 情報システムにおける熱分布は、情報システムの特定のエリアにおける機器上の負荷を制御することによって管理することができる。機器における負荷を制御することによって熱分布を管理するために、負荷に関する情報を集めることができる。一部の実施形態では、管理コンピュータ520は、LAN903を介して、VM711、プロセス731、およびコンピュータ500などの項目の負荷に関する情報を集める。負荷に関する情報が負荷情報532に記録され、維持され、負荷情報は、図4に関連する上記の実施形態に記載されたアクセス情報202に似ていてもよい。
[0153] 図39は、VMに関係する負荷情報532の一例を示す。負荷情報532は、項目ID5321、負荷測定タイプ5322、および項目のタイプごとの負荷測定タイプのうちの1つまたは複数による負荷の量5323を含む。これらのパラメータは、1時間当たりの平均、他の適した量など、所定の期間などに従って集められ、記録されてもよい。例えば、図39に示した実施形態では、VMごとの負荷は、CPU使用量、メモリ使用量、単位時間当たり(すなわち1秒当たり)VMによって処理されるトランザクション数、および単位時間当たりVMによって行われるプロセスについての転送されたデータの量(MB/秒など)に従って追跡され得る。また、管理コンピュータ520は、負荷情報532として、プロセス、および他のサーバ負荷など、情報システムにおける他のタイプの項目に関する類似の情報を維持することもできる。上記の監視に加えて、管理コンピュータ520は、スイッチ910から要求割当情報911を集め、その情報を、メモリ530内の要求割当情報536に格納することができる。
[0154] 適切な熱分布を維持するためのプロセス
[0155] 図40は、情報システムにおいて望ましい熱分布を維持するためのプロセス例を示す。エリア情報534によって定義されているルールに従って、図40に示したプロセスをたどることによって、VMの移行、プロセスの移行、または他の負荷再分散の方法を使用することによって、情報システムにおいて所望の熱分布パターンを達成することができる。したがって、図40の以下の手順は、上述した最初の2つの再配置の方法例、およびいくつかの他の再配置の方法に適用可能であり、図41のプロセスは、要求割当情報を使用する第3の再配置の方法例に適用可能である。
[0156] ステップ1501で、管理コンピュータ520は、所定の周期間隔で、または温度センサ513または713のうちの1つが所定の温度を上回る温度を示した場合の警告に応答して、熱情報535をチェックする。ユーザは、管理コンピュータ520から所定の間隔を指定したり、希望通りに間隔を変更したりすることができる。
[0157] ステップ1502で、管理コンピュータ520は、構成情報531、エリア情報534、および熱情報535を使用することによって、情報システムにおける各セクションの温度をチェックする。管理コンピュータ520は、エリア情報534に記載されている条件が維持されているかどうかを確認する。
[0158] ステップ1503で、この条件に基づく熱分布がエリア情報534に従って維持されている場合、プロセスが終了する。そうでない場合、プロセスは、ステップ1504に進んで、是正処置を取る。
[0159] ステップ1504で、管理コンピュータ520は、適切な熱分布を達成するために移動すべき1つまたは複数の項目(例えば、VMまたはプロセス)を選択する。このステップは、プロセスが、パリティグループとボリュームとの間の関係ではなく、セクションと項目(例えば、VMまたはプロセス)との間の関係を使用することを除いて、上述した実施形態における図10のステップ1104に関して記載したものと同じ方法で実行される。例えば、管理コンピュータ520は、「低い」(すなわち「T」が「A」以上である)に指定された条件より高温の「低い」セクション525(すなわち、図31および図46に示されているものなど、エリア情報534に従って「低い」エリアに属するセクション)を見つけると、負荷情報532を参照することによって、そのセクション525内で最大の負荷を有する項目5321を選択する。あるいは、管理コンピュータ520が「高い」の条件より低温の「高い」セクション525(すなわち、エリア情報534に従って「高い」エリアに属するセクション)を見つけると、負荷情報532を参照することによって、そのセクション525内で最小の負荷を有する項目を選択するように、管理コンピュータ520を構成することができる。このことによって処理容量が解放され、後述するように、高負荷をセクションに移行することができる。
[0160] ステップ1505で、管理コンピュータ520は、維持されていない条件を満たすために移動する必要がある項目の宛先を探す。管理コンピュータ520が(使用可能な処理容量など)項目の再配置についての要件を満たす場所を見つけることができた場合、プロセスは、ステップ1507に進む。一方で、すべての要件を満たす場所がない場合、プロセスは、ステップ1506に進む。例えば、ステップ1505で、管理コンピュータが項目を「低い」セクションから「高い」セクションに移動する必要があるとき、管理コンピュータは、「高い」セクション525(すなわち、「高い」エリアにあるものとして分類されたセクション)のうちの1つに未使用の容量を有するコンピュータ500を、その項目の移行のための対象の宛先として選択する。最大負荷を有する項目(すなわち、大量の処理要件のために、大量の熱を発生させる物)を「高い」セクション525に移動させることによって、「低い」セクションにおける熱が低減され、代わりに、この項目が、図31および図46のルールによって確立された熱分布パターンに従って、より高い熱を有することができるセクションに配置される。あるいは、管理コンピュータが移動に適した低負荷の項目を見つけることができる場合、未使用の場所に項目を移動するだけではなく、管理コンピュータは、「低い」セクションにある項目を、「高い」セクションのうちの1つにある低負荷の項目と交換することができる。同様に、例えば、「高い」セクションが条件内にないとき、ステップ1505で、管理コンピュータ520は、「低い」セクション525(すなわち、エリア情報534に従って「低い」セクション525に属する)のうちの1つに未使用の容量を有するコンピュータ500を、低負荷の項目の移行のための対象の宛先として選択する。低負荷の項目を「低」温セクション525に移動することによって、未使用の容量が特定の「高い」セクション525に作成され、このことは、より高い負荷の項目を、未使用の容量に移行することができることを意味する。したがって、熱分布は、図31および図46に示されているように、ルールによって記載されている分布に自動的に調整される。あるいは、低負荷の項目を「低い」セクションのうちの1つにおける未使用の容量に移動させるだけではなく、管理コンピュータ520は、低負荷の項目を、「低い」セクション525のうちの1つに配置されている高負荷の項目と自動的に交換することができる。
[0161] 一方、ステップ1506で、管理コンピュータ520は、その項目に適した宛先を探すことができないとき、エリア情報534に記載されているカテゴリに基づくベストエフォートの決定によって、項目の宛先を選択することができる。ベストエフォートの決定の一例として、管理コンピュータ520は、条件が完全には満たされていない場合でさえ、熱分布を条件に近づけることができる場所を選択することができる。ベストエフォートの決定の別の例として、再配置の手順の実行を保証しない最低限の改良しかない場合、管理コンピュータ520は、任意の変更を行わない(すなわち、再配置の操作を行わない)ことを決定することができる。
[0162] ステップ1507で、管理コンピュータ520は、選択された項目を選択された宛先に再配置するよう、影響を受けるコンピュータ500に指示する。例えば、上述したように、VMの場合、指示は、影響を受けるコンピュータ500のハイパーバイザ710に送信されてもよい。同様に、プロセスを移動させる場合、指示は、影響を受けるコンピュータ500上のクラスタリングソフトウェア730に送信されてもよい。
[0163] ステップ1508で、コンピュータ500は、指示に従って項目を移動させ、次いで、移行の完了を管理コンピュータ520に報告する。
[0164] ステップ1509で、管理コンピュータ520は、項目の移行に従って、項目移動情報533を更新する。したがって、上記のプロセスでは、熱分布の管理は、指定されたルールに従って、情報システム内で実行される。
[0165] 図41は、情報システムにおいて所望の熱分布を維持するための別のプロセス例を示す。エリア情報534によって定義されたルールに従って、図41に示したプロセスをたどることによって、上述した要求割当制御の使用を介して、情報システムにおける機器間の適切な熱分布を達成することができる。
[0166] ステップ1601で、管理コンピュータ520は、所定の周期間隔で、または温度センサ513または713のうちの1つが所定の温度を上回る温度を示した場合の警告に応答して、熱情報535をチェックする。ユーザは、管理コンピュータ520から間隔を指定したり、希望通りに間隔を変更したりすることができる。
[0167] ステップ1602で、管理コンピュータ520は、構成情報531、エリア情報534、および熱情報535を使用することによって、各セクションの温度をチェックする。管理コンピュータ520は、エリア情報534に記載されているルールが維持されているかどうかを確認する。
[0168] ステップ1603で、ルールに基づく熱分布がエリア情報534に従って維持されている場合、プロセスが終了する。そうでない場合、プロセスは、ステップ1604に進んで、是正処置を取る。
[0169] ステップ1604で、管理コンピュータ520は、適切な熱分布を達成するために、要求割当(すなわち、負荷の割当)の新しい条件を取得する。このステップは、図37〜38に示されているものなど、要求割当情報536が参照されることを除いて、上記の実施形態においてステップ1504に関して記載された同じ方法で行われる。管理コンピュータ520は、要求割当情報536を参照して、特定のコンピュータ500の新しい条件を決定する。例えば、図37に示されているように、要求割当率の割合が使用される場合、サーバによって生成された熱を低減することが望まれるとき、特定のコンピュータ500の要求割当率の割合が低減され得る。同様に、図38に示されるように、帯域幅が使用される場合、特定のコンピュータ500に割り振られた帯域幅が低減され得る。帯域幅の低減の場合、他の問題が考慮され得る。例えば、コンピュータ500上で稼働している特定のアプリケーションが、何らの最低限の帯域幅を必要とする場合、帯域幅がそれ未満に低減されないより低い閾値が提供されてもよい。
[0170] ステップ1605で、管理コンピュータ520が、ルールを満たす要求割当情報の条件の変化を見つけることができた場合、プロセスは、ステップ1607に進む。一方、管理コンピュータ520が、ルールを満たす条件の変化を見つけられない場合、プロセスは、ステップ1606に進む。
[0171] ステップ1606で、管理コンピュータ520は、エリア情報534に記載されているカテゴリに基づくベストエフォートの決定によって、新しい条件を得ようと試みる。ベストエフォートの決定の一例として、熱分布条件が完全には満たされていない場合でさえ、管理コンピュータ520は、熱分布を熱分布条件に近づけることができる要求割当条件(すなわち、帯域幅または割当の割合)における変更を選択することができる。別の例として、管理コンピュータ520は、変更に起因する最低限の向上しかない場合、任意の変更(すなわち変更操作)を行わないよう決定することができる。
[0172] ステップ1607で、管理コンピュータ520は、関連のスイッチ910に、管理コンピュータが変更されるべきと決定した要求割当情報の条件に従って、要求割当情報911を更新するよう指示する。
[0173] ステップ1608で、スイッチ910は、管理コンピュータからの指示に従って要求割当情報911を更新し、次いで、新しい条件の適用の開始を管理コンピュータ520に報告する。
[0174] ステップ1609で、管理コンピュータ520は、新しい条件に従って、要求割当情報536を更新する。
[0175] あるいは、上述したように、要求割当情報911および要求割当プログラム912がコンピュータ500に実装される実施形態において、管理コンピュータ520は、スイッチ911ではなく、関連のコンピュータ500に指示を送信し、コンピュータ500は、新しい条件を適用し始めると、管理コンピュータ520に報告する。したがって、上記のプロセスは、指定されたルールに従って、情報システム内の熱分布の管理を達成することができる。これによって、データセンター、通信施設、他の情報システムなど、情報システムにおいて、効率的な冷却、および電力消費の低減が可能になる。
[0176] 第5の実施形態−システム構成
[0177] 本発明の第5の実施形態は、情報システムにおけるすべての機器の熱分布の管理を対象とする。本発明の第5の実施形態は、上記の実施形態において説明した図26に示されたものと同じ構成を使用して説明されるが、本発明は、他の情報システム構成にも適用可能である。図42は、構成情報531’の別の例を示す。構成情報531’は、器具、ブレード、プロセッサなど、様々なタイプの機器の情報を含むこともできる。さらに、構成情報531’は、CMDB(構成管理データベース)として管理することができる。さらに、これらの実施形態において、各セクションは、コンピュータ500だけではなく、ストレージシステム100やスイッチ910など、他のタイプの機器を、エリア情報534において定義されている所望の熱分布を達成するために管理すべき機器として含むことができる。
[0178] これらの実施形態のセクションの定義の例が、図43および図44に示されている。図43において、ラック590は、行および列によって指定されたセクションに分割されており、サーバ500だけでなく、ストレージシステム100およびスイッチ910も、構成情報531’に登録されている各セクションに配置される。例えば、図43に示されているように、セクション1−1は、1対のコンピュータ500およびスイッチ910を含み、セクション2−1は、コンピュータ500、スイッチ910、およびストレージシステム100を含む。さらに、図44に示されるように、セクションを、通路を形成する一列に並んだ複数のラックとして画定することもできる。エリア情報534は、上記の実施形態に関連して上述したように定義され得る。例えば、図45に示される熱分布ルールは、図46に記載されている定義に対応する定義を使用することによって、指定され得る。
[0179] 上述した他の定義も、図7〜8、14〜16、21〜24、31、および46のものなど、第4の実施形態に関連して上述したように、熱分布の別のルールとして適用することができる。すなわち、サーバコンピュータ500を含むコンピュータシステム全体、ストレージシステム100およびスイッチ910は、セクションの1つの定義および熱分布ルールの1つの定義を共有することができる。情報システムの熱分布は、温度センサ513、613、713、および/または913を使用して上述したように、図10、40、および41に記載されているプロセスを使用することによって管理され得る。次いで、各プロセスにおけるセクションの定義および熱分布ルール定義で、ストレージシステム100についての第1の実施形態に記載されているプロセスを実行し、コンピュータ500やスイッチ910など、他の機器についての第4の実施形態に記載されているプロセスを実行することによって、共有のルールに従った熱分布の総合的な管理が、サーバコンピュータ500、ストレージシステム100およびスイッチ910を含むコンピュータシステム全体について達成される。コンピュータ500における負荷(すなわちデータの処理)の場所は、スイッチ910におけるトランザクション負荷(すなわち、データの転送)の場所に影響を与えるため、熱分布管理は、コンピュータ500における負荷を制御することによって、スイッチ910を含むことができる。その結果、熱分布管理は、SAN901のネットワーク機器を含むこともできる。さらに、ストレージ構成要素またはサーバ構成要素を最優先の項目として移動させるかどうかに関して、階層が確立され得る。例えば、プロセスが、ストレージシステム100からボリュームを移動させる前に、最初にコンピュータ500から項目を移動させようとする階層でもよく、または他の階層が採用されてもよい。
[0180] したがって、本発明の第5の実施形態は、情報システムにおける効率的な冷却および電力消費の低減を実現する。記載した機器に加えて、上述した方法を、ファイルサービス(すなわち、ネットワーク接続ストレージ(NAS)機能)やコンテンツ管理サービスなど、ストレージシステム100で実行されるプロセスに適用することができる。それによって、本発明の第5の実施形態は、上述した上記の実施形態に加えて、ストレージシステム100に関する熱分布管理の別の手段を提供する。
[0181] 上記から、本発明の一部の実施形態が、情報システムにおいて冷却の効率を向上させ、電力消費を低減するための方法および装置を提供することがわかる。さらに、本明細書において、特定の実施形態が示され、説明されているが、同じ目的を達成するように計算された任意の構成を、開示された特定の実施形態の代わりに使用することができることを、当業者であれば理解されたい。この開示は、本発明の任意のおよびすべての適応形態または変形形態をカバーするものであり、上記は、限定的な方法ではなく例示な方法で説明されていることを理解されたい。したがって、本発明の範囲は、添付の特許請求の範囲、およびこうした特許請求の範囲が権利を有する全範囲の均等物に関連して、適切に決定されるものとする。
[0011]本発明の方法および装置が適用され得るシステム構成の一例を示す図である。 [0012]図1のアーキテクチャで使用できる本発明の記憶装置構成の一例を示す図である。 [0013]パリティグループ情報のデータ構造例を示す図である。 [0014]アクセス情報のデータ構造例を示す図である。 [0015]ボリューム情報のデータ構造例を示す図である。 [0016]パリティグループの物理的な構成例を示す図である。 [0017]エリア情報のデータ構造例を示す図である。 [0018]ルールをパリティグループおよび結果として生じる熱分布構成に適用するプロセス例を示す図である。 [0018]ルールをパリティグループおよび結果として生じる熱分布構成に適用するプロセス例を示す図である。 [0019]熱情報のデータ構造例を示す図である。 [0020]効率的な熱分布を達成するために実行されるプロセス例を示す図である。 [0021]ボリュームの移行のプロセス例を示す図である。 [0022]移行情報のデータ構造例を示す図である。 [0023]移行中のボリュームへの書き込み要求を実行するプロセス例を示す図である。 [0024]エリア情報の別のデータ構造例を示す図である。 [0025]ストレージシステムの冷却のための構成例を示す図である。 [0026]複数のストレージシステムの冷却のための構成例を示す図である。 [0027]熱情報の別のデータ構造例を示す図である。 [0028]本発明の第2の実施形態によるシステム構成例を示す図である。 [0029]第2の実施形態におけるボリューム情報のデータ構造例を示す図である。 [0030]第2の実施形態におけるノードの物理構成例を示す図である。 [0031]第2の実施形態におけるエリア情報のデータ構造例を示す図である。 [0032]ノードが均等化される図20の物理構成例を示す図である。 [0033]エリア情報の別のデータ構造例を示す図である。 [0034]図22によるストレージシステムの冷却のための構成例を示す図である。 [0035]本発明の第3の実施形態を実行するプロセス例を示す図である。 [0036]本発明の第4および第5の実施形態が適用され得る構成例を示す図である。 [0037]管理コンピュータの構成例を示す図である。 [0038]本発明の第4の実施形態による構成情報例を示す図である。 [0039]第4の実施形態における情報システムのセクションの配列例を示す図である。 [0040]第4の実施形態における情報システムのセクションの配列例を示す図である。 [0041]第4の実施形態における高温セクションおよび低温セクションの配列例を示す図である。 [0042]負荷を再配置する第1の方法例を示す図である。 [0043]図32に関する項目移動情報のデータ構造例を示す図である。 [0044]負荷を再配置する第2の方法例を示す図である。 [0045]図34に関する項目移動情報のデータ構造例を示す図である。 [0046]負荷を再配置する第3の方法例を示す図である。 [0047]要求割当情報のデータ構造例を示す図である。 [0048]要求割当情報の別のデータ構造例を示す図である。 [0049]第4および第5の実施形態における負荷情報のデータ構造例を示す図である。 [0050]第4および第5の実施形態における熱分布のプロセス例を示す図である。 [0051]第4および第5の実施形態における熱分布の別のプロセス例を示す図である。 [0052]第5の実施形態についての構成情報のデータ構造例を示す図である。 [0053]第5の実施形態における情報システムのセクションの配列例を示す図である。 [0054]第5の実施形態における情報システムのセクションの配列例を示す図である。 [0055]第5の実施形態における高温セクションおよび低温セクションの配列例を示す図である。 [0056]エリア情報の第4および第5の実施形態のデータ構造例を示す図である。 [0057]第4および第5の実施形態における熱情報のデータ構造例を示す図である。

Claims (20)

  1. 情報システムの第1のセクションに配置されている1つまたは複数の第1のコンピュータ、および前記情報システムの第2のセクションに配置されている1つまたは複数の第2のコンピュータを含み、
    前記1つまたは複数の第1のコンピュータが第1の処理負荷を有し、
    前記1つまたは複数の第2のコンピュータが第2の処理負荷を有し、
    前記第1のセクションの第1の温度状態を感知するための第1の温度センサを含み、
    前記第2のセクションの第2の温度状態を感知するための第2の温度センサを含み、
    前記第1の温度状態および前記第2の温度状態から決定された熱分布が熱分布についての所定のルールに適合していない場合、前記情報システムが、前記熱分布を前記ルールに適合させるよう試みるために、前記第1の処理負荷の第1の部分を前記第2のコンピュータに再配置する、または前記第2の処理負荷の第2の部分を前記第1のコンピュータに再配置するように構成されている
    情報システム。
  2. 前記第1のセクション内の第1のストレージシステムと、
    前記第2のセクション内の第2のストレージシステムと
    をさらに含み、前記情報システムが、前記第1のストレージシステムから前記第2のストレージシステムに、または前記第2のストレージシステムから前記第1のストレージシステムに、データを移行して、前記熱分布を前記ルールに適合させるのを助ける
    請求項1に記載の情報システム。
  3. 前記第1のセクション内の第1のスイッチと、
    前記第2のセクション内の第2のスイッチと
    をさらに含み、前記情報システムが、前記第1のスイッチから前記第2のスイッチに、または前記第2のスイッチから前記第1のスイッチに、トランザクション負荷を移行して、前記熱分布を前記ルールに適合させるのを助ける
    請求項1に記載の情報システム。
  4. 前記1つまたは複数の第1のコンピュータおよび1つまたは複数の第2のコンピュータが、前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータの上で1つまたは複数の仮想マシンを稼働させるための仮想マシンソフトウェアを含み、
    前記第1のセクションと前記第2のセクションとの間で1つまたは複数の仮想マシンを再配置することによって、前記第1または第2の処理負荷が、それぞれ前記第1のセクションと前記第2のセクションとの間で再配置される
    請求項1に記載の情報システム。
  5. 前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータが、前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータの上で1つまたは複数のプロセスを稼働させるためのクラスタリングソフトウェアを含み、
    前記第1のセクションと前記第2のセクションとの間で1つまたは複数のプロセスを再配置することによって、前記第1または第2の処理負荷が、それぞれ前記第1のセクションと前記第2のセクションとの間で再配置される
    請求項1に記載の情報システム。
  6. 前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータと通信する少なくとも1つのスイッチ
    をさらに含み、前記情報システムが、前記熱分布を前記ルールに適合させるよう試みるために、それぞれ前記第1のセクションおよび前記第2のセクションにおける前記第1および第2の処理負荷を変更するために要求割当情報を調整するよう前記スイッチに指示するように構成されている
    請求項1に記載の情報システム。
  7. 複数の前記第1のセクションおよび複数の前記第2のセクションがあり、
    前記熱分布ルールが、前記第1のセクションを高温セクション、前記第2のセクションを低温セクションとなるよう指定し、
    前記熱分布ルールが、より高い処理負荷を、前記低温の第2のセクションにおける前記第2のコンピュータよりも、前記高温の第1のセクションにおける前記第1のコンピュータに割り当てることによって実施される
    請求項1に記載の情報システム。
  8. 前記情報システム内の前記熱分布を監視し、前記処理負荷の前記第1の部分または前記処理負荷の前記第2の部分を再配置する旨の指示を送信する管理コンピュータ
    をさらに含む請求項1に記載の情報システム。
  9. 複数の前記第1のセクションおよび複数の前記第2のセクションがあり、
    所定の熱分布ルールが、前記第1のセクションを高温セクション、前記第2のセクションを低温セクションとなるように指定し、前記高温セクションが、前記ルールに従って前記情報システムの1つのエリアに配列され、前記低温セクションが別のエリアに配置される
    請求項1に記載の情報システム。
  10. 複数の前記第1のセクションおよび複数の前記第2のセクションがあり、
    所定の熱分布ルールが、前記第1のセクションを高温セクション、前記第2のセクションを低温セクションとなるように指定し、各高温セクションが低温セクションと接し、その逆も同様に接して市松模様構成になるように、前記高温セクションが前記ルールに従って配列される
    請求項1に記載の情報システム。
  11. 前記情報システムに配置されている1つまたは複数の第1のコンピュータ、および前記情報システムに配置されている1つまたは複数の第2のコンピュータを含み、
    前記1つまたは複数の第1のコンピュータがそれぞれ第1の処理負荷を有し、
    前記1つまたは複数の第2のコンピュータがそれぞれ第2の処理負荷を有し、
    前記1つまたは複数の第1のコンピュータ、および前記1つまたは複数の第2のコンピュータに関連付けられる温度状態を感知するための温度センサを含み、
    前記感知された温度状態から決定された熱分布が熱分布についての所定のルールに適合していない場合、前記情報システムが、前記熱分布を前記ルールに適合させるよう試みるために、前記第1の処理負荷の第1の部分を前記1つまたは複数の第2のコンピュータに再配置する、または前記第2の処理負荷の第2の部分を前記1つまたは複数の第1のコンピュータに再配置するように構成されている
    情報システム。
  12. 前記情報システムが、前記情報システムの異なる物理的エリアにあるいくつかのセクションに分割され、
    前記1つまたは複数の第1のコンピュータが、1つまたは複数の第1のセクションにあり、前記ルールが、前記1つまたは複数の第1のセクションを低温セクションと指定し、
    前記1つまたは複数の第2のコンピュータが、1つまたは複数の第2のセクションにあり、前記ルールが、前記1つまたは複数の第2のセクションを高温セクションと指定し、
    前記低温セクションのうちの1つにおける前記温度状態が所定の温度より高いとき、前記情報システムが、前記第1の処理負荷の一部分を、前記低温セクションにおける最高の処理負荷を有する前記第1のコンピュータから、前記1つまたは複数の高温セクションにおける前記第2のコンピュータのうちの1つに再配置する
    請求項11に記載の情報システム。
  13. 前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータが、前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータの上で1つまたは複数の仮想マシンを稼働させるための仮想マシンソフトウェアを含み、
    前記1つまたは複数の第1のコンピュータと前記1つまたは複数の第2のコンピュータとの間で1つまたは複数の仮想マシンを再配置することによって、前記第1または第2の処理負荷が、それぞれ前記1つまたは複数の第1のコンピュータと前記1つまたは複数の第2のコンピュータとの間で再配置される
    請求項11に記載の情報システム。
  14. 前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータが、前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータの上で1つまたは複数のプロセスを稼働させるためのクラスタリングソフトウェアを含み、
    前記1つまたは複数の第1のコンピュータと前記1つまたは複数の第2のコンピュータとの間で1つまたは複数のプロセスを再配置することによって、前記第1または第2の処理負荷が、それぞれ前記1つまたは複数の第1のコンピュータと前記1つまたは複数の第2のコンピュータとの間で再配置される
    請求項11に記載の情報システム。
  15. 前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータと通信する少なくとも1つのスイッチ
    をさらに含み、前記情報システムが、前記熱分布を前記ルールに適合させるよう試みるために、それぞれ前記第1のセクションおよび前記第2のセクションにおける前記第1および第2の処理負荷を変更するために要求割当情報を調整するよう前記スイッチに指示するように構成されている
    請求項11に記載の情報システム。
  16. 1つまたは複数の第1の場所が第1の温度状態として指定され、1つまたは複数の第2の場所が第2の温度状態として指定される熱分布についてのルールを確立するステップと、
    前記1つまたは複数の第1の場所における前記第1の温度状態、前記第2の温度状態および前記1つまたは複数の第2の場所を監視するステップと、
    前記情報システムの前記熱分布を前記ルールに適合させるよう試みるために、前記1つまたは複数の第1の場所のうちの前記1つにおける前記第1の温度状態を低減しようと試みるために、処理負荷の少なくとも一部分を、所定の温度を上回る温度を有する前記1つまたは複数の第1の場所のうちの1つにおける第1のコンピュータから、前記1つまたは複数の第2の場所のうちの1つにおける第2のコンピュータに再配置するステップと
    を含む情報システムにおける熱分布管理のための方法。
  17. 前記1つまたは複数の第1の場所および前記1つまたは複数の第2の場所における前記温度状態を監視する前記ステップが、前記1つまたは複数の第1の場所および前記1つまたは複数の第2の場所に関連付けられている温度センサから温度測定値を受信するステップを含む
    請求項16に記載の方法。
  18. 前記第1のコンピュータおよび前記第2のコンピュータの上で1つまたは複数の仮想マシンを稼働させるための仮想マシンソフトウェアを提供するステップと、
    1つまたは複数の仮想マシンを、前記第1のコンピュータから前記第2のコンピュータに再配置することによって、前記処理負荷の前記部分を、前記第1のコンピュータから前記第2のコンピュータに再配置するステップと
    をさらに含む請求項16に記載の方法。
  19. 前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータの上で1つまたは複数のプロセスを稼働させるクラスタリングソフトウェアを提供するステップと、
    1つまたは複数のプロセスを、前記第1のコンピュータから前記第2のコンピュータに再配置することによって、前記処理負荷の前記部分を、前記第1のコンピュータから前記第2のコンピュータに再配置するステップと
    をさらに含む請求項16に記載の方法。
  20. 前記1つまたは複数の第1のコンピュータおよび前記1つまたは複数の第2のコンピュータと通信する少なくとも1つのスイッチを提供するステップと、
    前記第1のコンピュータの処理負荷を低減するために、要求割当情報を調整するよう前記スイッチに指示することによって、前記処理負荷の前記部分を、前記第1のコンピュータから前記第2のコンピュータに再配置するステップと
    をさらに含む請求項16に記載の方法。
JP2008201783A 2007-09-18 2008-08-05 情報システムにおける熱管理のための方法および装置 Pending JP2009076062A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/898,948 US7818499B2 (en) 2007-09-18 2007-09-18 Methods and apparatuses for heat management in storage systems
US12/068,944 US7953574B2 (en) 2007-09-18 2008-02-13 Methods and apparatuses for heat management in information systems

Publications (1)

Publication Number Publication Date
JP2009076062A true JP2009076062A (ja) 2009-04-09

Family

ID=40076570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008201783A Pending JP2009076062A (ja) 2007-09-18 2008-08-05 情報システムにおける熱管理のための方法および装置

Country Status (3)

Country Link
US (1) US7953574B2 (ja)
EP (1) EP2042968A3 (ja)
JP (1) JP2009076062A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039890A (ja) * 2009-08-14 2011-02-24 Kddi Corp データセンタ内におけるノード設置方法及びノード設置支援装置
JP2013152552A (ja) * 2012-01-24 2013-08-08 Hitachi Ltd 情報処理システムの運用管理方法
KR102403632B1 (ko) * 2021-10-15 2022-05-30 오케스트로 주식회사 핫 스팟을 고려하여 가상 머신의 예측 마이그레이션을 구현한 가상 머신 배치 시스템 및 가상 머신 배치 방법

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009244999A (ja) * 2008-03-28 2009-10-22 Fujitsu Ltd 仮想マシン管理プログラム及び管理サーバ装置
US8212817B2 (en) * 2008-10-31 2012-07-03 Hewlett-Packard Development Company, L.P. Spatial temporal visual analysis of thermal data
US8589931B2 (en) * 2009-03-18 2013-11-19 International Business Machines Corporation Environment based node selection for work scheduling in a parallel computing system
US8365176B2 (en) * 2009-10-15 2013-01-29 International Business Machines Corporation Data center job migration and scheduling based on server chassis fan speed threshold
JP5614226B2 (ja) * 2010-10-15 2014-10-29 富士通株式会社 仮想マシン制御装置、仮想マシン制御プログラムおよび仮想マシン制御方法
US8918576B2 (en) 2012-04-24 2014-12-23 Avago Technologies General Ip (Singapore) Pte. Ltd. Selectively placing data in thermally constrained memory systems to dynamically adapt to changing environmental conditions
US8856567B2 (en) 2012-05-10 2014-10-07 International Business Machines Corporation Management of thermal condition in a data processing system by dynamic management of thermal loads
US20140281590A1 (en) * 2013-03-15 2014-09-18 Ioan Sauciuc Battery power management for electronic device
JP6314533B2 (ja) * 2014-02-25 2018-04-25 富士通株式会社 データセンター
US9947386B2 (en) * 2014-09-21 2018-04-17 Advanced Micro Devices, Inc. Thermal aware data placement and compute dispatch in a memory system
US10216212B1 (en) * 2014-12-16 2019-02-26 Amazon Technologies, Inc. Operating temperature-based mass storage device management
US9378088B1 (en) * 2014-12-30 2016-06-28 Datadirect Networks, Inc. Method and system for reclamation of distributed dynamically generated erasure groups for data migration between high performance computing architectures and data storage using non-deterministic data addressing
US9596784B2 (en) * 2015-03-13 2017-03-14 True Power Electric, LLC Multi-chamber cooling system
US10235085B2 (en) * 2016-06-27 2019-03-19 International Business Machines Corporation Relocating storage unit data in response to detecting hotspots in a dispersed storage network
US10310935B2 (en) * 2016-11-17 2019-06-04 International Business Machines Corporation Dynamically restoring disks based on array properties
TWI709042B (zh) * 2018-11-08 2020-11-01 慧榮科技股份有限公司 用來進行關於容錯式磁碟陣列的映射資訊管理之方法與裝置以及儲存系統
US11012072B1 (en) * 2020-01-22 2021-05-18 Xilinx, Inc. Thermal load balancing of programmable devices
US11595321B2 (en) 2021-07-06 2023-02-28 Vmware, Inc. Cluster capacity management for hyper converged infrastructure updates

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6804632B2 (en) 2001-12-06 2004-10-12 Intel Corporation Distribution of processing activity across processing hardware based on power consumption considerations
US6987673B1 (en) 2003-09-09 2006-01-17 Emc Corporation Techniques for cooling a set of circuit boards within a rack mount cabinet
US7167359B2 (en) * 2003-12-29 2007-01-23 Sherwood Information Partners, Inc. System and method for mass storage using multiple-hard-disk-drive enclosure
WO2006037091A2 (en) * 2004-09-28 2006-04-06 Storagedna, Inc. Managing disk storage media
US20060112286A1 (en) * 2004-11-23 2006-05-25 Whalley Ian N Method for dynamically reprovisioning applications and other server resources in a computer center in response to power and heat dissipation requirements
US7644148B2 (en) * 2005-05-16 2010-01-05 Hewlett-Packard Development Company, L.P. Historical data based workload allocation
US7461273B2 (en) 2005-05-16 2008-12-02 Hewlett-Packard Development Company, L.P. Power distribution among servers

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039890A (ja) * 2009-08-14 2011-02-24 Kddi Corp データセンタ内におけるノード設置方法及びノード設置支援装置
JP2013152552A (ja) * 2012-01-24 2013-08-08 Hitachi Ltd 情報処理システムの運用管理方法
KR102403632B1 (ko) * 2021-10-15 2022-05-30 오케스트로 주식회사 핫 스팟을 고려하여 가상 머신의 예측 마이그레이션을 구현한 가상 머신 배치 시스템 및 가상 머신 배치 방법

Also Published As

Publication number Publication date
EP2042968A3 (en) 2009-04-22
US20090077558A1 (en) 2009-03-19
US7953574B2 (en) 2011-05-31
EP2042968A2 (en) 2009-04-01

Similar Documents

Publication Publication Date Title
US7953574B2 (en) Methods and apparatuses for heat management in information systems
US7818499B2 (en) Methods and apparatuses for heat management in storage systems
JP5795496B2 (ja) 疎結合複数ストレージ環境のための階層式ストレージプール管理及び制御
US8380928B1 (en) Applying data access activity measurements
JP6019513B2 (ja) 記憶リソースを共有する方法およびシステム
US8006056B2 (en) Storage system including capability to move a virtual storage device group without moving data
US8738975B2 (en) Runtime dynamic performance skew elimination
JP5830599B2 (ja) 計算機システム及びその管理システム
US7194592B2 (en) Storage system using load balancing among systems of varying performance
US7613878B2 (en) Management of number of disk groups that can be activated in storage device
JP2008217216A (ja) 負荷分散方法及び計算機システム
US8473108B2 (en) Information apparatus and method of optimizing cooling efficiency of air conditioner
JP2005275525A (ja) ストレージシステム
JP2005078507A (ja) 仮想化制御装置、アクセス経路制御方法及び計算機システム
JP2009043030A (ja) ストレージシステム
JP5882557B2 (ja) 要求優先順位シーク・マネージャ
JP2006285808A (ja) ストレージシステム
JP2004021557A (ja) プログラム、情報処理方法、情報処理装置、及び記憶装置
US10223016B2 (en) Power management for distributed storage systems
JP5597266B2 (ja) ストレージシステム
US11768744B2 (en) Alerting and managing data storage system port overload due to host path failures
US11340809B1 (en) Redirecting i/o communications based on network topology
JP2021099560A (ja) ストレージシステム
JP2024087143A (ja) ストレージ装置
JP2020119474A (ja) ストレージ管理システム、プール構成決定方法、及びそのコンピュータプログラム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090223