JP2015153300A - 監視装置及び監視方法 - Google Patents

監視装置及び監視方法 Download PDF

Info

Publication number
JP2015153300A
JP2015153300A JP2014028471A JP2014028471A JP2015153300A JP 2015153300 A JP2015153300 A JP 2015153300A JP 2014028471 A JP2014028471 A JP 2014028471A JP 2014028471 A JP2014028471 A JP 2014028471A JP 2015153300 A JP2015153300 A JP 2015153300A
Authority
JP
Japan
Prior art keywords
wind speed
abnormality
cooling air
temperature
wind
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014028471A
Other languages
English (en)
Inventor
昭弘 河津
Akihiro Kawazu
昭弘 河津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2014028471A priority Critical patent/JP2015153300A/ja
Priority to US14/594,204 priority patent/US20150233960A1/en
Publication of JP2015153300A publication Critical patent/JP2015153300A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01PMEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
    • G01P5/00Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft
    • G01P5/02Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft by measuring forces exerted by the fluid on solid bodies, e.g. anemometer
    • G01P5/04Measuring speed of fluids, e.g. of air stream; Measuring speed of bodies relative to fluids, e.g. of ship, of aircraft by measuring forces exerted by the fluid on solid bodies, e.g. anemometer using deflection of baffle-plates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01PMEASURING LINEAR OR ANGULAR SPEED, ACCELERATION, DECELERATION, OR SHOCK; INDICATING PRESENCE, ABSENCE, OR DIRECTION, OF MOVEMENT
    • G01P13/00Indicating or recording presence, absence, or direction, of movement
    • G01P13/02Indicating direction only, e.g. by weather vane
    • G01P13/04Indicating positive or negative direction of a linear movement or clockwise or anti-clockwise direction of a rotational movement
    • G01P13/045Indicating positive or negative direction of a linear movement or clockwise or anti-clockwise direction of a rotational movement with speed indication
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Thermal Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】データセンタ内の環境を改善するための判断材料をユーザに提示することができる監視装置及び監視方法を提供すること。【解決手段】データセンタ1の床2の開口部2aに設定した複数の風速測定点PSごとに、開口部2aから電子機器5に供給される冷却風Wの風速を取得する風速取得部41と、風速測定点PSごとの風速に基づいて、冷却風Wの状態が、予め分類しておいた複数の状態パターンA〜Eのうちのどれに該当するのかを特定する状態パターン特定部45と、特定した状態パターンに基づいて、データセンタ1の異常の種類を特定する異常特定部46とを有する監視装置による。【選択図】図6

Description

本発明は、監視装置及び監視方法に関する。
データセンタにおいては、サーバ等の複数の電子機器にジョブが分配され、各電子機器においてジョブが実行される。電子機器にはCPU(Central Processing Unit)等の電子部品が設けられているが、大量のジョブを処理すると電子部品の温度も上昇し、電子機器が故障したりその性能が低下したりする。
そのため、データセンタにおいては空調機で生成された冷却風を電子機器に供給し、その冷却風で電子部品を冷却するようにしている。
これにより電子機器の故障を防止できると期待できるが、電子機器を設置している環境によっては電子部品を適切に冷却できず、電子部品の寿命が縮まるおそれがある。
そこで、電子部品が置かれている環境の温度等を監視することにより電子部品の寿命を予測し、寿命に達したと判断された場合にはユーザに電子部品の交換を促す方法が提案されている。
特開2009−104322号公報 特開2001−60785号公報 特開平7−333015号公報
しかしながら、前述の方法では電子部品の交換を促すのみであるため、電子部品の短寿命化の原因となる事象を特定できず、短寿命化を防止するためにデータセンタ内の環境をどのように改善したらよいのかユーザは分らない。
そこで、本開示の技術は、データセンタ内の環境を改善するための判断材料をユーザに提示することができる監視装置及び監視方法を提供することを目的とする。
以下の開示の一観点によれば、データセンタの床の開口部に設定した複数の風速測定点ごとに、前記開口部から電子機器に供給される冷却風の風速を取得する風速取得部と、前記風速測定点ごとの前記風速に基づいて、前記冷却風の状態が、予め分類しておいた複数の状態パターンのうちのどれに該当するのかを特定する状態パターン特定部と、前記特定した状態パターンに基づいて、前記データセンタの異常の種類を特定する異常特定部とを有する監視装置が提供される。
また、その開示の別の観点によれば、風速取得部が、データセンタの床の開口部に設定した複数の風速測定点ごとに、前記開口部から電子機器に供給される冷却風の風速を取得する処理と、状態パターン特定部が、前記風速測定点ごとの前記風速に基づいて、前記冷却風の状態が、予め分類しておいた複数の状態パターンのうちのどれに該当するのかを特定する処理と、異常特定部が、前記特定した状態パターンに基づいて、前記データセンタの異常の種類を特定する処理とを有する監視方法が提供される。
以下の開示によれば、床の開口部から電子機器に供給される冷却風の風速に基づいてデータセンタの異常の種類を特定するので、その異常を解消してデータセンタ内の環境を改善するための判断材料をユーザが得ることが可能となる。
図1は、本実施形態において監視対象となるデータセンタの模式断面図である。 図2は、データセンタの床に設けられた開口部の上面図である。 図3は、本実施形態で使用する測定治具の模式図である。 図4(a)は、本実施形態で使用する風速センサの一例を示す模式斜視図であり、図4(b)は、本実施形態で使用する風向センサの一例を示す模式断面図である。 図5は、本実施形態に係る監視装置のハードウェア構成図である。 図6は、本実施形態に係る監視装置の機能ブロック図である。 図7は、パターンAの冷却風について説明するための模式図である。 図8は、パターンBの冷却風について説明するための模式図である。 図9は、パターンCの冷却風について説明するための模式図である。 図10は、パターンDの冷却風について説明するための模式図である。 図11は、パターンEの冷却風について説明するための模式図である。 図12は、状態パターンデータベースを模式的に示す図である。 図13は、温度データベースを模式的に示す図である。 図14は、エラーデータベースを模式的に示す図である。 図15は、総合判断データベースを模式的に示す図である。 図16は、本実施形態に係る監視方法の全体の手順を示すフローチャートである。 図17は、本実施形態に係る監視処理の手順を示すフローチャート(その1)である。 図18は、本実施形態に係る監視処理の手順を示すフローチャート(その2)である。 図19は、第1の調査で取得した風速と風向を模式的に示す表である。 図20は、第1の調査で取得したラックの内部の温度を模式的に示す表である。 図21は、第1の調査で取得したエラー情報を模式的に示す表である。 図22は、第1の調査の結果をまとめた表である。 図23は、第2の調査で使用したラックとその周囲を模式的に示す側面図である。 図24は、図23の各ラックの直下の開口部を模式的に示す平面図である。 図25は、図23の左側のラックにおいて、測定点13〜18での冷却風の風速と風向の測定結果を示す表である。 図26は、図23の右側のラックにおいて、測定点13〜18での冷却風の風速と風向の測定結果を示す表である。 図27は、図23の左右のラックの各々の測定点10〜12での冷却風の風速と風向の測定結果を示す表である。 図28は、図23の左右のラックの各々の測定点19〜21での冷却風の風速と風向の測定結果を示す表である。
以下に、本実施形態について添付図面を参照しながら説明する。
図1は、本実施形態において監視対象となるデータセンタ1の模式断面図である。
データセンタ1は、床2と空調機3とを有する。空調機3は、所定の温度に冷却された冷却風Wを生成し、その冷却風Wを床2の下方の空間に供給する。
床2には複数の開口部2aが設けられており、前述の冷却風Wは各開口部2aから床上に吹き上がる。
各開口部2aの直上にはラック4が設置される。ラック4は、例えばサーバラックであって、複数の電子機器5を収容する。電子機器5は特に限定されないが、この例ではCPU等の電子部品5aを備えたサーバを電子機器5として使用する。
また、前述の開口部2aに対向する部位のラック4にはファン8が設けられる。ファン8は、開口部2aから吹き上がる冷却風Wをラック4内に取り込み、その冷却風Wで各電子機器5を冷却するように機能する。
そして、ラック4の内部には温度測定部6とエラー検出部7とが設けられる。
温度測定部6は、電子機器5の周囲の温度Tを測定する温度センサであり、その温度Tを含む温度情報STを出力する。
一方、エラー検出部7は、一台のラック4の各電子部品5aから送信されるエラー情報SEを集約し、そのエラー情報SEを出力する。エラー情報SEは、電子部品5aに不具合がある旨の情報であって、例えばCPUが出力するI/F(Interface)エラーである。
これらの温度情報STとエラー情報SEは、後述の監視装置20に送信される。
図2は、開口部2aの上面図である。なお、図1における各開口部2aの断面は、図2のI−I線に沿う断面に相当する。
図2に示すように、開口部2aは平面視で矩形状である。
この例では開口部2aを複数の仮想領域Rに行列状に分割する。ここでは、空調機3(図1参照)に近い列から順に符号A、B、C、Dを付す。そして、各行には符号1、2、3を付し、これらの符号A、B、C、D、1、2、3の組み合わせにより各仮想領域Rを特定する。
その開口部2aには、冷却風Wの風速を測定する複数の風速測定点PSと、冷却風Wの風向を測定する複数の風向測定点PDとが設定される。
これらのうち、風速測定点PSは、一つの仮想領域Rに一つずつ設けられる。一方、風向測定点PDは、複数の仮想領域Rにまたがって設けられる。この例では、A列の仮想領域Rにおける風向が左の風向測定点PDで測定され、B列とC列の仮想領域Rにおける風向が中央の風向測定点PDで測定される。そして、D列の仮想領域Rにおける風向が右の風向測定点PDで測定される。
図3は、開口部2aに嵌められる測定治具の模式図である。
この測定治具12は、開口部2aを通る冷却風Wの風速と風向を測定するのに使用されるものであり、開口部2aに対応した矩形状の枠12xを有する。
そして、その枠12xの内側には、風速測定点PSに対応する位置に風速センサ13が設けられると共に、風向測定点PDに対応する位置に風向センサ15が設けられる。
なお、風速センサ13と風向センサ15は金属線によって枠12xに固定される。
図4(a)は風速センサ13の一例を示す模式斜視図であり、図4(b)は風向センサ15の一例を示す模式断面図である。
図4(a)に示すように、風速センサ13は、冷却風Wを受けて傾く風受け板14を有しており、その傾きの角度θを冷却風Wの風速に変換することで、当該風速を含む風速情報SSを出力する。
一方、図4(b)に示すように、風向センサ15は、冷却風Wを受けたときに軸17に沿って昇降する風受け板16を有する。軸17は、鉛直方向に延びており、風受け板16が下方に変位するのを規制するストッパ17aを有する。
風向センサ15は、軸17に沿った風受け板16の変位量zを風向情報SDとして出力する。その変位量zが正の場合には冷却風Wの風向が鉛直上向きであり、変位量zが0の場合には、冷却風Wの風向が鉛直下向きであるか、又は無風であるということになる。
次に、監視装置20について説明する。
図5は、監視装置20のハードウェア構成図である。
本実施形態では、ノート型パソコン等のモバイル端末を監視装置20として用い、その監視装置20でデータセンタ1の異常を監視する。
監視装置20は、CPU21、メモリ22、ハードディスク制御部23、ハードディスク24、RS-232C制御部25、LAN(Local Area Network)制御部26、及び表示部27を有する。
これらのうち、ハードディスク制御部23は、ハードディスク24とメモリ22との間におけるデータの入出力を制御する。また、RS-232C制御部25は、RS-232Cケーブル29により測定治具12と接続されており、RS-232C規格に準拠して風速センサ13(図3参照)や風向センサ15との間の通信を制御する。
そして、LAN制御部26は、LANケーブル30を介して前述の電子機器5と接続されており、イーサネット(登録商標)規格に準拠して電子機器5との間の通信を制御する。
なお、電子機器5にはサービスプロセッサ31が設けられており、前述の温度情報STとエラー情報SEは、サービスプロセッサ31とLANケーブル30を介して監視装置20に送信される。
RS-232Cケーブル29とLANケーブル30は監視装置20に脱着自在であって、監視装置20を使用する場合にのみこれらのケーブルを監視装置20に装着すればよい。
また、表示部27は、例えば液晶ディスプレイであって、データセンタ1内の異常の種類を表示するのに使用される。
また、監視装置20はAC100Vの電源51で駆動し、電子機器5はAC100V又はAC200Vの電源52で駆動する。
図6は、監視装置20の機能ブロック図である。
監視装置20は、風速取得部41、風向取得部42、温度取得部43、エラー情報取得部44、状態パターン特定部45、及び異常特定部46を有する。
これらの各部は、前述のハードディスク24(図5参照)に専用のプログラムをインストールし、CPU21とメモリ22とが協働してそのプログラムを実行することでより実現できる。
風速取得部41は、前述の風速センサ13から風速情報SSを取得する機能を有し、風向取得部42は、前述の風向センサ15から風向情報SDを取得する機能を有する。
また、温度取得部43は、前述の温度測定部6から温度情報STを取得する機能を有し、エラー情報取得部44は、前述のエラー検出部7からエラー情報SEを取得する機能を有する。
状態パターン特定部45は、風速取得部41と風向取得部42の各々から風速情報SSと風向情報SDを受け、これらの情報に基づいて開口部2aから吹き上がる冷却風Wの状態を特定する。その特定には状態パターンデータベースDB1が使用される。
異常特定部46は、状態パターン特定部45が特定した状態パターンに基づいて、後述のようにデータセンタ1の異常の種類を特定する。なお、異常の種類を特定するにあたっては、異常特定部46は、温度データベースDB2、エラーデータベースDB3、及び総合判断データベースDB4も参照する。
次に、状態パターン特定部45で特定される冷却風Wの状態パターンについて説明する。
図7〜図11は、冷却風Wの各状態パターンについて説明するための模式図である。
図7〜図11においては、冷却風Wの風向と風速とを同時に表す記号として◎、○、△、×、黒塗りの△、及び●を導入する。各記号の意味は以下の通りである。
◎:風速が基準風速の2倍以上であって、風向が順風。
○:風速が基準風速以上であって、風向が順風。
△:風速が基準風速未満であって、風向が順風。
×:無風。
黒塗りの△:風速が基準風速未満であって、風向が逆風。
●:風速が基準風速以上であって、風向が逆風。
なお、黒塗りの△は、図面では以下のように表す。
Figure 2015153300
また、基準風速は、開口部2aを流れる冷却風Wの強弱を判定する目安の風量であり、この例では(基準風量)/(開口部2aの面積)で定義される。この定義において、基準風量は予めユーザにより設定される。
更に、図7〜図11においては、「風向・風速データ」、「風速可視化」、「風量可視化」、及び「風量パターン表示」の各々を併記する。
このうち、「風向・風速データ」は、開口部2aを流れる冷却風Wの風速と風向とを表す模式平面図であって、図2の符号A、B、C、D、1、2、3により開口部2aの各仮想領域Rを表す。
また、「風速モード表示」は、冷却風Wの風速を表示する模式断面図であって、矢印の向きが風向を表し、矢印の長さが風速を表す。
更に、「風量モード表示」は、冷却風Wの風量を表示する模式断面図であって、風速と風向を表す矢印を内包する多角形により風量を模式的に表す。
そして、「風量パターン表示」は、開口部2aの周辺の気流を表す白抜き矢印を上記した「風量モード表示」に併記した図である。
図7は、パターンAを示す。
パターンAは、開口部2aにおいて空調機3に近い部位で冷却風Wが逆風となっている状態パターンである。
パターンAの「風速モード表示」は「乱流」となる。
図8は、パターンBを示す。
パターンBは、逆風とはなっていないものの、開口部2aにおいて空調機3に近い部位で冷却風Wの風速が弱く、空調機3から離れるにつれ風速が強くなる状態パターンである。
パターンBでも「風速モード表示」は「乱流」となる。
図9は、パターンCを示す。
パターンCは、開口部2a内の全ての部位において冷却風Wが順風であり、かつ、冷却風Wの風量が基準風速以上の状態パターンである。
パターンCの「風速モード表示」は「安定」となる。
図10は、パターンDを示す。
パターンDは、開口部2aの周縁において風量が弱い状態パターンであって、「風速モード表示」は「微風」となる。
図11は、パターンEを示す。
パターンEは、開口部2aの全ての部位において無風となっている状態パターンであり、「風速モード表示」は「無風」となる。
なお、図7〜図11の例では、パターンA〜パターンEに分類するに際し冷却風Wの風速と風向の両方を用いているが、風速のみを用いて冷却風Wの状態パターンを分類するようにしてもよい。
図12は、前述の状態パターンデータベースDB1を模式的に示す図である。
図12に示すように、状態パターンデータベースDB1は、仮想領域Rを特定するための前述の符号A、B、C、D、1、2、3と「状態パターン」とを属性として有する。そして、符号A、B、C、D、1、2、3の属性値には、前述の記号◎、○、△、×、黒塗りの△、及び●のいずれかが格納される。また、「状態パターン」の属性値には、図7〜図11で説明したパターンA〜Eのいずれかが格納される。
状態パターンデータベースDB1は、符号A、B、C、D、1、2、3の各々の属性値である風速と風向とを指定して問い合わせを行うことで、これらの属性値に対応した「状態パターン」の属性値を返す。
なお、図7〜図11において風速のみで状態パターンを分類する場合には、状態パターンデータベースDB1の符号A、B、C、D、1、2、3の各々の属性値には風速のみを格納しておけばよい。
図13は、前述の温度データベースDB2を模式的に示す図である。
図13に示すように、温度データベースDB2は、「基準温度未満」と「基準温度以上」の二つの属性を有し、これらの各々に属性値として記号「◎」、「×」が格納されている。
なお、基準温度は、電子機器5の動作を保証する温度の上限温度であって、ユーザによって予め設定される。
温度データベースDB2は、前述のように異常特定部46により参照されるものであり、温度情報STに含まれる温度Tが基準温度未満の場合には「◎」を異常特定部46に返し、温度Tが基準温度以上の場合には「×」を返す。
図14は、前述のエラーデータベースDB3を模式的に示す図である。
図14に示すように、エラーデータベースDB3は、「エラー発生なし」と「エラー発生あり」の二つの属性を有し、これらの各々に属性値として記号「◎」、「×」が格納されている。
エラーデータベースDB3は、前述のように異常特定部46により参照されるものであり、一つのラック4における複数の電子部品5aのうち一つでも不具合があることがエラー情報SEにより判明した場合には異常特定部46に「×」を返す。一方、一つのラック4における全ての電子部品5aに不具合がないことがエラー情報SEにより判明した場合には特定部46に「◎」を返す。
図15は、総合判断データベースDB4を模式的に示す図である。
総合判断データベースDB4は、データセンタ1の異常の種類と前述の「状態パターン」等とを対応させたものであり、属性として「状態パターン」、「温度」、「エラー」、「総合判断」、「異常の種類」、及び「改善ポイント」を有する。
これらの属性のうち、「状態パターン」は、パターンデータベースDB1(図12参照)の属性「状態パターン」と同じである。
また、属性「温度」には、温度データベースDB2(図13参照)における属性値である「◎」、「×」が格納される。
属性「エラー」には、エラーデータベースDB3(図14参照)における属性値である「◎」、「×」が格納される。
属性「総合判断」は、データセンタ1内の環境を改善する必要があるか否かの判断結果を格納する属性である。
更に、属性「異常の種類」は、データセンタ1に想定される異常の種類を格納する属性である。
そして、属性「改善ポイント」は、データセンタ1の異常を取り除くための改善ポイントを格納する属性であって、属性「異常の種類」に応じて予め設定される。
以下に、総合判断データベースDB4の各行d1〜d6について説明する。
・第1行目d1
第1行目d1は、属性「状態パターン」が「パターンA」、属性「温度」が「×」、属性「エラー」が「×」の場合である。
「パターンA」のときは、図7のように冷却風Wが逆風となっている。これは、開口部2aが空調機3に近いときに、空調機3から出た直後の強い冷却風Wの風向が開口部2aの近傍で乱れ、データセンタ1内にエアーカーテンが生じることで起こり得る。
また、属性「温度」が「×」となったのは、このような冷却風Wの乱れによりラック4内に冷却風Wが取り込まれ難くなり、ラック4内の温度Tが上昇したためである。更に、温度Tの上昇により電子部品5aが冷却不足となり、当該電子部品5aからエラー情報SEが出たため属性「エラー」も「×」となる。
このような状態を放置すれば電子部品5aの性能低下が著しくなるので、この場合の属性「総合判断」は「改善要」となる。
また、属性「異常の種類」は、前述のように冷却風Wが乱れに起因した「エアーカーテン状態」である。
属性「改善ポイント」には、温度Tを基準温度以下にし、かつエラー情報SEが発生しないようにするための方策が格納される。
そのような方策としては、例えば、冷却風Wの流れを整えるための整流板を床2の下に設置することで「エアーカーテン状態」を解消することが挙げられる。
また、冷却風Wの乱れに合わせて各々のファン8の回転数を調節し、ラック4内に十分な量の冷却風Wを取り込むことによっても、温度Tを基準温度以下にし、かつエラー情報SEが発生しないようにすることができる。
・第2行目d2
第2行目d2は、属性「状態パターン」が「パターンB」であり、これ以外の属性は第1行目と同じである。
「パターンB」のときは、図8に示したように、開口部2aにおいて空調機3に近い部位での冷却風Wの風速が弱い。
これは、「パターンA」のときと同様に、開口部2aが空調機3に近いときにエアーカーテンが生じることで起こり得る。
よって、属性「異常の種類」と属性「改善ポイント」は、第1行目d1におけるそれらと同じである。
・第3行目d3
第3行目d3は、属性「状態パターン」が「パターンC」、属性「温度」が「◎」、属性「エラー」が「◎」の場合である。
「パターンC」のときは、図9に示したように、開口部2aの全ての部位において冷却風Wが順風であり、かつ冷却風Wの風量が基準風速以上である。また、属性「温度」と属性「エラー」のいずれも「◎」である。
よって、この場合はデータセンタ1に異常はないとみなせるので、「総合判断」は「改善不要」となる。そして、属性「改善ポイント」も「なし」となる。
・第4行目d4
第4行目d4は、属性「状態パターン」が「パターンC」、属性「温度」が「×」、属性「エラー」が「×」の場合である。
この場合は、冷却風Wが順風でその風量が基準風量以上であるにも関わらず、温度Tが基準温度以上であり、かつエラー情報SEが発生している場合である。これは、各ファン8(図1参照)が故障しており、ファン8によってラック4内に冷却風Wが取り込めていないことが原因と考えられる。
よって、属性「異常の種類」は「ファン8の異常」となり、属性「総合判断」は「改善要」となる。
また、属性「改善ポイント」は、「ファン8の点検」となる。
・第5行目d5
第5行目d5は、属性「状態パターン」が「パターンD」、属性「温度」が「×」、属性「エラー」が「×」の場合である。
「パターンD」のときは、図10に示したように、開口部2aの周縁において冷却風Wの風量が弱い。そして、このような風量不足が原因で、属性「温度」と属性「エラー」の両方とも「×」となっている。
このような状態を放置すれば、電子部品5aの性能低下が著しくなるので、この場合の属性「総合判断」は「改善要」となる。
また、属性「異常の種類」は、前述のように冷却風Wの「風量不足」である。
このように冷却風Wの風量が不足している場合でも電子部品5aを適切に冷却できるようにするには、各ファン8の回転数を上昇させることにより、ラック4内により多くの冷却風Wを取り込むようにすればよい。
よって、属性「改善ポイント」には、「ファン8の回転数の上昇」が格納される。
・第6行目d6
第6行目d6は、属性「状態パターン」が「パターンE」、属性「温度」が「×」、属性「エラー」が「×」の場合である。
「パターンE」のときは、図11に示したように、冷却風Wが無風となっている。これでは冷却風Wによる電子部品5aの冷却が行えないため、属性「温度」と属性「エラー」の両方とも「×」になっている。
冷却風Wが無風となっているのは、空調機3が故障しているためと考えられる。
よって、属性「異常の種類」は「空調機3の故障」となり、属性「総合判断」は「改善要」となる。
また、属性「改善ポイント」は、「空調機3の点検」となる。
次に、上記した監視装置20を用いた本実施形態に係る監視方法について説明する。
図16は、本実施形態に係る監視方法の全体の手順を示すフローチャートである。
まず、ステップS1において、開口部2aに測定治具12(図3参照)をセットする。
次に、ステップS2に移り、RS-232Cケーブル29(図5参照)で測定治具12と監視装置20とを接続する。更に、LANケーブル20で電子機器5と監視装置20とを接続する。
次いで、ステップS3に移り、監視装置20の電源51(図5参照)を投入する。
その後、ステップS4に移り、各電子機器5の電源52(図5参照)を投入する。
次に、ステップS5に移り、監視装置20におけるデータセンタ1の監視処理を開始する。
この監視処理は、ハードディスク24(図5参照)に予めインストールされている専用のプログラムを実行することで行われる。
図17及び図18は、ステップS5における監視処理の手順を示すフローチャートである。
まず、図17のステップS11において、監視装置20が、この監視処理を実行するための専用のプログラムを起動する。
次に、ステップS12に移り、ユーザが、基準風量と開口部2aの面積とを監視装置20に入力する。
そして、監視装置20が、(基準風量)/(開口部2aの面積)で定義される基準風速を算出する。
次に、ステップS13に移り、風向取得部42(図6参照)が風向センサ15(図3参照)から風向情報SDを取得する。
そして、ステップS14に移り、全ての開口部2aの全ての風向センサ15から風向情報SDを取得できたかどうかを風向取得部42が判断する。
ここで、取得できていない(NO)と判断された場合には、ステップS13に戻り、風向情報SDの取得を続行する。
一方、取得できた(YES)と判断された場合にはステップS15に移る。
ステップS15においては、風速取得部41(図6参照)が各風速センサ13(図3参照)から風速情報SSを取得する。
そして、ステップS16に移り、全ての開口部2aの全ての風速センサ13から風速情報SSを取得できたかどうかを風速取得部41が判断する。
ここで、取得できていない(NO)と判断された場合には、ステップS15に戻り、風速情報SSの取得を続行する。
一方、取得できた(YES)と判断された場合にはステップS17に移る。
ステップS17においては、温度取得部43(図6参照)が前述の温度測定部6(図1参照)から温度情報STを取得する。
そして、ステップS18に移り、全ての温度測定部6から温度情報STを取得できたかどうかを温度取得部43が判断する。
ここで、取得できていない(NO)と判断された場合には、ステップS17に戻り、温度情報STの取得を続行する。
一方、取得できた(YES)と判断された場合には、図18のステップS19に移る。
ステップS19においては、エラー情報取得部44(図6参照)がエラー検出部7(図1参照)からエラー情報SEを取得する。
次に、ステップS20に移り、全ての電子部品5aのエラー情報SEを取得できたかどうかをエラー情報取得部44が判断する。
ここで、取得できていない(NO)と判断された場合には、ステップS19に戻り、エラー情報SEの取得を続行する。
一方、取得できた(YES)と判断された場合にはステップS21に移る。
ステップS21においては、以下のようにしてデータセンタ1の異常の診断と解析とを行う。
まず、各開口部2aにおける冷却風Wの状態が、状態パターンデータベースDB1(図12参照)において予め分類しておいた状態パターンA〜Eのうち、どれに該当するのかを特定する。この例では、状態パターン特定部45が、ステップS13とステップS15の各々で取得した風向情報SDと風速情報SSに合致する冷却風Wの状態パターンを状態パターンデータベースDB1から読み出すことにより状態パターンの特定が行われる。
なお、風速のみで状態パターンA〜Eを分類している場合には、風速情報SSにのみ基づいて状態パターンを特定すればよい。
次に、異常特定部46が、データセンタ1の異常の種類を特定する。
異常の種類の特定にあたっては、ステップS17で取得した温度情報STに含まれる温度Tの値に応じて、異常特定部46が温度データベースDB2から属性値「◎」と「×」のどちらかを取得する。なお、これらの属性値は複数のラック4ごとに取得される。
更に、ステップS19で取得したエラー情報SEを利用して、異常特定部46がエラーデータベースDB3から属性値「◎」と「×」のどちらかを取得する。この属性値も、複数のラック4ごとに取得される。
その後、異常特定部46が、上記で特定した状態パターン、温度データベースDB2の属性値、及びエラーデータベースDB3の属性値の各々に対応する行を総合判断データベースDB4から呼び出す。
これにより、複数のラック4の各々について、「総合判断」、「異常の種類」、及び「改善ポイント」を得ることができる。
次に、ステップS22に移る。
ステップS22においては、ステップS21で取得した「総合判断」が「改善要」となっているラック4が存在するか否かを異常特定部46が判断する。
ここで、「改善要」となったラック4が一つもなければ、データセンタ1内の環境を改善する必要がないので、本実施形態に係る監視方法を終了する。
一方、「改善要」となったラック4が存在する場合には、ステップS23に移り、異常特定部46の制御下でそのラック4に対応する「異常の種類」と「改善ポイント」とを表示部27に表示する。
これにより、ユーザが「異常の種類」と「改善ポイント」とを把握することができ、その「改善ポイント」に従うことでデータセンタ1の異常を解消するための対策を講じることが可能となる。
以上により、本実施形態に係る監視方法の基本ステップを終了する。
上記した本実施形態によれば、開口部2aにおける冷却風Wの風速や風向に基づいて、冷却風Wの状態が状態パターンデータベースDB1に格納されている複数の状態パターンのどれに該当するのかを特定する。そして、その状態パターンに基づいてデータセンタ1の異常の種類を特定する。これにより、ユーザが異常の種類に応じて対策を講じることができ、電子部品5aの冷却不足等に起因した電子機器5の性能低下を防止できる。
更に、異常の種類を特定するに際しては、冷却風Wの状態パターンだけでなく、ラック4内の温度Tや電子部品5aから送信されたエラー情報SEも勘案するので、異常の種類を特定する精度が向上する。
しかも、異常の種類だけでなく、改善ポイントをユーザに提示することで、異常を解消させるために講じるべき対策が明確となり、ユーザの便宜に資することが可能となる。
次に、本願発明者が行った調査について説明する。
(第1の調査)
図19は、本調査で取得した風速と風向を模式的に示す表である。
図19において、「テスト日時」はこの調査を行った日時であり、「装置号機」は複数のラック4と特定するための番号である。また、「試験環境温度」は、参考のために取得したデータセンタ1内の温度である。
なお、この調査では、各ラック4の直下にある開口部2aの各々における冷却風Wの風速と風向が調べられた。図18における各符号A、B、C、D、1、2、3は、図2に示したように開口部2aの仮想領域Rを特定するための符号であって、例えばA1は、1行A列目の仮想領域Rということになる。また、記号黒塗りの△は、冷却風Wが逆風であることを示す。
図19に示すように、この例では、#1のラック4の直下において逆風となっている。
図20は、本調査で取得したラック4の内部の温度Tを模式的に示す表である。
なお、図20において「温度診断」は温度Tが基準温度を超えているか否かの結果を記号「◎」、「×」で示すものであり、温度データベースDB2(図13参照)の属性値と同じである。この調査では基準温度を40℃とした。
図20に示すように、#4と#5のラック4において温度Tが基準温度を超えている。
図21は、本調査で取得したエラー情報SEを模式的に示す表である。
図21において、「エラー発生有無」は、一つのラック4における複数の電子部品5aのうちに一つでも不具合があるか否かを表すものである。また、「エラー診断」は、これと同様のことを記号「◎」、「×」で示すものであり、エラーデータベースDB3(図14参照)の属性値と同じである。
更に、「エラー回数」は、一時間に発生した不具合の回数を示すものであり、参考のために取得した。
図21に示すように、この調査では、#2のラック4のみが「◎」であり、これ以外のラック4では「×」となった。
図19〜図21の調査結果に基づいて「風速表示モード」を確認したところ、図22のようになった。
図22は、本調査の結果をまとめた表である。なお、図22における「風速モード表示」は、図7〜図11における「風速モード表示」と同一である。
図22に示すように、「風速表示モード」が「安定」となったのは#2と#4のラック4であり、これ以外のラック4では「風速表示モード」が「乱気流」、「微風」、及び「無風」となった。
(第2の調査)
図23は、本調査で使用したラック4とその周囲を模式的に示す側面図である。
図23に示すように、この調査では二つのラック4を使用した。これらのラック4を以下ではラック(左)4とラック(右)4で区別する。
ラック(左)4は不具合が発生していないラックであり、ラック(右)4は不具合が多発していたラックである。
また、この調査では、図2で示した開口部2a内の風速測定点PSと風向測定点PDの他に、丸付き数字の10〜21で示す高さ位置にも風速測定点と風向測定点を設けた。これらの測定点のうち、10〜12はラック4の内側に位置し、13〜15はラック4の入口に位置する。そして、16〜18は床2とラック4との間に位置し、19〜21は床2の下方に位置する。
図24は、図23の各ラック4の直下の開口部2aを模式的に示す平面図である。
図24における丸付き数字1〜9は、図23において10〜21で示した各測定点の面内位置を示す符号である。
図25は、ラック(左)4において、測定点13〜18での冷却風Wの風速と風向の測定結果を示す表である。この調査では、各測定点での冷却風Wの温度も調査し、その結果を図25に括弧書きで併記した。
また、冷却風Wの基準風量を0.4m/secに設定した。
なお、図25における「床面」は、図2のように開口部2a内に設定した風速測定点PSと風向測定点PDでの測定結果を表す。
図25に示すように、測定点13〜18と「床面」のいずれにおいても冷却風Wは順風となっており、かつ、基準風量よりも高い風量が得られている。
一方、図26は、これと同じ調査をラック(右)4に対して行って得られた表である。
図26の「床面(改善前)」から分かるように、ラック(右)4においては床面の一部において冷却風Wが逆風となったり、その風量が基準風量(0.4m/sec)未満となったりしている。
この状況を本実施形態に従って判断したところ、「改善ポイント」として整流板の設置が挙げられた。
そこで、図23の点線に示すように、開口部2aの下に整流板40を設置し、空調機3から供給された冷却風Wの多くをラック(右)4に供給するようにした。
その結果、図26の「床面(改善後)」に示すように、床面において冷却風Wが順風となり、かつ、その風量も基準風量の0.4m/secよりも大きくなった。
一方、図27は、ラック(左)4とラック(右)4の各々の測定点10〜12での風速と風向の測定結果を示す表である。また、図28は、ラック(左)4とラック(右)4の各々の測定点19〜21での風速と風向の測定結果を示す表である。
前述のように、測定点10〜12はラック4の内側に位置し、測定点19〜21は床2の下方に位置する。
図27及び図28の結果によれば、前述のように左右のラック4では不具合の発生の仕方が異なるにも関わらず、左右のラック4において測定点10〜12、19〜21での測定結果に大きな差がない。よって、ラック4の内側や床2の下方で冷却風Wの風向や風速を測定したのでは、ラック4内の電子機器5の不具合を発見することができないことになる。
このことから、電子機器5を備えたデータセンタ1の不具合を診断するには、本実施形態のように開口部2a内に風速測定点PSと風向測定点PDとを設定するのが有効であることが確認できた。
以上説明した各実施形態に関し、更に以下の付記を開示する。
(付記1) データセンタの床の開口部に設定した複数の風速測定点ごとに、前記開口部から電子機器に供給される冷却風の風速を取得する風速取得部と、
前記風速測定点ごとの前記風速に基づいて、前記冷却風の状態が、予め分類しておいた複数の状態パターのうちのどれに該当するのかを特定する状態パターン特定部と、
前記特定した状態パターンに基づいて、前記データセンタの異常の種類を特定する異常特定部と、
を有することを特徴とする監視装置。
(付記2) 前記開口部に設定した複数の風向測定点ごとに、前記冷却風の風向を取得する風向取得部を更に有し、
前記状態パターン特定部は、前記風速と前記風向とに基づいて、前記状態パターンを特定することを特徴とする付記1に記載の監視装置。
(付記3) 前記電子機器の温度を取得する温度取得部を更に有し、
前記異常特定部は、前記特定した状態パターンと前記温度とに基づいて、前記異常の前記種類を特定することを特徴とする付記2に記載の監視装置。
(付記4) 前記電子機器内の電子部品に不具合がある旨のエラー情報を取得するエラー情報取得部を更に有し、
前記異常特定部は、前記特定した状態パターン、前記温度、及び前記エラー情報に基づいて、前記異常の前記種類を特定することを特徴とする付記3に記載の監視装置。
(付記5) 前記異常特定部は、前記異常の前記種類に応じた改善ポイントを特定することを特徴とする付記1乃至付記4のいずれかに記載の監視装置。
(付記6) 前記異常の前記種類を表示する表示部を更に有することを特徴とする付記1乃至付記5のいずれかに記載の監視装置。
(付記7) 前記状態パターンと前記異常の種類とを対応させたデータベースを更に有し、
前記異常特定部は、前記データベースを参照することにより、前記特定した状態パターンに対応する前記異常の種類を特定することを特徴とする付記1乃至付記6のいずれかに記載の監視装置。
(付記8) 風速取得部が、データセンタの床の開口部に設定した複数の風速測定点ごとに、前記開口部から電子機器に供給される冷却風の風速を取得する処理と、
状態パターン特定部が、前記風速測定点ごとの前記風速に基づいて、前記冷却風の状態が、予め分類しておいた複数の状態パターンのうちのどれに該当するのかを特定する処理と、
異常特定部が、前記特定した状態パターンに基づいて、前記データセンタの異常の種類を特定する処理と、
を有することを特徴とする監視方法。
(付記9) 風向取得部が、前記開口部に設定した複数の風向測定点ごとに、前記冷却風の風向を取得する処理を更に有し、
前記状態パターンを特定する処理において、前記状態パターン特定部が、前記風速と前記風向とに基づいて、前記状態パターンを特定することを特徴とする付記8に記載の監視方法。
(付記10) 温度取得部が前記電子機器の温度を取得する処理を更に有し、
前記異常の前記種類を特定する処理において、前記異常特定部が、前記特定した状態パターンと前記温度とに基づいて、前記異常の前記種類を特定することを特徴とする付記9に記載の監視方法。
(付記11) エラー情報取得部が、前記電子機器内の電子部品に不具合がある旨のエラー情報を取得する処理を更に有し、
前記異常の前記種類を特定する処理において、前記異常特定部が、前記特定した状態パターン、前記温度、及び前記エラー情報に基づいて、前記異常の前記種類を特定することを特徴とする付記10に記載の監視方法。
1…データセンタ、2…床、2a…開口部、4…ラック、5…電子機器、5a…電子部品、6…温度測定部、7…エラー検出部、8…ファン、12…測定治具、13…風速センサ、14…風受け板、15…風向センサ、16…風受け板、17…軸、17a…ストッパ、20…監視装置、21…CPU、22…メモリ、23…ハードディスク制御部、24…ハードディスク、25…RS-232C制御部、26…LAN制御部、27…表示部、29…RS-232Cケーブル、30…LANケーブル、41…風速取得部、42…風向取得部、43…温度取得部、44…エラー情報取得部、45…状態パターン特定部、46…異常特定部、51、52…電源、DB1…状態パターンデータベース、DB2…温度データベース、DB3…エラーデータベース、DB4…総合判断データベース。

Claims (6)

  1. データセンタの床の開口部に設定した複数の風速測定点ごとに、前記開口部から電子機器に供給される冷却風の風速を取得する風速取得部と、
    前記風速測定点ごとの前記風速に基づいて、前記冷却風の状態が、予め分類しておいた複数の状態パターンのうちのどれに該当するのかを特定する状態パターン特定部と、
    前記特定した状態パターンに基づいて、前記データセンタの異常の種類を特定する異常特定部と、
    を有することを特徴とする監視装置。
  2. 前記開口部に設定した複数の風向測定点ごとに、前記冷却風の風向を取得する風向取得部を更に有し、
    前記状態パターン特定部は、前記風速と前記風向とに基づいて、前記状態パターンを特定することを特徴とする請求項1に記載の監視装置。
  3. 前記電子機器の温度を取得する温度取得部を更に有し、
    前記異常特定部は、前記特定した状態パターンと前記温度とに基づいて、前記異常の前記種類を特定することを特徴とする請求項2に記載の監視装置。
  4. 前記電子機器内の電子部品に不具合がある旨のエラー情報を取得するエラー情報取得部を更に有し、
    前記異常特定部は、前記特定した状態パターン、前記温度、及び前記エラー情報に基づいて、前記異常の前記種類を特定することを特徴とする請求項3に記載の監視装置。
  5. 前記異常特定部は、前記異常の前記種類に応じた改善ポイントを特定することを特徴とする請求項1乃至請求項4のいずれかに1項に記載の監視装置。
  6. 風速取得部が、データセンタの床の開口部に設定した複数の風速測定点ごとに、前記開口部から電子機器に供給される冷却風の風速を取得する処理と、
    状態パターン特定部が、前記風速測定点ごとの前記風速に基づいて、前記冷却風の状態が、予め分類しておいた複数の状態パターンのうちのどれに該当するのかを特定する処理と、
    異常特定部が、前記特定した状態パターンに基づいて、前記データセンタの異常の種類を特定する処理と、
    を有することを特徴とする監視方法。
JP2014028471A 2014-02-18 2014-02-18 監視装置及び監視方法 Pending JP2015153300A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014028471A JP2015153300A (ja) 2014-02-18 2014-02-18 監視装置及び監視方法
US14/594,204 US20150233960A1 (en) 2014-02-18 2015-01-12 Monitoring device and monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014028471A JP2015153300A (ja) 2014-02-18 2014-02-18 監視装置及び監視方法

Publications (1)

Publication Number Publication Date
JP2015153300A true JP2015153300A (ja) 2015-08-24

Family

ID=53797920

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014028471A Pending JP2015153300A (ja) 2014-02-18 2014-02-18 監視装置及び監視方法

Country Status (2)

Country Link
US (1) US20150233960A1 (ja)
JP (1) JP2015153300A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008034715A (ja) * 2006-07-31 2008-02-14 Hitachi Ltd 電子装置およびラック型電子装置
JP2013204932A (ja) * 2012-03-28 2013-10-07 Fujitsu Ltd 空調制御システム及び空調制御方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6337630B1 (en) * 2000-02-22 2002-01-08 Dell Products, L.P. Apparatus and method for detecting cooling conditions in a computer
US7330350B2 (en) * 2004-06-04 2008-02-12 Cray Inc. Systems and methods for cooling computer modules in computer cabinets
GB2450098B (en) * 2007-06-12 2012-06-20 Jca Technology Cooling system
JP5344459B2 (ja) * 2008-06-30 2013-11-20 インターナショナル・ビジネス・マシーンズ・コーポレーション 制御装置、制御方法および制御プログラム
US8521449B2 (en) * 2009-06-06 2013-08-27 International Business Machines Corporation Three dimensional air flow sensors for data center cooling
GB201008825D0 (en) * 2010-05-26 2010-07-14 Bripco Bvba Data centre cooling system
US8857204B2 (en) * 2011-09-23 2014-10-14 R4 Ventures Llc Real time individual electronic enclosure cooling system
US8842433B2 (en) * 2011-11-17 2014-09-23 Cisco Technology, Inc. Environmental control for module housing electronic equipment racks
GB2513141A (en) * 2013-04-17 2014-10-22 Ibm Data processing system with real-time data center air flow simulator

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008034715A (ja) * 2006-07-31 2008-02-14 Hitachi Ltd 電子装置およびラック型電子装置
JP2013204932A (ja) * 2012-03-28 2013-10-07 Fujitsu Ltd 空調制御システム及び空調制御方法

Also Published As

Publication number Publication date
US20150233960A1 (en) 2015-08-20

Similar Documents

Publication Publication Date Title
TWI659283B (zh) 診斷裝置、診斷方法及程式
US10732619B2 (en) Method for monitoring driving unit of car body assembly line, and device therefor
JP3780508B2 (ja) 工作機械の異常診断装置、異常診断方法及び異常診断プログラム
JP4832609B1 (ja) 異常予兆診断装置および異常予兆診断方法
US20190004507A1 (en) Equipment management apparatus, equipment management system, computer readable medium, and equipment management method
US11782430B2 (en) Abnormality diagnosis method, abnormality diagnosis device and non-transitory computer readable storage medium
JP5081999B1 (ja) 異常予兆診断結果の表示方法
CN103189849B (zh) 显示处理系统、显示处理方法和程序
JP6009395B2 (ja) ワイヤーロープ探傷システム
JP6200833B2 (ja) プラントと制御装置の診断装置
JP2006135412A (ja) 遠隔監視システム
US20220035356A1 (en) Equipment failure diagnosis support system and equipment failure diagnosis support method
KR101865897B1 (ko) 서포트 벡터 머신을 이용한 회전체 수명 진단방법
US20200004220A1 (en) Method and apparatus for performing an automatic health checkup for a cnc turning center
EP4174601A1 (en) System, apparatus and method for monitoring condition of an asset in technical installation
KR101858121B1 (ko) 발전소 상태 판단 장치 및 방법
JP6667664B2 (ja) プラント管理装置、プラント管理方法、およびプログラム
JP5782237B2 (ja) 複数のdcファンの回転状態を監視する方法
JP4500876B1 (ja) 生産管理システム
JP2014049067A (ja) 設備診断装置および設定変更督促方法
JP2015153300A (ja) 監視装置及び監視方法
JP2008033902A (ja) 警報装置
CN111077886A (zh) 一种车站故障实时监测系统
JP2010039733A (ja) 製造プロセスの監視方法、監視プログラム、監視システムおよび製品の製造方法
JP6744342B2 (ja) 工作機械の制御装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161102

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170801

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180213