JP5790662B2 - 表示処理システム、表示処理方法、およびプログラム - Google Patents

表示処理システム、表示処理方法、およびプログラム Download PDF

Info

Publication number
JP5790662B2
JP5790662B2 JP2012546668A JP2012546668A JP5790662B2 JP 5790662 B2 JP5790662 B2 JP 5790662B2 JP 2012546668 A JP2012546668 A JP 2012546668A JP 2012546668 A JP2012546668 A JP 2012546668A JP 5790662 B2 JP5790662 B2 JP 5790662B2
Authority
JP
Japan
Prior art keywords
service
failure
display processing
server
predetermined period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012546668A
Other languages
English (en)
Other versions
JPWO2012073408A1 (ja
Inventor
輝哉 池上
輝哉 池上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012546668A priority Critical patent/JP5790662B2/ja
Publication of JPWO2012073408A1 publication Critical patent/JPWO2012073408A1/ja
Application granted granted Critical
Publication of JP5790662B2 publication Critical patent/JP5790662B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20709Modifications to facilitate cooling, ventilating, or heating for server racks or cabinets; for data centers, e.g. 19-inch computer racks
    • H05K7/20836Thermal management, e.g. server temperature control
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、表示処理システム、表示処理方法、およびプログラムに関し、特に、システムの管理情報を表示する表示処理システム、表示処理方法、およびプログラムに関する。
近年、コンピュータのクラウド化が進む中で、データセンタなどにおけるIT(Information Technology)機器やサービスの大規模化かつ複雑化が加速している。そのような背景の下で、システムの運用管理を如何に効率よく行い、かつ信頼性を確保していくかが、重要な課題となっている。
提供されるサービスを統合的に管理するシステムの一例が、非特許文献1に記載されている。非特許文献1に記載されたシステムは、データセンタの現在の熱だまりの異常情報が一覧表などで表示され、監視者が異常時に熱だまり発生箇所を示すフロアマップなどがさらに表示される。これにより、監視者が熱だまりの発生箇所をフロアマップで確認し、迅速に対策を講じることができるようになっている。
また、特許文献1には、空調装置の消費電力を含む運転データを取得蓄積し、分析したデータを可視化する構成が記載されている。また、特許文献2には、空調設備の遠隔リアルタイム資産管理システムにおいて、制御された空調設備の運転状態をリアルタイムでモニタ管理することにより、空調設備の遠隔モニタ機能を実現し、空調コストの節約が図られることが記載されている。
特開2008−157533号公報 特開2009−169946号公報
株式会社日立製作所、「オープンミドルウェアレポート vol.47」、p.31、[online]、平成21年2月、[平成22年9月6日検索]、インターネット、〈http://www.hitachi.co.jp/Prod/comp/soft1/omr/vol47/pdf/omr47.pdf〉
上述した文献に記載された技術では、熱だまりなどの発生監視を行い、警報発生時に対策を講じるために、熱だまり発生箇所のフロアマップなどを表示するとともに、冷却に要する消費電力量をモニタすることができる。しかし、上述した文献に記載された技術では、熱だまりが発生したサーバが提供しているサービスレベルを維持するために、熱だまりによる障害のサービスへの影響を関連付けて表示することはなされていなかった。
本発明は上記事情に鑑みてなされたものであり、その目的とするところは、サービスの信頼性を向上する表示処理システム、表示処理方法、およびプログラムを提供することにある。
本発明の表示処理システムは、
所定期間のサービスを提供するサーバの熱だまりの発生状況情報とともに、前記所定期間の前記熱だまりにより発生した障害の発生状況情報を、前記障害による前記サービスへの影響レベルに分けて表示する表示手段を備える。
本発明の表示処理方法は、
表示装置に接続された処理装置が、
所定期間のサービスを提供するサーバの熱だまりの発生状況情報とともに、前記所定期間の前記熱だまりにより発生した障害の発生状況情報を、前記障害による前記サービスへの影響レベルに分けて前記表示装置に表示する。
本発明のプログラムは、
表示装置に接続されたコンピュータに、
所定期間のサービスを提供するサーバの熱だまりの発生状況情報とともに、前記所定期間の前記熱だまりにより発生した障害の発生状況情報を、前記障害による前記サービスへの影響レベルに分けて前記表示装置に表示する手順を実行させるためのものである。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
また、本発明の各種の構成要素は、必ずしも個々に独立した存在である必要はなく、複数の構成要素が一個の部材として形成されていること、一つの構成要素が複数の部材で形成されていること、ある構成要素が他の構成要素の一部であること、ある構成要素の一部と他の構成要素の一部とが重複していること、等でもよい。
また、本発明の方法およびコンピュータプログラムには複数の手順を順番に記載してあるが、その記載の順番は複数の手順を実行する順番を限定するものではない。このため、本発明の方法およびコンピュータプログラムを実施するときには、その複数の手順の順番は内容的に支障しない範囲で変更することができる。
さらに、本発明の方法およびコンピュータプログラムの複数の手順は個々に相違するタイミングで実行されることに限定されない。このため、ある手順の実行中に他の手順が発生すること、ある手順の実行タイミングと他の手順の実行タイミングとの一部ないし全部が重複していること、等でもよい。
本発明によれば、サービスの信頼性を向上する表示処理システム、表示処理方法、およびプログラムが提供される。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
本発明の実施の形態に係る表示処理システムの構成を示すブロック図である。 本発明の実施の形態に係る表示処理システムの表示処理装置の構成を示す機能ブロック図である。 本発明の実施の形態に係る表示処理システムの表示画面の一例を示す図である。 図2の表示処理装置の熱だまり情報取得部の構成の一例を示す機能ブロック図である。 本発明の実施の形態に係る表示処理システムの動作の一例を示すフローチャートである。 図2の表示処理装置のサービステーブル記憶部に記憶されるテーブルの構造の例を示す図である。 本発明の実施の形態に係る表示処理システムの表示処理装置の構成を示す機能ブロック図である。 本発明の実施の形態に係る表示処理システムの表示画面の一例を示す図である。 本発明の実施の形態に係る表示処理システムの動作の一例を示すフローチャートである。 本発明の実施の形態に係る表示処理システムの表示処理装置の構成を示す機能ブロック図である。 本発明の実施の形態に係る表示処理システムの動作の一例を示すフローチャートである。 本発明の実施の形態に係る表示処理システムの表示画面の例を示す図である。 本発明の実施の形態に係る表示処理システムの表示画面の例を示す図である。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
(第1の実施の形態)
図1は、本発明の実施の形態に係る表示処理システム1の構成を示すブロック図である。
本発明の実施の形態に係る表示処理システム1は、たとえば、ネットワーク3を介して接続されるデータセンタ(DC)5の多数のIT機器、たとえば、多数のサーバ7やサービスの運用管理状況を示す情報をデータセンタ5のシステムを管理する管理者に提示する。
データセンタ5など、多数のIT機器がラックに収容され、室内に多数のラックが配備されているような施設において、IT機器から発生する熱により、熱だまりが発生することがある。熱だまりに対しては、空調を用いて冷却を行うなどの対策を施す。本発明の表示処理システム1は、その対策が適切に行われているかを一見して把握できる情報を提示する。
また、本実施形態において、SLA(Service Level Agreement)などに沿って、サービス利用者とサービス提供者との間で運用ルールが予め決められているものとすることができる。このSLAは、データセンタ5のサーバ7を利用してサービスを提供しているサービス提供者が、サービス利用者に提供するサービスの品質レベルをサービス利用者に保証する制度である。そして、SLAは、ランクによって、サービスの保証品質レベルが、様々な項目について定められている。たとえば、応答時間の最大値、最低通信速度、サービス利用不能時間の上限などがランク毎に決められているものとする。なお、本実施形態では、品質が高い順にS、A、B、Cの4つのランクが定められているものとして説明する。
さらに、本実施形態の表示処理システム1において、データセンタ5の管理者の中でも、管理職や経営者などが、画面を見たときに、熱だまりによる障害発生状況とともに、サービスの品質が維持できているかなどを一見して把握できることが望ましい。
表示処理システム1は、たとえば、CPU12やメモリ14、ハードディスクなどの記憶装置16、および通信装置(ネットワーク接続用インタフェース(図では「I/F」)18)を備えるコンピュータ10を有する。CPU12は、コンピュータ10の各要素とバス20を介して接続され、各要素とともにコンピュータ10全体を制御する。表示処理システム1のコンピュータ10は、キーボードやマウス等の入力装置40やディスプレイなどの表示装置30やプリンタ等の出力装置(不図示)と接続されるサーバコンピュータやパーソナルコンピュータ、またはそれらに相当する装置により実現することができる。そして、CPU12が、記憶装置16に記憶されるプログラムをメモリ14に読み出して実行することにより、以下に説明する各ユニットの各機能を実現することができる。
なお、各図において、本発明の本質に関わらない部分の構成については省略してあり、図示されていない。
図2は、本発明の実施の形態に係る表示処理システム1のコンピュータ10が実現する表示処理装置100の構成を示す機能ブロック図である。
図2に示すように、本実施形態の表示処理システム1は、所定期間のサービスを提供するサーバ7(図1)の熱だまりの発生状況情報とともに、所定期間の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示する表示部114を備える。
なお、表示処理装置100の各構成要素は、図1を用いて上述した、CPU12、メモリ14、メモリ14にロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶装置16、ネットワーク接続用インタフェース18を有するコンピュータ10のハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。以下説明する各図は、ハードウェア単位の構成ではなく、機能単位のブロックを示している。
本実施形態のコンピュータプログラムは、表示処理装置100を実現させるためのコンピュータ10(図1)に、所定期間のサービスを提供するサーバ7(図1)の熱だまりの発生状況情報とともに、所定期間の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示装置30(図1)に表示する手順を実行させるように記述されている。
本実施形態のコンピュータプログラムは、コンピュータで読み取り可能な記録媒体に記録されてもよい。記録媒体は特に限定されず、様々な形態のものが考えられる。また、プログラムは、記録媒体からコンピュータのメモリにロードされてもよいし、ネットワークを通じてコンピュータにダウンロードされ、メモリにロードされてもよい。
具体的には、表示処理装置100は、熱だまり情報取得部102と、障害情報取得部104と、サービステーブル記憶部(図中、「サービステーブル」と示す)106と、判定部108と、集計部110と、判別部112と、表示部114と、を備える。
熱だまり情報取得部102は、サービスを提供するサーバ7(図1)の熱だまりの発生状況情報をネットワーク3を介して取得する。
図4に示すように、熱だまり情報取得部102は、さらに、検出部120と、温度センサ配置テーブル記憶部(図中、「温度センサ配置テーブル」と示す)122と、特定部124と、を含んでもよい。
検出部120は、ネットワーク3を介してデータセンタ5(図1)の管理装置(不図示)からサービスを提供するサーバ7周辺に配置された温度センサ(不図示)で測定した温度情報を受信し、受信した温度情報に基づいて、熱だまりの発生を検出する。検出部120は、温度センサの温度情報が、予め設定されたしきい値以上のもの位置およびその期間に基づいて、熱だまりの発生を検出する。
温度センサ配置テーブル記憶部122は、サーバ7と温度センサの配置の対応テーブルを記憶する。温度センサ配置テーブル記憶部122は、メモリ14または記憶装置16に含まれる。特定部124は、温度センサ配置テーブル記憶部122を参照し、検出された熱だまりが発生したサーバ7を少なくとも1つ特定し、特定したサーバ7の熱だまりの発生状況情報を出力する。
なお、上記構成による熱だまりの発生状況情報の生成は、データセンタ5の管理装置で行なわれ、表示処理装置100に送信されてもよい。
図2に戻り、障害情報取得部104は、サービスまたはサーバ7(図1)で発生した障害の発生状況情報をデータセンタ5からネットワーク3を介して取得する。
サーバ7から収集した熱だまりの発生状況情報や障害の発生状況情報は、定期的または随時、メモリ14または記憶装置16に記憶してもよい。また、表示処理装置100の熱だまり情報取得部102および障害情報取得部104は、メモリ14または記憶装置16に記憶された値を用いてもよい。あるいは、表示処理装置100は、各サーバ7または管理装置から収集した対象となるコンピュータの各情報を一定期間分予め記録した記録媒体から読み取って取得することもできる。このように、各情報は、様々なタイミングかつ様々な方法で取得することができる。
サービステーブル記憶部106は、サーバ7が提供するサービスのSLAランクを対応付けたサーバテーブルを記憶する。サービステーブル記憶部106は、メモリ14または記憶装置16に含まれる。なお、サーバテーブルは、サーバ7とサービスの対応テーブルと、サービスとSLAランクの対応テーブルの2つのテーブルを含んでもよい。サービステーブル記憶部106に記憶される各種テーブルは、設定画面(不図示)からオペレータにより確認および変更できる。
本実施形態では、サービステーブル記憶部106は、図6(a)に示す障害レベルテーブル150と、図6(b)に示すサーバランクテーブル152とを記憶する。サーバランクテーブル152は、データセンタ5のサーバ7毎に予め定められたSLAランクが関連付けて記憶される。なお、サーバ7が提供するサービスは、リソースの割り当てとともに変更されることがある。変更された場合には、随時サーバランクテーブル152は書き換えられることとなる。
障害レベルテーブル150は、SLAランク毎に、監視項目毎の設定された基準値が記憶されている。監視項目は、例として、応答時間、最低通信速度、利用不能時間の上限などである。各ランクの各監視項目は、それぞれ2つの異なるしきい値、たとえば、第1しきい値as1と第2しきい値as2が基準値として設定されている。ここで、第1しきい値as1は、たとえば、SLA違反となる値とすることができる。そして、第2しきい値as2は、たとえば、SLA違反となる前に、警告を発する基準となる値とすることができる。この例では、各ランクの各監視項目に2つのしきい値がそれぞれ設けられているが、これに限定されるものではない。しきい値の数は1以上であればよいが、2つ以上であることが好ましい。
判別部112は、サービスの品質保証レベル(SLAランク)毎にそれぞれ設けられた障害のサービスへの影響レベル(SLA違反および警告)に応じた異なる判定基準(しきい値)に基づいて、集計された所定期間の障害の発生状況情報を判別して分類する。
このように、ランク毎に、複数の異なるしきい値を設けることで、ランクによって異なるレベルで要求されるサービス品質への影響を複数のレベルで監視することができる。本実施形態では、障害が発生したサーバ7が提供しているサービスのSLAランクを特定し、そのランクに応じた判定基準(しきい値)で障害による影響レベルを判別することができる。
また、ある監視項目についてランク毎に1つの基準値(第1しきい値)を設け、警告を発する基準値(第2しきい値)を算出するための値はランク共通で設定するようにしてもよい。あるいは、ある監視項目についてランク共通で1つの基準値(第1しきい値)を設け、警告を発する基準値(第2しきい値)を算出するための値をランク毎に設定するようにしてもよい。本実施形態では、第1しきい値は、SLAで予めランク毎に設定された値であるため、SLAで規定されている値を採用するのが望ましい。一方、第1しきい値以外のしきい値は、管理者が任意に設定することができる。本実施形態の表示処理装置100は、図示されない設定画面などの操作受付用のユーザインタフェースを設けることができる。これらの値は、オペレータが操作して設定画面により予め設定、または随時設定または変更できてもよい。
判定部108は、熱だまり情報取得部102が取得した熱だまりが発生したサーバ7と、障害情報取得部104が取得した障害が発生したサーバ7とが一致したとき、サーバ7およびサービスにおける障害が熱だまりにより発生したものと判定する。あるいは、他の実施形態において、データセンタ5におけるサーバ7の管理装置(不図示)によって熱だまりによる障害を検出する。そして、表示処理装置100は、サーバ7の熱だまりによる障害情報を管理装置から取得してもよい。
集計部110は、取得したサーバ7の熱だまりの発生状況情報、および熱だまりにより発生したものと判定された障害の発生状況情報を、所定期間で集計する。本実施形態では、集計部110は、所定期間内の熱だまりの発生件数を集計する。
本実施形態において、集計を行う所定期間は、たとえば、1日、1週間、1ヶ月、3ヶ月、6ヶ月、1年、複数年、または任意指定された期間等、オペレータが予め指定するか随時変更するなどして少なくとも1つの指定された期間とすることができる。この所定期間はオペレータが操作して設定画面(不図示)により予め選択、または随時選択できてもよい。
また、熱だまりの件数の定義もオペレータが予め指定することができる。指定方法は下記に例示するように様々考えられる。
(1)数日間、同じ場所で発生した熱だまりを1件とするか、日数分カウントするか
(2)熱だまりの規模が大きく、複数のサーバ7が関連する場合も熱だまりを1件とするか、関連するサーバ7の台数分とするか、あるいは、関連するサービス毎にカウントするか
上記項目は、個別にかつ任意に指定することができるものとする。
判別部112は、サービステーブル記憶部106を参照し、サーバランクテーブル152に基づいて、障害が発生したと判定されたサーバ7が提供するサービスのSLAランクを特定する。さらに、判別部112は、障害レベルテーブル150に基づいて、特定されたランクの基準値から障害のサービスへの影響レベルを判別し、たとえば、警告レベルかSLA違反レベルかを分類する。ここで、影響レベルは、上述した監視項目毎に設定された第1しきい値と第2しきい値に基づく判定結果で分けることができる。
たとえば、障害の発生状況情報で、応答時間が第2しきい値を超えたものがあった場合は、サービスへの影響レベルは警告レベルに分類される。応答時間が第1しきい値を超えたものがあった場合は、サービスへの影響レベルはSLA違反に分類される。
表示部114は、集計された所定期間の熱だまりの発生状況情報とともに、所定期間の熱だまりにより発生した障害の発生状況情報を、判別部112で分類されたサービスへの影響レベルに分けて表示装置30(図1)に表示する。
図3は、本実施形態の表示処理システム1の画面130の一例を示す図である。
図3に示すように、表示部114(図2)が表示装置30(図1)に表示する画面130は、熱だまり件数表示部132と、警告件数表示部134と、SLA違反件数表示部136と、を含む。さらに、画面130には、期間選択リスト142が設けることができる。期間選択リスト142を用いて、熱だまり件数表示部132、警告件数表示部134、およびSLA違反件数表示部136に表示する件数の集計期間を選択する操作を受け付けることができる。集計期間は、上述したように、所定期間から選択することができる。図3では、過去1ヶ月間の集計結果が表示されている。
なお、本実施形態では、最近の履歴のみ表示する構成としているが、これに限定されない。過去に遡って参照できるようにしてもよい。しかし、本発明では、この画面130を見て、発生した障害の原因などを究明することが目的ではなく、少なくとも現時点の状況が表示されるのが好ましい。なぜなら、本発明では、障害によってサービスの品質に影響がないことを確認できること、品質に影響がある場合に迅速に認識できること、あるいは、品質への影響がどの程度なのか、その深刻度を認識できることが優先であるからである。
熱だまり件数表示部132には、集計部110により期間選択リスト142で選択された所定期間分集計された熱だまり件数が表示される。警告件数表示部134には、集計部110により期間選択リスト142で選択された所定期間分集計された警告件数が表示される。SLA違反件数表示部136には、集計部110により期間選択リスト142で選択された所定期間分集計されたSLA違反件数が表示される。
また、画面130では、SLA違反件数が所定件数以上、ここでは1件以上の場合、件数表示部分が強調表示138されるとともに、管理者にSLA違反が発生していることを通知するためのアイコン140がSLA違反件数表示部136の近傍に表示される。強調表示138は、たとえば、色を赤にしたり、文字を太くしたり、点滅させたり、背景色を変更してハイライト表示したり等、様々な手法が考えられる。アイコン140は、たとえば、本実施形態では、赤丸の中に×のマークが描いてあるものとするが、これに限定されない。たとえば、アイコン140は、色は黄色などでもよいし、形は他の形状でもよいし、中の画像は「NG」などの他の文字や記号でもよいし、他の画像であってもよい。オペレータがSLA違反の発生を視覚的に直感的に一見して認識できる画像が好ましい。
強調表示138やアイコン140の表示により、画面130を見た管理者は、視覚的に直感的にSLA違反の発生などの警告を認識しやすくすることができる。図3には示していないが、熱だまり件数表示部132や警告件数表示部134も同様に、所定件数以上で、件数表示部分を強調表示したり、その近傍にアイコンを表示したりすることで、視覚的に直感的に警告を認識しやすくすることができる。強調表示やアイコンを表示する所定件数は、オペレータが操作して設定画面(不図示)により予め設定、または随時設定変更できてもよい。
このように構成された本実施形態の表示処理システム1の動作について、以下に説明する。
図5は、本実施形態の表示処理システム1の動作の一例を示すフローチャートである。以下、図1乃至図6を用いて説明する。
本実施形態の表示処理方法は、所定期間のサービスを提供するサーバ7(図1)の熱だまりの発生状況情報とともに、所定期間の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示装置30(図1)に表示する(図5のステップS113)。
具体的には、まず、本実施形態の表示処理システム1(図2)において、表示処理装置100の熱だまり情報取得部102(図2)が、サービスを提供するサーバ7の熱だまりの発生状況情報をネットワーク3(図2)を介して取得する(ステップS101)。そして、表示処理装置100の障害情報取得部104(図2)が、サービスまたはサーバ7で発生した障害の発生状況情報をデータセンタ5(図1)からネットワーク3を介して取得する(ステップS103)。
そして、表示処理装置100の判定部108(図2)が、熱だまり情報取得部102が取得した熱だまりが発生したサーバ7と、障害情報取得部104が取得した障害が発生したサーバ7とが一致するか否かを判定する(ステップS105)。一致したとき(ステップS105のYES)、サーバ7およびサービスにおける障害が熱だまりにより発生したものと判定し(ステップS107)、ステップS109に進む。一致しないとき(ステップS105のNO)、障害は熱だまりによって発生したものではないので、ステップS107はバイパスして、ステップS109に進む。
そして、表示処理装置100の集計部110(図2)が、取得したサーバ7の熱だまりの発生状況情報、および熱だまりにより発生したものと判定された障害の発生状況情報を、所定期間で集計する(ステップS109)。
なお、ステップS101〜ステップS107の処理は、常時、所定の周期で繰り返し実行することができ、所定期間毎にステップS109を実行することができるが、本図では繰り返し処理の説明は省略する。
そして、表示処理装置100の判別部112(図2)が、表示処理装置100のサービステーブル記憶部106(図2)を参照し、サーバランクテーブル152(図6(b))に基づいて、障害が発生したと判定されたサーバ7が提供するサービスのSLAランクを特定する。そして、表示処理装置100の判別部112が、障害レベルテーブル150(図6(a))に基づいて、特定されたランクの基準値から障害のサービスへの影響レベルを判別し、たとえば、警告レベルかSLA違反レベルかを分類する(ステップS111)。
そして、表示処理装置100の表示部114(図2)が、集計された所定期間の熱だまりの発生状況情報とともに、所定期間の熱だまりにより発生した障害の発生状況情報を、表示処理装置100の判別部112で分類されたサービスへの影響レベルに分けて表示する(ステップS113)。
上述したように、図3の画面130にこの1ヶ月に発生した熱だまり件数と、熱だまりによって発生した警告件数と、SLA違反件数が表示される。ここでは、アイコン140と強調表示138によって、熱だまりによる障害によりSLA違反が発生してしまったことが、一見して把握できる。
なお、上述したように、ステップS109の集計処理は、必ずしも所定期間毎に実行される必要はない。このステップS109の集計処理は、所定期間毎の集計値が算出できるタイミングで行うことができる。また、ステップS113の表示更新処理は、オペレータが操作ボタン(不図示)などにより画面130の表示を指示したときにのみ行ってもよい。また、表示部114により画面130が表示されている状態において、熱だまり件数表示部132、警告件数表示部134、およびSLA違反件数表示部136に表示すべき情報に変化が生じた場合、特に、警告やSLA違反の発生時には、即時、表示を更新するのが好ましい。ただし、表示の更新を自動的にするか操作ボタン(不図示)などにより手動で行うか、また自動更新周期などは、オペレータが操作して設定画面(不図示)により予め設定、または随時設定変更できてもよい。
以上説明したように、本実施形態の表示処理システム1によれば、所定期間の熱だまりによる障害発生状況と、サービスへの影響レベルとを関連付けて可視化できる。
熱だまりを検出して対策を講じることは、当然必要なことであり、そのためには、詳細な障害情報を確認する必要がある。しかし、本発明の表示処理システム1では、詳細な情報の提示ではなく、熱だまりが発生したことによって、提供しているサービスにどの程度の影響を及ぼしているのかを、概略知ることが目的である。
本発明によれば、所定期間の熱だまりの発生状況と、そこから障害に至った件数とともに、サービスの品質に与えた影響レベルを提示することで、サービスの品質維持に関する情報を分かり易く提示することができる。さらに、本発明によれば、提供サービスの品質維持状況を容易に把握できるので、問題が発生した場合に迅速に気付くことができ、対策を講じることができる。結果としてサービスの信頼性が向上する。
(第2の実施の形態)
図7は、本発明の実施の形態に係る表示処理システム1のコンピュータが実現する表示処理装置200の構成を示す機能ブロック図である。本実施形態の表示処理システム1は、上記実施の形態とは、熱だまりによるサービスへの影響とともに、エネルギ効率をあわせて表示する点で相違する。
データセンタ5(図1)など、多数のIT機器がラックに収容され、室内に多数のラックが配備されているような施設において、IT機器から発生する熱により、熱だまりが発生することがある。熱だまりに対しては、空調を用いて冷却を行うなどの対策を施す。本実施形態の表示処理システム1は、その対策が適切に行われているかを一見して把握できる情報を提示する。
また、IT機器が設置されているフロアは、通常無人であることが多く、空調により無駄に冷やし過ぎてしまっても気付かないことがある。過冷却は、環境の観点からも望ましいことではない。本実施形態の表示処理システム1は、消費電力を無駄にしていないかどうかも、一見して把握できる情報を提示する。
さらに、熱だまりによる障害の発生状況が、提供しているサービスの品質を損なうことのないように、本実施形態の表示処理システム1は、サービスの安定性も上記情報とともに一見して把握できる情報を提示する。
特に、本実施形態の表示処理システム1において、データセンタ5の管理者の中でも、管理職や経営者などが画面を見たときに、上記情報を一見して把握できることが望ましい。
本実施形態の表示処理装置200は、所定期間のサービスを提供するサーバ7(図1)の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示するとともに、障害の発生状況情報に関連付けて所定期間のサーバ7のエネルギ効率情報を表示する表示部208を備える。
なお、表示処理装置200の各構成要素は、図1を用いて上述した、CPU12、メモリ14、メモリ14にロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶装置16、ネットワーク接続用インタフェース18を有するコンピュータ10のハードウェアとソフトウェアの任意の組合せによって実現される。そして、その実現方法、装置にはいろいろな変形例があることは、当業者には理解されるところである。以下説明する各図は、ハードウェア単位の構成ではなく、機能単位のブロックを示している。
本実施形態のコンピュータプログラムは、表示処理装置200を実現させるためのコンピュータ10(図1)に、所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示装置30(図1)に表示するとともに、障害の発生状況情報に関連付けて所定期間のサーバ7のエネルギ効率情報を表示装置30(図1)に表示する手順を実行させるように記述されている。
本実施形態のコンピュータプログラムは、コンピュータで読み取り可能な記録媒体に記録されてもよい。記録媒体は特に限定されず、様々な形態のものが考えられる。また、プログラムは、記録媒体からコンピュータのメモリにロードされてもよいし、ネットワークを通じてコンピュータにダウンロードされ、メモリにロードされてもよい。
詳細には、本実施形態の表示処理装置200は、温度取得部202と、算出部204と、集計部206と、表示部208と、を備える。なお、本実施形態では、図2の表示処理装置100で説明した所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報を他の装置などからネットワーク3を介して取得するものとする。所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報を求める図2の表示処理装置100の構成と本実施形態の表示処理装置200の構成を組み合わせた構成の具体例については、後述する実施形態で詳細に説明する。
温度取得部202は、サーバ7の周辺に配置された温度センサ(不図示)で測定した温度情報をネットワーク3を介して取得する。
算出部204は、温度取得部202が取得した温度情報に基づき、所定期間のサーバ7のエネルギ効率情報を求める。
具体的には、算出部204は、温度取得部202が取得した温度が所定期間で既定温度以下となった過冷却ののべ時間を求める。既定温度は、システム運用上、過冷却と認定できる温度であり、オペレータが操作して設定画面(不図示)により予め設定、または随時設定変更できてもよい。
算出部204は、さらに、サーバ7の消費電力量(kwh)をネットワーク3を介して取得する消費電力量取得部(不図示)を有することができる。そして、算出部204は、消費電力量取得部が取得したサーバ7の消費電力量(kwh)の所定期間の総和を算出してもよい。また、消費電力量取得部が取得する消費電力量の代わりに1ヶ月の電気代を、ネットワーク3を介して取得し、所定期間の電気代(円)を集計してもよい。
算出部204は、さらに、上記算出した所定期間の消費電力量の総和の増減傾向を求める。具体的には、たとえば、過去の一定期間の消費電力量の総和の平均値と、所定期間の消費電力量の総和との差分(kwh)、あるいは、変化率(%)などの平均比を求める。算出される平均比は、過去の消費電力量に基づいて予め設定された標準値との差分または変化量でもよい。
集計部206は、所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報を、ネットワーク3を介して取得して集計する。
表示部208は、集計部206により集計された所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示するとともに、算出された所定期間のサーバ7のエネルギ効率情報を障害の発生状況情報に関連付けて表示装置30(図1)に表示する。
図8は、本実施形態の表示処理システム1の画面230の一例を示す図である。
図8に示すように、表示部208(図7)が表示装置30(図1)に表示する画面230は、上記実施形態の図3の画面130と同様な熱だまりの発生状況情報を表示する熱だまり障害情報表示欄130aに加え、さらに、過冷却情報表示欄230aを有する。
画面230には、図3と同様に期間選択リスト142が設けることができる。期間選択リスト142を用いて、各表示部に表示する件数の集計期間を選択する操作を受け付けることができる。集計期間は、上述したように、所定期間から選択することができる。図8では、過去1ヶ月間の集計結果が表示されている。
なお、本実施形態では、最近の履歴のみ表示する構成としているが、これに限定されない。過去に遡って参照できるようにしてもよい。しかし、本発明では、この画面230を見て、発生した障害の原因などを究明することが優先的な目的ではなく、少なくとも現時点の状況が表示されるのが好ましい。なぜなら、本発明では、障害によってサービスの品質に影響がないことや過冷却が発生していないことを確認できること、品質に影響がある場合や過冷却を迅速に認識できること、あるいは、品質への影響がどの程度なのか、その深刻度や無駄なエネルギ消費がどの程度なのかを認識できることが優先であるからである。
過冷却時間表示部232には、算出部204(図7)により期間選択リスト142で選択された所定期間分集計された温度取得部202(図7)が取得した温度が既定温度以下となった過冷却ののべ時間が表示される。
消費電力量表示部234には、算出部204により期間選択リスト142で選択された所定期間分集計されたサーバ7(図1)の消費電力量(kwh)の総和が表示される。
平均比表示部236には、算出部204により期間選択リスト142で選択された所定期間分集計された消費電力量の総和の平均比が表示される。
たとえば、画面230では、平均比が所定値以上の増加傾向にある場合、ここでは20%以上の場合、平均比表示部分を強調表示238するとともに、管理者に、平均比が増加傾向にあることを通知するためのアイコン240が平均比表示部236の近傍に表示される。強調表示238は、たとえば、色を赤にしたり、文字を太くしたり、点滅させたり、背景色を変更してハイライト表示したり、様々な手法が考えられる。アイコン240は、たとえば、本実施形態では、赤色の上向きの矢印であるものとするが、これに限定されない。アイコン240は、たとえば、「×」や「NG」などの好ましくない傾向であることを示す他の記号や文字、あるいは、他の画像であってもよい。オペレータが平均比の増加傾向を視覚的に直感的に認識できるものが好ましい。
また、平均比が減少傾向にある場合に、緑色の下向きの矢印や、「○」や「OK」など問題のない良好な傾向であることを示す他の記号や文字、あるいは、他の画像のアイコン240を表示してもよい。オペレータが平均比の減少傾向を視覚的に直感的に認識できるものが好ましい。あるいは、平均比に変化がない場合、すなわち、標準値並みの場合、緑色の水平方向の矢印や、「○」や「OK」など問題のない良好な傾向であることを示す他の記号や文字、あるいは、他の画像のアイコン240を表示してもよい。オペレータが、平均比が標準値並みであることを視覚的に直感的に認識できるものが好ましい。
強調表示238やアイコン240の表示により、画面230を見た管理者は、視覚的に直感的に過冷却による消費電力量の増加傾向などの状態を認識しやすくすることができる。
また、本実施形態の表示処理システム1において、表示処理装置200は、算出部204が算出した差分または変化率が標準値に対して、許容範囲内か否かを判定する判定部(不図示)と、判定部の判定結果を利用者に通知する判定通知部(図8の画面230)と、をさらに備えてもよい。
たとえば、図8には示していないが、平均比表示部236と同様に、過冷却時間表示部232が所定時間以上など標準値に対して許容範囲外の場合、または、消費電力量表示部234が所定消費電力量以上など標準値に対して許容範囲外の場合、数値表示部分を強調表示したり、その近傍にアイコンを表示したりしてもよい。そのようにすることで、視覚的に直感的に状態を認識しやすくすることができる。強調表示やアイコンを表示する許容範囲は、オペレータが操作して設定画面(不図示)により予め設定、または随時設定変更できてもよい。
このように構成された本実施形態の表示処理システム1の動作について、以下に説明する。
図9は、本実施形態の表示処理システム1の動作の一例を示すフローチャートである。以下、図1、図7乃至図9を用いて説明する。
本実施形態の表示処理方法は、表示処理装置200(図7)が、所定期間のサービスを提供するサーバ7(図1)の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示装置30(図1)に表示するとともに、障害の発生状況情報に関連付けて所定期間のサーバ7のエネルギ効率情報を表示装置30(図1)に表示する(ステップS207)。
具体的には、まず、本実施形態の表示処理システム1において、表示処理装置200の温度取得部202(図7)が、サーバ7(図1)の周辺に配置された温度センサ(不図示)で測定した温度情報をネットワーク3(図1)を介して取得する(ステップS201)。
そして、表示処理装置200の算出部204(図7)が、温度取得部202が取得した温度情報に基づき、所定期間のサーバ7のエネルギ効率情報を求める(ステップS203)。
そして、表示処理装置200の集計部206(図7)が、所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報をネットワーク3を介して取得して集計する(ステップS205)。
そして、表示処理装置200の表示部208(図7)が、集計部206により集計された所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示するとともに、算出された所定期間のサーバ7のエネルギ効率情報を障害の発生状況情報に関連付けて表示する(ステップS207)。
図8の画面230に、この1ヶ月に発生した熱だまり件数と、熱だまりによって発生した警告件数と、SLA違反件数とともに、この1ヶ月に過冷却による規定温度(たとえば、17℃)以下となったのべ時間と、消費電力量と、標準値と比較した場合の消費電力の増減値が表示される。ここでは、アイコン140と強調表示138によって、熱だまりによる障害によりSLA違反が発生してしまったことと、アイコン240と強調表示238によって、過冷却により、標準値より消費電力が30%増加してしまったことが、一見して把握できる。
なお、本フローチャートにおいて、ステップS201およびステップS203の処理は、常時、所定の周期で繰り返し実行することができる。ステップS205は、必ずしも所定期間毎に実行される必要はなく、所定期間毎の集計値が算出できるタイミングで行うことができる。
また、ステップS207の表示更新処理は、オペレータが操作ボタン(不図示)などにより画面230の表示を指示したときにのみ行ってもよい。また、表示部208(図7)により図8の画面230が表示されている状態において、熱だまり件数表示部132、警告件数表示部134、およびSLA違反件数表示部136に表示すべき情報に変化が生じた場合、特に、警告やSLA違反の発生時には、即時、表示を更新するのが好ましい。ただし、表示の更新を自動的にするか操作ボタン(不図示)などにより手動で行うか、また自動更新周期などは、オペレータが操作して設定画面(不図示)により予め設定、または随時設定変更できてもよい。
以上説明したように、本実施形態の表示処理システム1によれば、上記実施形態と同様な効果を奏するとともに、熱だまりによるサービスへの影響とエネルギ効率との関連を可視化できる。結果として、サービスの信頼性が向上する。
(第3の実施の形態)
図10は、本発明の実施の形態に係る表示処理システム1のコンピュータが実現する表示処理装置300の構成を示す機能ブロック図である。本実施形態の表示処理システム1の表示処理装置300は、図2、図4および図7の上記実施の形態の表示処理システム1の表示処理装置を組み合わせた機能を有し、サーバの熱だまりの発生状況情報と、熱だまりによる障害の発生状況情報と、エネルギ効率とを求め、これらの情報と熱だまりによるサービスへの影響とを関連付けて提示する。
具体的には、本実施形態の表示処理システム1の表示処理装置300は、図2の上記実施形態の表示処理装置100と同様な障害情報取得部104と、サービステーブル記憶部106と、判定部108と、集計部110と、判別部112と、図4と同様な温度センサ配置テーブル記憶部122と、図7の上記実施形態の表示処理装置200と同様な温度取得部202と、算出部204と、を有するとともに、さらに、検出部302と、特定部304と、表示部308と、を備える。
検出部302は、温度取得部202が取得した温度情報に基づいて、熱だまりの発生を検出する。検出部302は、温度センサの温度情報が、予め設定されたしきい値以上のものの位置およびその期間に基づいて、熱だまりの発生を検出する。
特定部304は、温度センサ配置テーブル記憶部122を参照し、検出された熱だまりが発生したサーバ7(図1)を少なくとも1つ特定し、特定したサーバ7の熱だまりの発生状況情報を出力する。
表示部308は、集計部110により集計された所定期間のサービスを提供するサーバ7の熱だまりにより発生した障害の発生状況情報を、障害によるサービスへの影響レベルに分けて表示するとともに、算出部204により算出された所定期間のサーバのエネルギ効率情報を障害の発生状況情報に関連付けて表示する。表示部308は、上述した図8の画面230を表示装置30(図1)に表示する。
このように構成された本実施形態の表示処理システム1の動作について、以下に説明する。
図11は、本実施形態の表示処理システム1の動作の一例を示すフローチャートである。以下、図1、図6乃至図11を用いて説明する。
なお、これに限定されないが、本実施形態の表示処理装置300は、上記実施形態の表示処理装置200の図9のフローチャートと同様なステップS201〜ステップS207の処理を実行した後、図11のフローチャートの処理を実行するものとする。ここでは、図9のフローチャートの処理の説明は省略する。
表示処理装置300の温度取得部202(図10)がネットワーク3(図10)を介してデータセンタ5(図1)の管理装置(不図示)から取得した温度情報に基づいて、表示処理装置300の検出部302が、熱だまりの発生を検出する(ステップS301)。
そして、表示処理装置300の特定部304(図10)が、温度センサ配置テーブル記憶部122を参照し、検出された熱だまりが発生したサーバ7(図1)を少なくとも1つ特定し、特定したサーバ7の熱だまりの発生状況情報を出力する(ステップS303)。
そして、表示処理装置300の障害情報取得部104(図10)が、サービスまたはサーバ7(図1)で発生した障害の発生状況情報をデータセンタ5(図1)からネットワーク3を介して取得する(ステップS304)。
そして、表示処理装置300の判定部108(図10)が、特定部304が特定した熱だまりが発生したサーバ7と、障害情報取得部104が取得した障害が発生したサーバ7とが一致するか否かを判定する(ステップS305)。一致したとき(ステップS305のYES)、サーバ7およびサービスにおける障害が熱だまりにより発生したものと判定し(ステップS307)、ステップS309に進む。一致しないとき(ステップS305のNO)、障害は熱だまりによって発生したものではないので、ステップS307はバイパスして、ステップS309に進む。
そして、表示処理装置300の集計部110(図10)が、取得したサーバ7の熱だまりの発生状況情報、および熱だまりにより発生したものと判定された障害の発生状況情報を、所定期間で集計する(ステップS309)。
なお、ステップS301〜ステップS307の処理は、常時、所定の周期で繰り返し実行することができ、所定期間毎にステップS309を実行することができるが、本図では繰り返し処理の説明は省略する。
そして、表示処理装置300の判別部112(図10)が、表示処理装置300のサービステーブル記憶部106(図10)を参照し、サーバランクテーブル152(図6(b))に基づいて、障害が発生したと判定されたサーバ7が提供するサービスのSLAランクを特定する。さらに、表示処理装置300の判別部112は、障害レベルテーブル150(図6(a))に基づいて、特定されたランクの基準値から障害のサービスへの影響レベルを判別し、たとえば、警告レベルかSLA違反レベルかを分類する(ステップS311)。
そして、表示処理装置300の表示部308(図10)が、集計された所定期間の熱だまりの発生状況情報とともに、所定期間の熱だまりにより発生した障害の発生状況情報を、表示処理装置300の判別部112で分類されたサービスへの影響レベルに分けて表示するとともに、障害の発生状況情報に関連付けて所定期間のサーバのエネルギ効率情報を表示する(ステップS313)。
以上説明したように、本実施形態の表示処理システム1によれば、上記実施形態と同様な効果を奏するとともに、熱だまりの発生状況と熱だまりによる障害の発生状況を把握し、これらの情報とともに、熱だまりによるサービスへの影響とエネルギ効率との関連を可視化できる。
(第4の実施の形態)
図12は、本実施形態の表示処理システム1の画面330の一例を示す図である。
本実施形態の表示処理システム1は、上記実施形態とは、所定期間の熱だまりによるサービスの運用への影響度を算出し、エネルギ効率と関連付けて提示する点で相違する。
本実施形態の表示処理システム1において、表示処理装置は、表示処理装置300(図10)の構成に加え、さらに、影響度算出部(不図示)を備える。
影響度算出部は、所定期間における、サーバ7(図1)の熱だまりの発生状況情報、熱だまりによる障害の発生状況情報、または熱だまりによるサービスへの影響レベルに基づいて、所定期間の熱だまりによるサービスの運用への影響度を算出する。
そして、表示部308(図10)は、所定期間のサーバのエネルギ効率情報とサービスの運用への影響度を関連付けて表示する。
具体的には、規定のルールに従い、熱だまりの発生件数と、警告発生件数と、SLA違反件数にそれぞれ重み付け係数を掛けて影響度を算出することができる。以下の影響度の計算式(1)は一例であり、これに限定されるものではない。また、計算式や各係数は、オペレータが操作して設定画面(不図示)により予め設定、または随時設定変更できてもよい。
Figure 0005790662

ここで、a、b、cは重み付け係数である。本実施形態では、たとえば、a=0、b=3、c=5とする。
たとえば、図8に示すように、熱だまり発生件数が19件、警告件数が3件、SLA違反件数が1件の場合、以下の式(2)により、影響度は14と算出される。

19×0+3×3+1×5=14 ・・・式(2)

このようにして算出された影響度は、後述するエネルギ効率情報とサービスへの影響度を関連付けて画面表示する際、使用される。
このように構成された本実施形態の表示処理装置の動作は、上記実施形態の表示処理装置300の動作を示す図11のフローチャートと同様なステップS301〜S311を有するとともに、さらに、ステップS311に続きステップS313の代わりに、以下のステップS413とステップS415(不図示)を有する。
すなわち、表示処理装置の影響度算出部が、所定期間における、サーバ7(図1)の熱だまりの発生状況情報、熱だまりによる障害の発生状況情報、または熱だまりによるサービスへの影響レベルに基づいて、所定期間の熱だまりによるサービスの運用への影響度を算出する(ステップS413)。
そして、表示処理装置300の表示部308(図10)が、所定期間のサーバのエネルギ効率情報とサービスの運用への影響度を関連付けて表示する(ステップS415)。また、表示部308は、集計された所定期間の熱だまりの発生状況情報とともに、所定期間の熱だまりにより発生した障害の発生状況情報を、表示処理装置300の判別部112(図10)で分類されたサービスへの影響レベルに分けてさらに表示してもよい。
図12(a)に示すように、表示部308が表示装置30に表示する画面330は、算出された所定期間のサーバのエネルギ効率情報(消費電力)および算出された所定期間のサービスの運用への影響度(サービスレベル)を二次元マトリクスの軸にそれぞれ割り当てプロット331される。
なお、図12(a)は、2月のグラフ、図12(b)および図12(c)は4月のグラフを示している。本実施形態の表示処理装置300では、図示されない選択リストなどの操作受付用のユーザインタフェースを設け、表示するグラフの日付、週、月、年、期間などをオペレータが選択できるものとする。また、オペレータが指定した複数のグラフを並べて表示することもできるのが好ましい。
画面330には、エネルギ効率情報(消費電力)の所定の基準値P0および影響度(サービスレベル)の所定の基準値L0をそれぞれ二次元マトリクスの軸に垂直に二次元マトリクス上に延ばした第1補助線343および第2補助線342が示され、二次元マトリクスのプロット領域が4分割される。各基準値は、オペレータが操作して設定画面(不図示)により予め設定、または随時設定変更できてもよい。たとえば、基準値が実体からかけ離れた値が設定されているような場合、適宜見直すこともできる。
そして、画面330は、第1領域351(図12(c)の一点破線)と、第2領域352(図12(c)の二点破線)と、第3領域353(図12(c)の点線)と、第4領域354(図12(c)の実線)と、を有することとなる。
第1領域351は、算出されたエネルギ効率情報(消費電力)が基準値P0未満、かつ算出された影響度(サービスレベル)が基準値L0未満の場合のプロット領域となる。
第2領域352は、算出されたエネルギ効率情報(消費電力)が基準値P0未満、かつ算出された影響度(サービスレベル)が基準値L0以上の場合のプロット領域となる。
第3領域353は、算出されたエネルギ効率情報(消費電力)が基準値P0以上、かつ算出された影響度(サービスレベル)が基準値L0未満の場合のプロット領域となる。
第4領域354は、算出されたエネルギ効率情報(消費電力)が基準値P0以上、かつ算出された影響度(サービスレベル)が基準値L0以上の場合のプロット領域となる。
本実施形態の表示処理装置300は、エネルギ効率情報の所定のしきい値および影響度がそれぞれ予め決められた基準値を満たすか否かを判定する基準判定部(不図示)をさらに備えてもよい。本実施形態では、エネルギ効率情報および影響度はともに基準値より少ない値である方が問題のない正常な状態であることを示している。画面330の二次元マトリクスは、各軸とも矢印方向に向かって数値が小さくなり、正常な状態を示す。
画面330では、基準判定部の判定結果に基づいて、各領域の背景色を色変えして表示する。たとえば、図12(c)に示すように、エネルギ効率情報(消費電力)および影響度(サービスレベル)が基準値をそれぞれ超えている場合、第2領域352および第3領域353の背景色をそれぞれピンクにする。また、エネルギ効率情報(消費電力)および影響度(サービスレベル)が基準値をそれぞれ超えていない場合、第2領域352および第3領域353の背景色をそれぞれ黄緑にする。
また、エネルギ効率情報(消費電力)および影響度(サービスレベル)が共に基準値を超えている場合、第4領域354の背景色をピンク色とすることができる。また、エネルギ効率情報(消費電力)および影響度(サービスレベル)のいずれか一方が基準値を超えている場合、第4領域354の背景色は黄色とすることができる。また、エネルギ効率情報(消費電力)および影響度(サービスレベル)がともに基準値未満の場合、第4領域354の背景色は黄緑とすることができる。
たとえば、図12(a)では、プロット331が示すように、エネルギ効率情報(消費電力)および影響度(サービスレベル)がともに基準値を超えている。したがって、第2領域352、第3領域353、および第4領域354の背景色はともに、ピンク色に表示されることとなる。なお、図12(a)に示すように、エネルギ効率情報(消費電力)の基準値P0および影響度(サービスレベル)の基準値L0からそれぞれ引かれた第1補助線343および第2補助線342に対して、プロット331からそれぞれ垂直に引いた第1補助破線332および第2補助破線333を示すことができる。
そして、さらに、画面330では、基準判定部の判定結果に基づいて、第2領域352、第3領域353、および第4領域354に、算出されたエネルギ効率情報(消費電力)および算出された影響度(サービスレベル)の判定結果を示す画像(図12(a)では、第1評価アイコン362、第2評価アイコン363、および第3評価アイコン364)がそれぞれ表示される。
たとえば、これらの画像(第1評価アイコン、第2評価アイコン、および第3評価アイコン)は、エネルギ効率と影響度ともに基準を満たしていない場合は、NGマーク(赤丸)のアイコンを表示してもよい。あるいは、いずれか一方が基準を満たしている場合は、注意マーク(三角黄色!)のアイコンを表示したり、OKマーク(緑丸)のアイコンを表示してもよい。このようにすることで、直感的に分かりやすく利用者に状況を通知できる。
図12(b)のプロット371に示すように、影響度(サービスレベル)が基準値L0を満たしている場合、第2領域352の背景色は黄緑色になり、さらに、第2領域352には、影響度(サービスレベル)が基準値L0を満たしていることを示すOKマークの第1評価アイコン382が表示される。図12(b)の例では、エネルギ効率情報(消費電力)の基準値P0から引かれた第1補助線343に対して、プロット371から垂直に引いた第1補助破線372を示すことができる。
また、エネルギ効率(消費電力)は基準値P0を満たしていないので、第3領域353の背景色はピンク色となり、さらに、第3領域353には、エネルギ効率(消費電力)が基準値P0を満たしていないことを示すNGマークの第2評価アイコン383が表示される。さらに、第4領域354の背景色は黄色になり、第4領域354には、黄色い三角形の注意マークの第3評価アイコン384が表示される。
以上説明したように、本実施形態の表示処理システム1によれば、上記実施形態と同様な効果を奏するとともに、画面を一見してエネルギ効率とサービスレベルの関連を認識できる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
たとえば、上記実施形態の表示処理装置300(図10)において、算出部204(図10)で算出された所定期間のサーバ7(図1)のエネルギ効率情報および影響度算出部で算出された所定期間のサービスの運用への影響度を履歴として記録する記録部(不図示)をさらに備えることができる。そして、表示部308(図10)は、記録された所定期間ごとの履歴を、所定期間のサーバ7のエネルギ効率情報および所定期間のサービスの運用への影響度の推移を時系列で表示することができる。
図13は、本実施形態の表示処理システム1における推移グラフ画面の一例を示す図である。
図13に示すように、画面430には、影響度凡例432で示す熱だまりのサービスへの影響度の棒グラフ442と、消費電力凡例434で示す過冷却による消費電力の線グラフ444が、時間軸440に沿って、月毎に時系列に表示される。
画面430に、選択リストなどを設けて、時間軸440を月単位以外に、週単位、年単位などをオペレータが選択して画面表示切り替え可能としてもよい。
本実施形態では、エネルギ効率として、過冷却による消費電力量をグラフ化しているが、上記算出部204(図7または図10)で算出される他のエネルギ効率情報を表示してもよい。また、選択リストなどを設けて、オペレータが選択して画面表示を切り替え可能としてもよい。
影響度とエネルギ効率のグラフの種類(棒グラフ、線グラフなど)は、オペレータにより適宜選択可能とすることができる。また、グラフ以外に、一覧表などでもよい。
さらに、本実施形態の表示処理装置300では、熱だまりに対して対策を講じた時期を受け付ける受付部(不図示)と、時期をグラフ(図13(b)の画面450の棒グラフ452、線グラフ454)または一覧表に示す提示部(図13(b)のアイコン460)とを備えてもよい。
この構成によれば、対策を講じたことによる効果も視覚的に確認でき、もし効果がない場合には、さらなる対策をとるなどのアクションをとることが可能になる。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2010年11月29日に出願された日本出願特願2010−265476号を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims (6)

  1. 所定期間のサービスを提供するサーバの熱だまりの発生状況情報とともに、前記所定期間の前記熱だまりにより発生した障害の発生状況情報を、前記障害による前記サービスへの影響レベルに分けて表示する表示手段を備える表示処理システム。
  2. 請求項1に記載の表示処理システムにおいて、
    前記サービスを提供する前記サーバの前記熱だまりの前記発生状況情報を取得する熱だまり情報取得手段と、
    前記サービスまたは前記サーバで発生した障害の発生状況情報を取得する障害情報取得手段と、
    前記熱だまり情報取得手段が取得した前記熱だまりが発生した前記サーバと、前記障害情報取得手段が取得した前記障害が発生した前記サーバとが一致したとき、前記サーバおよび前記サービスにおける前記障害が前記熱だまりにより発生したものと判定する判定手段と、
    取得した前記サーバの前記熱だまりの前記発生状況情報、および前記熱だまりにより発生したものと判定された前記障害の発生状況情報を、前記所定期間で集計する集計手段と、
    集計された前記所定期間の前記障害の発生状況情報を、前記障害が発生したと判定された前記サーバが提供する前記サービスへの影響レベルに応じて判別して分類する判別手段と、を備え、
    前記表示手段は、集計された前記所定期間の前記熱だまりの発生状況情報とともに、前記所定期間の前記熱だまりにより発生した前記障害の発生状況情報を、前記判別手段で分類された前記サービスへの影響レベルに分けて表示する表示処理システム。
  3. 請求項に記載の表示処理システムにおいて、
    前記熱だまり情報取得手段は、
    前記サービスを提供する前記サーバ周辺に配置された温度センサで測定した温度情報に基づいて、前記熱だまりの発生を検出する検出部と、
    検出された前記熱だまりが発生した前記サーバを特定し、特定した前記サーバの前記熱だまりの発生状況情報を出力する特定部と、を有する表示処理システム。
  4. 請求項2または3に記載の表示処理システムにおいて、
    前記判別手段は、前記サービスの品質保証レベル毎にそれぞれ設けられた前記障害の前記サービスへの影響レベルに応じた、異なる判定基準に基づいて、集計された前記所定期間の前記障害の発生状況情報を判別して分類する表示処理システム。
  5. 表示装置に接続された処理装置が、
    所定期間のサービスを提供するサーバの熱だまりの発生状況情報とともに、前記所定期間の前記熱だまりにより発生した障害の発生状況情報を、前記障害による前記サービスへの影響レベルに分けて前記表示装置に表示する表示処理方法。
  6. 表示装置に接続されたコンピュータに、
    所定期間のサービスを提供するサーバの熱だまりの発生状況情報とともに、前記所定期間の前記熱だまりにより発生した障害の発生状況情報を、前記障害による前記サービスへの影響レベルに分けて前記表示装置に表示する手順を実行させるためのプログラム。
JP2012546668A 2010-11-29 2011-09-09 表示処理システム、表示処理方法、およびプログラム Expired - Fee Related JP5790662B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012546668A JP5790662B2 (ja) 2010-11-29 2011-09-09 表示処理システム、表示処理方法、およびプログラム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2010265476 2010-11-29
JP2010265476 2010-11-29
PCT/JP2011/005090 WO2012073408A1 (ja) 2010-11-29 2011-09-09 表示処理システム、表示処理方法、およびプログラム
JP2012546668A JP5790662B2 (ja) 2010-11-29 2011-09-09 表示処理システム、表示処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2012073408A1 JPWO2012073408A1 (ja) 2014-05-19
JP5790662B2 true JP5790662B2 (ja) 2015-10-07

Family

ID=46171386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012546668A Expired - Fee Related JP5790662B2 (ja) 2010-11-29 2011-09-09 表示処理システム、表示処理方法、およびプログラム

Country Status (4)

Country Link
US (1) US9208012B2 (ja)
JP (1) JP5790662B2 (ja)
CN (1) CN103189849B (ja)
WO (1) WO2012073408A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8988237B2 (en) 2010-05-27 2015-03-24 University Of Southern California System and method for failure prediction for artificial lift systems
US8988236B2 (en) 2010-05-27 2015-03-24 University Of Southern California System and method for failure prediction for rod pump artificial lift systems
JP5761201B2 (ja) * 2010-11-29 2015-08-12 日本電気株式会社 表示処理システム、表示処理方法、およびプログラム
US9280517B2 (en) * 2011-06-23 2016-03-08 University Of Southern California System and method for failure detection for artificial lift systems
US9157308B2 (en) * 2011-12-29 2015-10-13 Chevron U.S.A. Inc. System and method for prioritizing artificial lift system failure alerts
JP6098145B2 (ja) * 2012-01-18 2017-03-22 株式会社リコー 機器管理装置、機器管理システム、及びプログラム
US9883009B2 (en) * 2013-12-27 2018-01-30 International Business Machines Corporation Automatic computer room air conditioning control method
US9638583B2 (en) * 2014-05-21 2017-05-02 Amazon Technologies, Inc. Virtual data center environmental monitoring system
US9558093B2 (en) * 2014-07-30 2017-01-31 Microsoft Technology Licensing, Llc Visual tools for failure analysis in distributed systems
DE102014118290A1 (de) * 2014-12-10 2016-06-16 Océ Printing Systems GmbH & Co. KG Verfahren zum Konfigurieren einer Steuerungseinrichtung für ein Produktionssystem und ein solches Produktionssystem
DE102014118293A1 (de) * 2014-12-10 2016-06-16 Océ Printing Systems GmbH & Co. KG System und Verfahren zur Überwachung eines Produktionssystems

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005092886A (ja) * 2003-09-18 2005-04-07 Internatl Business Mach Corp <Ibm> ユーティリティ・コンピューティング環境の、自動アラートおよび率先リベートを伴うリアルタイム・サービス・レベル・パフォーマンス、違反、および保証された均一性を表示する方法。
US20090210813A1 (en) * 2008-02-15 2009-08-20 Sawczak Stephen D Systems and methods for computer equipment management
US7596431B1 (en) * 2006-10-31 2009-09-29 Hewlett-Packard Development Company, L.P. Method for assessing electronic devices
JP2009252056A (ja) * 2008-04-09 2009-10-29 Hitachi Ltd 情報処理システムの運用管理方法および運用管理装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822512A (en) 1995-05-19 1998-10-13 Compaq Computer Corporartion Switching control in a fault tolerant system
US5956665A (en) * 1996-11-15 1999-09-21 Digital Equipment Corporation Automatic mapping, monitoring, and control of computer room components
US6128016A (en) * 1996-12-20 2000-10-03 Nec Corporation Graphic user interface for managing a server system
US6145098A (en) * 1997-05-13 2000-11-07 Micron Electronics, Inc. System for displaying system status
US6338150B1 (en) * 1997-05-13 2002-01-08 Micron Technology, Inc. Diagnostic and managing distributed processor system
US6243838B1 (en) * 1997-05-13 2001-06-05 Micron Electronics, Inc. Method for automatically reporting a system failure in a server
US7246159B2 (en) * 2002-11-01 2007-07-17 Fidelia Technology, Inc Distributed data gathering and storage for use in a fault and performance monitoring system
US6889908B2 (en) * 2003-06-30 2005-05-10 International Business Machines Corporation Thermal analysis in a data processing system
US20060047466A1 (en) * 2004-08-27 2006-03-02 White Gene H System and method for monitoring rack equipment
CN1870750B (zh) * 2006-04-29 2011-11-30 北京北大方正电子有限公司 一种报警处理系统及方法
JP4151727B2 (ja) 2006-12-22 2008-09-17 ダイキン工業株式会社 空調管理装置
US7894944B2 (en) * 2007-07-06 2011-02-22 Microsoft Corporation Environmental monitoring in data facilities
US20090113323A1 (en) * 2007-10-31 2009-04-30 Microsoft Corporation Data center operation optimization
TW200931330A (en) 2008-01-15 2009-07-16 Chunghwa Telecom Co Ltd Remote real-time asset management system for air conditioning equipments
US20100328080A1 (en) * 2008-03-31 2010-12-30 Tracy Mark S Method To Sense Ambient Temperatures Around A Computer To Notify End Users
US8904383B2 (en) * 2008-04-10 2014-12-02 Hewlett-Packard Development Company, L.P. Virtual machine migration according to environmental data
JP2011059739A (ja) * 2009-09-04 2011-03-24 Fujitsu Ltd 温度予測装置、温度予測方法および温度予測プログラム
US8484510B2 (en) * 2009-12-15 2013-07-09 Symantec Corporation Enhanced cluster failover management
US8509959B2 (en) * 2010-08-12 2013-08-13 Schneider Electric It Corporation System and method for predicting transient cooling performance for a data center
US8838286B2 (en) * 2010-11-04 2014-09-16 Dell Products L.P. Rack-level modular server and storage framework

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005092886A (ja) * 2003-09-18 2005-04-07 Internatl Business Mach Corp <Ibm> ユーティリティ・コンピューティング環境の、自動アラートおよび率先リベートを伴うリアルタイム・サービス・レベル・パフォーマンス、違反、および保証された均一性を表示する方法。
US7596431B1 (en) * 2006-10-31 2009-09-29 Hewlett-Packard Development Company, L.P. Method for assessing electronic devices
US20090210813A1 (en) * 2008-02-15 2009-08-20 Sawczak Stephen D Systems and methods for computer equipment management
JP2009252056A (ja) * 2008-04-09 2009-10-29 Hitachi Ltd 情報処理システムの運用管理方法および運用管理装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015018069; 高木均,外3人: 'NECのグリーンITへの取り組み「REAL IT COOL PROJECT」' NEC技報 第62巻,第3号, 20090925, p.24-27, 日本電気株式会社 *
JPN6015018071; 福本邦男,外2人: 'データセンターにおけるIT負荷とファシリティエネルギーの最適化' FUJITSU 第61巻,第3号, 20100510, p.255-260, 富士通株式会社 *

Also Published As

Publication number Publication date
US9208012B2 (en) 2015-12-08
JPWO2012073408A1 (ja) 2014-05-19
WO2012073408A1 (ja) 2012-06-07
US20130212443A1 (en) 2013-08-15
CN103189849B (zh) 2015-09-02
CN103189849A (zh) 2013-07-03

Similar Documents

Publication Publication Date Title
JP5790662B2 (ja) 表示処理システム、表示処理方法、およびプログラム
JP6364800B2 (ja) 監視装置及び監視方法
JP5267736B2 (ja) 障害検出装置、障害検出方法およびプログラム記録媒体
CN106776214B (zh) 一种服务器健康度评估方法
JP7221644B2 (ja) 機器故障診断支援システムおよび機器故障診断支援方法
US9575488B2 (en) Method and system for monitoring an industrial system involving an eye tracking system
JP2008134039A (ja) 空調設備の監視装置および監視方法
JP5368388B2 (ja) 災害危機管理装置、被害レベル計算方法、およびプログラム
JP5761201B2 (ja) 表示処理システム、表示処理方法、およびプログラム
US11113364B2 (en) Time series data analysis control method and analysis control device
JP5790658B2 (ja) 表示処理システム、表示処理方法、およびプログラム
WO2012070475A1 (ja) 情報処理装置、情報処理方法、並びに情報処理プログラム
US20130215118A1 (en) Operation status visualization system, operation status visualization method, and information storage medium storing program
CN110059906B (zh) 策略效能分析方法、装置、服务器及存储介质
JP7020835B2 (ja) 監視制御装置、監視制御システム及び表示方法
JPH0784636A (ja) プロセスデータ収集・監視方法及び装置
JP2005071136A (ja) 納期管理支援システム、そのプログラム、そのプログラムを記録した記録媒体および製品の納期管理方法
JP6177022B2 (ja) 情報処理装置及び情報処理方法及びプログラム
JP5932887B2 (ja) 業務処理システム、業務処理能力の監視システムおよび監視方法
JP2019191662A (ja) 設備遠隔監視システムおよび設備遠隔監視方法
JP2014049045A (ja) ジョブ管理システムにおける障害対応システム及びそのプログラム
JPWO2009087986A1 (ja) 情報提供システム、情報提供装置、情報提供方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140806

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150720

R150 Certificate of patent or registration of utility model

Ref document number: 5790662

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees