JP2019101822A - Information processing apparatus and cooling component management program - Google Patents
Information processing apparatus and cooling component management program Download PDFInfo
- Publication number
- JP2019101822A JP2019101822A JP2017232844A JP2017232844A JP2019101822A JP 2019101822 A JP2019101822 A JP 2019101822A JP 2017232844 A JP2017232844 A JP 2017232844A JP 2017232844 A JP2017232844 A JP 2017232844A JP 2019101822 A JP2019101822 A JP 2019101822A
- Authority
- JP
- Japan
- Prior art keywords
- fan
- life
- cooling
- predicted
- control unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、情報処理装置および冷却部品管理プログラムに関する。 The present invention relates to an information processing apparatus and a cooling part management program.
サーバ等の情報処理装置(以下、サーバ装置という)は、CPU(Central Processing Unit)等の発熱源を冷却する冷却ファン(以下、FANという)を備える。また、サーバ装置においては、冗長化等の目的により複数個のFANを搭載することが一般的である。 An information processing apparatus such as a server (hereinafter referred to as a server apparatus) includes a cooling fan (hereinafter referred to as a fan) that cools a heat generation source such as a CPU (central processing unit). Also, in the server apparatus, it is general to mount a plurality of FANs for the purpose of redundancy and the like.
サーバ装置の稼動開始後、保守対応期間(例えば、装置稼働開始後5年間)中に、FANの予期せぬ個別不良が発生した場合は、その都度、CE(Customer’s Engineer)によるスポット保守作業で故障FANの交換が行なわれる。 If an unexpected individual failure of the FAN occurs during the maintenance response period (for example, 5 years after the start of the device operation) after the server device starts operation, the spot maintenance work by CE (Customer's Engineer) causes a failure each time A replacement of the FAN takes place.
また、サーバ装置に対する保守作業として、例えば、年一回の定期点検が実施され、FANはフィールドでの保守作業における点検対象となっている。FANに関する具体的な保守作業としては、FANの回転に異常がないかの確認が行なわれている。 In addition, as maintenance work for the server device, for example, periodical inspection is performed once a year, and the FAN is subjected to inspection in the field maintenance work. As a specific maintenance work on the FAN, it is confirmed that there is no abnormality in the rotation of the FAN.
しかしながら、上述の如き定期点検を実施していても、以下の理由により、FANの寿命(交換時期)にばらつきが生じる。 However, even if the periodic inspection as described above is performed, the life (time of replacement) of the FAN varies due to the following reason.
すなわち、故障により交換された新しいFANよりも、交換されていないFANの方が稼働時間が長いので先に寿命を迎える。また、一般的に、FANの経年での寿命はグリスの寿命で決まるが、グリスは高温になるほど劣化し寿命が短くなる。そのため、サーバ装置内部で高温のエアー(ユニット)に近い位置に搭載されるFANの寿命は短くなる。 That is, the life of the non-replaced FAN is longer than the new FAN replaced due to the failure because the operation time is longer. Also, in general, the life of the FAN over time is determined by the life of the grease, but as the temperature becomes higher, the grease deteriorates and the life becomes shorter. Therefore, the life of the FAN mounted at a position close to the high temperature air (unit) inside the server device becomes short.
このようにFANの交換の有無や装置内における実装位置によって、サーバ装置に搭載される複数のFANの寿命にばらつきが生じる。 As described above, the lifespans of the plurality of FANs mounted on the server apparatus vary depending on the presence or absence of replacement of the FAN and the mounting position in the apparatus.
近年、社会的な節電要求に応じて、サーバ業界でも高温動作に適合するモデルの需要が高まっており、例えば、40℃の環境下での稼働を保証する40℃環境対応モデルの商品化も実現されている。 In recent years, the demand for models compatible with high-temperature operation is also increasing in the server industry in response to social power saving requirements. For example, the commercialization of a 40 ° C environmental response model that guarantees operation in a 40 ° C environment is also realized It is done.
通常のオフィス環境は年平均使用温度を25℃として設定されている。このような通常オフィス環境用のサーバ装置においては、保守対応期間(通常5年)内では寿命に至らないFANであっても、40℃環境対応モデルのような高温環境下での長期稼動を行なうことで、短期間で寿命に至る確率が高くなることが予想される。 In a normal office environment, the annual average operating temperature is set to 25 ° C. In such a normal office environment server device, even if the FAN does not reach the end of its service life (usually 5 years), it operates for a long time under high temperature environment like 40 ° C environment response model. Thus, it is expected that the probability of reaching the life in a short period is high.
一般的にサーバ装置内部では、CPUに近い部分の温度が非常に高くなるため、CPUの周囲部品への影響が大きい。 Generally, in the server apparatus, the temperature near the CPU becomes extremely high, and the influence on peripheral parts of the CPU is large.
万一、寿命のばらつきにより保守対応期間を満たさずに故障してしまうFANが発生した場合には、その都度、保守作業が発生し、ユーザに工数およびコストにかかる負担をかけ、ひいてはサーバに対する信頼を失うことになる。 In the event that a FAN occurs that fails to meet the maintenance response period due to variations in the life, maintenance work will occur each time, placing a burden on the user of man-hours and costs, and ultimately reliance on the server. You will lose
また、40℃環境対応モデルにおいてFANに異常が生じると、サーバ装置内部の部品において高温による処理速度低下(サーマルスロットリング)が発生し、サーバ装置の処理性能の低下を招くおそれがある。 In addition, if an abnormality occurs in the FAN in the 40 ° C. environment-friendly model, processing speed reduction (thermal throttling) may occur due to high temperature in parts inside the server apparatus, which may cause a reduction in processing performance of the server apparatus.
1つの側面では、本発明は、冷却部品の寿命のばらつきを解消することを目的とする。 In one aspect, the present invention aims to eliminate variations in the life of cooling components.
このため、この情報処理装置は、複数の冷却対象部品と、前記冷却対象部品を冷却する複数の冷却部品と、前記複数の冷却部品の温度を検出する温度検出部と、前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部とを備える。 Therefore, the information processing apparatus is based on the plurality of cooling target parts, the plurality of cooling parts for cooling the cooling target parts, the temperature detection unit for detecting the temperatures of the plurality of cooling parts, and the temperature. A life prediction unit for performing life prediction of each of the plurality of cooling parts, and a predicted short life cooling part having the shortest predicted life among the plurality of cooling parts as a result of the life prediction, and a predicted long life having the longest prediction life And a configuration change control unit configured to change the configuration of the part to be cooled, when a difference between the predicted life and the threshold is detected.
一実施形態によれば、冷却部品の寿命のばらつきを解消することができる。 According to one embodiment, variations in the life of the cooling component can be eliminated.
以下、図面を参照して本情報処理装置および冷却部品管理プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形(実施形態および各変形例を組み合わせる等)して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。 Hereinafter, embodiments of the information processing apparatus and the cooling component management program will be described with reference to the drawings. However, the embodiments described below are merely examples, and there is no intention to exclude the application of various modifications and techniques that are not specified in the embodiments. That is, the present embodiment can be implemented with various modifications (such as combining the embodiment and each modification) without departing from the scope of the present invention. In addition, each drawing is not intended to include only the components illustrated in the drawings, but may include other functions and the like.
(A)構成
図1は実施形態の一例としてのサーバシステム1の構成を模式的に示す図である。
(A) Configuration FIG. 1 is a view schematically showing a configuration of a
サーバシステム1は、図1に示すように、サーバ装置3および管理端末装置2を備える。サーバ装置3と管理端末装置2とは、通信回線8を介して通信可能に接続されている。
The
通信回線8は、例えば、LAN(Local Area Network)である。なお、通信回線8はLANに限定されるものではなく、種々変形して実施することができる。
The
サーバ装置3は、サーバ機能を備えたコンピュータであり、本サーバシステム1における保守対象装置の一例である。
The
サーバ装置3は、MMB(Management Board)10,FRU(Field-Replaceable Unit)4,IOU(Input Output Unit)6,PCIeボックス7およびSB(System Board)5−1〜5−4を備える。
The
[SB5]
SB5−1〜5−4は、本サーバシステム1における各種制御や演算処理を行なう処理装置である。図1に示す例においては、4つのSB5−1〜5−4が備えられている。これらのSB5−1〜5−4は同様の構成を有する。以下、SBを示す符号としては、複数のSBのうち1つを特定する必要があるときには符号5−1〜5−4を用いるが、任意のSBを指すときには符号5を用いる。
[SB5]
The SBs 5-1 to 5-4 are processing devices that perform various controls and arithmetic processing in the
また、以下、SB5−1をSB#0という場合がある。同様に、SB5−2,5−3,5−4を、それぞれ、SB#1,#2,#3という場合がある。
Also, hereinafter, SB5-1 may be referred to as
図2(a)〜(c)は実施形態の一例としてのサーバシステム1の外観を模式的に示す図である。図2(a)はSB5(5−1)の外観を模式的に示す斜視図であり、図2(b)はサーバシステム1の筐体1a内におけるSB5の配置を例示する図である。また、図2(c)は図2(b)のA矢視図である。
Fig.2 (a)-(c) are figures which show typically the external appearance of the
各SB5においては、図2(a)に示すように、基板501上にCPU51やDIMM52が配置されている。
In each
図2(b)に示す例においては、筐体1aの一方の面に沿って、4つのSB5が、互いに平行になるよう立設した状態で並べて配置されている。
In the example shown in FIG. 2B, four
また、図2(c)に示すように、筐体1aにおける、SB5が並ぶ面とは反対側には、FRU4とIOU6とが配置されている。
Further, as shown in FIG. 2C, the
筐体1aの高さ方向における中央付近にはIOU6が備えられている。図2(c)においては、便宜上、1つのIOU6として図示されているが、このIOU6は、複数のIOU6および複数のPCIeボックス7を1つにまとめたものであってもよい。
An
IOU6の上面に沿ってFAN#0,#1が水平方向に並べて配置されている。そして、FAN#0の上方にはPSU#0が、FAN#1の上方にはPSU#1が、それぞれ配置されている。一方、IOU6の下面に沿って、FAN#2,#3が水平方向に並べて配置されている。そして、FAN#2の下方にはPSU#2が、FAN#3の下方にはPSU#3が、それぞれ配置されている。
なお、筐体1a内におけるSB5,IOU6,FAN40,PSU41の位置はこれに限定されるものではなく、適宜変更して実施することができる。
The positions of the
SB5は、図1に示すように、BMC(Baseboard Management Controller)50,1つ以上(図1に示す例では2つ)のCPU51および1つ以上(図1に示す例では4つ)のDIMM(Dual Inline Memory Module)52を備える。
As shown in FIG. 1, the
DIMM52は、データや、OS(Operating System),プログラム等を一時的に格納する記憶領域であり、例えば、CPU51がプログラムを実行する際に、一次記憶メモリあるいはワーキングメモリとして利用される。DIMM52上のソフトウェアプログラムは、CPU51に適宜読み込まれて実行される。
The
CPU51は、種々の制御や演算を行なう処理装置であり、DIMM52に格納されたOSやプログラムを実行することにより、種々の機能を実現する。
The
CPU51やDIMM52はSB5としての処理の実行中に発熱する発熱源であり、これらのCPU51,DIMM52を備えるSB5は、FAN40による冷却対象部品である。
The
BMC50は、SB5を管理するコントローラであり、CPU51やDIMM52,図示しない温度センサ等のハードウェアの監視やハードウェアイベントの記録等を行なう。BMC50は、例えば、IPMI(Intelligent Platform Management Interface)が定義する標準仕様に従った機能構成を有してもよい。
The
BMC50は、SB5のMMB10に、SB5等の各種情報を送信する。例えば、BMC50は、FAN40に備えられた温度センサの検出値や、FAN40のモータの回転数をFRU4から取得し、MMB10に送信する。
The
なお、SB5に搭載されるCPU51やDIMM52の数は、図1に示した例に限定されるものではなく、種々変形して実施することができる。
The number of
また、サーバシステム1に備えられるSB5の数は4つに限定されるものではなく、3つ以下、もしくは5つ以上のSB5を備えてもよく、種々変形して実施することができる。
Further, the number of
本サーバシステム1に備えられた4つのSB5のうち、少なくとも1つのSB5(例えば、SB5−3,5−4)は、リザーブドSB(Reserved SB)5として用いられる。
Among the four
リザーブドSB機能は、あらかじめ筐体1a内に予備のSB5を実装しておき、故障したSB5を自動的に切り離し、予備SB5を組み込んでパーティションを再起動することで、SB5の構成変更を実現する機能である。 The Reserved SB function is a function to realize a configuration change of SB5 by mounting a spare SB5 in the housing 1a in advance, automatically disconnecting the failed SB5, and incorporating the spare SB5 to restart the partition. It is.
また、障害発生時に切り替える目的の予備SB5をリザーブド(Reserved)SBという場合もある。
In addition, there is also a case where a
リザーブドSB5への切り替えにはシステムのシャットダウンが必要となる。
Switching to
リザーブドSB5(例えば、SB5−4)は、サーバシステム1に備えられた他のSB5(例えばSB5−1〜5−3)のうちのいずれかに故障が検出された場合に、この故障が検出されたSB5に代えて用いられる予備のSB5である。リザーブドSB5は、スタンバイ状態で待機している。
The reserved SB5 (for example, SB5-4) is detected when a failure is detected in any of the other SB5 (for example, SB5-1 to 5-3) provided in the
本サーバシステム1において、後述するMMB10は、故障したSB5をサーバシステム1から切り離し、この故障したSB5の代わりにリザーブドSB5を組み込み、パーティションを再起動するリザーブドSB機能を実現する。
In the
[IOU6]
IOU6は、外部装置との間でデータ等の入出力を行なう。IOU6は、例えば、PCIe(Peripheral Component Interconnect Express)の規格に従って、外部装置等と通信を行なう。図1に示す例においては、4つのIOU6が備えられ、複数のSB5のそれぞれに対して1つのIOU6が備えられている。4つのIOU6をIOU#0〜#3とそれぞれ表す場合がある。
[IOU 6]
The
IOU6も処理の実行中に発熱する発熱源であり、FAN40による冷却対象である。
[PCIeボックス7]
PCIeボックス7は、PCIeスロットを増設可能な拡張ボックスであり、IOU6に対応して備えられる。図1に示す例においては、IOU6と同様に、4つのPCIeボックス7が備えられ、複数のIOU6のそれぞれに対して1つのPCIeボックス7が備えられている。4つのPCIeボックス7をPCIebox#0〜#3とそれぞれ表す場合がある。
[PCIe box 7]
The
IOU#0およびPCIebox#0はそれぞれSB#0に対応して備えられる。同様に、IOU#1およびPCIebox#1はそれぞれSB#1に、IOU#2およびPCIebox#2はそれぞれSB#2に、IOU#3およびPCIebox#3はそれぞれSB#3に、それぞれ対応して備えられる。
The
[FRU4]
FRU4は、本サーバシステム1が稼働している現場で交換可能に構成された部品である。図1に示す例においては、FRU4は、4つのFAN40−1〜40−4と、4つのPSU(Power Supply Unit)41−1〜41−4を備える。
[FRU4]
The
FAN40−1〜40−4は、冷却風を発生させることで冷却対象部品を冷却する冷却装置である。FAN40−1〜40−4は、同様の構成を有する。以下、FANを示す符号としては、複数のFANのうち1つを特定する必要があるときには符号40−1〜40−4を用いるが、任意のFANを指すときには符号40を用いる。
The FANs 40-1 to 40-4 are cooling devices that cool components to be cooled by generating cooling air. The FANs 40-1 to 40-4 have the same configuration. Hereinafter, as a code indicating a FAN, the codes 40-1 to 40-4 are used when it is necessary to specify one of a plurality of FANs, and the
また、以下、FAN40−1をFAN#0という場合がある。同様に、FAN40−2,40−3,40−4を、それぞれ、FAN#1,#2,#3という場合がある。
Also, hereinafter, the FAN 40-1 may be referred to as
FAN#0〜#3はCEによる保守作業対象部品であり、故障等の障害が検出された場合には、CEによる保守作業により新たなFAN40に交換される。例えば、FAN#0に障害が検出された場合には、FAN#0として用いられていたFAN40が取り外され、新たなFAN40がFAN#0として取り付けられる。
なお、FAN40のそれぞれにはユニークな識別情報(FAN ID)が設定されており、FAN#0〜3としてFRU4に取り付けられるFAN40は、適宜交換される。なお、FAN#0〜3としてFRU4に取り付けられるFAN40のFAN IDは、後述するFAN配置履歴情報124によって管理される。以下、FAN IDを単に“ID”と表す場合がある。以下、4つのFAN40のIDが、それぞれ“A”,“B”,“C”,“D”である例について示す。
Unique identification information (FAN ID) is set to each of the
本サーバシステム1において、FAN40は、FRU4に形成された複数のスロット(図示省略)のうちのいずれかに取り付けられる。以下、スロット位置を表す識別情報(スロットID)を“POS”と表す場合がある。以下、本サーバシステム1においてFRU4に4つのスロットが備えられ、これらの4つのスロットのPOSが、それぞれ“101”,“102”,“103”,“104”である例について示す。例えば、FAN#0,#1,#2,#3が、スロット“101”,“102”,“103”,“104”にそれぞれ取り付けられる。
In the
また、サーバシステム1の筐体1a内におけるスロット位置がFAN40の寿命に影響を与える。
Further, the slot position in the housing 1 a of the
FRU4においては、FAN#0〜3として取り付けられている各FAN40のFAN IDと、各FAN40が取り付けられているスロット位置のスロットIDとをFAN配置情報として、図示しないメモリに記憶(管理)している。
In
各FAN40には図示しない温度センサが備えられており、この温度センサにより、FAN40の温度(運転温度)もしくはFAN40の周囲の温度を検出する。なお、以下、便宜上、FAN40の温度もしくはFAN40の周囲の温度を、単にFAN40の温度という場合がある。
Each
各FAN40の温度センサの検出値は、例えば、BMC50により採取され、このBMC50からMMB10にI2C(Inter-Integrated Circuit)通信を介して送信される。各FAN40の温度センサの検出値は、例えば、後述するMMB10の温度情報管理部112から取得要求が行なわれると、この取得要求に応答してBMC50により採取され、MMB10に送信される。
The detection value of the temperature sensor of each
本サーバシステム1においては、SB5(CPU51,DIMM52),IOU6等の発熱体にFAN40によって生成される冷却風を送風することで、これらの冷却を行なう。
In the
各FAN40の回転速度等は、後述するMMB10によって制御される。また、各FAN40の動作状況を表す情報(例えば、FAN回転数)もBMC50を介して採取され、MMB10によって管理される。
The rotational speed and the like of each
PSU41−1〜41−4は、本サーバシステム1に備えられる各部に電力供給を行なう。以下、PSU41−1をPSU#0という場合がある。同様に、PSU41−2,41−3,41−4を、それぞれ、PSU#1,#2,#3という場合がある。
The PSUs 41-1 to 41-4 supply power to each unit provided in the
例えば、PSU#0はFAN#0,SB#0,IOU#0およびPCIeボックス#0に電力を供給する。
For example,
同様に、PSU#1はFAN#1,SB#1,IOU#1およびPCIeボックス#1に、PSU#2はFAN#2,SB#2,IOU#2およびPCIeボックス#2に、PSU#3はFAN#3,SB#3,IOU#3およびPCIeボックス#3に、それぞれ電力を供給する。
Similarly,
PSU41も発熱源であり、FAN40による冷却対象である。
The
[MMB10]
MMB10は、本サーバシステム1における制御や監視、パーティション管理、システム初期化などの処理を行なうシステム制御ユニットである。
[MMB10]
The
MMB10は、図1に示すように、CPU11およびメモリ12を備える。
The
メモリ12は、データや,OS,プログラム等を一時的に格納する記憶領域であり、例えば、CPU11がプログラムを実行する際に、一次記憶メモリあるいはワーキングメモリとして利用される。メモリ12上のソフトウェアプログラムは、CPU11に適宜読み込まれて実行される。
The
ソフトウェアプログラムには、MMB10によって本実施形態のFAN管理機能を実現するためにCPU11によって実行されるFAN配置管理プログラムが含まれてもよい。FAN配置管理プログラムは、例えば、ファームウェアにモジュールとして組み込まれてもよい。
The software program may include a fan layout management program executed by the
また、メモリ12には、構成情報121,温度情報112,FAN回転数情報123,FAN配置履歴情報124,予測寿命履歴情報125および温度影響情報126が記憶領域に格納される。
Further, in the
図3は実施形態の一例としてのサーバシステム1における構成情報121を例示する図である。
FIG. 3 is a diagram exemplifying
構成情報121は、例えば、各SB5のハードウェア構成を管理する情報であり、SB5を構成する部品の構成や性能を示す情報である。構成情報121は、各SB5に備えられたCPU51およびDIMM52の構成や性能を示す情報をSB5毎に対応付けて構成されている。図3に示す例においては、CPU51の構成や性能を示す情報としてプロセッサ種類(Xenon等)が、また、DIMM52の構成や性能を示す情報としては、種類,枚数,メモリサイズが、それぞれSB5毎に登録されている。
The
なお、図3においてはx個(xは自然数)のDIMM52についての構成情報を示すものであり、図1に例示するサーバシステム1の構成においては、各SB5にそれぞれ4つのDIMM52が搭載されているのでx=4となる。
Note that FIG. 3 shows configuration information for x (where x is a natural number)
構成情報121は、例えば、サーバシステム1の設定時や保守作業時に、担当CEやシステム管理者等によって設定されてもよい。
The
なお、図3に例示する構成情報121はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。また、構成情報121において管理する情報は、図3に例示したものに限定されるものではなく、例えば、プロセッサの動作周波数等、他の情報を含めてもよく種々変形して実施することができる。
Although the
図4は実施形態の一例としてのサーバシステム1における温度情報122を例示する図である。
FIG. 4 is a diagram illustrating
温度情報122は、各FAN40において検出された温度の履歴を管理する情報である。図4に例示する温度情報122においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)から、所定時間が経過する毎の各タイミングで測定(サンプリング)された各FAN40の温度がFAN40毎に登録されている。
The
なお、図4においてはn個(nは自然数)のFAN#0〜#n−1についての温度情報122を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。
Note that FIG. 4 shows
例えば、BMC50が、各FAN40に備えられた温度センサの検出値を採取し、温度情報122に定期的に記録してもよい。また、後述するMMB10の温度情報管理部112が、FRU4から各FAN40の温度を定期的に取得し、温度情報122に記録してもよい。
For example, the
FAN40の温度は、所定時間が経過する毎の各タイミングで測定(サンプリング)された値に代えて、例えば所定経過時間毎の平均値であってもよく、種々変形して実施することができる。
The temperature of the
図4に例示する温度情報122はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。
Although the
図5は実施形態の一例としてのサーバシステム1におけるFAN回転数情報123を例示する図である。
FIG. 5 is a diagram illustrating the FAN
FAN回転数情報123は、各FAN40の回転数(回転速度)の履歴を管理する情報である。図5に例示するFAN回転数情報123においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングで測定(サンプリング)された回転数の値がFAN40毎に登録されている。
The FAN
なお、図5においてはn個(nは自然数)のFAN#0〜#n−1についてのFAN回転数情報123を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。
Note that FIG. 5 shows FAN
例えば、BMC50が、FRU4に備えられた図示しない制御装置から各FAN40の回転数を採取し、FAN回転数情報123に定期的に記録してもよい。また、後述するMMB10のFAN回転数管理部113が、FRU4から各FAN40の回転数を定期的に取得し、FAN回転数情報123に記録してもよい。
For example, the
FAN回転数情報123は、FAN回転数管理部113によって登録・管理される。
The FAN
なお、FAN40の回転数は、所定時間が経過する毎の各タイミングで測定(サンプリング)された値に代えて、所定経過時間毎の平均値であってもよく、種々変形して実施することができる。
In addition, the rotational speed of the
図5に例示するFAN回転数情報123はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。
Although the FAN
図6は実施形態の一例としてのサーバシステム1におけるFAN配置履歴情報124を例示する図である。
FIG. 6 is a diagram illustrating the FAN
FAN配置履歴情報124は、各FAN40の配置の履歴を管理する情報である。図6に例示するFAN配置履歴情報124においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングでの、FAN#0〜#n−1のサーバシステム1内での取り付けスロット位置(POS)が登録されている。
The FAN
なお、図6においてはn個(nは自然数)のFAN#0〜#n−1についてのFAN配置履歴情報124を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。また、図6に例示するFAN配置履歴情報124においては、便宜上、具体的な値に代えて“POS”との文字が示されている。
6 shows the FAN
後述するFAN配置履歴管理部114が、FRU4において管理されるFAN配置情報から取得し、この取得した情報を用いてFAN配置履歴情報124が登録・管理される。
The FAN placement
図6に例示するFAN配置履歴情報124はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。
Although the FAN arrangement | positioning
図7は実施形態の一例としてのサーバシステム1における予測寿命履歴情報125を例示する図である。
FIG. 7 is a diagram exemplifying predicted
予測寿命履歴情報125は、各FAN40について算出された予測寿命の履歴を管理する情報である。図7に例示する予測寿命履歴情報125においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングでFAN予測寿命管理部115によって算出された、FAN#0〜#n−1の予測寿命(Life(ID,POS))が登録されている。FAN4の予測寿命の詳細については後述する。
The predicted
Life(ID,POS)は、FAN予測寿命管理部115によって算出された予測寿命(単位:h(時間))に、当該予測寿命の算出の対象であるFAN40を特定するID(FAN ID)と、当該FAN40が取り付けられたスロットを特定するPOSとを関連付ける。
Life (ID, POS) is an estimated life (unit: h (hour)) calculated by the FAN estimated
なお、図7においてはn個(nは自然数)のFAN#0〜#n−1についての予測寿命履歴情報125を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。
Note that FIG. 7 shows the predicted
予測寿命履歴情報125は、後述するFAN予測寿命管理部115によって登録・管理される。
The predicted
図7に例示する予測寿命履歴情報125はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。
Although the predicted
温度影響情報126については後述する。
The temperature influence
CPU11は、種々の制御や演算を行なう処理装置であり、メモリ12に格納されたOSやプログラムを実行することにより、種々の機能を実現する。CPU11は、FAN管理プログラムを実行することで、本サーバシステム1に備えられた複数のFAN40を管理するFAN配置管理機能を実現する。
The
具体的には、CPU11は、FAN配置管理プログラムを実行することで、図1に示すように、構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現する。
Specifically, as shown in FIG. 1, the
なお、これらの構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現するためのプログラム(FAN配置管理プログラム)は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。
Note that a program for realizing the functions of the configuration
構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現する際には、内部記憶装置(本実施形態ではメモリ12)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU11)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。
When realizing the functions as the configuration
構成情報管理部111は、各SB5のハードウェア構成を管理する。構成情報管理部111は、構成情報121から各SB5のハードウェア構成に関する情報を読み出し、メモリ12の所定の領域に格納する。
The configuration
温度情報管理部112は、各FAN40において検出された温度の履歴を管理する。温度情報管理部112は、メモリ12の温度情報122を用いて各FAN40の温度を管理する。例えば、温度情報管理部112は、FAN予測寿命管理部115からの要求に応じてFAN40の温度を随時取得し、FAN予測寿命管理部115に通知する。温度情報管理部112は、収集したFAN40の温度を温度情報122に記録する。
The temperature
また、温度情報管理部112は、複数のFAN40の温度を検出する温度検出部として機能する。
Further, the temperature
FAN回転数管理部113は、各FAN40の回転数(回転速度)の履歴を管理する。FAN回転数管理部113は、メモリ12のFAN回転数情報123を用いて各FAN40の回転数を管理する。FAN回転数管理部113は、FAN予測寿命管理部115からの要求に応じてFAN40の回転数を随時取得し、FAN予測寿命管理部115に通知する。FAN回転数管理部113は、収集したFAN回転数をFAN回転数情報123に記録する。
The FAN rotation
FAN配置履歴管理部114は、各FAN40の配置の履歴を管理する。FAN配置管理部114は、メモリ12のFAN配置履歴情報124を用いて各FAN40の配置履歴を管理する。FAN配置履歴管理部114は、FAN予測寿命管理部115からの要求に応じてFAN40の配置履歴を随時取得し、FAN予測寿命管理部115に通知する。例えば、FAN配置履歴管理部114は、FRU4から各スロットに取り付けられたFAN40のFAN IDを取得し、FAN配置履歴情報124に記録する。
The FAN placement
FAN予測寿命管理部(寿命予測部)115は、各FAN40の寿命を予測する演算(寿命予測演算)を行なうことで、各FAN40の寿命予測を行なう。
The FAN predicted life management unit (life prediction unit) 115 performs life prediction of each
FAN40の寿命予測を行なうに際して、FAN予測寿命管理部115は、変数“life_fan(ID)”,変数“life_static(POS)”および変数“count”を用いる。
When predicting the life of the
変数“life_fan(ID)”は、識別子がIDのFAN40の残寿命を表す。例えば、変数“life_fan(ID)”を1以下の数値とする。そして、life_fan(ID)= 1の場合に寿命がフルであるとし、その値が小さいほど残寿命が短いことを示すこととする。また、life_fan(ID)の初期値を1とする。
The variable “life_fan (ID)” represents the remaining life of the
変数“life_static(POS)”は、識別子がPOSのスロット位置がFAN40の寿命に与える影響を表す数値である。例えば、変数“life_static(POS)”を1以下の数値とし、その値が小さいほど、FAN40の残寿命(life_fan(ID))を短くするよう作用する。また、life_fan(ID)の初期値を1とする。
The variable “life_static (POS)” is a numerical value that represents the influence of the slot position of the POS identifier on the life of the
変数“count”は、ループ回数を数える。countの初期値を1とする。 The variable "count" counts the number of loops. The initial value of count is 1.
FAN予測寿命管理部115は、サンプリングされた各FAN40の温度に基づき、FAN40の寿命予測を行なう。
The FAN predicted
例えば、FAN予測寿命管理部115は、FANモータのグリス寿命の算出式に基づき、FAN40の寿命予測を行なう。具体的にはFAN予測寿命管理部115は、以下の式(1)〜(3)を用いて、各FAN40の予測寿命を算出する。
For example, the FAN predicted
log(L1) = A - B*T1 ・・・(1)
log(L2) = A - B*T2 ・・・(2)
l= 10^(A - Bt) ・・・(3)
なお、上記式において、L1は温度T1(単位:℃)におけるFAN40のカタログ値(仕様値)としての寿命(単位:h(時間))であり、L2は温度T2(単位:℃)におけるFAN40のカタログ値としての寿命(単位:h(時間))である。A,Bは定数であり、例えばFAN40に用いられるグリスに固有の値である。そして、lは温度t(単位:℃)におけるFAN40の寿命(単位:h(時間))である。
log (L1) = A-B * T1 (1)
log (L2) = A-B * T2 (2)
l = 10 ^ (A-Bt) (3)
In the above equation, L1 is the life (unit: h (hour)) as catalog value (specification value) of
FAN予測寿命管理部115は、上記の式(1),(2)の連立式を解くことでA,Bを算出し、これらの算出したA,Bの値を式(3)に設定することで、FAN40の温度tにおける寿命lを算出する。
The FAN predicted
例えば、FAN#0〜#3に用いられる各FAN40は同種であり、FAN40の温度30℃(T1=30)で寿命70000h(L1=70000),40℃(T2=40)で寿命56000h(L2=56000)であるとする。
For example, each
上記式(1),(2)より
log(70000) = A - B*30
log(56000) = A - B*40
となる。これらの連立式を解くことで、
A = 5.1358
B = 0.0096910
が求められる。
From the above equations (1) and (2)
log (70000) = A-B * 30
log (56000) = A-B * 40
It becomes. By solving these simultaneous expressions,
A = 5.1358
B = 0.0096910
Is required.
次に、上記式(3)に基づき、以下の式が得られる。 Next, the following equation is obtained based on the equation (3).
l = 10^(5.1358-0.0096910*t)
この式にサンプリングで読み取った温度tを代入すると、当該温度でのFAN40の予測寿命lが得られる。
l = 10 ^ (5.1358-0.0096910 * t)
Substituting the temperature t read by sampling into this equation, the predicted life l of the
例えば、温度FAN40の動作温度においてt=50度が読み取れたとすると、
l=44797h
となる。
For example, assuming that t = 50 degrees can be read at the operating temperature of the
l = 44797h
It becomes.
なお、FAN予測寿命管理部115によって算出された各FAN40の予測寿命は、例えば、メモリ12の所定の記憶領域に予測寿命履歴情報125として記録される。
The predicted life of each
また、FAN予測寿命管理部115は、以下の式(4)に基づいて、FAN40の温度取得にかかるサンプリング間隔S中に消費した消費寿命laを算出する。すなわち、以下の式(4)に示すように、FAN予測寿命管理部115は上記式(3)で求めた予測寿命lに温度のサンプリング間隔S(単位:ms)を掛け算して逆数をとることで、サンプリング間隔S中に消費した消費寿命laを算出する。
In addition, the FAN predicted
la = 1/(t*S) ・・・(4)
例えば、温度のサンプリング間隔10msである場合には、上記式(4)に基づき、以下のように求められる。
la = 1 / (t * S) (4)
For example, in the case where the sampling interval of temperature is 10 ms, the following equation is obtained based on the above equation (4).
la = 1/(0.01*(44797*60*60))
FAN予測寿命管理部115は、それぞれのサンプリングデータ毎に 消費寿命laを計算し、life_fan(ID), life_static(POS)から減算する。
la = 1 / (0.01 * (44797 * 60 * 60))
The FAN predicted
切替制御部116は、FAN予測寿命管理部115による寿命予測の結果に基づき、予測寿命が短いと判断されるFAN40の負荷を軽減するための処理を行なう。
The switching
例えば、切替制御部116は、FAN予測寿命管理部115による寿命予測の結果、複数のFAN40のうち、予測寿命が最も長いFAN40(長寿命FAN40)と予測寿命が最も短いFAN40(短寿命FAN40)との予測寿命の差が所定値(例えば、1か月)以上であるかを確認する。すなわち、切替制御部116は、複数のFAN40間において予測寿命のばらつきが生じているかを確認する。
For example, as a result of the life prediction by the FAN predicted
切替制御部116は、例えば、複数のFAN40間において予測寿命のばらつきが生じており(条件1)、且つ、本サーバシステム1においてDP(Dynamic Partitioning)機能が有効(条件2)である場合に、DP機能を用いて、短寿命FAN40の負荷を軽減させる制御を行なう。
For example, when there is a variation in predicted life among a plurality of FANs 40 (condition 1) and the DP (Dynamic Partitioning) function is valid (condition 2) in the
DPは、本サーバシステム1において、パーティションのシステム(サーバ装置3)を停止させることなくパーティション構成を動的に変更する機能である。DPにおいては、例えば、パーティションに対して、CPUやメモリ,IOユニット等のハードウェア資源を動的に追加,削除,交換(活性構成変更)することができる。なお、DPは既知の手法で実現することができ、その詳細な説明は省略する。
The DP is a function of dynamically changing the partition configuration in the
本サーバシステム1において、DPにより追加・削除を行なう単位は、パーティション構成要素であるSB,LSB(Logical System Board),IOU(PCIeボックスを含む)である。
SBホットプラグ機能を利用することで、パーティション上で動作するOSの再起動なしに、SBをパーティションに組み込み・切り離しができる。
In the
By using the SB hot plug function, the SB can be incorporated into and detached from the partition without rebooting the OS operating on the partition.
なお、このようなSBのパーティションへの組み込みや切り離しは、サーバシステム1において、事前にDP機能を有効にして一定の構成を構築済みであること、およびOSがDP機能をサポートしていること等が条件となる。
It should be noted that such incorporation or detachment of SBs into partitions is enabled in advance by enabling the DP function in the
図8は実施形態の一例としてのサーバシステム1における切替制御部116によるSB5の切り替え制御を説明するための図である。この図8においては、FAN40間において予測寿命のばらつきが生じていることが検知された場合における、この予測寿命のばらつきを解消するための5種類(パターン1〜5)の制御手法を例示する。
FIG. 8 is a diagram for describing switching control of
図8に示す例において、元の状態(オリジナル)においては(符号A1参照)、SB#0,#1が稼働状態(ON状態)であり、SB#2,#3がスタンバイ状態(SBY状態)である。このオリジナルのサーバシステム1においては、ON状態のSB#0,#1に対して、FAN#0,#1が冷却風の送風を行なっている。また、稼働中の全てのFAN#0〜#3のFAN回転数は通常回転(Normal)である。
In the example shown in FIG. 8, in the original state (original) (see reference A1),
このような状態において、負荷が高いFAN#0,#2が高温状態となり、この高温状態がFAN40#0,#2の寿命に影響を与え短寿命化を招く。また、一部のFAN#0,#2だけが高温となることにより、本サーバシステム1に備えられた複数のFAN40間において予測寿命のばらつきが生じる。
In such a state, the high
切替制御部116は、SB5の切り替え制御を行なうことで、これらのFAN40#0,#2の負荷を軽減する。これにより、特定のFAN40だけが高温となることを阻止し、本サーバシステム1に備えられた複数のFAN40間において予測寿命のばらつきを解消する。
The switching
切替制御部116は、FAN予測寿命管理部115による寿命予測の結果、複数のFAN40間において予測寿命が最も短い短寿命FAN40(予測短寿命冷却部品)と、予測寿命が最も長い長寿命FAN40(予測長寿命冷却部品)との間に、予測寿命が閾値以上(例えば、1か月以上)の差(ばらつき)が検出された場合に、SB5の構成変更を行なう構成変更制御部として機能する。
The switching
例えば、切替制御部116は、複数のFAN40間において予測寿命のばらつきが生じている場合に、本サーバシステム1がDPによる切り替えを実行可能であるかを確認する。
For example, the
本サーバシステム1がDPによる切り替えを実行可能である場合には、切替制御部116はこのDPの機能を用いたSB5の構成変更を行なう(符号A2参照)。
When the
そして、切替制御部116は本サーバシステム1において、DPを即時に実行可能であるかを確認する(符号A3参照)。
Then, the switching
例えば、切替制御部116は、メモリ12の所定の記憶領域に設定されている、本サーバシステム1においてDP機能を有効にするか否か等を示すフラグの設定値を確認することで、DPを即時実行可能であるかを判断する。
For example, the switching
確認の結果、本サーバシステム1において、DPによるSB5の切り替えを即時に実行可能である場合に、切替制御部116は、DPによるSB5の切替制御を行なう(パターン1)。
As a result of the confirmation, when it is possible to immediately execute switching of
すなわち、切替制御部116は、DPのSB切替機能を用いて、SB#2,#3をON状態にする一方で、SB#0,#1をスタンバイ状態(SBY)にする。FAN#0,#2が冷却対象とするSB#0,#1をスタンバイ状態にすることで、これらのFAN#0,#2の負荷が低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
That is, the switching
スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する熱影響が小さいSB5をDPによりON状態とするSB5として優先的に選択することが望ましい。これにより、短寿命FAN40にかかる温度負荷を効率的に分散させる。
When there are a plurality of
図9は実施形態の一例としてのサーバシステム1における温度影響情報126を例示する図である。
FIG. 9 is a diagram illustrating temperature influence
温度影響情報126は、FAN40に対するSB5の影響を数値として表す情報であり、個々のSB5の発熱が各FAN40に対して与える影響(温度影響)を表す。図9に示す例においては、SB5とFAN40との組み合わせのそれぞれに、係数Amnが設定されている(m,nはそれぞれ自然数)。係数Amnは各SB5がどのFAN40に対して熱を与えやすいかを示す値であり、熱を与えやすいほど大きな値が設定される。温度影響情報126は、事前に行なわれる試験結果等に基づいて具体的な各数値が設定されて作成され、予めメモリ12等に格納される。
The temperature influence
すなわち、温度影響情報126は、発熱しやすいユニットであるSB5が、どのFAN40に対して熱(熱影響)を与えやすいかを示す係数(Amn)を予め定義したものである。
That is, the
なお、図9においてはn個(nは自然数)のFAN#0〜#n−1と、m個(mは自然数)のSB#0〜#m−1とについての温度影響情報126を示すものである。図1に例示するサーバシステム1の構成においては、4つのFAN40と4つのSB5が搭載されているのでn=m=4となる。
In FIG. 9, the
スタンバイ状態のSB5が複数ある場合には、切替制御部116は、この温度影響情報126を参照して、短寿命FAN40について係数Amnの値が最も小さいSB5をDPによりON状態とするSB5として選択する。すなわち、切替制御部116は、短寿命FAN40への熱影響が最も小さいSB5を選択する。これにより、短寿命FAN40にかかる温度負荷を効率的に分散させることができる。
When there are a plurality of SB5 in the standby state, the switching
このように、パターン1においては、切替制御部116は、複数のSB5のうち、短寿命FAN40に対する熱影響が最も低いSB5を稼働させる構成変更を行なう。これにより、稼働させたSB5に対応するFAN40を作動させ、短寿命FAN40の負荷を軽減させるのである。
As described above, in the
なお、切替制御部116は、スタンバイ状態のSB5が複数ある場合に、短寿命FAN40と物理的に近い位置にあるSB5をDPによりON状態とするSB5として優先して選択してもよい。
When there are a plurality of
一方、確認の結果、本サーバシステム1において、DPによるSB5の切り替えを即時に実行可能でない場合に、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう(パターン2)。
On the other hand, as a result of confirmation, in the case where the
すなわち、切替制御部116は、DPのホットプラグ機能を用いて、スタンバイ状態であったSB#2,#3をON状態にすることで、これらのSB#2,#3を追加する。
That is, the switching
これにより、SB#0〜#3の全てがON状態になり、SB#0〜#3の間において負荷が分散される。従って、FAN#0,#2が冷却対象とするSB#0,#1の負荷が低減して発熱量が低下し、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
As a result, all the
このように、パターン2においては、切替制御部116は、SB5を追加する構成変更を行ない、追加されたSB5に対応するFAN40を作動させることで、短寿命FAN40の負荷を軽減させるのである。
As described above, in the
なお、スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40と物理的に遠い位置にあるSB5を優先してON状態にすることが望ましい。
When there are a plurality of
一方、本サーバシステム1がDPによる切り替えを実行不可である場合には、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なう。すなわち、リザーブドSB5をON状態にすることで、SB5の構成変更を行なう(符号A4参照)。
On the other hand, when the
切替制御部116は本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能であるかを確認する(符号A6参照)。例えば、切替制御部116は、メモリ12の所定の記憶領域に設定されている、本サーバシステム1においてリザーブドSB5を用いた静的なSB5の切り替えを有効にするか否か等を示すフラグの設定値を確認することで、当該切り替えを実行可能であるかを判断する。
The switching
確認の結果、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合に、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行なう(パターン3)。
As a result of the confirmation, in the
すなわち、切替制御部116は、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。
That is, the switching
これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
As a result, in addition to
スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する影響が小さいリザーブドSB5をDPによりON状態とするSB5として優先的に選択することが望ましい。
When there are a plurality of
一方、確認の結果、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に不可である場合には、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう(パターン4)。
On the other hand, as a result of confirmation, when it is impossible to immediately switch
すなわち、切替制御部116は、本サーバシステム1に稼働率が低い時間帯において、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。
That is, in a time zone where the operation rate of the
これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
As a result, in addition to
また、リザーブドSB5を用いたSB5の切り替えが行なわれるまでの間は、稼働中のFAN#0〜#3のFAN回転数をそれぞれ上げる。これにより、本サーバシステム1の筐体1a内の温度が低下し、結果的にFAN#0,2の負荷が低減することになる。
In addition, during switching of
本サーバシステム1がDPによる切り替えと、リザーブドSB5を用いた静的なSB5の切り替えとのいずれも実行できない場合もある(符号A5参照)。
In some cases, the
このような場合においては、稼働中全てのFAN40のFAN回転数を上げてHighにする(パターン5)。これにより、本サーバシステム1の筐体1a内の温度が低下し、結果的にFAN#1,2の負荷(高温負荷)が低減することになる。
In such a case, the fan rotational speeds of all the
このように、切替制御部116は、複数のFAN40の回転速度を高くする制御を行なうことで、短寿命FAN40の負荷を軽減させるのである。
As described above, the switching
また、切替制御部116は、FAN予測寿命管理部115によって算出された各FAN40の予測寿命に基づいて、本サーバシステム1内における複数のFAN40の最適配置を決定する機能(FAN最適配置決定機能)を有する。
In addition, the switching
例えば、本サーバシステム1がn個のFAN40をスロット位置に搭載する場合に、その搭載のしかたは、nPn−1通り存在する。切替制御部116は、これらのnPn−1通りのFAN40とスロット位置との全ての組み合わせを列挙する。
For example, when the
図10は実施形態の一例としてのサーバシステム1におけるFAN40とスロット位置との組み合わせをテーブル状に例示する図である。
FIG. 10 is a diagram illustrating a combination of the
この図10に示す例においては、4つのFAN40(FAN ID=A,B,C,D)を、識別子POSが“101”,“102”,“103”,“104”である4つのスロットに取り付ける全ての組み合わせ(4P3=24通り)を示している。 In the example shown in FIG. 10, four FANs 40 (FAN ID = A, B, C, D) are assigned to four slots whose identifiers POS are "101", "102", "103", "104". All combinations ( 4 P 3 = 24 ways) to be attached are shown.
以下、FAN ID=Aで特定されるFAN40をFAN(A)と表す。同様に、FAN IDB,C,Dで特定されるFAN40を、それぞれFAN(B),FAN(C),FAN(D)と表す。
Hereinafter, the
また、FAN予測寿命管理部115によって算出されたFAN(A)の残寿命life_fan(A)=0.5とする。同様に、FAN(B)の残寿命life_fan(B)=0.7,FAN(C)の残寿命life_fan(C)=0.4,FAN(D)の残寿命life_fan(D)=0.3とする。
In addition, it is assumed that the remaining life life_fan (A) of FAN (A) calculated by the FAN predicted
さらに、識別子101のスロット位置が寿命に与える影響を表す数値life_static(101)=0.9とする。同様に、識別子102のスロット位置が寿命に与える影響を表す数値life_static(102)=0.9,識別子103のスロット位置が寿命に与える影響を表す数値life_static(103)=0.8,識別子104のスロット位置が寿命に与える影響を表す数値life_static(104)=0.7とする。
Furthermore, it is assumed that the value life_static (101) = 0.9, which represents the influence of the slot position of the
図10に示すテーブルには、各FAN40の組み合わせについて、スロット位置による影響を考慮した残寿命[life_fan(ID)-(1- life_static(POS))]が登録されている。
In the table shown in FIG. 10, the remaining life [life_fan (ID) − (1−life_static (POS))] is registered for each combination of the
以下、スロット位置による影響を考慮した残寿命を更新済み残寿命といい、life(ID,POS)と表す場合がある。 Hereinafter, the remaining life considering the influence of the slot position is referred to as updated remaining life, and may be expressed as life (ID, POS).
life(ID,POS) = life_fan(ID) - (1 - life_static(POS))
さらに、図10に例示するテーブルには、各組み合わせ毎に、当該組み合わせに含まれる各FAN40の更新済み残寿命life(ID,POS)を昇順に並べ換えた情報(更新済み残寿命の昇順)も、その右側に併記されている。
life (ID, POS) = life_fan (ID)-(1-life_static (POS))
Furthermore, in the table illustrated in FIG. 10, information in which the updated remaining life (life, ID, POS) of each
この昇順に並べ換えられた更新済み残寿命life(ID,POS)の組み合わせにおいて、その最小値を代表値とする。 In the combination of the updated remaining life life (ID, POS) sorted in ascending order, the minimum value is taken as a representative value.
これにより、この図10に示すテーブルを参照することで、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせを容易に特定することができる。また、各組み合わせにおける代表値を参照することで、更新済み残寿命の最小値の比較を容易に行なうことができる。
Thus, by referring to the table shown in FIG. 10, it is possible to easily identify the combination of the
切替制御部116は、FAN40とスロット位置との全ての組み合わせの中から、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせを1組選択し、FAN40とスロット位置との最適な組み合わせ(FAN40の最適配置)として採用する。
The switching
また、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせが複数ある場合には、更新済み残寿命の2番目に小さい値や3番目に小さい値を適宜順番に比較し、更新済み残寿命が最も大きい組み合わせを1組選択(採用)することが望ましい。
In addition, when there are a plurality of combinations of the
例えば、図10に示す例においては、更新済み残寿命の最小値が最も大きい組み合わせは、更新済み残寿命の最小値が0.2である、No.6,12,17,18,20,22,24で特定される各組み合わせである。これらのうち、更新済み残寿命の最小値が2番目に小さい組み合わせは、更新済み残寿命の2番目に小さい値0.3である、No.17,18で特定される2つの組み合わせである(図10の符号P1参照)。 For example, in the example shown in FIG. 10, the combination having the largest updated remaining life value is the one having the least updated remaining life value of 0.2. It is each combination specified by 6, 12, 17, 18, 20, 22, 24. Among these, the combination in which the minimum value of the updated remaining life is the second smallest is the second smallest value of the updated remaining life, 0.3. This is a combination of two identified by 17 and 18 (see the symbol P1 in FIG. 10).
これらの2つの組み合わせは、昇順に並べ換えた更新済み残寿命の組み合わせが同じであるので、切替制御部116は、これらのいずれの組み合わせを選択してもよい。
Since these two combinations are the same combination of the updated remaining life sorted in ascending order, the switching
切替制御部116によって決定されたFAN40の最適配置は、FAN最適配置情報として管理端末装置2に作業指示情報とともに送信される。
The optimal arrangement of the
作業指示情報は、保守作業員に対して提示される作業指示に関する情報であり、サーバシステム1におけるFAN40の配置を変更させる作業指示を含む。このFAN40の配置を変更させる作業指示は、FAN最適配置情報に示される配置(最適配置)従って、保守作業員に、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更させる。
The work instruction information is information on a work instruction presented to the maintenance worker, and includes a work instruction for changing the arrangement of the
[管理端末装置2]
管理端末装置2は、CE等の保守作業員やシステム管理者が使用する情報処理装置であり、CPU21の他、図示しないメモリ,ディスプレイ,キーボードやマウス等の入力装置を備える。
[Management terminal device 2]
The
CPU21は、メモリ等の記憶装置に格納されたOSや管理端末用プログラムを実行することで、FAN最適配置情報抽出部22および結果表示制御部23としての機能を実現する。
The
FAN最適配置情報抽出部22は、サーバ装置3から作業指示情報とともに送信されたFAN最適配置情報を抽出する。
The FAN optimum arrangement
結果表示制御部23は、FAN最適配置情報抽出部22によって抽出されたFAN最適配置情報を、図示しないディスプレイに表示させたり、プリンタを介して印刷させることで出力させる。
The result
保守作業員は、このようにして出力されたFAN最適配置情報に従って、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更させる。
The maintenance worker changes the position of the
(B)動作
上述の如く構成された実施形態の一例としてのサーバシステム1におけるFAN40の最適配置制御方法の概要を、図11に示すフローチャート(ステップB1〜B9)に従って説明する。
(B) Operation The outline of the method for controlling the optimal arrangement of the
本サーバシステム1に電源投入が行なわれると(装置パワーオン)、ステップB1において、各FAN40が回転を開始する。
When the
ステップB2において、MMB10が各種監視を開始する。具体的には、構成情報管理部111,温度情報管理部112およびFAN回転数管理部113が、本サーバシステム1に備えられた各SB5の構成や、各FAN40の温度,各FAN40の回転数の監視をそれぞれ行なう。
In step B2, the
ステップB3において、FAN予測寿命管理部115が、各FAN40の予測寿命を演算する。ステップB4において、切替制御部116が、DPを用いたSB5の構成変更やリザーブドSB5を用いたSB5の切り替え、FAN回転数等を行なう。なお、これらのステップB3,B4の処理は、本サーバシステム1において日常的に行なわれる(デイリー監視)。
In step B3, the FAN predicted
また、本サーバシステム1の定期点検時において、以下のステップB5,B6の処理が行なわれる。
Further, at the time of periodic inspection of the
すなわち、ステップB5において、FAN予測寿命管理部115が各FAN40の予測寿命を演算する。ステップB6において、切替制御部116が、FAN40の最適配置を決定し、管理端末装置2を介して保守作業員等にFAN最適配置情報と作業指示情報とを通知する。保守作業員は、通知されたFAN最適配置情報に応じて、FAN40の配置交換等の作業を行なう。作業終了後には、必要に応じて装置パワーオンが行なわれ、本フローチャートの先頭からの処理が再度行なわれてもよい。
That is, in step B5, the FAN predicted
上記のステップB1〜B6の処理は、本サーバシステム1の保守対応期間において行なわれるものであり、本サーバシステム1が稼働を開始してから例えば5年が経過するまでの期間に行なわれる。
The processes in steps B1 to B6 described above are performed in the maintenance support period of the
本サーバシステム1が稼働を開始してから例えば5年が経過した後は、保守対応期間が終了する。
After five years, for example, have elapsed since the
ステップB7において、本サーバシステム1のオーバーホールの実施の有無を確認する。確認の結果、オーバーホールを行なう場合には(ステップB7の“有”ルート参照)、オーバーホールを行なった後、装置パワーオンが行なわれ、本フローチャートの先頭からの処理が再度行なわれる。
In step B7, it is checked whether or not overhaul of the
ステップB7における確認の結果、オーバーホールを行なわない場合には(ステップB7の“無”ルート参照)、ステップB8に移行する。 As a result of confirmation in step B7, if overhaul is not to be performed (see the "absent" route in step B7), the process proceeds to step B8.
ステップB8において、FAN予測寿命管理部115が、各FAN40の予測寿命を演算する。ステップB9において、切替制御部116が、DPを用いたSB5の構成変更やリザーブドSB5を用いたSB5の切り替え、FAN回転数等を行なう。なお、これらのステップB8,B9の処理も、本サーバシステム1において日常的に行なわれる(デイリー監視)。また、ステップB7〜B9の処理は、本サーバシステム1が稼働を開始してから例えば5年が経過した後に行なわれる。
In step B8, the FAN predicted
その後、本サーバシステム1の稼働処理を終了する。
Thereafter, the operation process of the
次に、実施形態の一例としてのサーバシステム1におけるFAN40の最適配置管理を実現するための各機能構成部の処理を、図12に示すシーケンス図に従って説明する。
Next, processing of each functional configuration unit for realizing the optimal arrangement management of the
先ず、管理端末装置2において、保守プログラムの実行が開始される(符号C1参照)。
First, in the
サーバ装置3の各SB5のBMC50が、自身が動作するSB5の構成を監視し、MMB10のメモリ12の構成情報121に記録する(符号C2参照)。
The
また、各SB5のBMC50が、自身が動作するSB5に対応するFAN40の温度を監視し、MMB10のメモリ12の温度情報122に記録する(符号C3参照)。さらに、BMC50が、自身が動作するSB5に対応するFAN40の回転数の監視を行ない、検出した各FAN40の回転数をFAN回転数情報123に記録する(符号C4参照)。
Further, the
MMB10において、構成情報管理部111が構成情報121からSB5の構成情報を取得する(符号C5参照)。
In the
MMB10において、温度情報管理部112が温度情報122からFAN40の温度情報を取得する(符号C6参照)。
In the
MMB10において、FAN回転数管理部113がFAN回転数情報123からFAN40の回転数の履歴を取得する(符号C7参照)。
In the
FRU4においては、FANの配置をFAN配置履歴情報124に記録する(符号C8参照)。
In the
MMB10において、FAN予測寿命管理部115が、各FAN40の寿命予測を行なう(符号C9参照)。FAN予測寿命管理部115は算出した各FAN40の予測寿命を予測寿命履歴情報125に記録する。
In the
MMB10において、切替制御部116が、DPを用いたSB5の構成変更(DP切替え)やリザーブドSB5を用いたSB5の切り替え(SB切替え)、FAN回転数等を行なう(符号C10参照)。
In the
また、切替制御部116は、FAN40の最適配置を決定する(符号C11参照)。決定されたFAN最適配置情報は、管理端末装置2のFAN最適配置情報抽出部22に通知され、FAN最適配置情報抽出部22はFAN最適配置情報を取得する(符号C12参照)。
Further, the switching
保守作業員は、管理端末装置2において、FAN最適配置情報を取得する。そして、このFAN最適配置情報に示される配置(最適配置)に従って、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更する作業を行なう(符号C13参照)。
The maintenance worker acquires the FAN optimum arrangement information in the
次に、実施形態の一例としてのサーバシステム1におけるFAN最適配置を行なうための制御を、図13および図14に示すフローチャート(ステップD1〜D21)に従って説明する。図13はFAN最適配置を実現するための監視処理を示し(ステップD1〜D13)、図14はFAN最適配置にかかる保守作業の処理を示す(ステップD14〜D21)。
Next, control for performing the FAN optimal arrangement in the
図13のステップD1において、FAN予測寿命管理部115は、各FAN40の予測寿命を算出する。
In step D1 of FIG. 13, the FAN predicted
図13のステップD2において、切替制御部116は、定期保守作業の実施であるかを確認する。確認の結果、定期保守作業の実施でない場合には(ステップD2のNOルート参照)、図13のステップD3に移行する。
In step D2 of FIG. 13, the switching
ステップD3おいて、切替制御部116は、本サーバシステム1において、DPによるSB5の切り替えを実行可能であるかを確認する。
In step D3, the switching
確認の結果、DPによるSB5の切り替えが可能である場合には(ステップD3のYESルート参照)、図13のステップD9に移行する。ステップD9において、切替制御部116は、DP機能によるSB5の切り替えを行なうための調整を開始する。図13のステップD10において、切替制御部116は、本サーバシステム1において、DPを即時に実行可能であるかを確認する。
As a result of confirmation, if switching of
確認の結果、DPを即時実行可能である場合には(ステップD10のYESルート参照)、 図13のステップD11において、DP機能によるSB5の切替制御を行なう。その後、ステップD1に戻る。
As a result of the check, if it is possible to immediately execute DP (see YES route in step D10), switching control of
また、ステップD10における確認の結果、DPを即時実行可能でない場合には(ステップD10のNOルート参照)、図13のステップD12に移行する。ステップD12において、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう。これにより、SB#0〜#3の間において負荷が分散され、ステップD1において算出された短寿命FAN30の回転数を低下させ、その負荷を軽減させることができる。その後、処理はステップD1に戻る。
If DP can not be immediately executed as a result of confirmation in step D10 (refer to NO route in step D10), the process proceeds to step D12 in FIG. In step D12, the switching
ステップD3における確認の結果、DPによるSB5の切り替えが可能でない場合には(ステップD3のNOルート参照)、図13のステップD4に移行する。ステップD4においては、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なうことが可能であるかを確認する。確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを行なうことができる場合には(ステップD4のYESルート参照)、図13のステップD5に移行する。
As a result of confirmation in step D3, if switching of
ステップD5においては、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なうための調整を開始する。図13のステップD6において、切替制御部116は、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能であるかを確認する。
In step D5, the switching
確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合には(ステップD6のYESルート参照)、図13のステップD13に移行する。
As a result of confirmation, when it is possible to immediately execute switching of
ステップD13において、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行ない、その後、ステップD1に戻る。
In step D13, the switching
一方、ステップD6における確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能でない場合には(ステップD6のNOルート参照)、図13のステップD7に移行する。
On the other hand, as a result of confirmation in step D6, when it is not possible to immediately execute switching of
ステップD7において、切替制御部116は、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう。その後、ステップD1に戻る。
In step D7, the switching
ステップD4における確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを行なうことができない場合には(ステップD4のNOルート参照)、図13のステップD8に移行する。
If
ステップD8において、切替制御部116は、稼働中の全てのFAN40のFAN回転数をHighに上げるよう調整(FAN回転数調整)を行なう。その後、ステップD1に戻る。
In step D8, the switching
また、ステップD2における確認の結果、定期保守の実施である場合には(ステップD2のYESルート参照)、図14のステップD14に移行する。 Moreover, as a result of confirmation in step D2, when it is implementation of regular maintenance (refer the YES route | root of step D2), it transfers to step D14 of FIG.
ステップD14においては、例えばCEが、本サーバシステム1に対する保守作業を開始する。
In step D14, for example, the CE starts maintenance work on the
図14のステップD15において、CEは管理端末装置2を用いて保守プログラムを実行させる。
In step D15 of FIG. 14, the CE causes the
図14のステップD16において、FAN予測寿命管理部115は、各FAN40の予測寿命の算出を行なう。図14のステップD17において、切替制御部116は、FAN40の予防交換が必要であるかを確認する。
In step D16 of FIG. 14, the FAN predicted
ステップD17における確認の結果、FAN40の予防交換が必要であると判断された場合には(ステップD17におけるYESルート参照)、図14のステップD20において、CEによるFAN40の交換(予防交換)が行なわれる。その後、図14のステップD21において、CEによる保守作業が完了される。CEは、例えば、管理端末装置2において、保守作業が完了した旨の入力操作を行なう。
As a result of confirmation in step D17, if it is determined that preventive replacement of
また、ステップD17における確認の結果、FAN40の予防交換が不要であると判断された場合には(ステップD17のNOルート参照)、図14のステップD18に移行する。
Further, as a result of confirmation in step D17, when it is determined that the preventive replacement of the
ステップD18において、CEは、FAN40の配置換えが必要であるかを確認する。例えば、CEは、管理端末装置2において示されたFAN最適配置情報が、現状のサーバシステム1におけるFAN40の状態と同じである場合には、FAN40の配置換えは不要であると判断する。
In step D18, the CE confirms whether relocation of the
確認の結果、FAN40の配置換えが必要であると判断された場合には(ステップD18のYESルート参照)、図14のステップD19に移行する。
As a result of confirmation, when it is determined that the relocation of the
ステップD19においては、CEがFAN最適配置情報に合わせて、サーバシステム1におけるFAN40の配置換えを実施する。その後、ステップD21に移行する。
In step D19, the CE performs relocation of the
次に、実施形態の一例としてのサーバシステム1のMMB10の処理を、図15に示すフローチャート(ステップE1〜E16)に従って説明する。
Next, processing of the
ステップE1において、FAN予測寿命管理部115は、変数“life_fan(ID)”および変数“life_static(POS)”にそれぞれ1を設定することで初期化する(life_fan(ID) = 1,life_static(POS) = 1)。
In step E1, the FAN predicted
なお、life_fan(ID)の初期化は全てのFAN40について行なう。また、life_static(POS)の初期化は全てのスロット位置について行なう。
The initialization of life_fan (ID) is performed for all the
ステップE2において、温度情報管理部112は、各FAN40の温度をポーリングにより取得(サンプリング)する。また、変数“count”に0を設定することで初期化する。
In step E2, the temperature
ステップE3において、構成情報管理部111は、各FAN40のFAN ID(ID)を確認し、構成情報121に登録されていない新たなFAN40が本サーバシステム1に取り付けられている(新設されている)かを確認する。
In step E3, the configuration
新しいFAN40が取り付けられている場合には(ステップE3のYESルート参照)、ステップE4に移行する。ステップE4においては、この新設されたFAN40についてlife_fan(ID)=1とすることで初期化を行なう。
If a
その後、ステップE5において、温度情報管理部112は、各FAN40の温度を温度情報12に記録する。また、温度情報12は、一定時間Sだけ待機した後にcountに1を加算(インクリメント)する。
Thereafter, in step E5, the temperature
その後、ステップE6において、温度情報管理部112は、countの値がN未満であるかを確認する。ここで、Nは、任意の正の整数であり、例えば、サンプリング数として経験上、充分であるとみなされる数が設定されることが望ましい。確認の結果、countの値がN未満である場合(count < N;ステップE6のYESルート参照)、ステップE5に戻る。
Thereafter, in step E6, the temperature
一方、count が N以上である場合には(ステップE6のNOルート参照)、ステップE7に移行する。 On the other hand, if count is equal to or greater than N (see the NO route of step E6), the process moves to step E7.
ステップE7においては、FAN予測寿命管理部115が、サンプリングしたFAN40の温度に基づき、FAN40の予測寿命を算出する。すなわち、FAN予測寿命管理部115は、上記の式(1)〜(3)を用いて、FAN40の予測寿命を算出する。FAN予測寿命管理部115は、各FAN40の温度を寿命に変換するのである。
In step E7, the FAN predicted
なお、FAN40の温度に基づいてFAN40の予測寿命を算出する手法は、図16に示すフローチャートを用いて後述する。 In addition, the method of calculating the estimated life of FAN40 based on the temperature of FAN40 is later mentioned using the flowchart shown in FIG.
また、FAN予測寿命管理部115は、各FAN40について、それぞれのサンプリングデータ毎に消費寿命laを算出し、それぞれのサンプリングデータ毎に、life_fan(ID), life_static(SLOT)から消費寿命laを減算する。
In addition, the FAN predicted
ステップE8において、切替制御部116は、本サーバシステム1が保守作業モードであるか否かを確認する。すなわち、MMB10ファームウェアで定期保守の指示がされているかを確認する。
In step E8, the switching
確認の結果、保守作業である場合(ステップE8のYESルート)、ステップE14に移行する。ステップE14において、切替制御部116は、FAN予測寿命管理部115によって算出された各FAN40の予測寿命に基づいて、本サーバシステム1内における複数のFAN40の最適配置を決定する。
なお、このFAN40の最適配置の決定方法の詳細は、図17に示すフローチャートを用いて後述する。
As a result of confirmation, if it is maintenance work (YES route in step E8), the process proceeds to step E14. In step E14, the switching
The details of the method of determining the optimal arrangement of the
切替制御部116は、決定したFAN40の最適配置を管理端末装置2に通知する。管理端末装置2においては、結果表示制御部23が、ディスプレイにFAN40の最適配置を表示させる。
The switching
ステップE15において、FAN予測寿命管理部115は、変数“life_static(POS)”に1を設定することで初期化する(life_static(POS) = 1)。その後、ステップE2に戻る。
In step E15, the FAN predicted
ステップE8における確認の結果、本サーバシステム1が保守作業モードでない場合には(ステップE8のNOルート参照)、ステップE9に移行する。
If the
ステップE9においては、切替制御部116は、予測寿命が最も長いFAN40(長寿命FAN40)と予測寿命が最も短いFAN40(短寿命FAN40)との予測寿命の差が所定値(例えば、1か月)以上であるかを確認する。
In step E9, the switching
確認の結果、長寿命FAN40の予測寿命と短寿命FAN40の予測寿命との差が1ヶ月未満である場合には(ステップE9のNOルート参照)、ステップE2に戻る。
As a result of confirmation, when the difference between the predicted life of the
一方、長寿命FAN40の予測寿命と短寿命FAN40の予測寿命との差が1ヶ月以上である場合には(ステップE9のYESルート参照)、ステップE10において、切替制御部116は、次に、DP機能が使用可能であるか否かを確認する。
On the other hand, if the difference between the predicted life of the
確認の結果、DP機能が使用可能である場合には(ステップE10のYESルート参照)、ステップE16に移行する。ステップE16において、切替制御部116は、SB5の切り替えを行なう。なお、このSB5の切替処理におけるSB5の選択方法の詳細は、図18に示すフローチャートを用いて後述する。その後、処理はステップE2に戻る。
As a result of confirmation, if the DP function is available (see YES route in step E10), the process proceeds to step E16. In step E16, the switching
ステップE10における確認の結果、DP機能が使用可能でない場合には(ステップE10のNOルート参照)、ステップE11に移行する。 As a result of confirmation in step E10, when the DP function is not available (see the NO route of step E10), the process proceeds to step E11.
ステップE11においては、本サーバシステム1においてリザーブドSB5が使用可能であるかを確認する。
In step E11, it is checked whether the
リザーブドSB5が使用可能でない場合には(ステップE11のNOルート参照)、ステップE2に戻る。 If Reserved SB5 is not available (see the NO route of step E11), the process returns to step E2.
また、リザーブドSB5が使用可能である場合には(ステップE11のYESルート参照)、ステップE12に移行する。 If Reserved SB5 is available (see YES route in step E11), the process moves to step E12.
ステップE12においては、本サーバシステム1がパワーオフ(POFF)しているかを確認する。確認の結果、本サーバシステム1がパワーオフしている場合には(ステップE12のYESルート参照)、ステップE16に移行する。
In step E12, it is confirmed whether the
また、ステップE12における確認の結果、本サーバシステム1がパワーオフしていない場合には(ステップE12のNOルート参照)、ステップE13に移行する。
If the
ステップE13においては、切替制御部116は、本サーバシステム1内の各FAN40の回転数を上げる。その後、ステップE2に戻る。
In step E13, the switching
次に、実施形態の一例としてのサーバシステム1におけるFAN予測寿命管理部115によるFAN40の予測寿命を算出方法を、図16に示すフローチャート(ステップF1〜F4)に従って説明する。以下の処理は、各FAN40のそれぞれに対して行なわれる。
Next, a method of calculating the predicted life of the
ステップF1において、FAN予測寿命管理部115は、FAN40に関して、2通りの温度T1,T2のそれぞれでの寿命を、カタログ値や実験値に基づいて取得する。これらの値は、予めメモリ12に格納してもよく、また、CE等が入力してもよい。
In step F1, the FAN predicted
FAN予測寿命管理部115は、上記式(1),(2)に基づいて2つの式(連立方程式)を立て(ステップF2)、定数A,Bについて解く(ステップF3)。
The FAN predicted
ステップF4において、FAN予測寿命管理部115は、上記式(3)に基づき、消費寿命lを算出し、処理を終了する。
In step F4, the FAN estimated
次に、実施形態の一例としてのサーバシステム1における切替制御部116によるFAN40の最適配置の決定方法を図17に示すフローチャート(ステップG1〜G5)に従って説明する。
Next, a method of determining the optimal arrangement of the
ステップG1において、切替制御部116は、本サーバシステム1がn個のFAN40を搭載する場合に、切替制御部116は、これらのFAN40とスロット位置との全ての組み合わせ(nPn−1通り)を列挙する。
In step G1, when the
ステップG2において、切替制御部116は、nPn−1通りのFAN40とスロット位置との組み合わせの中から1つの組み合わせを選択し、スロット位置による影響を考慮した更新済み残寿命life(ID,POS)を算出する。
In step G2, the switching
更新済み残寿命life(ID,POS) = life_fan(ID) - (1 - life_static(POS))
ステップG3において、切替制御部116は、ステップG2において選択した組み合わせ内における更新済み残寿命life(ID,POS)の最小値を求め、当該組み合わせの代表値とする。
Updated remaining life life (ID, POS) = life_fan (ID)-(1-life_static (POS))
In step G3, the switching
ステップG4において、切替制御部116は、FAN40とスロット位置との全ての組み合わせについて、ステップG2,G3の処理を行なったかを確認する。
In step G4, the switching
確認の結果、処理がまだ行なわれていない組み合わせがある場合には(ステップG4のNOルート参照)、ステップG2に戻る。 As a result of confirmation, if there is a combination that has not been processed yet (see NO route in step G4), the process returns to step G2.
全ての組み合わせについて、ステップG2,G3の処理を行なった場合に(ステップG4のYESルート参照)、ステップG5に移行する。 If the processes in steps G2 and G3 have been performed for all combinations (see YES route in step G4), the process moves to step G5.
ステップG5において、切替制御部116は、全ての組み合わせの内、最も代表値の大きい組み合わせを、FAN40の最適配置として決定する。
In step G5, the switching
また、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせが複数ある場合には、更新済み残寿命の2番目に小さい値や3番目に小さい値を適宜順番に比較し、更新済み残寿命が最も大きい組み合わせを1組選択(採用)することが望ましい。
In addition, when there are a plurality of combinations of the
切替制御部116は、決定したFAN40の最適配置を管理端末装置2に通知し、管理端末装置2においては、結果表示制御部23がディスプレイに表示させる。
The switching
その後、処理を終了する。 Thereafter, the process ends.
次に、実施形態の一例としてのサーバシステム1における切替制御部116によるDP機能を用いたSB5の切り替え時のSB5の選択方法を、図18に示すフローチャート(ステップH1〜H4)に従って説明する。
Next, a method of selecting SB5 at the time of switching SB5 using the DP function by the switching
ステップH1において、発熱しやすいユニットであるSB5がどのFAN40に対して熱を起こしやすいかを示す係数(Amn)を予め定義した温度影響情報126を用意する。
In step H1, the
ステップH2において、切替制御部116は、複数のFAN40のうち、予測寿命が短いものから順に、処理対象FAN40として選択する。
In step H <b> 2, the switching
ステップH3において、切替制御部116は、温度影響情報126を参照して、処理対象FAN40(短寿命FAN40)について、当該処理対象FAN40に対応するSB5以外のSB5であって、最も係数Amnの値が小さいSB5を選択する。
In step H3, the switching
ステップH4において、切替制御部116は、全てのFAN40について、当該FAN40への熱影響が最も小さいSB5の選択を行なったかを確認する。
In step H4, the switching
確認の結果、当該FAN40への熱影響が最も小さいSB5の選択が行なわれていないFAN40がある場合には(ステップH4のNOルート参照)、ステップH2に戻る。また、全てのFAN40について、当該FAN40への熱影響が最も小さいSB5の選択が行なわれた場合には(ステップH4のYESルート参照)、処理を終了する。
As a result of the check, if there is a
(C)効果
このように、本発明の一実施形態としてのサーバシステム1によれば、DPによるSB5の切り替えを即時に実行可能である場合に、切替制御部116は、DPによるSB5の切替制御を行なう。切替制御部116は、DPのSB切替機能を用いて、SB#2,#3をON状態にする一方で、SB#0,#1をスタンバイ状態(SBY)にする。FAN#0,#2が冷却対象とするSB#0,#1をスタンバイ状態にすることで、これらのFAN#0,#2の負荷が低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
(C) Effects As described above, according to the
また、DPによるSB5の切り替えを即時に実行可能でない場合に、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう。すなわち、切替制御部116は、DPのホットプラグ機能を用いて、スタンバイ状態であったSB#2,#3をON状態にすることで、これらのSB#2,#3を追加する。
When the switching of the
これにより、SB#0〜#3の全てがON状態になり、SB#0〜#3の間において負荷が分散される。従って、FAN#0,#2が冷却対象とするSB#0,#1の負荷が低減して発熱量が低下し、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
As a result, all the
温度影響情報126を用いることで、短寿命FAN40に対して熱(熱影響)を与えやすいSB5を容易に特定することができる。
By using the
DPによる切り替えを実行不可である場合には、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なう。
When the switching by DP can not be performed, the switching
リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合に、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行なう。すなわち、切替制御部116は、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。
When switching of
これにより、FAN#0,#2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
As a result, in addition to
リザーブドSB5を用いた静的なSB5の切り替えを即時に行なうことができない場合には、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう。すなわち、切替制御部116は、本サーバシステム1に稼働率が低い時間帯において、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。
If switching of
これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
As a result, in addition to
スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する影響が小さいSB5をDPによりON状態とするSB5として優先的に選択することで、短寿命FAN40にかかる温度負荷を効率的に分散させることができる。
When there are a plurality of SB5 in the standby state, the switching
(D)その他
本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
(D) Others The present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present invention.
開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。 The disclosed technology is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present embodiment. The configurations and processes of the present embodiment can be selected as needed, or may be combined as appropriate.
上述した実施形態においては、切替制御部116が、DPのホットプラグ機能により、SB5の追加を行なうことで、稼働するSB5の数を増やし、作動するFAN40とを増やすことで短寿命FAN40の負荷を軽減しているが、これに限定されるものではない。例えば、切替制御部116は、SB切替えにより、リザーブドSB5を追加で稼働させることで、稼働するSB5の数を増やし、差動するFAN40とを増やすことで短寿命FAN40の負荷を軽減してもよい。
In the embodiment described above, the switching
また、上述した実施形態においては、切替制御部116が、短寿命FAN40に対する熱影響が最も低いSB5をDPのホットプラグ機能により稼働させることで、作動するFAN40を増やし、短寿命FAN40の負荷を軽減しているが、これに限定されるものではない。
Further, in the embodiment described above, the switching
例えば、切替制御部116は、SB切替えにより、短寿命FAN40に対する熱影響が最も低いSB5をDPのホットプラグ機能により稼働させてもよく、これにより差動するFAN40を増やし、短寿命FAN40の負荷を軽減してもよい。
For example, the switching
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。 Moreover, it is possible for a person skilled in the art to carry out and manufacture the present embodiment from the above disclosure.
(E)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(E) Appendices The following appendices are further disclosed regarding the above embodiment.
(付記1)
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
前記複数の冷却部品の温度を検出する温度検出部と、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部と
を備えることを特徴とする、情報処理装置。
(Supplementary Note 1)
Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
A temperature detection unit that detects the temperatures of the plurality of cooling components;
A life prediction unit that performs life prediction of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. And a configuration change control unit configured to change the configuration of the component to be cooled.
(付記2)
前記構成変更制御部が、冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、付記1記載の情報処理装置。
(Supplementary Note 2)
The information processing apparatus according to
(付記3)
前記構成変更制御部が、前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、付記1記載の情報処理装置。
(Supplementary Note 3)
The configuration change control unit performs a configuration change in which the cooling target component having the lowest thermal influence on the predicted short-lived cooling component is operated among the plurality of cooling target components, and the cooling corresponding to the cooling target component operated. The information processing apparatus according to
(付記4)
前記構成変更制御部が、当該情報処理装置を停止させることなくパーディションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
ことを特徴とする、付記1〜3のいずれか1項に記載の情報処理装置。
(Supplementary Note 4)
The configuration change control unit is configured to change the configuration of the component to be cooled using a first configuration change function capable of changing the hardware resource of the partition without stopping the information processing apparatus. The information processing apparatus according to any one of
(付記5)
前記構成変更制御部が、前記保守対象部品を切り離し、当該情報処理装置の再起動後に前記保守対象部品に代えて予備保守対象部品を動作させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
ことを特徴とする、付記1〜3のいずれか1項に記載の情報処理装置。
(Supplementary Note 5)
The configuration change control unit separates the maintenance target component, and uses the second configuration change function to operate the spare maintenance target component instead of the maintenance target component after restarting the information processing apparatus. The information processing apparatus according to any one of
(付記6)
前記構成変更制御部が、前記複数の冷却部品の回転速度を高くする制御を行なう
ことを特徴とする、付記1〜5のいずれか1項に記載の情報処理装置。
(Supplementary Note 6)
The information processing apparatus according to any one of
(付記7)
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
プロセッサとを備える情報処理装置において、
前記複数の冷却部品の温度を検出し、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行ない、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させる、冷却部品管理プログラム。
(Appendix 7)
Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
An information processing apparatus including a processor;
Detecting temperatures of the plurality of cooling components;
Predicting the life of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. A cooling component management program, which causes the processor to execute a process of changing the configuration of the component to be cooled, in the case where it is detected.
(付記8)
冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
処理を、前記プロセッサに実行させることを特徴とする、付記7記載の冷却部品管理プログラム。
(Supplementary Note 8)
The cooling component management program according to
(付記9)
前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
処理を、前記プロセッサに実行させることを特徴とする、付記7記載の冷却部品管理プログラム。
(Appendix 9)
Among the plurality of parts to be cooled, a configuration change is made to operate the part to be cooled having the lowest thermal influence on the predicted short-lived parts to be cooled, and a process to operate the cooling parts corresponding to the operated parts to be cooled The cooling component management program according to
(付記10)
当該情報処理装置を停止させることなくパーディションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜9のいずれか1項に記載の冷却部品管理プログラム。
(Supplementary Note 10)
The processor is caused to execute the process of changing the configuration of the part to be cooled using the first configuration change function capable of changing the hardware resource of the partition without stopping the information processing apparatus. The cooling component management program according to any one of appendices 7-9.
(付記11)
前記保守対象部品を切り離し、当該情報処理装置の再起動後に前記保守対象部品に代えて予備保守対象部品を動作させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜9のいずれか1項に記載の冷却部品管理プログラム。
(Supplementary Note 11)
Processing for separating the component to be cooled using the second configuration change function of operating the spare maintenance target component instead of the maintenance target component after separating the maintenance target component and restarting the information processing apparatus; The cooling component management program according to any one of
(付記12)
前記複数の冷却部品の回転速度を高くする制御を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜11のいずれか1項に記載の冷却部品管理プログラム。
(Supplementary Note 12)
12. The cooling component management program according to any one of
1 サーバシステム
2 管理端末装置
21 CPU
22 FAN最適配置情報抽出部
23 結果表示制御部
3 サーバ装置
4 FRU4
5−1〜5−4,5 SB
51 CPU
52 DIMM
6 IOU
7 PCIeボックス
8 通信回線
10 MMB
11 CPU
111 構成情報管理部
112 温度情報管理部
113 FAN回転数管理部
114 FAN配置履歴管理部
115 FAN予測寿命管理部
116 切替制御部
12 メモリ
121 構成情報
122 温度情報
123 FAN回転数情報
124 FAN配置履歴情報
125 予測寿命履歴情報
126 温度影響情報
40−1〜40−4,40 FAN
41−1〜41−4,41 PSU
1
22 FAN optimal arrangement
5-1 to 5-4, 5 SB
51 CPU
52 DIMM
6 IOU
7
11 CPU
111 Configuration
41-1 to 41-4, 41 PSU
Claims (7)
前記冷却対象部品を冷却する複数の冷却部品と、
前記複数の冷却部品の温度を検出する温度検出部と、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部と
を備えることを特徴とする、情報処理装置。 Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
A temperature detection unit that detects the temperatures of the plurality of cooling components;
A life prediction unit that performs life prediction of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. And a configuration change control unit configured to change the configuration of the component to be cooled.
ことを特徴とする、請求項1記載の情報処理装置。 The information processing apparatus according to claim 1, wherein the configuration change control unit performs configuration change of adding a cooling target component and operates a cooling component corresponding to the added cooling target component.
ことを特徴とする、請求項1記載の情報処理装置。 The configuration change control unit performs a configuration change in which the cooling target component having the lowest thermal influence on the predicted short-lived cooling component is operated among the plurality of cooling target components, and the cooling corresponding to the cooling target component operated. The information processing apparatus according to claim 1, wherein the component is operated.
ことを特徴とする、請求項1〜3のいずれか1項に記載の情報処理装置。 The configuration change control unit is configured to change the configuration of the component to be cooled using a first configuration change function capable of changing the hardware resource of the partition without stopping the information processing apparatus. The information processing apparatus according to any one of claims 1 to 3.
ことを特徴とする、請求項1〜3のいずれか1項に記載の情報処理装置。 The configuration change control unit separates the maintenance target component, and uses the second configuration change function to cause the spare maintenance target component to function instead of the maintenance target component after restarting the information processing apparatus. The information processing apparatus according to any one of claims 1 to 3, wherein the change is made.
ことを特徴とする、請求項1〜5のいずれか1項に記載の情報処理装置。 The information processing apparatus according to any one of claims 1 to 5, wherein the configuration change control unit performs control to increase a rotational speed of the plurality of cooling components.
前記冷却対象部品を冷却する複数の冷却部品と、
プロセッサとを備える情報処理装置において、
前記複数の冷却部品の温度を検出し、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行ない、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させる、冷却部品管理プログラム。 Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
An information processing apparatus including a processor;
Detecting temperatures of the plurality of cooling components;
Predicting the life of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. A cooling component management program, which causes the processor to execute a process of changing the configuration of the component to be cooled, in the case where it is detected.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017232844A JP6988414B2 (en) | 2017-12-04 | 2017-12-04 | Information processing equipment and cooling parts management program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017232844A JP6988414B2 (en) | 2017-12-04 | 2017-12-04 | Information processing equipment and cooling parts management program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019101822A true JP2019101822A (en) | 2019-06-24 |
JP6988414B2 JP6988414B2 (en) | 2022-01-05 |
Family
ID=66973776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017232844A Active JP6988414B2 (en) | 2017-12-04 | 2017-12-04 | Information processing equipment and cooling parts management program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6988414B2 (en) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007199052A (en) * | 2005-12-28 | 2007-08-09 | Nec Corp | Lifetime prediction monitoring device, lifetime prediction monitoring method, and lifetime prediction monitoring program |
JP2010097257A (en) * | 2008-10-14 | 2010-04-30 | Nec Corp | Processor control system, method, and program |
JP2011227709A (en) * | 2010-04-20 | 2011-11-10 | Nec Corp | Raid controller device, raid device, and processing method and program for raid device |
JP2012134209A (en) * | 2010-12-20 | 2012-07-12 | Nec Corp | Fan controller, fan control method, and fan control program |
JP2012169494A (en) * | 2011-02-15 | 2012-09-06 | Nec Corp | Cooling system and method for efficiently cooling apparatus |
JP2016126485A (en) * | 2014-12-26 | 2016-07-11 | 株式会社Nttファシリティーズ | Information processing system and program therefor |
JP2017174065A (en) * | 2016-03-23 | 2017-09-28 | 日本電気株式会社 | Server device, server control method, and program |
-
2017
- 2017-12-04 JP JP2017232844A patent/JP6988414B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007199052A (en) * | 2005-12-28 | 2007-08-09 | Nec Corp | Lifetime prediction monitoring device, lifetime prediction monitoring method, and lifetime prediction monitoring program |
JP2010097257A (en) * | 2008-10-14 | 2010-04-30 | Nec Corp | Processor control system, method, and program |
JP2011227709A (en) * | 2010-04-20 | 2011-11-10 | Nec Corp | Raid controller device, raid device, and processing method and program for raid device |
JP2012134209A (en) * | 2010-12-20 | 2012-07-12 | Nec Corp | Fan controller, fan control method, and fan control program |
JP2012169494A (en) * | 2011-02-15 | 2012-09-06 | Nec Corp | Cooling system and method for efficiently cooling apparatus |
JP2016126485A (en) * | 2014-12-26 | 2016-07-11 | 株式会社Nttファシリティーズ | Information processing system and program therefor |
JP2017174065A (en) * | 2016-03-23 | 2017-09-28 | 日本電気株式会社 | Server device, server control method, and program |
Also Published As
Publication number | Publication date |
---|---|
JP6988414B2 (en) | 2022-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10519960B2 (en) | Fan failure detection and reporting | |
JP5055192B2 (en) | Management apparatus and storage apparatus control method | |
US7131019B2 (en) | Method of managing power of control box | |
US11934889B2 (en) | Risk-based scheduling of containerized application services | |
JP2017224285A (en) | Chassis management system and chassis management method | |
JP2009294802A (en) | Storage device and start-up control method for storage device | |
US20060161972A1 (en) | System and method for license management in blade server system | |
JP5874484B2 (en) | Processing system, device management apparatus, and program | |
JP2009015584A (en) | Storage control device and method for controlling power supply of casing unit | |
JP6036819B2 (en) | Information processing apparatus, replication method, and replication program | |
US10133330B2 (en) | Cluster system, controller, method for controlling, and computer-readable recording medium having stored therein controlling program that operate node at the combination of the respective load setting values that satisfy required performance and lowers power consumption | |
JPWO2010018635A1 (en) | Cooling method and computer | |
WO2018080556A1 (en) | Unified power device management and analyzer | |
US10628338B2 (en) | Selection of a location for installation of a CPU in a compute node using predicted performance scores | |
JP5975094B2 (en) | Exchange candidate presentation method, information processing apparatus, and program | |
US11640377B2 (en) | Event-based generation of context-aware telemetry reports | |
JP2019101822A (en) | Information processing apparatus and cooling component management program | |
JP2018018177A (en) | Information processing device, information processing system, information processing device control program and information processing device control method | |
KR102137891B1 (en) | Server managing Method, Server, and Recording medium using User Specialized Operating Mechanism on BMC environment | |
JP6885626B2 (en) | Server equipment, control methods and programs | |
US10877539B2 (en) | System and method to prevent power supply failures based on data center environmental behavior | |
US10846184B2 (en) | System and method to predict and prevent power supply failures based on data center environmental behavior | |
JP2012108794A (en) | Repeating installation, repeating method, and device management apparatus | |
WO2021187128A1 (en) | Monitoring system, monitoring device, and monitoring method | |
JP2020113113A (en) | Storage device and data allocation method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20190607 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200911 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210712 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210727 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210927 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211102 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211115 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6988414 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |