JP2019101822A - Information processing apparatus and cooling component management program - Google Patents

Information processing apparatus and cooling component management program Download PDF

Info

Publication number
JP2019101822A
JP2019101822A JP2017232844A JP2017232844A JP2019101822A JP 2019101822 A JP2019101822 A JP 2019101822A JP 2017232844 A JP2017232844 A JP 2017232844A JP 2017232844 A JP2017232844 A JP 2017232844A JP 2019101822 A JP2019101822 A JP 2019101822A
Authority
JP
Japan
Prior art keywords
fan
life
cooling
predicted
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017232844A
Other languages
Japanese (ja)
Other versions
JP6988414B2 (en
Inventor
佐輝子 西井
Sakiko Nishii
佐輝子 西井
考司 武田
Koji Takeda
考司 武田
真紀子 井上
Makiko Inoue
真紀子 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017232844A priority Critical patent/JP6988414B2/en
Publication of JP2019101822A publication Critical patent/JP2019101822A/en
Application granted granted Critical
Publication of JP6988414B2 publication Critical patent/JP6988414B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To eliminate variations in the life of cooling components.SOLUTION: Provided are a temperature detection unit 112 configured to detect temperatures of a plurality of cooling components 40, a life prediction unit 115 configured to perform life prediction for each of the plurality of cooling components 40 based on the temperature, and a configuration change control unit 116 configured to change the configuration of a component 5 to be cooled when a difference equal to or greater than a threshold is detected in predicted life between a predicted short life cooling component 40 having the shortest predicted life and a predicted long life cooling component 40 having the longest predicted life, among the plurality of cooling components, as a result of the life prediction.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理装置および冷却部品管理プログラムに関する。   The present invention relates to an information processing apparatus and a cooling part management program.

サーバ等の情報処理装置(以下、サーバ装置という)は、CPU(Central Processing Unit)等の発熱源を冷却する冷却ファン(以下、FANという)を備える。また、サーバ装置においては、冗長化等の目的により複数個のFANを搭載することが一般的である。   An information processing apparatus such as a server (hereinafter referred to as a server apparatus) includes a cooling fan (hereinafter referred to as a fan) that cools a heat generation source such as a CPU (central processing unit). Also, in the server apparatus, it is general to mount a plurality of FANs for the purpose of redundancy and the like.

サーバ装置の稼動開始後、保守対応期間(例えば、装置稼働開始後5年間)中に、FANの予期せぬ個別不良が発生した場合は、その都度、CE(Customer’s Engineer)によるスポット保守作業で故障FANの交換が行なわれる。   If an unexpected individual failure of the FAN occurs during the maintenance response period (for example, 5 years after the start of the device operation) after the server device starts operation, the spot maintenance work by CE (Customer's Engineer) causes a failure each time A replacement of the FAN takes place.

また、サーバ装置に対する保守作業として、例えば、年一回の定期点検が実施され、FANはフィールドでの保守作業における点検対象となっている。FANに関する具体的な保守作業としては、FANの回転に異常がないかの確認が行なわれている。   In addition, as maintenance work for the server device, for example, periodical inspection is performed once a year, and the FAN is subjected to inspection in the field maintenance work. As a specific maintenance work on the FAN, it is confirmed that there is no abnormality in the rotation of the FAN.

しかしながら、上述の如き定期点検を実施していても、以下の理由により、FANの寿命(交換時期)にばらつきが生じる。   However, even if the periodic inspection as described above is performed, the life (time of replacement) of the FAN varies due to the following reason.

すなわち、故障により交換された新しいFANよりも、交換されていないFANの方が稼働時間が長いので先に寿命を迎える。また、一般的に、FANの経年での寿命はグリスの寿命で決まるが、グリスは高温になるほど劣化し寿命が短くなる。そのため、サーバ装置内部で高温のエアー(ユニット)に近い位置に搭載されるFANの寿命は短くなる。   That is, the life of the non-replaced FAN is longer than the new FAN replaced due to the failure because the operation time is longer. Also, in general, the life of the FAN over time is determined by the life of the grease, but as the temperature becomes higher, the grease deteriorates and the life becomes shorter. Therefore, the life of the FAN mounted at a position close to the high temperature air (unit) inside the server device becomes short.

このようにFANの交換の有無や装置内における実装位置によって、サーバ装置に搭載される複数のFANの寿命にばらつきが生じる。   As described above, the lifespans of the plurality of FANs mounted on the server apparatus vary depending on the presence or absence of replacement of the FAN and the mounting position in the apparatus.

特開2010−186772号公報JP, 2010-186772, A 特開2013−115392号公報Unexamined-Japanese-Patent No. 2013-115392 特開平8−278834号公報JP-A-8-278834 特開2001−144484号公報JP 2001-144484 A 特開平5−226868号公報JP-A-5-226868

近年、社会的な節電要求に応じて、サーバ業界でも高温動作に適合するモデルの需要が高まっており、例えば、40℃の環境下での稼働を保証する40℃環境対応モデルの商品化も実現されている。   In recent years, the demand for models compatible with high-temperature operation is also increasing in the server industry in response to social power saving requirements. For example, the commercialization of a 40 ° C environmental response model that guarantees operation in a 40 ° C environment is also realized It is done.

通常のオフィス環境は年平均使用温度を25℃として設定されている。このような通常オフィス環境用のサーバ装置においては、保守対応期間(通常5年)内では寿命に至らないFANであっても、40℃環境対応モデルのような高温環境下での長期稼動を行なうことで、短期間で寿命に至る確率が高くなることが予想される。   In a normal office environment, the annual average operating temperature is set to 25 ° C. In such a normal office environment server device, even if the FAN does not reach the end of its service life (usually 5 years), it operates for a long time under high temperature environment like 40 ° C environment response model. Thus, it is expected that the probability of reaching the life in a short period is high.

一般的にサーバ装置内部では、CPUに近い部分の温度が非常に高くなるため、CPUの周囲部品への影響が大きい。   Generally, in the server apparatus, the temperature near the CPU becomes extremely high, and the influence on peripheral parts of the CPU is large.

万一、寿命のばらつきにより保守対応期間を満たさずに故障してしまうFANが発生した場合には、その都度、保守作業が発生し、ユーザに工数およびコストにかかる負担をかけ、ひいてはサーバに対する信頼を失うことになる。   In the event that a FAN occurs that fails to meet the maintenance response period due to variations in the life, maintenance work will occur each time, placing a burden on the user of man-hours and costs, and ultimately reliance on the server. You will lose

また、40℃環境対応モデルにおいてFANに異常が生じると、サーバ装置内部の部品において高温による処理速度低下(サーマルスロットリング)が発生し、サーバ装置の処理性能の低下を招くおそれがある。   In addition, if an abnormality occurs in the FAN in the 40 ° C. environment-friendly model, processing speed reduction (thermal throttling) may occur due to high temperature in parts inside the server apparatus, which may cause a reduction in processing performance of the server apparatus.

1つの側面では、本発明は、冷却部品の寿命のばらつきを解消することを目的とする。   In one aspect, the present invention aims to eliminate variations in the life of cooling components.

このため、この情報処理装置は、複数の冷却対象部品と、前記冷却対象部品を冷却する複数の冷却部品と、前記複数の冷却部品の温度を検出する温度検出部と、前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部とを備える。   Therefore, the information processing apparatus is based on the plurality of cooling target parts, the plurality of cooling parts for cooling the cooling target parts, the temperature detection unit for detecting the temperatures of the plurality of cooling parts, and the temperature. A life prediction unit for performing life prediction of each of the plurality of cooling parts, and a predicted short life cooling part having the shortest predicted life among the plurality of cooling parts as a result of the life prediction, and a predicted long life having the longest prediction life And a configuration change control unit configured to change the configuration of the part to be cooled, when a difference between the predicted life and the threshold is detected.

一実施形態によれば、冷却部品の寿命のばらつきを解消することができる。   According to one embodiment, variations in the life of the cooling component can be eliminated.

実施形態の一例としてのサーバシステムの構成を模式的に示す図である。It is a figure showing typically the composition of the server system as an example of an embodiment. (a)〜(c)は実施形態の一例としてのサーバシステムの外観を模式的に示す図である。(A)-(c) is a figure which shows typically the external appearance of the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおける構成情報を例示する図である。It is a figure which illustrates the configuration information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおける温度情報を例示する図である。It is a figure which illustrates temperature information in a server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおけるFAN回転数情報を例示する図である。It is a figure which illustrates FAN rotation number information in a server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおけるFAN配置履歴情報を例示する図である。It is a figure which illustrates FAN arrangement history information in a server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおける予測寿命履歴情報を例示する図である。It is a figure which illustrates the prediction life history information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおける切替制御部によるSBの切り替え制御を説明するための図である。It is a figure for demonstrating switching control of SB by the switching control part in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおける温度影響情報を例示する図である。It is a figure which illustrates temperature influence information in a server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおけるFANとスロット位置との組み合わせをテーブル状に例示する図である。It is a figure which illustrates the combination of FAN and slot position in the server system as an example of an embodiment in the shape of a table. 実施形態の一例としてのサーバシステムにおけるFANの最適配置制御方法の概要を説明するためのフローチャートである。It is a flowchart for demonstrating the outline | summary of the optimal arrangement | positioning control method of FAN in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおけるFANの最適配置管理を実現するための各機能構成部の処理を説明するためのフローチャートである。It is a flowchart for demonstrating the process of each function structure part for implement | achieving the optimal arrangement | positioning management of FAN in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおけるFAN最適配置を行なうための制御を説明するためのフローチャートである。It is a flowchart for demonstrating the control for performing FAN optimal arrangement | positioning in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおけるFAN最適配置を行なうための制御を説明するためのフローチャートである。It is a flowchart for demonstrating the control for performing FAN optimal arrangement | positioning in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムのMMBの処理を説明するためのフローチャートである。It is a flowchart for demonstrating the process of MMB of the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおけるFAN予測寿命管理部によるFANの予測寿命の算出方法を説明するためのフローチャートである。It is a flowchart for demonstrating the calculation method of the estimated lifetime of FAN by the FAN estimated lifetime management part in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおける切替制御部によるFANの最適配置の決定方法を説明するフローチャートである。It is a flowchart explaining the determination method of the optimal arrangement | positioning of FAN by the switching control part in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおける切替制御部によるDP機能を用いたSBの切り替え時のSBの選択方法を説明するためのフローチャートである。It is a flowchart for demonstrating the selection method of SB at the time of switching of SB using DP function by the switching control part in the server system as an example of embodiment.

以下、図面を参照して本情報処理装置および冷却部品管理プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形(実施形態および各変形例を組み合わせる等)して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。   Hereinafter, embodiments of the information processing apparatus and the cooling component management program will be described with reference to the drawings. However, the embodiments described below are merely examples, and there is no intention to exclude the application of various modifications and techniques that are not specified in the embodiments. That is, the present embodiment can be implemented with various modifications (such as combining the embodiment and each modification) without departing from the scope of the present invention. In addition, each drawing is not intended to include only the components illustrated in the drawings, but may include other functions and the like.

(A)構成
図1は実施形態の一例としてのサーバシステム1の構成を模式的に示す図である。
(A) Configuration FIG. 1 is a view schematically showing a configuration of a server system 1 as an example of the embodiment.

サーバシステム1は、図1に示すように、サーバ装置3および管理端末装置2を備える。サーバ装置3と管理端末装置2とは、通信回線8を介して通信可能に接続されている。   The server system 1 includes a server device 3 and a management terminal device 2 as shown in FIG. The server device 3 and the management terminal device 2 are communicably connected via the communication line 8.

通信回線8は、例えば、LAN(Local Area Network)である。なお、通信回線8はLANに限定されるものではなく、種々変形して実施することができる。   The communication line 8 is, for example, a LAN (Local Area Network). The communication line 8 is not limited to the LAN, and various modifications can be made.

サーバ装置3は、サーバ機能を備えたコンピュータであり、本サーバシステム1における保守対象装置の一例である。   The server device 3 is a computer having a server function, and is an example of a maintenance target device in the server system 1.

サーバ装置3は、MMB(Management Board)10,FRU(Field-Replaceable Unit)4,IOU(Input Output Unit)6,PCIeボックス7およびSB(System Board)5−1〜5−4を備える。   The server device 3 includes a Management Board (MMB) 10, a Field-Replaceable Unit (FRU) 4, an Input Output Unit (IOU) 6, a PCIe box 7, and System Boards (SB) 5-1 to 5-4.

[SB5]
SB5−1〜5−4は、本サーバシステム1における各種制御や演算処理を行なう処理装置である。図1に示す例においては、4つのSB5−1〜5−4が備えられている。これらのSB5−1〜5−4は同様の構成を有する。以下、SBを示す符号としては、複数のSBのうち1つを特定する必要があるときには符号5−1〜5−4を用いるが、任意のSBを指すときには符号5を用いる。
[SB5]
The SBs 5-1 to 5-4 are processing devices that perform various controls and arithmetic processing in the server system 1. In the example shown in FIG. 1, four SBs 5-1 to 5-4 are provided. These SBs 5-1 to 5-4 have the same configuration. Hereinafter, as a code indicating an SB, the codes 5-1 to 5-4 are used when it is necessary to specify one of a plurality of SBs, and the code 5 is used to indicate an arbitrary SB.

また、以下、SB5−1をSB#0という場合がある。同様に、SB5−2,5−3,5−4を、それぞれ、SB#1,#2,#3という場合がある。   Also, hereinafter, SB5-1 may be referred to as SB # 0. Similarly, SBs 5-2, 5-3 and 5-4 may be referred to as SBs # 1, # 2 and # 3, respectively.

図2(a)〜(c)は実施形態の一例としてのサーバシステム1の外観を模式的に示す図である。図2(a)はSB5(5−1)の外観を模式的に示す斜視図であり、図2(b)はサーバシステム1の筐体1a内におけるSB5の配置を例示する図である。また、図2(c)は図2(b)のA矢視図である。   Fig.2 (a)-(c) are figures which show typically the external appearance of the server system 1 as an example of embodiment. FIG. 2A is a perspective view schematically showing the appearance of SB 5 (5-1), and FIG. 2B is a view exemplifying the arrangement of SB 5 in the chassis 1 a of the server system 1. Moreover, FIG.2 (c) is A arrow line view of FIG.2 (b).

各SB5においては、図2(a)に示すように、基板501上にCPU51やDIMM52が配置されている。   In each SB 5, as shown in FIG. 2A, the CPU 51 and the DIMM 52 are disposed on the substrate 501.

図2(b)に示す例においては、筐体1aの一方の面に沿って、4つのSB5が、互いに平行になるよう立設した状態で並べて配置されている。   In the example shown in FIG. 2B, four SBs 5 are arranged side by side in a state of being erected in parallel with each other along one surface of the housing 1a.

また、図2(c)に示すように、筐体1aにおける、SB5が並ぶ面とは反対側には、FRU4とIOU6とが配置されている。   Further, as shown in FIG. 2C, the FRU 4 and the IOU 6 are disposed on the side opposite to the surface on which the SBs 5 are arranged in the casing 1a.

筐体1aの高さ方向における中央付近にはIOU6が備えられている。図2(c)においては、便宜上、1つのIOU6として図示されているが、このIOU6は、複数のIOU6および複数のPCIeボックス7を1つにまとめたものであってもよい。   An IOU 6 is provided near the center in the height direction of the housing 1a. In FIG. 2C, although it is illustrated as one IOU 6 for convenience, this IOU 6 may be a combination of a plurality of IOUs 6 and a plurality of PCIe boxes 7 into one.

IOU6の上面に沿ってFAN#0,#1が水平方向に並べて配置されている。そして、FAN#0の上方にはPSU#0が、FAN#1の上方にはPSU#1が、それぞれ配置されている。一方、IOU6の下面に沿って、FAN#2,#3が水平方向に並べて配置されている。そして、FAN#2の下方にはPSU#2が、FAN#3の下方にはPSU#3が、それぞれ配置されている。   FANs # 0 and # 1 are arranged side by side along the upper surface of the IOU 6 in the horizontal direction. The PSU # 0 is disposed above the FAN # 0, and the PSU # 1 is disposed above the FAN # 1. On the other hand, FANs # 2 and # 3 are arranged in the horizontal direction along the lower surface of the IOU 6. The PSU # 2 is disposed below the FAN # 2, and the PSU # 3 is disposed below the FAN # 3.

なお、筐体1a内におけるSB5,IOU6,FAN40,PSU41の位置はこれに限定されるものではなく、適宜変更して実施することができる。   The positions of the SB 5, the IOU 6, the FAN 40, and the PSU 41 in the housing 1 a are not limited to these, and can be appropriately changed and implemented.

SB5は、図1に示すように、BMC(Baseboard Management Controller)50,1つ以上(図1に示す例では2つ)のCPU51および1つ以上(図1に示す例では4つ)のDIMM(Dual Inline Memory Module)52を備える。   As shown in FIG. 1, the SB 5 includes a BMC (Baseboard Management Controller) 50, one or more (two in the example shown in FIG. 1) CPUs 51, and one or more (four in the example shown in FIG. 1) DIMMs. A dual inline memory module 52 is provided.

DIMM52は、データや、OS(Operating System),プログラム等を一時的に格納する記憶領域であり、例えば、CPU51がプログラムを実行する際に、一次記憶メモリあるいはワーキングメモリとして利用される。DIMM52上のソフトウェアプログラムは、CPU51に適宜読み込まれて実行される。   The DIMM 52 is a storage area for temporarily storing data, an OS (Operating System), a program and the like, and is used as a primary storage memory or a working memory, for example, when the CPU 51 executes a program. The software program on the DIMM 52 is appropriately read and executed by the CPU 51.

CPU51は、種々の制御や演算を行なう処理装置であり、DIMM52に格納されたOSやプログラムを実行することにより、種々の機能を実現する。   The CPU 51 is a processing device that performs various controls and calculations, and realizes various functions by executing the OS and programs stored in the DIMM 52.

CPU51やDIMM52はSB5としての処理の実行中に発熱する発熱源であり、これらのCPU51,DIMM52を備えるSB5は、FAN40による冷却対象部品である。   The CPU 51 and the DIMM 52 are heat sources that generate heat during execution of the processing as the SB 5, and the SB 5 including the CPU 51 and the DIMM 52 is a component to be cooled by the FAN 40.

BMC50は、SB5を管理するコントローラであり、CPU51やDIMM52,図示しない温度センサ等のハードウェアの監視やハードウェアイベントの記録等を行なう。BMC50は、例えば、IPMI(Intelligent Platform Management Interface)が定義する標準仕様に従った機能構成を有してもよい。   The BMC 50 is a controller that manages the SB 5 and monitors hardware such as the CPU 51, the DIMM 52, a temperature sensor (not shown), and records hardware events. The BMC 50 may have a functional configuration according to a standard specification defined by, for example, IPMI (Intelligent Platform Management Interface).

BMC50は、SB5のMMB10に、SB5等の各種情報を送信する。例えば、BMC50は、FAN40に備えられた温度センサの検出値や、FAN40のモータの回転数をFRU4から取得し、MMB10に送信する。   The BMC 50 transmits various information such as SB5 to the MMB 10 of SB5. For example, the BMC 50 acquires the detection value of the temperature sensor provided in the FAN 40 and the rotation speed of the motor of the FAN 40 from the FRU 4 and transmits the acquired value to the MMB 10.

なお、SB5に搭載されるCPU51やDIMM52の数は、図1に示した例に限定されるものではなく、種々変形して実施することができる。   The number of CPUs 51 and DIMMs 52 mounted on the SB 5 is not limited to the example shown in FIG. 1 and can be modified in various ways.

また、サーバシステム1に備えられるSB5の数は4つに限定されるものではなく、3つ以下、もしくは5つ以上のSB5を備えてもよく、種々変形して実施することができる。   Further, the number of SBs 5 provided in the server system 1 is not limited to four, and three or less or five or more SBs 5 may be provided, and various modifications can be made.

本サーバシステム1に備えられた4つのSB5のうち、少なくとも1つのSB5(例えば、SB5−3,5−4)は、リザーブドSB(Reserved SB)5として用いられる。   Among the four SBs 5 provided in the server system 1, at least one SB 5 (for example, SBs 5-3 and 5-4) is used as a Reserved SB (Reserved SB) 5.

リザーブドSB機能は、あらかじめ筐体1a内に予備のSB5を実装しておき、故障したSB5を自動的に切り離し、予備SB5を組み込んでパーティションを再起動することで、SB5の構成変更を実現する機能である。   The Reserved SB function is a function to realize a configuration change of SB5 by mounting a spare SB5 in the housing 1a in advance, automatically disconnecting the failed SB5, and incorporating the spare SB5 to restart the partition. It is.

また、障害発生時に切り替える目的の予備SB5をリザーブド(Reserved)SBという場合もある。   In addition, there is also a case where a reserve SB 5 for switching when a failure occurs is referred to as a reserved SB.

リザーブドSB5への切り替えにはシステムのシャットダウンが必要となる。   Switching to Reserved SB 5 requires a system shutdown.

リザーブドSB5(例えば、SB5−4)は、サーバシステム1に備えられた他のSB5(例えばSB5−1〜5−3)のうちのいずれかに故障が検出された場合に、この故障が検出されたSB5に代えて用いられる予備のSB5である。リザーブドSB5は、スタンバイ状態で待機している。   The reserved SB5 (for example, SB5-4) is detected when a failure is detected in any of the other SB5 (for example, SB5-1 to 5-3) provided in the server system 1. It is a spare SB5 used in place of the SB5. The reserved SB 5 stands by in the standby state.

本サーバシステム1において、後述するMMB10は、故障したSB5をサーバシステム1から切り離し、この故障したSB5の代わりにリザーブドSB5を組み込み、パーティションを再起動するリザーブドSB機能を実現する。   In the server system 1, the MMB 10 to be described later separates the failed SB 5 from the server system 1, incorporates the reserved SB 5 instead of the failed SB 5, and implements a reserved SB function that restarts the partition.

[IOU6]
IOU6は、外部装置との間でデータ等の入出力を行なう。IOU6は、例えば、PCIe(Peripheral Component Interconnect Express)の規格に従って、外部装置等と通信を行なう。図1に示す例においては、4つのIOU6が備えられ、複数のSB5のそれぞれに対して1つのIOU6が備えられている。4つのIOU6をIOU#0〜#3とそれぞれ表す場合がある。
[IOU 6]
The IOU 6 performs input and output of data with an external device. The IOU 6 communicates with an external device or the like according to, for example, the PCIe (Peripheral Component Interconnect Express) standard. In the example shown in FIG. 1, four IOUs 6 are provided, and one IOU 6 is provided for each of the plurality of SBs 5. The four IOUs 6 may be represented as IOU # 0 to # 3, respectively.

IOU6も処理の実行中に発熱する発熱源であり、FAN40による冷却対象である。   IOU 6 is also a heat generation source that generates heat during processing, and is a target to be cooled by the FAN 40.

[PCIeボックス7]
PCIeボックス7は、PCIeスロットを増設可能な拡張ボックスであり、IOU6に対応して備えられる。図1に示す例においては、IOU6と同様に、4つのPCIeボックス7が備えられ、複数のIOU6のそれぞれに対して1つのPCIeボックス7が備えられている。4つのPCIeボックス7をPCIebox#0〜#3とそれぞれ表す場合がある。
[PCIe box 7]
The PCIe box 7 is an expansion box in which PCIe slots can be added, and is provided corresponding to the IOU 6. In the example illustrated in FIG. 1, similarly to the IOU 6, four PCIe boxes 7 are provided, and one PCIe box 7 is provided for each of the plurality of IOUs 6. The four PCIe boxes 7 may be represented as PCIe boxes # 0 to # 3, respectively.

IOU#0およびPCIebox#0はそれぞれSB#0に対応して備えられる。同様に、IOU#1およびPCIebox#1はそれぞれSB#1に、IOU#2およびPCIebox#2はそれぞれSB#2に、IOU#3およびPCIebox#3はそれぞれSB#3に、それぞれ対応して備えられる。   The IOU # 0 and the PCIe box # 0 are respectively provided corresponding to the SB # 0. Similarly, IOU # 1 and PCIebox # 1 are provided corresponding to SB # 1, IOU # 2 and PCIebox # 2 to SB # 2, and IOU # 3 and PCIebox # 3 to SB # 3, respectively. Be

[FRU4]
FRU4は、本サーバシステム1が稼働している現場で交換可能に構成された部品である。図1に示す例においては、FRU4は、4つのFAN40−1〜40−4と、4つのPSU(Power Supply Unit)41−1〜41−4を備える。
[FRU4]
The FRU 4 is a component configured to be replaceable at the site where the server system 1 is operating. In the example illustrated in FIG. 1, the FRU 4 includes four FANs 40-1 to 40-4 and four PSUs (Power Supply Units) 41-1 to 41-4.

FAN40−1〜40−4は、冷却風を発生させることで冷却対象部品を冷却する冷却装置である。FAN40−1〜40−4は、同様の構成を有する。以下、FANを示す符号としては、複数のFANのうち1つを特定する必要があるときには符号40−1〜40−4を用いるが、任意のFANを指すときには符号40を用いる。   The FANs 40-1 to 40-4 are cooling devices that cool components to be cooled by generating cooling air. The FANs 40-1 to 40-4 have the same configuration. Hereinafter, as a code indicating a FAN, the codes 40-1 to 40-4 are used when it is necessary to specify one of a plurality of FANs, and the code 40 is used to indicate an arbitrary FAN.

また、以下、FAN40−1をFAN#0という場合がある。同様に、FAN40−2,40−3,40−4を、それぞれ、FAN#1,#2,#3という場合がある。   Also, hereinafter, the FAN 40-1 may be referred to as FAN # 0. Similarly, the FANs 40-2, 40-3, and 40-4 may be referred to as FANs # 1, # 2, and # 3, respectively.

FAN#0〜#3はCEによる保守作業対象部品であり、故障等の障害が検出された場合には、CEによる保守作業により新たなFAN40に交換される。例えば、FAN#0に障害が検出された場合には、FAN#0として用いられていたFAN40が取り外され、新たなFAN40がFAN#0として取り付けられる。   FANs # 0 to # 3 are parts to be subjected to maintenance work by the CE, and when a failure such as a failure is detected, they are replaced with a new FAN 40 by maintenance work by the CE. For example, when a failure is detected in the FAN # 0, the FAN 40 used as the FAN # 0 is removed, and a new FAN 40 is attached as the FAN # 0.

なお、FAN40のそれぞれにはユニークな識別情報(FAN ID)が設定されており、FAN#0〜3としてFRU4に取り付けられるFAN40は、適宜交換される。なお、FAN#0〜3としてFRU4に取り付けられるFAN40のFAN IDは、後述するFAN配置履歴情報124によって管理される。以下、FAN IDを単に“ID”と表す場合がある。以下、4つのFAN40のIDが、それぞれ“A”,“B”,“C”,“D”である例について示す。   Unique identification information (FAN ID) is set to each of the FANs 40, and the FANs 40 attached to the FRU 4 as the FANs # 0 to # 3 are appropriately exchanged. In addition, FAN ID of FAN40 attached to FRU4 as FAN # 0-3 is managed by FAN arrangement | positioning historical information 124 mentioned later. Hereinafter, the FAN ID may be simply referred to as “ID”. Hereinafter, an example in which the IDs of the four FANs 40 are “A”, “B”, “C”, and “D” will be shown.

本サーバシステム1において、FAN40は、FRU4に形成された複数のスロット(図示省略)のうちのいずれかに取り付けられる。以下、スロット位置を表す識別情報(スロットID)を“POS”と表す場合がある。以下、本サーバシステム1においてFRU4に4つのスロットが備えられ、これらの4つのスロットのPOSが、それぞれ“101”,“102”,“103”,“104”である例について示す。例えば、FAN#0,#1,#2,#3が、スロット“101”,“102”,“103”,“104”にそれぞれ取り付けられる。   In the server system 1, the FAN 40 is attached to any one of a plurality of slots (not shown) formed in the FRU 4. Hereinafter, identification information (slot ID) representing a slot position may be represented as "POS". In the following, an example in which four slots are provided in the FRU 4 in the server system 1 and POS of these four slots are “101”, “102”, “103” and “104” will be described. For example, FANs # 0, # 1, # 2, # 3 are attached to the slots "101", "102", "103", and "104", respectively.

また、サーバシステム1の筐体1a内におけるスロット位置がFAN40の寿命に影響を与える。   Further, the slot position in the housing 1 a of the server system 1 affects the life of the FAN 40.

FRU4においては、FAN#0〜3として取り付けられている各FAN40のFAN IDと、各FAN40が取り付けられているスロット位置のスロットIDとをFAN配置情報として、図示しないメモリに記憶(管理)している。   In FRU 4, the FAN ID of each FAN 40 attached as FANs # 0 to 3 and the slot ID of the slot position where each FAN 40 is attached are stored (managed) in a memory (not shown) as FAN arrangement information. There is.

各FAN40には図示しない温度センサが備えられており、この温度センサにより、FAN40の温度(運転温度)もしくはFAN40の周囲の温度を検出する。なお、以下、便宜上、FAN40の温度もしくはFAN40の周囲の温度を、単にFAN40の温度という場合がある。   Each FAN 40 is provided with a temperature sensor (not shown), and this temperature sensor detects the temperature of the FAN 40 (operating temperature) or the temperature around the FAN 40. Hereinafter, for convenience, the temperature of the FAN 40 or the temperature around the FAN 40 may be simply referred to as the temperature of the FAN 40.

各FAN40の温度センサの検出値は、例えば、BMC50により採取され、このBMC50からMMB10にI2C(Inter-Integrated Circuit)通信を介して送信される。各FAN40の温度センサの検出値は、例えば、後述するMMB10の温度情報管理部112から取得要求が行なわれると、この取得要求に応答してBMC50により採取され、MMB10に送信される。   The detection value of the temperature sensor of each FAN 40 is collected by, for example, the BMC 50, and transmitted from the BMC 50 to the MMB 10 via I2C (Inter-Integrated Circuit) communication. For example, when an acquisition request is made from the temperature information management unit 112 of the MMB 10 described later, the detection value of the temperature sensor of each FAN 40 is collected by the BMC 50 in response to the acquisition request and transmitted to the MMB 10.

本サーバシステム1においては、SB5(CPU51,DIMM52),IOU6等の発熱体にFAN40によって生成される冷却風を送風することで、これらの冷却を行なう。   In the server system 1, the cooling air generated by the FAN 40 is blown to the heating elements such as the SB 5 (CPU 51 and DIMM 52) and the IOU 6 to cool them.

各FAN40の回転速度等は、後述するMMB10によって制御される。また、各FAN40の動作状況を表す情報(例えば、FAN回転数)もBMC50を介して採取され、MMB10によって管理される。   The rotational speed and the like of each FAN 40 are controlled by the MMB 10 described later. In addition, information (for example, the number of revolutions of the fan) indicating the operating status of each FAN 40 is also collected via the BMC 50 and managed by the MMB 10.

PSU41−1〜41−4は、本サーバシステム1に備えられる各部に電力供給を行なう。以下、PSU41−1をPSU#0という場合がある。同様に、PSU41−2,41−3,41−4を、それぞれ、PSU#1,#2,#3という場合がある。   The PSUs 41-1 to 41-4 supply power to each unit provided in the server system 1. Hereinafter, PSU 41-1 may be referred to as PSU # 0. Similarly, the PSUs 41-2, 41-3, and 41-4 may be referred to as PSU # 1, # 2, and # 3, respectively.

例えば、PSU#0はFAN#0,SB#0,IOU#0およびPCIeボックス#0に電力を供給する。   For example, PSU # 0 supplies power to FAN # 0, SB # 0, IOU # 0 and PCIe box # 0.

同様に、PSU#1はFAN#1,SB#1,IOU#1およびPCIeボックス#1に、PSU#2はFAN#2,SB#2,IOU#2およびPCIeボックス#2に、PSU#3はFAN#3,SB#3,IOU#3およびPCIeボックス#3に、それぞれ電力を供給する。   Similarly, PSU # 1 is for FAN # 1, SB # 1, IOU # 1 and PCIe box # 1, PSU # 2 is for FAN # 2, SB # 2, IOU # 2 and PCIe box # 2, PSU # 3 Supplies power to FAN # 3, SB # 3, IOU # 3 and PCIe box # 3, respectively.

PSU41も発熱源であり、FAN40による冷却対象である。   The PSU 41 is also a heat source and is a cooling target by the FAN 40.

[MMB10]
MMB10は、本サーバシステム1における制御や監視、パーティション管理、システム初期化などの処理を行なうシステム制御ユニットである。
[MMB10]
The MMB 10 is a system control unit that performs processing such as control and monitoring, partition management, and system initialization in the server system 1.

MMB10は、図1に示すように、CPU11およびメモリ12を備える。   The MMB 10 includes a CPU 11 and a memory 12 as shown in FIG.

メモリ12は、データや,OS,プログラム等を一時的に格納する記憶領域であり、例えば、CPU11がプログラムを実行する際に、一次記憶メモリあるいはワーキングメモリとして利用される。メモリ12上のソフトウェアプログラムは、CPU11に適宜読み込まれて実行される。   The memory 12 is a storage area for temporarily storing data, an OS, a program and the like, and is used as, for example, a primary storage memory or a working memory when the CPU 11 executes a program. The software program on the memory 12 is appropriately read and executed by the CPU 11.

ソフトウェアプログラムには、MMB10によって本実施形態のFAN管理機能を実現するためにCPU11によって実行されるFAN配置管理プログラムが含まれてもよい。FAN配置管理プログラムは、例えば、ファームウェアにモジュールとして組み込まれてもよい。   The software program may include a fan layout management program executed by the CPU 11 to realize the fan management function of the present embodiment by the MMB 10. The FAN placement management program may be incorporated as a module into firmware, for example.

また、メモリ12には、構成情報121,温度情報112,FAN回転数情報123,FAN配置履歴情報124,予測寿命履歴情報125および温度影響情報126が記憶領域に格納される。   Further, in the memory 12, configuration information 121, temperature information 112, FAN rotation number information 123, FAN arrangement history information 124, predicted life history information 125 and temperature influence information 126 are stored in a storage area.

図3は実施形態の一例としてのサーバシステム1における構成情報121を例示する図である。   FIG. 3 is a diagram exemplifying configuration information 121 in the server system 1 as an example of the embodiment.

構成情報121は、例えば、各SB5のハードウェア構成を管理する情報であり、SB5を構成する部品の構成や性能を示す情報である。構成情報121は、各SB5に備えられたCPU51およびDIMM52の構成や性能を示す情報をSB5毎に対応付けて構成されている。図3に示す例においては、CPU51の構成や性能を示す情報としてプロセッサ種類(Xenon等)が、また、DIMM52の構成や性能を示す情報としては、種類,枚数,メモリサイズが、それぞれSB5毎に登録されている。   The configuration information 121 is, for example, information for managing the hardware configuration of each SB 5, and is information indicating the configuration and performance of components constituting the SB 5. The configuration information 121 is configured by associating information indicating the configuration and performance of the CPU 51 and the DIMM 52 provided in each SB 5 with each SB 5. In the example shown in FIG. 3, the processor type (Xenon etc.) as information indicating the configuration and performance of the CPU 51, and as the information indicating the configuration and performance of the DIMM 52, type, number, and memory size for each SB5 It is registered.

なお、図3においてはx個(xは自然数)のDIMM52についての構成情報を示すものであり、図1に例示するサーバシステム1の構成においては、各SB5にそれぞれ4つのDIMM52が搭載されているのでx=4となる。   Note that FIG. 3 shows configuration information for x (where x is a natural number) DIMMs 52, and in the configuration of the server system 1 illustrated in FIG. 1, four DIMMs 52 are mounted on each SB 5 So x = 4.

構成情報121は、例えば、サーバシステム1の設定時や保守作業時に、担当CEやシステム管理者等によって設定されてもよい。   The configuration information 121 may be set by, for example, a responsible CE or a system administrator at the time of setting of the server system 1 or maintenance work.

なお、図3に例示する構成情報121はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。また、構成情報121において管理する情報は、図3に例示したものに限定されるものではなく、例えば、プロセッサの動作周波数等、他の情報を含めてもよく種々変形して実施することができる。   Although the configuration information 121 illustrated in FIG. 3 has a table-like configuration, it is not limited to this, and the data structure can be appropriately changed and implemented. Further, the information managed in the configuration information 121 is not limited to the one illustrated in FIG. 3 and may include other information such as an operating frequency of a processor, for example, and can be variously modified and implemented. .

図4は実施形態の一例としてのサーバシステム1における温度情報122を例示する図である。   FIG. 4 is a diagram illustrating temperature information 122 in the server system 1 as an example of the embodiment.

温度情報122は、各FAN40において検出された温度の履歴を管理する情報である。図4に例示する温度情報122においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)から、所定時間が経過する毎の各タイミングで測定(サンプリング)された各FAN40の温度がFAN40毎に登録されている。   The temperature information 122 is information for managing the history of the temperature detected in each of the FANs 40. In the temperature information 122 illustrated in FIG. 4, for example, the temperature of each of the FANs 40 measured (sampled) at each timing when a predetermined time has elapsed since the first activation (first AC-ON) of the server system 1 Are registered for each FAN40.

なお、図4においてはn個(nは自然数)のFAN#0〜#n−1についての温度情報122を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。   Note that FIG. 4 shows temperature information 122 for n (n is a natural number) FANs # 0 to # n-1 in FIG. 4, and in the configuration of the server system 1 illustrated in FIG. Since it is mounted, n = 4.

例えば、BMC50が、各FAN40に備えられた温度センサの検出値を採取し、温度情報122に定期的に記録してもよい。また、後述するMMB10の温度情報管理部112が、FRU4から各FAN40の温度を定期的に取得し、温度情報122に記録してもよい。   For example, the BMC 50 may collect the detection value of the temperature sensor provided in each FAN 40 and periodically record the detection value in the temperature information 122. In addition, the temperature information management unit 112 of the MMB 10 described later may periodically acquire the temperature of each FAN 40 from the FRU 4 and record the temperature in the temperature information 122.

FAN40の温度は、所定時間が経過する毎の各タイミングで測定(サンプリング)された値に代えて、例えば所定経過時間毎の平均値であってもよく、種々変形して実施することができる。   The temperature of the FAN 40 may be, for example, an average value for each predetermined elapsed time, instead of the value measured (sampled) at each timing when the predetermined time elapses, and can be implemented with various modifications.

図4に例示する温度情報122はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。   Although the temperature information 122 illustrated in FIG. 4 has a table-like configuration, it is not limited to this, and the data structure can be appropriately changed and implemented.

図5は実施形態の一例としてのサーバシステム1におけるFAN回転数情報123を例示する図である。   FIG. 5 is a diagram illustrating the FAN rotation number information 123 in the server system 1 as an example of the embodiment.

FAN回転数情報123は、各FAN40の回転数(回転速度)の履歴を管理する情報である。図5に例示するFAN回転数情報123においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングで測定(サンプリング)された回転数の値がFAN40毎に登録されている。   The FAN rotation speed information 123 is information for managing the history of the rotation speed (rotation speed) of each FAN 40. In the FAN rotation speed information 123 illustrated in FIG. 5, for example, the rotation speed measured (sampled) at each timing when a predetermined time has elapsed from the time of first activation (first time AC-ON) of the server system 1 The value of is registered for each FAN40.

なお、図5においてはn個(nは自然数)のFAN#0〜#n−1についてのFAN回転数情報123を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。   Note that FIG. 5 shows FAN rotation number information 123 for n (n is a natural number) FANs # 0 to # n-1, and in the configuration of the server system 1 illustrated in FIG. Since the FAN 40 is mounted, n = 4.

例えば、BMC50が、FRU4に備えられた図示しない制御装置から各FAN40の回転数を採取し、FAN回転数情報123に定期的に記録してもよい。また、後述するMMB10のFAN回転数管理部113が、FRU4から各FAN40の回転数を定期的に取得し、FAN回転数情報123に記録してもよい。   For example, the BMC 50 may collect the rotational speed of each FAN 40 from a control device (not shown) provided in the FRU 4 and periodically record the rotational speed in the FAN rotational speed information 123. Further, the FAN rotation speed management unit 113 of the MMB 10 described later may periodically acquire the rotation speed of each FAN 40 from the FRU 4 and record the rotation speed in the FAN rotation speed information 123.

FAN回転数情報123は、FAN回転数管理部113によって登録・管理される。   The FAN rotation number information 123 is registered and managed by the FAN rotation number management unit 113.

なお、FAN40の回転数は、所定時間が経過する毎の各タイミングで測定(サンプリング)された値に代えて、所定経過時間毎の平均値であってもよく、種々変形して実施することができる。   In addition, the rotational speed of the FAN 40 may be an average value for each predetermined elapsed time instead of the value measured (sampled) at each timing when the predetermined time elapses, and various modifications may be performed. it can.

図5に例示するFAN回転数情報123はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。   Although the FAN rotation speed information 123 illustrated in FIG. 5 has a table-like configuration, it is not limited to this, and the data structure can be appropriately changed and implemented.

図6は実施形態の一例としてのサーバシステム1におけるFAN配置履歴情報124を例示する図である。   FIG. 6 is a diagram illustrating the FAN arrangement history information 124 in the server system 1 as an example of the embodiment.

FAN配置履歴情報124は、各FAN40の配置の履歴を管理する情報である。図6に例示するFAN配置履歴情報124においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングでの、FAN#0〜#n−1のサーバシステム1内での取り付けスロット位置(POS)が登録されている。   The FAN placement history information 124 is information for managing the placement history of each FAN 40. In the FAN placement history information 124 illustrated in FIG. 6, for example, the FANs # 0 to #n at each timing when a predetermined time has elapsed from the time of first activation (first time AC-ON) of the server system 1 The mounting slot position (POS) in the server system 1 of -1 is registered.

なお、図6においてはn個(nは自然数)のFAN#0〜#n−1についてのFAN配置履歴情報124を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。また、図6に例示するFAN配置履歴情報124においては、便宜上、具体的な値に代えて“POS”との文字が示されている。   6 shows the FAN placement history information 124 for n (n is a natural number) FANs # 0 to # n-1, and in the configuration of the server system 1 illustrated in FIG. Since the FAN 40 is mounted, n = 4. In addition, in the FAN arrangement history information 124 illustrated in FIG. 6, for convenience, characters “POS” are shown instead of the specific values.

後述するFAN配置履歴管理部114が、FRU4において管理されるFAN配置情報から取得し、この取得した情報を用いてFAN配置履歴情報124が登録・管理される。   The FAN placement history management unit 114, which will be described later, acquires from the FAN placement information managed in the FRU 4, and the FAN placement history information 124 is registered and managed using the acquired information.

図6に例示するFAN配置履歴情報124はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。   Although the FAN arrangement | positioning historical information 124 illustrated in FIG. 6 has a table-like structure, it is not limited to this, The data structure can be changed suitably and can be implemented.

図7は実施形態の一例としてのサーバシステム1における予測寿命履歴情報125を例示する図である。   FIG. 7 is a diagram exemplifying predicted life history information 125 in the server system 1 as an example of the embodiment.

予測寿命履歴情報125は、各FAN40について算出された予測寿命の履歴を管理する情報である。図7に例示する予測寿命履歴情報125においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングでFAN予測寿命管理部115によって算出された、FAN#0〜#n−1の予測寿命(Life(ID,POS))が登録されている。FAN4の予測寿命の詳細については後述する。   The predicted life history information 125 is information for managing the history of predicted life calculated for each of the FANs 40. In the predicted life history information 125 illustrated in FIG. 7, for example, the predicted life management information 115 is calculated by the FAN predicted life management unit 115 at each timing when a predetermined time has elapsed from the first activation (first AC-ON) of the server system 1. The estimated life (Life (ID, POS)) of FAN # 0 to # n-1 is registered. Details of the predicted life of FAN4 will be described later.

Life(ID,POS)は、FAN予測寿命管理部115によって算出された予測寿命(単位:h(時間))に、当該予測寿命の算出の対象であるFAN40を特定するID(FAN ID)と、当該FAN40が取り付けられたスロットを特定するPOSとを関連付ける。   Life (ID, POS) is an estimated life (unit: h (hour)) calculated by the FAN estimated life management unit 115, and an ID (FAN ID) specifying the FAN 40 that is the target of the calculation of the estimated life; It associates with the POS that specifies the slot in which the FAN 40 is attached.

なお、図7においてはn個(nは自然数)のFAN#0〜#n−1についての予測寿命履歴情報125を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。   Note that FIG. 7 shows the predicted life history information 125 for n (n is a natural number) FANs # 0 to # n-1, and in the configuration of the server system 1 illustrated in FIG. Since the FAN 40 is mounted, n = 4.

予測寿命履歴情報125は、後述するFAN予測寿命管理部115によって登録・管理される。   The predicted life history information 125 is registered and managed by a FAN predicted life management unit 115 described later.

図7に例示する予測寿命履歴情報125はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。   Although the predicted life history information 125 illustrated in FIG. 7 has a table-like configuration, it is not limited to this, and the data structure can be appropriately changed and implemented.

温度影響情報126については後述する。   The temperature influence information 126 will be described later.

CPU11は、種々の制御や演算を行なう処理装置であり、メモリ12に格納されたOSやプログラムを実行することにより、種々の機能を実現する。CPU11は、FAN管理プログラムを実行することで、本サーバシステム1に備えられた複数のFAN40を管理するFAN配置管理機能を実現する。   The CPU 11 is a processing device that performs various controls and calculations, and realizes various functions by executing the OS and programs stored in the memory 12. The CPU 11 executes a FAN management program to realize a FAN placement management function of managing a plurality of FANs 40 provided in the server system 1.

具体的には、CPU11は、FAN配置管理プログラムを実行することで、図1に示すように、構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現する。   Specifically, as shown in FIG. 1, the CPU 11 executes the FAN placement management program, and the configuration information management unit 111, the temperature information management unit 112, the FAN rotation speed management unit 113, and the FAN placement history management unit 114. , And realize functions as the FAN predicted life management unit 115 and the switching control unit 116.

なお、これらの構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現するためのプログラム(FAN配置管理プログラム)は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。   Note that a program for realizing the functions of the configuration information management unit 111, the temperature information management unit 112, the FAN rotation speed management unit 113, the FAN arrangement history management unit 114, the FAN predicted life management unit 115, and the switching control unit 116. (FAN placement management program) is, for example, a flexible disk, a CD (CD-ROM, CD-R, CD-RW, etc.), a DVD (DVD-ROM, DVD-RAM, DVD-R, DVD + R, DVD-RW, DVD + RW, It is provided in the form of being recorded on a computer readable recording medium such as HD DVD, Blu-ray disc, magnetic disc, optical disc, magneto-optical disc and the like. Then, the computer reads the program from the recording medium, transfers the program to an internal storage device or an external storage device, and uses it. Alternatively, the program may be recorded in a storage device (recording medium) such as, for example, a magnetic disk, an optical disk, or a magneto-optical disk, and may be provided from the storage device to the computer via a communication path.

構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現する際には、内部記憶装置(本実施形態ではメモリ12)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU11)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。   When realizing the functions as the configuration information management unit 111, the temperature information management unit 112, the FAN rotation speed management unit 113, the FAN arrangement history management unit 114, the FAN predicted life management unit 115, and the switching control unit 116, the internal storage device The program stored in (the memory 12 in the present embodiment) is executed by the microprocessor (the CPU 11 in the present embodiment) of the computer. At this time, the computer may read and execute the program recorded on the recording medium.

構成情報管理部111は、各SB5のハードウェア構成を管理する。構成情報管理部111は、構成情報121から各SB5のハードウェア構成に関する情報を読み出し、メモリ12の所定の領域に格納する。   The configuration information management unit 111 manages the hardware configuration of each SB 5. The configuration information management unit 111 reads the information on the hardware configuration of each SB 5 from the configuration information 121 and stores the information in a predetermined area of the memory 12.

温度情報管理部112は、各FAN40において検出された温度の履歴を管理する。温度情報管理部112は、メモリ12の温度情報122を用いて各FAN40の温度を管理する。例えば、温度情報管理部112は、FAN予測寿命管理部115からの要求に応じてFAN40の温度を随時取得し、FAN予測寿命管理部115に通知する。温度情報管理部112は、収集したFAN40の温度を温度情報122に記録する。   The temperature information management unit 112 manages the history of the temperature detected in each of the FANs 40. The temperature information management unit 112 manages the temperature of each FAN 40 using the temperature information 122 of the memory 12. For example, the temperature information management unit 112 acquires the temperature of the FAN 40 at any time in response to a request from the FAN predicted life management unit 115, and notifies the FAN predicted life management unit 115 of the temperature. The temperature information management unit 112 records the collected temperature of the FAN 40 in the temperature information 122.

また、温度情報管理部112は、複数のFAN40の温度を検出する温度検出部として機能する。   Further, the temperature information management unit 112 functions as a temperature detection unit that detects the temperatures of the plurality of FANs 40.

FAN回転数管理部113は、各FAN40の回転数(回転速度)の履歴を管理する。FAN回転数管理部113は、メモリ12のFAN回転数情報123を用いて各FAN40の回転数を管理する。FAN回転数管理部113は、FAN予測寿命管理部115からの要求に応じてFAN40の回転数を随時取得し、FAN予測寿命管理部115に通知する。FAN回転数管理部113は、収集したFAN回転数をFAN回転数情報123に記録する。   The FAN rotation speed management unit 113 manages the history of the rotation speed (rotation speed) of each FAN 40. The FAN rotation number management unit 113 manages the rotation number of each FAN 40 using the FAN rotation number information 123 of the memory 12. The FAN rotation speed management unit 113 acquires the rotation speed of the FAN 40 as needed in response to the request from the FAN predicted life management unit 115, and notifies the FAN predicted life management unit 115 of the rotation speed. The FAN rotation number management unit 113 records the collected FAN rotation number in the FAN rotation number information 123.

FAN配置履歴管理部114は、各FAN40の配置の履歴を管理する。FAN配置管理部114は、メモリ12のFAN配置履歴情報124を用いて各FAN40の配置履歴を管理する。FAN配置履歴管理部114は、FAN予測寿命管理部115からの要求に応じてFAN40の配置履歴を随時取得し、FAN予測寿命管理部115に通知する。例えば、FAN配置履歴管理部114は、FRU4から各スロットに取り付けられたFAN40のFAN IDを取得し、FAN配置履歴情報124に記録する。   The FAN placement history management unit 114 manages the placement history of each FAN 40. The FAN placement management unit 114 manages the placement history of each FAN 40 using the FAN placement history information 124 of the memory 12. The FAN placement history management unit 114 acquires the placement history of the FAN 40 at any time in response to a request from the FAN predicted life management unit 115, and notifies the FAN predicted life management unit 115 of the obtained history. For example, the FAN placement history management unit 114 acquires the FAN ID of the FAN 40 attached to each slot from the FRU 4 and records the FAN ID in the FAN placement history information 124.

FAN予測寿命管理部(寿命予測部)115は、各FAN40の寿命を予測する演算(寿命予測演算)を行なうことで、各FAN40の寿命予測を行なう。   The FAN predicted life management unit (life prediction unit) 115 performs life prediction of each FAN 40 by performing calculation (life prediction calculation) for predicting the life of each FAN 40.

FAN40の寿命予測を行なうに際して、FAN予測寿命管理部115は、変数“life_fan(ID)”,変数“life_static(POS)”および変数“count”を用いる。   When predicting the life of the FAN 40, the FAN predicted life management unit 115 uses the variable "life_fan (ID)", the variable "life_static (POS)" and the variable "count".

変数“life_fan(ID)”は、識別子がIDのFAN40の残寿命を表す。例えば、変数“life_fan(ID)”を1以下の数値とする。そして、life_fan(ID)= 1の場合に寿命がフルであるとし、その値が小さいほど残寿命が短いことを示すこととする。また、life_fan(ID)の初期値を1とする。   The variable “life_fan (ID)” represents the remaining life of the FAN 40 whose identifier is ID. For example, the variable "life_fan (ID)" is set to a value of 1 or less. Then, when life_fan (ID) = 1, it is assumed that the life is full, and the smaller the value is, the shorter the remaining life is. Also, the initial value of life_fan (ID) is 1.

変数“life_static(POS)”は、識別子がPOSのスロット位置がFAN40の寿命に与える影響を表す数値である。例えば、変数“life_static(POS)”を1以下の数値とし、その値が小さいほど、FAN40の残寿命(life_fan(ID))を短くするよう作用する。また、life_fan(ID)の初期値を1とする。   The variable “life_static (POS)” is a numerical value that represents the influence of the slot position of the POS identifier on the life of the FAN 40. For example, the variable “life_static (POS)” is set to a numerical value of 1 or less, and the smaller the value is, the shorter the remaining life (life_fan (ID)) of the FAN 40 is. Also, the initial value of life_fan (ID) is 1.

変数“count”は、ループ回数を数える。countの初期値を1とする。   The variable "count" counts the number of loops. The initial value of count is 1.

FAN予測寿命管理部115は、サンプリングされた各FAN40の温度に基づき、FAN40の寿命予測を行なう。   The FAN predicted life management unit 115 predicts the life of the FAN 40 based on the temperature of each FAN 40 sampled.

例えば、FAN予測寿命管理部115は、FANモータのグリス寿命の算出式に基づき、FAN40の寿命予測を行なう。具体的にはFAN予測寿命管理部115は、以下の式(1)〜(3)を用いて、各FAN40の予測寿命を算出する。   For example, the FAN predicted life management unit 115 predicts the life of the FAN 40 based on the formula for calculating the grease life of the FAN motor. Specifically, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40 using the following formulas (1) to (3).

log(L1) = A - B*T1 ・・・(1)
log(L2) = A - B*T2 ・・・(2)
l= 10^(A - Bt) ・・・(3)
なお、上記式において、L1は温度T1(単位:℃)におけるFAN40のカタログ値(仕様値)としての寿命(単位:h(時間))であり、L2は温度T2(単位:℃)におけるFAN40のカタログ値としての寿命(単位:h(時間))である。A,Bは定数であり、例えばFAN40に用いられるグリスに固有の値である。そして、lは温度t(単位:℃)におけるFAN40の寿命(単位:h(時間))である。
log (L1) = A-B * T1 (1)
log (L2) = A-B * T2 (2)
l = 10 ^ (A-Bt) (3)
In the above equation, L1 is the life (unit: h (hour)) as catalog value (specification value) of FAN 40 at temperature T 1 (unit: ° C.), and L 2 is the life of FAN 40 at temperature T 2 (unit: ° C.) It is the life (unit: h (hour)) as a catalog value. A and B are constants, for example, values unique to grease used for the FAN 40. And l is a life (unit: h (hour)) of FAN40 in temperature t (unit: ° C).

FAN予測寿命管理部115は、上記の式(1),(2)の連立式を解くことでA,Bを算出し、これらの算出したA,Bの値を式(3)に設定することで、FAN40の温度tにおける寿命lを算出する。   The FAN predicted life management unit 115 calculates A and B by solving the simultaneous equations of the above equations (1) and (2), and sets these calculated values of A and B in the equation (3). Then, the life l at the temperature t of the FAN 40 is calculated.

例えば、FAN#0〜#3に用いられる各FAN40は同種であり、FAN40の温度30℃(T1=30)で寿命70000h(L1=70000),40℃(T2=40)で寿命56000h(L2=56000)であるとする。   For example, each FAN 40 used for FANs # 0 to # 3 is the same type, and the life of FAN 40 is 30 ° C. (T1 = 30), and the life 70000 h (L1 = 70000), 40 ° C. (T2 = 40) 56000).

上記式(1),(2)より
log(70000) = A - B*30
log(56000) = A - B*40
となる。これらの連立式を解くことで、
A = 5.1358
B = 0.0096910
が求められる。
From the above equations (1) and (2)
log (70000) = A-B * 30
log (56000) = A-B * 40
It becomes. By solving these simultaneous expressions,
A = 5.1358
B = 0.0096910
Is required.

次に、上記式(3)に基づき、以下の式が得られる。   Next, the following equation is obtained based on the equation (3).

l = 10^(5.1358-0.0096910*t)
この式にサンプリングで読み取った温度tを代入すると、当該温度でのFAN40の予測寿命lが得られる。
l = 10 ^ (5.1358-0.0096910 * t)
Substituting the temperature t read by sampling into this equation, the predicted life l of the FAN 40 at that temperature is obtained.

例えば、温度FAN40の動作温度においてt=50度が読み取れたとすると、
l=44797h
となる。
For example, assuming that t = 50 degrees can be read at the operating temperature of the temperature fan 40,
l = 44797h
It becomes.

なお、FAN予測寿命管理部115によって算出された各FAN40の予測寿命は、例えば、メモリ12の所定の記憶領域に予測寿命履歴情報125として記録される。   The predicted life of each FAN 40 calculated by the FAN predicted life management unit 115 is recorded, for example, in a predetermined storage area of the memory 12 as predicted life history information 125.

また、FAN予測寿命管理部115は、以下の式(4)に基づいて、FAN40の温度取得にかかるサンプリング間隔S中に消費した消費寿命laを算出する。すなわち、以下の式(4)に示すように、FAN予測寿命管理部115は上記式(3)で求めた予測寿命lに温度のサンプリング間隔S(単位:ms)を掛け算して逆数をとることで、サンプリング間隔S中に消費した消費寿命laを算出する。   In addition, the FAN predicted life management unit 115 calculates the consumption life la consumed during the sampling interval S for obtaining the temperature of the FAN 40 based on the following formula (4). That is, as shown in the following expression (4), the FAN predicted life management unit 115 multiplies the predicted life l determined by the above expression (3) by the sampling interval S (unit: ms) of the temperature and takes the reciprocal. Then, the consumption life la consumed during the sampling interval S is calculated.

la = 1/(t*S) ・・・(4)
例えば、温度のサンプリング間隔10msである場合には、上記式(4)に基づき、以下のように求められる。
la = 1 / (t * S) (4)
For example, in the case where the sampling interval of temperature is 10 ms, the following equation is obtained based on the above equation (4).

la = 1/(0.01*(44797*60*60))
FAN予測寿命管理部115は、それぞれのサンプリングデータ毎に 消費寿命laを計算し、life_fan(ID), life_static(POS)から減算する。
la = 1 / (0.01 * (44797 * 60 * 60))
The FAN predicted life management unit 115 calculates the consumed life la for each of the sampling data, and subtracts it from the life_fan (ID) and the life_static (POS).

切替制御部116は、FAN予測寿命管理部115による寿命予測の結果に基づき、予測寿命が短いと判断されるFAN40の負荷を軽減するための処理を行なう。   The switching control unit 116 performs processing for reducing the load of the FAN 40 determined to have a short predicted life based on the result of the life prediction by the FAN predicted life management unit 115.

例えば、切替制御部116は、FAN予測寿命管理部115による寿命予測の結果、複数のFAN40のうち、予測寿命が最も長いFAN40(長寿命FAN40)と予測寿命が最も短いFAN40(短寿命FAN40)との予測寿命の差が所定値(例えば、1か月)以上であるかを確認する。すなわち、切替制御部116は、複数のFAN40間において予測寿命のばらつきが生じているかを確認する。   For example, as a result of the life prediction by the FAN predicted life management unit 115, the switching control unit 116 determines that the FAN 40 (long life FAN 40) having the longest predicted life and the FAN 40 (short life FAN 40) having the shortest predicted life among the plurality of FANs 40. It is confirmed whether or not the difference in the predicted life of is not less than a predetermined value (for example, one month). That is, the switching control unit 116 confirms whether or not variation in predicted life occurs among the plurality of FANs 40.

切替制御部116は、例えば、複数のFAN40間において予測寿命のばらつきが生じており(条件1)、且つ、本サーバシステム1においてDP(Dynamic Partitioning)機能が有効(条件2)である場合に、DP機能を用いて、短寿命FAN40の負荷を軽減させる制御を行なう。   For example, when there is a variation in predicted life among a plurality of FANs 40 (condition 1) and the DP (Dynamic Partitioning) function is valid (condition 2) in the server system 1, the switching control unit 116 The DP function is used to perform control to reduce the load on the short life FAN 40.

DPは、本サーバシステム1において、パーティションのシステム(サーバ装置3)を停止させることなくパーティション構成を動的に変更する機能である。DPにおいては、例えば、パーティションに対して、CPUやメモリ,IOユニット等のハードウェア資源を動的に追加,削除,交換(活性構成変更)することができる。なお、DPは既知の手法で実現することができ、その詳細な説明は省略する。   The DP is a function of dynamically changing the partition configuration in the server system 1 without stopping the partition system (server apparatus 3). In DP, for example, hardware resources such as a CPU, a memory, and an IO unit can be dynamically added to, deleted from, and exchanged (change in active configuration) to a partition. Note that DP can be realized by a known method, and the detailed description thereof is omitted.

本サーバシステム1において、DPにより追加・削除を行なう単位は、パーティション構成要素であるSB,LSB(Logical System Board),IOU(PCIeボックスを含む)である。
SBホットプラグ機能を利用することで、パーティション上で動作するOSの再起動なしに、SBをパーティションに組み込み・切り離しができる。
In the server system 1, units to be added / deleted by DP are partition components SB, LSB (Logical System Board), IOU (including PCIe box).
By using the SB hot plug function, the SB can be incorporated into and detached from the partition without rebooting the OS operating on the partition.

なお、このようなSBのパーティションへの組み込みや切り離しは、サーバシステム1において、事前にDP機能を有効にして一定の構成を構築済みであること、およびOSがDP機能をサポートしていること等が条件となる。   It should be noted that such incorporation or detachment of SBs into partitions is enabled in advance by enabling the DP function in the server system 1 and that a certain configuration has been built, and that the OS supports the DP function, etc. Is the condition.

図8は実施形態の一例としてのサーバシステム1における切替制御部116によるSB5の切り替え制御を説明するための図である。この図8においては、FAN40間において予測寿命のばらつきが生じていることが検知された場合における、この予測寿命のばらつきを解消するための5種類(パターン1〜5)の制御手法を例示する。   FIG. 8 is a diagram for describing switching control of SB 5 by the switching control unit 116 in the server system 1 as an example of the embodiment. In FIG. 8, there are illustrated five types (patterns 1 to 5) of control methods for eliminating the variation of the predicted life when it is detected that the variation of the predicted life among the FANs 40 has occurred.

図8に示す例において、元の状態(オリジナル)においては(符号A1参照)、SB#0,#1が稼働状態(ON状態)であり、SB#2,#3がスタンバイ状態(SBY状態)である。このオリジナルのサーバシステム1においては、ON状態のSB#0,#1に対して、FAN#0,#1が冷却風の送風を行なっている。また、稼働中の全てのFAN#0〜#3のFAN回転数は通常回転(Normal)である。   In the example shown in FIG. 8, in the original state (original) (see reference A1), SBs # 0 and # 1 are in the operating state (ON) and SBs # 2 and # 3 are in the standby state (SBY) It is. In the original server system 1, the fans # 0 and # 1 blow cooling air to the SBs # 0 and # 1 in the ON state. In addition, the FAN rotation numbers of all the running fans # 0 to # 3 are normal rotations (Normal).

このような状態において、負荷が高いFAN#0,#2が高温状態となり、この高温状態がFAN40#0,#2の寿命に影響を与え短寿命化を招く。また、一部のFAN#0,#2だけが高温となることにより、本サーバシステム1に備えられた複数のFAN40間において予測寿命のばらつきが生じる。   In such a state, the high load FANs # 0 and # 2 are in a high temperature state, and this high temperature state affects the life of the FANs 40 # 0 and # 2, resulting in shortening of the life. In addition, when only a part of the FANs # 0 and # 2 become high temperature, a variation in predicted life occurs among the plurality of FANs 40 provided in the server system 1.

切替制御部116は、SB5の切り替え制御を行なうことで、これらのFAN40#0,#2の負荷を軽減する。これにより、特定のFAN40だけが高温となることを阻止し、本サーバシステム1に備えられた複数のFAN40間において予測寿命のばらつきを解消する。   The switching control unit 116 performs switching control of SB 5 to reduce the load on these FANs 40 # 0 and # 2. As a result, it is possible to prevent only the specific FAN 40 from becoming high temperature, and eliminate the variation of the predicted life among the plurality of FANs 40 provided in the server system 1.

切替制御部116は、FAN予測寿命管理部115による寿命予測の結果、複数のFAN40間において予測寿命が最も短い短寿命FAN40(予測短寿命冷却部品)と、予測寿命が最も長い長寿命FAN40(予測長寿命冷却部品)との間に、予測寿命が閾値以上(例えば、1か月以上)の差(ばらつき)が検出された場合に、SB5の構成変更を行なう構成変更制御部として機能する。   The switching control unit 116, as a result of the life prediction by the FAN predicted life management unit 115, a short life FAN 40 (the predicted short life cooling component) with the shortest predicted life among the plurality of FANs 40 and a long life FAN 40 (the prediction with the longest predicted life). It functions as a configuration change control unit that changes the configuration of SB5 when a difference (variation) between the predicted life and the threshold value (for example, one month or more) with the long-life cooling component is detected.

例えば、切替制御部116は、複数のFAN40間において予測寿命のばらつきが生じている場合に、本サーバシステム1がDPによる切り替えを実行可能であるかを確認する。   For example, the switch control unit 116 confirms whether or not the server system 1 can execute the switching by the DP, when the predicted lifespan varies among the plurality of FANs 40.

本サーバシステム1がDPによる切り替えを実行可能である場合には、切替制御部116はこのDPの機能を用いたSB5の構成変更を行なう(符号A2参照)。   When the server system 1 is capable of executing switching by DP, the switching control unit 116 changes the configuration of SB 5 using the function of this DP (see symbol A2).

そして、切替制御部116は本サーバシステム1において、DPを即時に実行可能であるかを確認する(符号A3参照)。   Then, the switching control unit 116 confirms whether or not the DP can be immediately executed in the server system 1 (see a symbol A3).

例えば、切替制御部116は、メモリ12の所定の記憶領域に設定されている、本サーバシステム1においてDP機能を有効にするか否か等を示すフラグの設定値を確認することで、DPを即時実行可能であるかを判断する。   For example, the switching control unit 116 checks the setting value of the flag, which is set in a predetermined storage area of the memory 12 and indicates whether to enable the DP function in the server system 1, etc. Determine if immediate execution is possible.

確認の結果、本サーバシステム1において、DPによるSB5の切り替えを即時に実行可能である場合に、切替制御部116は、DPによるSB5の切替制御を行なう(パターン1)。   As a result of the confirmation, when it is possible to immediately execute switching of SB 5 by DP in the server system 1, the switching control unit 116 performs switching control of SB 5 by DP (pattern 1).

すなわち、切替制御部116は、DPのSB切替機能を用いて、SB#2,#3をON状態にする一方で、SB#0,#1をスタンバイ状態(SBY)にする。FAN#0,#2が冷却対象とするSB#0,#1をスタンバイ状態にすることで、これらのFAN#0,#2の負荷が低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。   That is, the switching control unit 116 sets the SBs # 2 and # 3 to the ON state while setting the SBs # 0 and # 1 to the standby state (SBY) by using the DP SB switching function. By placing the SBs # 0 and # 1 to be cooled by the FANs # 0 and # 2 in the standby state, the loads on these FANs # 0 and # 2 are reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する熱影響が小さいSB5をDPによりON状態とするSB5として優先的に選択することが望ましい。これにより、短寿命FAN40にかかる温度負荷を効率的に分散させる。   When there are a plurality of SBs 5 in the standby state, it is desirable that the switching control unit 116 preferentially select the SBs 5 having a small thermal effect on the short-lived FAN 40 as the SBs 5 to be turned on by DP. Thereby, the temperature load applied to the short life FAN 40 is efficiently dispersed.

図9は実施形態の一例としてのサーバシステム1における温度影響情報126を例示する図である。   FIG. 9 is a diagram illustrating temperature influence information 126 in the server system 1 as an example of the embodiment.

温度影響情報126は、FAN40に対するSB5の影響を数値として表す情報であり、個々のSB5の発熱が各FAN40に対して与える影響(温度影響)を表す。図9に示す例においては、SB5とFAN40との組み合わせのそれぞれに、係数Amnが設定されている(m,nはそれぞれ自然数)。係数Amnは各SB5がどのFAN40に対して熱を与えやすいかを示す値であり、熱を与えやすいほど大きな値が設定される。温度影響情報126は、事前に行なわれる試験結果等に基づいて具体的な各数値が設定されて作成され、予めメモリ12等に格納される。   The temperature influence information 126 is information representing the influence of the SB 5 on the FAN 40 as a numerical value, and represents the influence (temperature influence) exerted on each FAN 40 by the heat generation of the individual SB 5. In the example shown in FIG. 9, the coefficient Amn is set to each of the combinations of SB5 and FAN40 (m and n are natural numbers). The coefficient Amn is a value that indicates to which FAN 40 each SB 5 easily applies heat, and a larger value is set as heat is more easily applied. The temperature influence information 126 is created by setting specific numerical values on the basis of test results and the like performed in advance, and is stored in advance in the memory 12 or the like.

すなわち、温度影響情報126は、発熱しやすいユニットであるSB5が、どのFAN40に対して熱(熱影響)を与えやすいかを示す係数(Amn)を予め定義したものである。   That is, the temperature influence information 126 defines in advance a coefficient (Amn) indicating to which FAN 40 the SB 5 which is a unit easy to generate heat tends to give heat (heat influence).

なお、図9においてはn個(nは自然数)のFAN#0〜#n−1と、m個(mは自然数)のSB#0〜#m−1とについての温度影響情報126を示すものである。図1に例示するサーバシステム1の構成においては、4つのFAN40と4つのSB5が搭載されているのでn=m=4となる。   In FIG. 9, the temperature influence information 126 for n (n is a natural number) FANs # 0 to # n-1 and m (m is a natural number) SBs # 0 to # m-1 is shown. It is. In the configuration of the server system 1 illustrated in FIG. 1, since four FANs 40 and four SBs 5 are mounted, n = m = 4.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、この温度影響情報126を参照して、短寿命FAN40について係数Amnの値が最も小さいSB5をDPによりON状態とするSB5として選択する。すなわち、切替制御部116は、短寿命FAN40への熱影響が最も小さいSB5を選択する。これにより、短寿命FAN40にかかる温度負荷を効率的に分散させることができる。   When there are a plurality of SB5 in the standby state, the switching control unit 116 refers to the temperature influence information 126 to select the SB5 having the smallest value of the coefficient Amn for the short-life FAN 40 as the SB5 to be turned ON by DP. . That is, the switching control unit 116 selects SB5 that has the smallest thermal influence on the short life FAN 40. Thereby, the temperature load concerning short life FAN40 can be distributed efficiently.

このように、パターン1においては、切替制御部116は、複数のSB5のうち、短寿命FAN40に対する熱影響が最も低いSB5を稼働させる構成変更を行なう。これにより、稼働させたSB5に対応するFAN40を作動させ、短寿命FAN40の負荷を軽減させるのである。   As described above, in the pattern 1, the switching control unit 116 performs configuration change of operating the SB 5 having the lowest thermal influence on the short life FAN 40 among the plurality of SBs 5. As a result, the FAN 40 corresponding to the activated SB 5 is operated to reduce the load on the short life FAN 40.

なお、切替制御部116は、スタンバイ状態のSB5が複数ある場合に、短寿命FAN40と物理的に近い位置にあるSB5をDPによりON状態とするSB5として優先して選択してもよい。   When there are a plurality of SBs 5 in the standby state, the switching control unit 116 may preferentially select the SB 5 physically close to the short-life FAN 40 as the SBs 5 to be turned on by the DP.

一方、確認の結果、本サーバシステム1において、DPによるSB5の切り替えを即時に実行可能でない場合に、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう(パターン2)。   On the other hand, as a result of confirmation, in the case where the server system 1 can not immediately execute switching of the SB 5 by the DP, the switching control unit 116 performs addition control of SB 5 by the hot plug function of DP (pattern 2).

すなわち、切替制御部116は、DPのホットプラグ機能を用いて、スタンバイ状態であったSB#2,#3をON状態にすることで、これらのSB#2,#3を追加する。   That is, the switching control unit 116 adds the SBs # 2 and # 3 by setting the SBs # 2 and # 3 in the standby state to the ON state using the hot plug function of the DP.

これにより、SB#0〜#3の全てがON状態になり、SB#0〜#3の間において負荷が分散される。従って、FAN#0,#2が冷却対象とするSB#0,#1の負荷が低減して発熱量が低下し、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。   As a result, all the SBs # 0 to # 3 are turned ON, and the load is distributed among the SBs # 0 to # 3. Therefore, the load of SBs # 0 and # 1 to be cooled by FAN # 0 and # 2 is reduced, the amount of heat generation is reduced, and the load (high temperature load) of FANs # 0 and # 2 is also reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

このように、パターン2においては、切替制御部116は、SB5を追加する構成変更を行ない、追加されたSB5に対応するFAN40を作動させることで、短寿命FAN40の負荷を軽減させるのである。   As described above, in the pattern 2, the switching control unit 116 changes the configuration to add SB5 and operates the FAN 40 corresponding to the added SB5 to reduce the load of the short-life FAN 40.

なお、スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40と物理的に遠い位置にあるSB5を優先してON状態にすることが望ましい。   When there are a plurality of SBs 5 in the standby state, it is desirable that the switching control unit 116 prioritizes the SBs 5 physically distant from the short-life FAN 40 to be in the ON state.

一方、本サーバシステム1がDPによる切り替えを実行不可である場合には、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なう。すなわち、リザーブドSB5をON状態にすることで、SB5の構成変更を行なう(符号A4参照)。   On the other hand, when the server system 1 can not execute the switching by the DP, the switching control unit 116 switches the static SB 5 using the reserved SB 5. That is, the configuration change of SB5 is performed by turning on Reserved SB5 (see A4).

切替制御部116は本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能であるかを確認する(符号A6参照)。例えば、切替制御部116は、メモリ12の所定の記憶領域に設定されている、本サーバシステム1においてリザーブドSB5を用いた静的なSB5の切り替えを有効にするか否か等を示すフラグの設定値を確認することで、当該切り替えを実行可能であるかを判断する。   The switching control unit 116 confirms whether or not the switching of the static SB 5 using the reserved SB 5 can be immediately performed in the server system 1 (see symbol A 6). For example, the switching control unit 116 sets a flag, which is set in a predetermined storage area of the memory 12, and indicates whether or not to enable static SB 5 switching using the reserved SB 5 in the server system 1, and the like. By checking the value, it is determined whether the switching can be performed.

確認の結果、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合に、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行なう(パターン3)。   As a result of the confirmation, in the server system 1, when it is possible to immediately execute switching of static SB 5 using reserved SB 5, the switching control unit 116 performs switching of SB 5 using reserved SB 5 (pattern 3). ).

すなわち、切替制御部116は、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。   That is, the switching control unit 116 sets the reserved SB # 2 to the ON state, and sets the SB # 0 to the standby state (SBY).

これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。   As a result, in addition to FANs # 0 and # 2, fans # 1 and # 3 for cooling SB # 2 are also blown, and all fans # 0 to # 3 are blown and fan # The load of 0, # 2 (high temperature load) is also reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する影響が小さいリザーブドSB5をDPによりON状態とするSB5として優先的に選択することが望ましい。   When there are a plurality of SBs 5 in the standby state, it is desirable that the switching control unit 116 preferentially select the reserved SBs 5 having a small influence on the short life FAN 40 as the SBs 5 to be turned on by DP.

一方、確認の結果、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に不可である場合には、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう(パターン4)。   On the other hand, as a result of confirmation, when it is impossible to immediately switch static SB 5 using reserved SB 5 in this server system 1, a part of the time zone such as night time in which the operation rate is low in this server system 1. Then, switching of SB5 using Reserved SB5 is performed (pattern 4).

すなわち、切替制御部116は、本サーバシステム1に稼働率が低い時間帯において、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。   That is, in a time zone where the operation rate of the server system 1 is low, the switching control unit 116 sets the reserved SB # 2 to the ON state, and sets the SB # 0 to the standby state (SBY).

これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。   As a result, in addition to FANs # 0 and # 2, fans # 1 and # 3 for cooling SB # 2 are also blown, and all fans # 0 to # 3 are blown and fan # The load of 0, # 2 (high temperature load) is also reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

また、リザーブドSB5を用いたSB5の切り替えが行なわれるまでの間は、稼働中のFAN#0〜#3のFAN回転数をそれぞれ上げる。これにより、本サーバシステム1の筐体1a内の温度が低下し、結果的にFAN#0,2の負荷が低減することになる。   In addition, during switching of SB 5 using Reserved SB 5, the number of fan rotation of FANs # 0 to # 3 in operation is increased. As a result, the temperature in the chassis 1a of the server system 1 decreases, and as a result, the load on the FANs # 0 and # 2 is reduced.

本サーバシステム1がDPによる切り替えと、リザーブドSB5を用いた静的なSB5の切り替えとのいずれも実行できない場合もある(符号A5参照)。   In some cases, the server system 1 can not execute both the switching by DP and the switching of the static SB 5 using the reserved SB 5 (see a symbol A 5).

このような場合においては、稼働中全てのFAN40のFAN回転数を上げてHighにする(パターン5)。これにより、本サーバシステム1の筐体1a内の温度が低下し、結果的にFAN#1,2の負荷(高温負荷)が低減することになる。   In such a case, the fan rotational speeds of all the fans 40 in operation are increased to High in operation (pattern 5). As a result, the temperature in the chassis 1a of the server system 1 is lowered, and as a result, the loads (high temperature loads) of the FANs # 1 and # 2 are reduced.

このように、切替制御部116は、複数のFAN40の回転速度を高くする制御を行なうことで、短寿命FAN40の負荷を軽減させるのである。   As described above, the switching control unit 116 reduces the load on the short-lived FAN 40 by performing control to increase the rotational speeds of the plurality of FANs 40.

また、切替制御部116は、FAN予測寿命管理部115によって算出された各FAN40の予測寿命に基づいて、本サーバシステム1内における複数のFAN40の最適配置を決定する機能(FAN最適配置決定機能)を有する。   In addition, the switching control unit 116 has a function of determining the optimum arrangement of the plurality of FANs 40 in the server system 1 based on the predicted life of each FAN 40 calculated by the FAN predicted life management unit 115 (FAN optimum arrangement determining function) Have.

例えば、本サーバシステム1がn個のFAN40をスロット位置に搭載する場合に、その搭載のしかたは、n−1通り存在する。切替制御部116は、これらのn−1通りのFAN40とスロット位置との全ての組み合わせを列挙する。 For example, when the server system 1 mounts n FANs 40 at slot positions, there are n P n -1 ways of mounting. The switching control unit 116 enumerates all combinations of these n P n-1 FANs 40 and slot positions.

図10は実施形態の一例としてのサーバシステム1におけるFAN40とスロット位置との組み合わせをテーブル状に例示する図である。   FIG. 10 is a diagram illustrating a combination of the FAN 40 and the slot position in the server system 1 as an example of the embodiment in a table form.

この図10に示す例においては、4つのFAN40(FAN ID=A,B,C,D)を、識別子POSが“101”,“102”,“103”,“104”である4つのスロットに取り付ける全ての組み合わせ(=24通り)を示している。 In the example shown in FIG. 10, four FANs 40 (FAN ID = A, B, C, D) are assigned to four slots whose identifiers POS are "101", "102", "103", "104". All combinations ( 4 P 3 = 24 ways) to be attached are shown.

以下、FAN ID=Aで特定されるFAN40をFAN(A)と表す。同様に、FAN IDB,C,Dで特定されるFAN40を、それぞれFAN(B),FAN(C),FAN(D)と表す。   Hereinafter, the FAN 40 specified by FAN ID = A is represented as FAN (A). Similarly, FAN40 specified by FAN IDB, C, and D is represented as FAN (B), FAN (C), and FAN (D), respectively.

また、FAN予測寿命管理部115によって算出されたFAN(A)の残寿命life_fan(A)=0.5とする。同様に、FAN(B)の残寿命life_fan(B)=0.7,FAN(C)の残寿命life_fan(C)=0.4,FAN(D)の残寿命life_fan(D)=0.3とする。   In addition, it is assumed that the remaining life life_fan (A) of FAN (A) calculated by the FAN predicted life management unit 115 = 0.5. Similarly, the remaining life life_fan (B) of FAN (B) = 0.7, the remaining life life of fan (C) life_fan (C) = 0.4, and the remaining life life of fan (D) life_fan (D) = 0.3.

さらに、識別子101のスロット位置が寿命に与える影響を表す数値life_static(101)=0.9とする。同様に、識別子102のスロット位置が寿命に与える影響を表す数値life_static(102)=0.9,識別子103のスロット位置が寿命に与える影響を表す数値life_static(103)=0.8,識別子104のスロット位置が寿命に与える影響を表す数値life_static(104)=0.7とする。   Furthermore, it is assumed that the value life_static (101) = 0.9, which represents the influence of the slot position of the identifier 101 on the life. Similarly, a value life_static (102) = 0.9 indicating the effect of the slot position of the identifier 102 on the life, a value life_static (103) = 0.8 indicating the effect of the slot position of the identifier 103 on the life, and a slot position of the identifier 104 It is assumed that the value life_static (104) = 0.7 represents the effect on.

図10に示すテーブルには、各FAN40の組み合わせについて、スロット位置による影響を考慮した残寿命[life_fan(ID)-(1- life_static(POS))]が登録されている。   In the table shown in FIG. 10, the remaining life [life_fan (ID) − (1−life_static (POS))] is registered for each combination of the FANs 40 in consideration of the influence of the slot position.

以下、スロット位置による影響を考慮した残寿命を更新済み残寿命といい、life(ID,POS)と表す場合がある。   Hereinafter, the remaining life considering the influence of the slot position is referred to as updated remaining life, and may be expressed as life (ID, POS).

life(ID,POS) = life_fan(ID) - (1 - life_static(POS))
さらに、図10に例示するテーブルには、各組み合わせ毎に、当該組み合わせに含まれる各FAN40の更新済み残寿命life(ID,POS)を昇順に並べ換えた情報(更新済み残寿命の昇順)も、その右側に併記されている。
life (ID, POS) = life_fan (ID)-(1-life_static (POS))
Furthermore, in the table illustrated in FIG. 10, information in which the updated remaining life (life, ID, POS) of each FAN 40 included in the combination is rearranged in ascending order for each combination (the ascending order of the updated remaining life) is also It is written on the right side.

この昇順に並べ換えられた更新済み残寿命life(ID,POS)の組み合わせにおいて、その最小値を代表値とする。   In the combination of the updated remaining life life (ID, POS) sorted in ascending order, the minimum value is taken as a representative value.

これにより、この図10に示すテーブルを参照することで、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせを容易に特定することができる。また、各組み合わせにおける代表値を参照することで、更新済み残寿命の最小値の比較を容易に行なうことができる。   Thus, by referring to the table shown in FIG. 10, it is possible to easily identify the combination of the FAN 40 and the slot position having the largest updated remaining life value. Further, by referring to the representative value in each combination, comparison of the minimum value of the updated remaining life can be easily performed.

切替制御部116は、FAN40とスロット位置との全ての組み合わせの中から、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせを1組選択し、FAN40とスロット位置との最適な組み合わせ(FAN40の最適配置)として採用する。   The switching control unit 116 selects one set of the combination of the FAN 40 and the slot position having the largest minimum value of the updated remaining life from among all combinations of the FAN 40 and the slot position, and optimizes the FAN 40 and the slot position. Adopted as a combination (optimal placement of FAN 40).

また、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせが複数ある場合には、更新済み残寿命の2番目に小さい値や3番目に小さい値を適宜順番に比較し、更新済み残寿命が最も大きい組み合わせを1組選択(採用)することが望ましい。   In addition, when there are a plurality of combinations of the FAN 40 and the slot position where the minimum value of the updated remaining life is the largest, the second smallest value and the third smallest value of the updated remaining life are compared in order and updated It is desirable to select (adopt) one set having the largest remaining service life.

例えば、図10に示す例においては、更新済み残寿命の最小値が最も大きい組み合わせは、更新済み残寿命の最小値が0.2である、No.6,12,17,18,20,22,24で特定される各組み合わせである。これらのうち、更新済み残寿命の最小値が2番目に小さい組み合わせは、更新済み残寿命の2番目に小さい値0.3である、No.17,18で特定される2つの組み合わせである(図10の符号P1参照)。   For example, in the example shown in FIG. 10, the combination having the largest updated remaining life value is the one having the least updated remaining life value of 0.2. It is each combination specified by 6, 12, 17, 18, 20, 22, 24. Among these, the combination in which the minimum value of the updated remaining life is the second smallest is the second smallest value of the updated remaining life, 0.3. This is a combination of two identified by 17 and 18 (see the symbol P1 in FIG. 10).

これらの2つの組み合わせは、昇順に並べ換えた更新済み残寿命の組み合わせが同じであるので、切替制御部116は、これらのいずれの組み合わせを選択してもよい。   Since these two combinations are the same combination of the updated remaining life sorted in ascending order, the switching control unit 116 may select any of these combinations.

切替制御部116によって決定されたFAN40の最適配置は、FAN最適配置情報として管理端末装置2に作業指示情報とともに送信される。   The optimal arrangement of the FANs 40 determined by the switching control unit 116 is transmitted to the management terminal 2 together with the work instruction information as the FAN optimum arrangement information.

作業指示情報は、保守作業員に対して提示される作業指示に関する情報であり、サーバシステム1におけるFAN40の配置を変更させる作業指示を含む。このFAN40の配置を変更させる作業指示は、FAN最適配置情報に示される配置(最適配置)従って、保守作業員に、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更させる。   The work instruction information is information on a work instruction presented to the maintenance worker, and includes a work instruction for changing the arrangement of the FANs 40 in the server system 1. The work instruction for changing the arrangement of the FAN 40 causes the maintenance worker to change the position of the FAN 40 attached to the slot of the server system 1 according to the arrangement (optimal arrangement) indicated in the FAN optimum arrangement information.

[管理端末装置2]
管理端末装置2は、CE等の保守作業員やシステム管理者が使用する情報処理装置であり、CPU21の他、図示しないメモリ,ディスプレイ,キーボードやマウス等の入力装置を備える。
[Management terminal device 2]
The management terminal device 2 is an information processing device used by a maintenance worker such as a CE or a system administrator, and includes an input device such as a memory, a display, a keyboard, a mouse and the like (not shown) in addition to the CPU 21.

CPU21は、メモリ等の記憶装置に格納されたOSや管理端末用プログラムを実行することで、FAN最適配置情報抽出部22および結果表示制御部23としての機能を実現する。   The CPU 21 realizes functions as the FAN optimum arrangement information extraction unit 22 and the result display control unit 23 by executing the OS and the management terminal program stored in the storage device such as a memory.

FAN最適配置情報抽出部22は、サーバ装置3から作業指示情報とともに送信されたFAN最適配置情報を抽出する。   The FAN optimum arrangement information extraction unit 22 extracts the FAN optimum arrangement information transmitted together with the work instruction information from the server device 3.

結果表示制御部23は、FAN最適配置情報抽出部22によって抽出されたFAN最適配置情報を、図示しないディスプレイに表示させたり、プリンタを介して印刷させることで出力させる。   The result display control unit 23 outputs the FAN optimum arrangement information extracted by the FAN optimum arrangement information extraction unit 22 by displaying it on a display (not shown) or printing it via a printer.

保守作業員は、このようにして出力されたFAN最適配置情報に従って、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更させる。   The maintenance worker changes the position of the FAN 40 attached to the slot of the server system 1 according to the FAN optimum arrangement information output in this manner.

(B)動作
上述の如く構成された実施形態の一例としてのサーバシステム1におけるFAN40の最適配置制御方法の概要を、図11に示すフローチャート(ステップB1〜B9)に従って説明する。
(B) Operation The outline of the method for controlling the optimal arrangement of the FANs 40 in the server system 1 as an example of the embodiment configured as described above will be described according to the flowchart (steps B1 to B9) shown in FIG.

本サーバシステム1に電源投入が行なわれると(装置パワーオン)、ステップB1において、各FAN40が回転を開始する。   When the server system 1 is powered on (apparatus power on), the fans 40 start rotating in step B1.

ステップB2において、MMB10が各種監視を開始する。具体的には、構成情報管理部111,温度情報管理部112およびFAN回転数管理部113が、本サーバシステム1に備えられた各SB5の構成や、各FAN40の温度,各FAN40の回転数の監視をそれぞれ行なう。   In step B2, the MMB 10 starts various monitoring. Specifically, the configuration information management unit 111, the temperature information management unit 112, and the FAN rotation speed management unit 113 have the configuration of each SB 5 provided in the server system 1, the temperature of each FAN 40, and the rotation speed of each FAN 40. Monitor each one.

ステップB3において、FAN予測寿命管理部115が、各FAN40の予測寿命を演算する。ステップB4において、切替制御部116が、DPを用いたSB5の構成変更やリザーブドSB5を用いたSB5の切り替え、FAN回転数等を行なう。なお、これらのステップB3,B4の処理は、本サーバシステム1において日常的に行なわれる(デイリー監視)。   In step B3, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step B4, the switching control unit 116 changes the configuration of SB 5 using DP, switches SB 5 using reserved SB 5, performs the FAN rotation speed, and the like. The processing of these steps B3 and B4 is routinely performed in the server system 1 (daily monitoring).

また、本サーバシステム1の定期点検時において、以下のステップB5,B6の処理が行なわれる。   Further, at the time of periodic inspection of the server system 1, the following processing of steps B5 and B6 is performed.

すなわち、ステップB5において、FAN予測寿命管理部115が各FAN40の予測寿命を演算する。ステップB6において、切替制御部116が、FAN40の最適配置を決定し、管理端末装置2を介して保守作業員等にFAN最適配置情報と作業指示情報とを通知する。保守作業員は、通知されたFAN最適配置情報に応じて、FAN40の配置交換等の作業を行なう。作業終了後には、必要に応じて装置パワーオンが行なわれ、本フローチャートの先頭からの処理が再度行なわれてもよい。   That is, in step B5, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step B6, the switching control unit 116 determines the optimal arrangement of the FAN 40, and notifies the maintenance worker or the like of the FAN optimum arrangement information and the work instruction information via the management terminal device 2. The maintenance worker carries out work such as placement replacement of the FAN 40 according to the notified FAN optimum placement information. After completion of the work, the apparatus power on may be performed as needed, and the process from the beginning of the flowchart may be performed again.

上記のステップB1〜B6の処理は、本サーバシステム1の保守対応期間において行なわれるものであり、本サーバシステム1が稼働を開始してから例えば5年が経過するまでの期間に行なわれる。   The processes in steps B1 to B6 described above are performed in the maintenance support period of the server system 1, and are performed in a period from, for example, five years after the start of operation of the server system 1.

本サーバシステム1が稼働を開始してから例えば5年が経過した後は、保守対応期間が終了する。   After five years, for example, have elapsed since the server system 1 started operation, the maintenance response period ends.

ステップB7において、本サーバシステム1のオーバーホールの実施の有無を確認する。確認の結果、オーバーホールを行なう場合には(ステップB7の“有”ルート参照)、オーバーホールを行なった後、装置パワーオンが行なわれ、本フローチャートの先頭からの処理が再度行なわれる。   In step B7, it is checked whether or not overhaul of the server system 1 has been performed. As a result of confirmation, in the case where overhaul is performed (refer to the “presence route” in step B7), after the overhaul is performed, the apparatus power on is performed, and the process from the top of this flowchart is performed again.

ステップB7における確認の結果、オーバーホールを行なわない場合には(ステップB7の“無”ルート参照)、ステップB8に移行する。   As a result of confirmation in step B7, if overhaul is not to be performed (see the "absent" route in step B7), the process proceeds to step B8.

ステップB8において、FAN予測寿命管理部115が、各FAN40の予測寿命を演算する。ステップB9において、切替制御部116が、DPを用いたSB5の構成変更やリザーブドSB5を用いたSB5の切り替え、FAN回転数等を行なう。なお、これらのステップB8,B9の処理も、本サーバシステム1において日常的に行なわれる(デイリー監視)。また、ステップB7〜B9の処理は、本サーバシステム1が稼働を開始してから例えば5年が経過した後に行なわれる。   In step B8, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step B9, the switching control unit 116 changes the configuration of SB 5 using DP, switches SB 5 using reserved SB 5, performs the FAN rotation speed, and the like. The processes of these steps B8 and B9 are also routinely performed in the server system 1 (daily monitoring). Further, the processing in steps B7 to B9 is performed, for example, after 5 years have elapsed since the server system 1 started operation.

その後、本サーバシステム1の稼働処理を終了する。   Thereafter, the operation process of the server system 1 is ended.

次に、実施形態の一例としてのサーバシステム1におけるFAN40の最適配置管理を実現するための各機能構成部の処理を、図12に示すシーケンス図に従って説明する。   Next, processing of each functional configuration unit for realizing the optimal arrangement management of the FANs 40 in the server system 1 as an example of the embodiment will be described according to the sequence diagram shown in FIG.

先ず、管理端末装置2において、保守プログラムの実行が開始される(符号C1参照)。   First, in the management terminal 2, the execution of the maintenance program is started (see reference numeral C1).

サーバ装置3の各SB5のBMC50が、自身が動作するSB5の構成を監視し、MMB10のメモリ12の構成情報121に記録する(符号C2参照)。   The BMC 50 of each SB 5 of the server device 3 monitors the configuration of the SB 5 on which the server device 3 operates, and records the configuration in the configuration information 121 of the memory 12 of the MMB 10 (see symbol C2).

また、各SB5のBMC50が、自身が動作するSB5に対応するFAN40の温度を監視し、MMB10のメモリ12の温度情報122に記録する(符号C3参照)。さらに、BMC50が、自身が動作するSB5に対応するFAN40の回転数の監視を行ない、検出した各FAN40の回転数をFAN回転数情報123に記録する(符号C4参照)。   Further, the BMC 50 of each SB 5 monitors the temperature of the FAN 40 corresponding to the SB 5 in which it operates, and records the temperature in the temperature information 122 of the memory 12 of the MMB 10 (see the code C 3). Furthermore, the BMC 50 monitors the rotational speed of the FAN 40 corresponding to the SB 5 on which it operates, and records the detected rotational speed of each FAN 40 in the FAN rotational speed information 123 (see the code C4).

MMB10において、構成情報管理部111が構成情報121からSB5の構成情報を取得する(符号C5参照)。   In the MMB 10, the configuration information management unit 111 acquires configuration information of the SB 5 from the configuration information 121 (see reference symbol C5).

MMB10において、温度情報管理部112が温度情報122からFAN40の温度情報を取得する(符号C6参照)。   In the MMB 10, the temperature information management unit 112 acquires the temperature information of the FAN 40 from the temperature information 122 (see the code C6).

MMB10において、FAN回転数管理部113がFAN回転数情報123からFAN40の回転数の履歴を取得する(符号C7参照)。   In the MMB 10, the FAN rotation speed management unit 113 acquires the history of the rotation speed of the FAN 40 from the FAN rotation speed information 123 (see the code C7).

FRU4においては、FANの配置をFAN配置履歴情報124に記録する(符号C8参照)。   In the FRU 4, the placement of the FAN is recorded in the FAN placement history information 124 (see the code C8).

MMB10において、FAN予測寿命管理部115が、各FAN40の寿命予測を行なう(符号C9参照)。FAN予測寿命管理部115は算出した各FAN40の予測寿命を予測寿命履歴情報125に記録する。   In the MMB 10, the FAN predicted life management unit 115 performs the life prediction of each FAN 40 (see reference symbol C9). The FAN predicted life management unit 115 records the calculated predicted life of each FAN 40 in the predicted life history information 125.

MMB10において、切替制御部116が、DPを用いたSB5の構成変更(DP切替え)やリザーブドSB5を用いたSB5の切り替え(SB切替え)、FAN回転数等を行なう(符号C10参照)。   In the MMB 10, the switching control unit 116 performs configuration change of the SB 5 using DP (DP switching), switching of the SB 5 using reserved SB 5 (SB switching), FAN rotation speed and the like (see symbol C10).

また、切替制御部116は、FAN40の最適配置を決定する(符号C11参照)。決定されたFAN最適配置情報は、管理端末装置2のFAN最適配置情報抽出部22に通知され、FAN最適配置情報抽出部22はFAN最適配置情報を取得する(符号C12参照)。   Further, the switching control unit 116 determines the optimal arrangement of the FANs 40 (see reference numeral C11). The determined FAN optimum arrangement information is notified to the FAN optimum arrangement information extraction unit 22 of the management terminal device 2, and the FAN optimum arrangement information extraction unit 22 acquires the FAN optimum arrangement information (see the code C12).

保守作業員は、管理端末装置2において、FAN最適配置情報を取得する。そして、このFAN最適配置情報に示される配置(最適配置)に従って、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更する作業を行なう(符号C13参照)。   The maintenance worker acquires the FAN optimum arrangement information in the management terminal device 2. Then, according to the arrangement (optimal arrangement) indicated by the FAN optimum arrangement information, an operation of changing the position of the FAN 40 attached to the slot of the server system 1 is performed (see reference numeral C13).

次に、実施形態の一例としてのサーバシステム1におけるFAN最適配置を行なうための制御を、図13および図14に示すフローチャート(ステップD1〜D21)に従って説明する。図13はFAN最適配置を実現するための監視処理を示し(ステップD1〜D13)、図14はFAN最適配置にかかる保守作業の処理を示す(ステップD14〜D21)。   Next, control for performing the FAN optimal arrangement in the server system 1 as an example of the embodiment will be described according to flowcharts (steps D1 to D21) illustrated in FIGS. 13 and 14. FIG. 13 shows a monitoring process for realizing the FAN optimal arrangement (steps D1 to D13), and FIG. 14 shows a process of maintenance work for the FAN optimal arrangement (steps D14 to D21).

図13のステップD1において、FAN予測寿命管理部115は、各FAN40の予測寿命を算出する。   In step D1 of FIG. 13, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40.

図13のステップD2において、切替制御部116は、定期保守作業の実施であるかを確認する。確認の結果、定期保守作業の実施でない場合には(ステップD2のNOルート参照)、図13のステップD3に移行する。   In step D2 of FIG. 13, the switching control unit 116 confirms whether or not the periodic maintenance work is performed. As a result of confirmation, when it is not the implementation of the regular maintenance work (refer to NO route in step D2), the process proceeds to step D3 in FIG.

ステップD3おいて、切替制御部116は、本サーバシステム1において、DPによるSB5の切り替えを実行可能であるかを確認する。   In step D3, the switching control unit 116 confirms whether or not switching of the SB 5 by DP can be performed in the server system 1.

確認の結果、DPによるSB5の切り替えが可能である場合には(ステップD3のYESルート参照)、図13のステップD9に移行する。ステップD9において、切替制御部116は、DP機能によるSB5の切り替えを行なうための調整を開始する。図13のステップD10において、切替制御部116は、本サーバシステム1において、DPを即時に実行可能であるかを確認する。   As a result of confirmation, if switching of SB 5 by DP is possible (refer to YES route of step D3), the process proceeds to step D9 of FIG. In step D9, the switching control unit 116 starts adjustment for switching the SB 5 by the DP function. In step D10 of FIG. 13, the switching control unit 116 confirms whether the DP can be executed immediately in the server system 1.

確認の結果、DPを即時実行可能である場合には(ステップD10のYESルート参照)、 図13のステップD11において、DP機能によるSB5の切替制御を行なう。その後、ステップD1に戻る。   As a result of the check, if it is possible to immediately execute DP (see YES route in step D10), switching control of SB 5 by the DP function is performed in step D11 of FIG. Thereafter, the process returns to step D1.

また、ステップD10における確認の結果、DPを即時実行可能でない場合には(ステップD10のNOルート参照)、図13のステップD12に移行する。ステップD12において、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう。これにより、SB#0〜#3の間において負荷が分散され、ステップD1において算出された短寿命FAN30の回転数を低下させ、その負荷を軽減させることができる。その後、処理はステップD1に戻る。   If DP can not be immediately executed as a result of confirmation in step D10 (refer to NO route in step D10), the process proceeds to step D12 in FIG. In step D12, the switching control unit 116 performs addition control of SB 5 by the hot plug function of DP. As a result, the load is dispersed between SB # 0 and SB # 3, and the rotation speed of the short-life FAN 30 calculated in step D1 can be reduced, and the load can be reduced. Thereafter, the process returns to step D1.

ステップD3における確認の結果、DPによるSB5の切り替えが可能でない場合には(ステップD3のNOルート参照)、図13のステップD4に移行する。ステップD4においては、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なうことが可能であるかを確認する。確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを行なうことができる場合には(ステップD4のYESルート参照)、図13のステップD5に移行する。   As a result of confirmation in step D3, if switching of SB 5 by DP is not possible (refer to NO route of step D3), the process proceeds to step D4 of FIG. In step D4, the switching control unit 116 confirms whether static SB 5 switching using reserved SB 5 is possible. As a result of confirmation, when static SB 5 can be switched using Reserved SB 5 (refer to YES route in step D 4), the process proceeds to step D 5 in FIG.

ステップD5においては、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なうための調整を開始する。図13のステップD6において、切替制御部116は、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能であるかを確認する。   In step D5, the switching control unit 116 starts adjustment for switching the static SB 5 using the reserved SB 5. In step D6 of FIG. 13, the switching control unit 116 confirms whether or not switching of static SB 5 using reserved SB 5 can be immediately performed in the server system 1.

確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合には(ステップD6のYESルート参照)、図13のステップD13に移行する。   As a result of confirmation, when it is possible to immediately execute switching of static SB 5 using Reserved SB 5 (refer to YES route in step D 6), the process proceeds to step D 13 in FIG.

ステップD13において、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行ない、その後、ステップD1に戻る。   In step D13, the switching control unit 116 switches SB5 using reserved SB5, and then returns to step D1.

一方、ステップD6における確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能でない場合には(ステップD6のNOルート参照)、図13のステップD7に移行する。   On the other hand, as a result of confirmation in step D6, when it is not possible to immediately execute switching of static SB 5 using reserved SB 5 (see the NO route of step D6), the process proceeds to step D7 of FIG.

ステップD7において、切替制御部116は、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう。その後、ステップD1に戻る。   In step D7, the switching control unit 116 performs switching of SB5 using Reserved SB5 in a partial time slot where the operation rate is low in the server system 1 such as nighttime. Thereafter, the process returns to step D1.

ステップD4における確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを行なうことができない場合には(ステップD4のNOルート参照)、図13のステップD8に移行する。   If static SB 5 can not be switched using reserved SB 5 as a result of confirmation in step D 4 (see NO route in step D 4), the process proceeds to step D 8 in FIG.

ステップD8において、切替制御部116は、稼働中の全てのFAN40のFAN回転数をHighに上げるよう調整(FAN回転数調整)を行なう。その後、ステップD1に戻る。   In step D8, the switching control unit 116 performs adjustment (FAN rotation number adjustment) so as to raise the fan rotation number of all the operating fans 40 to High. Thereafter, the process returns to step D1.

また、ステップD2における確認の結果、定期保守の実施である場合には(ステップD2のYESルート参照)、図14のステップD14に移行する。   Moreover, as a result of confirmation in step D2, when it is implementation of regular maintenance (refer the YES route | root of step D2), it transfers to step D14 of FIG.

ステップD14においては、例えばCEが、本サーバシステム1に対する保守作業を開始する。   In step D14, for example, the CE starts maintenance work on the server system 1.

図14のステップD15において、CEは管理端末装置2を用いて保守プログラムを実行させる。   In step D15 of FIG. 14, the CE causes the management terminal 2 to execute the maintenance program.

図14のステップD16において、FAN予測寿命管理部115は、各FAN40の予測寿命の算出を行なう。図14のステップD17において、切替制御部116は、FAN40の予防交換が必要であるかを確認する。   In step D16 of FIG. 14, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step D17 of FIG. 14, the switching control unit 116 confirms whether the preventive replacement of the FAN 40 is necessary.

ステップD17における確認の結果、FAN40の予防交換が必要であると判断された場合には(ステップD17におけるYESルート参照)、図14のステップD20において、CEによるFAN40の交換(予防交換)が行なわれる。その後、図14のステップD21において、CEによる保守作業が完了される。CEは、例えば、管理端末装置2において、保守作業が完了した旨の入力操作を行なう。   As a result of confirmation in step D17, if it is determined that preventive replacement of FAN 40 is necessary (refer to YES route in step D17), replacement (preventive replacement) of FAN 40 by CE is performed in step D20 of FIG. . Thereafter, at step D21 in FIG. 14, the maintenance work by the CE is completed. The CE performs, for example, in the management terminal device 2, an input operation indicating that the maintenance work has been completed.

また、ステップD17における確認の結果、FAN40の予防交換が不要であると判断された場合には(ステップD17のNOルート参照)、図14のステップD18に移行する。   Further, as a result of confirmation in step D17, when it is determined that the preventive replacement of the FAN 40 is unnecessary (refer to NO route of step D17), the process proceeds to step D18 of FIG.

ステップD18において、CEは、FAN40の配置換えが必要であるかを確認する。例えば、CEは、管理端末装置2において示されたFAN最適配置情報が、現状のサーバシステム1におけるFAN40の状態と同じである場合には、FAN40の配置換えは不要であると判断する。   In step D18, the CE confirms whether relocation of the FAN 40 is required. For example, when the FAN optimum arrangement information indicated in the management terminal device 2 is the same as the state of the FAN 40 in the current server system 1, the CE determines that the rearrangement of the FAN 40 is unnecessary.

確認の結果、FAN40の配置換えが必要であると判断された場合には(ステップD18のYESルート参照)、図14のステップD19に移行する。   As a result of confirmation, when it is determined that the relocation of the FAN 40 is required (refer to YES route in step D18), the process proceeds to step D19 in FIG.

ステップD19においては、CEがFAN最適配置情報に合わせて、サーバシステム1におけるFAN40の配置換えを実施する。その後、ステップD21に移行する。   In step D19, the CE performs relocation of the FANs 40 in the server system 1 in accordance with the FAN optimal placement information. Thereafter, the process proceeds to step D21.

次に、実施形態の一例としてのサーバシステム1のMMB10の処理を、図15に示すフローチャート(ステップE1〜E16)に従って説明する。   Next, processing of the MMB 10 of the server system 1 as an example of the embodiment will be described according to the flowchart (steps E1 to E16) shown in FIG.

ステップE1において、FAN予測寿命管理部115は、変数“life_fan(ID)”および変数“life_static(POS)”にそれぞれ1を設定することで初期化する(life_fan(ID) = 1,life_static(POS) = 1)。   In step E1, the FAN predicted life management unit 115 initializes the variable “life_fan (ID)” and the variable “life_static (POS)” by setting 1 to each other (life_fan (ID) = 1, life_static (POS) = 1).

なお、life_fan(ID)の初期化は全てのFAN40について行なう。また、life_static(POS)の初期化は全てのスロット位置について行なう。   The initialization of life_fan (ID) is performed for all the FANs 40. Also, initialization of life_static (POS) is performed for all slot positions.

ステップE2において、温度情報管理部112は、各FAN40の温度をポーリングにより取得(サンプリング)する。また、変数“count”に0を設定することで初期化する。   In step E2, the temperature information management unit 112 obtains (samples) the temperature of each FAN 40 by polling. In addition, it initializes by setting 0 to variable “count”.

ステップE3において、構成情報管理部111は、各FAN40のFAN ID(ID)を確認し、構成情報121に登録されていない新たなFAN40が本サーバシステム1に取り付けられている(新設されている)かを確認する。   In step E3, the configuration information management unit 111 confirms the FAN ID (ID) of each FAN 40, and a new FAN 40 not registered in the configuration information 121 is attached to the server system 1 (newly installed) Make sure.

新しいFAN40が取り付けられている場合には(ステップE3のYESルート参照)、ステップE4に移行する。ステップE4においては、この新設されたFAN40についてlife_fan(ID)=1とすることで初期化を行なう。   If a new FAN 40 is attached (see YES route in step E3), the process proceeds to step E4. In step E4, initialization is performed by setting life_fan (ID) = 1 for the newly installed FAN 40.

その後、ステップE5において、温度情報管理部112は、各FAN40の温度を温度情報12に記録する。また、温度情報12は、一定時間Sだけ待機した後にcountに1を加算(インクリメント)する。   Thereafter, in step E5, the temperature information management unit 112 records the temperature of each FAN 40 in the temperature information 12. In addition, the temperature information 12 waits (or increments) the count by 1 after waiting for a predetermined time S.

その後、ステップE6において、温度情報管理部112は、countの値がN未満であるかを確認する。ここで、Nは、任意の正の整数であり、例えば、サンプリング数として経験上、充分であるとみなされる数が設定されることが望ましい。確認の結果、countの値がN未満である場合(count < N;ステップE6のYESルート参照)、ステップE5に戻る。   Thereafter, in step E6, the temperature information management unit 112 confirms whether the value of count is less than N. Here, N is any positive integer, and it is desirable to set, for example, a number that is considered empirically sufficient as the sampling number. As a result of confirmation, if the value of count is less than N (count <N; see YES route in step E6), the process returns to step E5.

一方、count が N以上である場合には(ステップE6のNOルート参照)、ステップE7に移行する。   On the other hand, if count is equal to or greater than N (see the NO route of step E6), the process moves to step E7.

ステップE7においては、FAN予測寿命管理部115が、サンプリングしたFAN40の温度に基づき、FAN40の予測寿命を算出する。すなわち、FAN予測寿命管理部115は、上記の式(1)〜(3)を用いて、FAN40の予測寿命を算出する。FAN予測寿命管理部115は、各FAN40の温度を寿命に変換するのである。   In step E7, the FAN predicted life management unit 115 calculates the predicted life of the FAN 40 based on the sampled temperature of the FAN 40. That is, the FAN predicted life management unit 115 calculates the predicted life of the FAN 40 using the above formulas (1) to (3). The FAN predicted life management unit 115 converts the temperature of each FAN 40 into a life.

なお、FAN40の温度に基づいてFAN40の予測寿命を算出する手法は、図16に示すフローチャートを用いて後述する。   In addition, the method of calculating the estimated life of FAN40 based on the temperature of FAN40 is later mentioned using the flowchart shown in FIG.

また、FAN予測寿命管理部115は、各FAN40について、それぞれのサンプリングデータ毎に消費寿命laを算出し、それぞれのサンプリングデータ毎に、life_fan(ID), life_static(SLOT)から消費寿命laを減算する。   In addition, the FAN predicted life management unit 115 calculates the consumed life la for each sampling data for each FAN 40, and subtracts the consumed life la from life_fan (ID) and life_static (SLOT) for each sampling data. .

ステップE8において、切替制御部116は、本サーバシステム1が保守作業モードであるか否かを確認する。すなわち、MMB10ファームウェアで定期保守の指示がされているかを確認する。   In step E8, the switching control unit 116 confirms whether or not the server system 1 is in the maintenance operation mode. That is, it is confirmed whether the instruction for periodic maintenance has been made by the MMB 10 firmware.

確認の結果、保守作業である場合(ステップE8のYESルート)、ステップE14に移行する。ステップE14において、切替制御部116は、FAN予測寿命管理部115によって算出された各FAN40の予測寿命に基づいて、本サーバシステム1内における複数のFAN40の最適配置を決定する。
なお、このFAN40の最適配置の決定方法の詳細は、図17に示すフローチャートを用いて後述する。
As a result of confirmation, if it is maintenance work (YES route in step E8), the process proceeds to step E14. In step E14, the switching control unit 116 determines the optimal arrangement of the plurality of FANs 40 in the server system 1 based on the predicted life of each FAN 40 calculated by the FAN predicted life management unit 115.
The details of the method of determining the optimal arrangement of the FANs 40 will be described later with reference to the flowchart shown in FIG.

切替制御部116は、決定したFAN40の最適配置を管理端末装置2に通知する。管理端末装置2においては、結果表示制御部23が、ディスプレイにFAN40の最適配置を表示させる。   The switching control unit 116 notifies the management terminal device 2 of the determined optimal arrangement of the FANs 40. In the management terminal device 2, the result display control unit 23 causes the display to display the optimal arrangement of the FANs 40.

ステップE15において、FAN予測寿命管理部115は、変数“life_static(POS)”に1を設定することで初期化する(life_static(POS) = 1)。その後、ステップE2に戻る。   In step E15, the FAN predicted life management unit 115 initializes the variable “life_static (POS)” by setting 1 (life_static (POS) = 1). Thereafter, the process returns to step E2.

ステップE8における確認の結果、本サーバシステム1が保守作業モードでない場合には(ステップE8のNOルート参照)、ステップE9に移行する。   If the server system 1 is not in the maintenance operation mode as a result of confirmation in step E8 (see NO route in step E8), the process proceeds to step E9.

ステップE9においては、切替制御部116は、予測寿命が最も長いFAN40(長寿命FAN40)と予測寿命が最も短いFAN40(短寿命FAN40)との予測寿命の差が所定値(例えば、1か月)以上であるかを確認する。   In step E9, the switching control unit 116 determines that the difference in predicted life between the FAN 40 (long life FAN 40) with the longest predicted life and the FAN 40 (short life FAN 40) with the shortest predicted life is a predetermined value (for example, one month). Check if it is above.

確認の結果、長寿命FAN40の予測寿命と短寿命FAN40の予測寿命との差が1ヶ月未満である場合には(ステップE9のNOルート参照)、ステップE2に戻る。   As a result of confirmation, when the difference between the predicted life of the long life FAN 40 and the predicted life of the short life FAN 40 is less than one month (see the NO route of step E9), the process returns to step E2.

一方、長寿命FAN40の予測寿命と短寿命FAN40の予測寿命との差が1ヶ月以上である場合には(ステップE9のYESルート参照)、ステップE10において、切替制御部116は、次に、DP機能が使用可能であるか否かを確認する。   On the other hand, if the difference between the predicted life of the long life FAN 40 and the predicted life of the short life FAN 40 is one month or more (see YES route in step E9), in step E10, the switching control unit 116 Check if the feature is available.

確認の結果、DP機能が使用可能である場合には(ステップE10のYESルート参照)、ステップE16に移行する。ステップE16において、切替制御部116は、SB5の切り替えを行なう。なお、このSB5の切替処理におけるSB5の選択方法の詳細は、図18に示すフローチャートを用いて後述する。その後、処理はステップE2に戻る。   As a result of confirmation, if the DP function is available (see YES route in step E10), the process proceeds to step E16. In step E16, the switching control unit 116 switches SB5. The details of the selection method of SB5 in the switching process of SB5 will be described later using the flowchart shown in FIG. Thereafter, the process returns to step E2.

ステップE10における確認の結果、DP機能が使用可能でない場合には(ステップE10のNOルート参照)、ステップE11に移行する。   As a result of confirmation in step E10, when the DP function is not available (see the NO route of step E10), the process proceeds to step E11.

ステップE11においては、本サーバシステム1においてリザーブドSB5が使用可能であるかを確認する。   In step E11, it is checked whether the reserved SB 5 can be used in the server system 1.

リザーブドSB5が使用可能でない場合には(ステップE11のNOルート参照)、ステップE2に戻る。   If Reserved SB5 is not available (see the NO route of step E11), the process returns to step E2.

また、リザーブドSB5が使用可能である場合には(ステップE11のYESルート参照)、ステップE12に移行する。   If Reserved SB5 is available (see YES route in step E11), the process moves to step E12.

ステップE12においては、本サーバシステム1がパワーオフ(POFF)しているかを確認する。確認の結果、本サーバシステム1がパワーオフしている場合には(ステップE12のYESルート参照)、ステップE16に移行する。   In step E12, it is confirmed whether the server system 1 is powered off (POFF). As a result of confirmation, when the server system 1 is powered off (see YES route in step E12), the process proceeds to step E16.

また、ステップE12における確認の結果、本サーバシステム1がパワーオフしていない場合には(ステップE12のNOルート参照)、ステップE13に移行する。   If the server system 1 is not powered off as a result of confirmation in step E12 (see NO route in step E12), the process proceeds to step E13.

ステップE13においては、切替制御部116は、本サーバシステム1内の各FAN40の回転数を上げる。その後、ステップE2に戻る。   In step E13, the switching control unit 116 increases the rotational speed of each FAN 40 in the server system 1. Thereafter, the process returns to step E2.

次に、実施形態の一例としてのサーバシステム1におけるFAN予測寿命管理部115によるFAN40の予測寿命を算出方法を、図16に示すフローチャート(ステップF1〜F4)に従って説明する。以下の処理は、各FAN40のそれぞれに対して行なわれる。   Next, a method of calculating the predicted life of the FAN 40 by the FAN predicted life management unit 115 in the server system 1 as an example of the embodiment will be described according to the flowchart (steps F1 to F4) illustrated in FIG. The following processing is performed on each of the FANs 40.

ステップF1において、FAN予測寿命管理部115は、FAN40に関して、2通りの温度T1,T2のそれぞれでの寿命を、カタログ値や実験値に基づいて取得する。これらの値は、予めメモリ12に格納してもよく、また、CE等が入力してもよい。   In step F1, the FAN predicted life management unit 115 obtains the life at each of the two temperatures T1 and T2 with respect to the FAN 40 based on the catalog value and the experimental value. These values may be stored in advance in the memory 12 or may be input by a CE or the like.

FAN予測寿命管理部115は、上記式(1),(2)に基づいて2つの式(連立方程式)を立て(ステップF2)、定数A,Bについて解く(ステップF3)。   The FAN predicted life management unit 115 sets two equations (simultaneous equations) based on the equations (1) and (2) (step F2), and solves for the constants A and B (step F3).

ステップF4において、FAN予測寿命管理部115は、上記式(3)に基づき、消費寿命lを算出し、処理を終了する。   In step F4, the FAN estimated life management unit 115 calculates the consumed life l based on the above equation (3), and ends the process.

次に、実施形態の一例としてのサーバシステム1における切替制御部116によるFAN40の最適配置の決定方法を図17に示すフローチャート(ステップG1〜G5)に従って説明する。   Next, a method of determining the optimal arrangement of the FANs 40 by the switching control unit 116 in the server system 1 as an example of the embodiment will be described according to the flowchart (steps G1 to G5) illustrated in FIG.

ステップG1において、切替制御部116は、本サーバシステム1がn個のFAN40を搭載する場合に、切替制御部116は、これらのFAN40とスロット位置との全ての組み合わせ(n−1通り)を列挙する。 In step G1, when the server system 1 mounts n FANs 40, the switch control unit 116 selects all combinations of these FANs 40 and slot positions ( n P n-1 ways). Enumerate

ステップG2において、切替制御部116は、n−1通りのFAN40とスロット位置との組み合わせの中から1つの組み合わせを選択し、スロット位置による影響を考慮した更新済み残寿命life(ID,POS)を算出する。 In step G2, the switching control unit 116 selects one combination out of n P n-1 combinations of FANs 40 and slot positions, and the updated remaining life life (ID, POS) in consideration of the influence of the slot positions. Calculate).

更新済み残寿命life(ID,POS) = life_fan(ID) - (1 - life_static(POS))
ステップG3において、切替制御部116は、ステップG2において選択した組み合わせ内における更新済み残寿命life(ID,POS)の最小値を求め、当該組み合わせの代表値とする。
Updated remaining life life (ID, POS) = life_fan (ID)-(1-life_static (POS))
In step G3, the switching control unit 116 obtains the minimum value of the updated remaining life life (ID, POS) in the combination selected in step G2, and sets it as a representative value of the combination.

ステップG4において、切替制御部116は、FAN40とスロット位置との全ての組み合わせについて、ステップG2,G3の処理を行なったかを確認する。   In step G4, the switching control unit 116 confirms whether the processing in steps G2 and G3 has been performed for all combinations of the FAN 40 and the slot position.

確認の結果、処理がまだ行なわれていない組み合わせがある場合には(ステップG4のNOルート参照)、ステップG2に戻る。   As a result of confirmation, if there is a combination that has not been processed yet (see NO route in step G4), the process returns to step G2.

全ての組み合わせについて、ステップG2,G3の処理を行なった場合に(ステップG4のYESルート参照)、ステップG5に移行する。   If the processes in steps G2 and G3 have been performed for all combinations (see YES route in step G4), the process moves to step G5.

ステップG5において、切替制御部116は、全ての組み合わせの内、最も代表値の大きい組み合わせを、FAN40の最適配置として決定する。   In step G5, the switching control unit 116 determines the combination having the largest representative value among all the combinations as the optimal arrangement of the FANs 40.

また、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせが複数ある場合には、更新済み残寿命の2番目に小さい値や3番目に小さい値を適宜順番に比較し、更新済み残寿命が最も大きい組み合わせを1組選択(採用)することが望ましい。   In addition, when there are a plurality of combinations of the FAN 40 and the slot position where the minimum value of the updated remaining life is the largest, the second smallest value and the third smallest value of the updated remaining life are compared in order and updated It is desirable to select (adopt) one set having the largest remaining service life.

切替制御部116は、決定したFAN40の最適配置を管理端末装置2に通知し、管理端末装置2においては、結果表示制御部23がディスプレイに表示させる。   The switching control unit 116 notifies the management terminal device 2 of the determined optimal arrangement of the FAN 40, and in the management terminal device 2, the result display control unit 23 causes the display to display.

その後、処理を終了する。   Thereafter, the process ends.

次に、実施形態の一例としてのサーバシステム1における切替制御部116によるDP機能を用いたSB5の切り替え時のSB5の選択方法を、図18に示すフローチャート(ステップH1〜H4)に従って説明する。   Next, a method of selecting SB5 at the time of switching SB5 using the DP function by the switching control unit 116 in the server system 1 as an example of the embodiment will be described according to the flowchart (steps H1 to H4) shown in FIG.

ステップH1において、発熱しやすいユニットであるSB5がどのFAN40に対して熱を起こしやすいかを示す係数(Amn)を予め定義した温度影響情報126を用意する。   In step H1, the temperature influence information 126 is prepared in which a coefficient (Amn) indicating in which FAN 40 the unit SB 5 which is apt to generate heat tends to generate heat is defined in advance.

ステップH2において、切替制御部116は、複数のFAN40のうち、予測寿命が短いものから順に、処理対象FAN40として選択する。   In step H <b> 2, the switching control unit 116 selects the plurality of FANs 40 as the processing target FAN 40 in order from the one with the shortest predicted life.

ステップH3において、切替制御部116は、温度影響情報126を参照して、処理対象FAN40(短寿命FAN40)について、当該処理対象FAN40に対応するSB5以外のSB5であって、最も係数Amnの値が小さいSB5を選択する。   In step H3, the switching control unit 116 refers to the temperature influence information 126 and, regarding the processing target FAN 40 (short life FAN 40), is the SB 5 other than the SB 5 corresponding to the processing target FAN 40, and the value of the coefficient Amn is most Select a smaller SB5.

ステップH4において、切替制御部116は、全てのFAN40について、当該FAN40への熱影響が最も小さいSB5の選択を行なったかを確認する。   In step H4, the switching control unit 116 confirms whether or not SB5 having the smallest thermal influence on the FAN 40 has been selected for all of the FANs 40.

確認の結果、当該FAN40への熱影響が最も小さいSB5の選択が行なわれていないFAN40がある場合には(ステップH4のNOルート参照)、ステップH2に戻る。また、全てのFAN40について、当該FAN40への熱影響が最も小さいSB5の選択が行なわれた場合には(ステップH4のYESルート参照)、処理を終了する。   As a result of the check, if there is a FAN 40 for which the selection of SB 5 having the smallest thermal influence on the FAN 40 has not been performed (see NO route in step H 4), the process returns to step H 2. In addition, when SB5 which has the smallest thermal effect on the FAN 40 is selected for all the FANs 40 (see the YES route in step H4), the process is ended.

(C)効果
このように、本発明の一実施形態としてのサーバシステム1によれば、DPによるSB5の切り替えを即時に実行可能である場合に、切替制御部116は、DPによるSB5の切替制御を行なう。切替制御部116は、DPのSB切替機能を用いて、SB#2,#3をON状態にする一方で、SB#0,#1をスタンバイ状態(SBY)にする。FAN#0,#2が冷却対象とするSB#0,#1をスタンバイ状態にすることで、これらのFAN#0,#2の負荷が低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
(C) Effects As described above, according to the server system 1 as one embodiment of the present invention, when it is possible to immediately execute switching of SB 5 by DP, the switching control unit 116 controls switching of SB 5 by DP. Do. The switching control unit 116 sets the SBs # 2 and # 3 to the ON state, and sets the SBs # 0 and # 1 to the standby state (SBY) using the DP SB switching function. By placing the SBs # 0 and # 1 to be cooled by the FANs # 0 and # 2 in the standby state, the loads on these FANs # 0 and # 2 are reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

また、DPによるSB5の切り替えを即時に実行可能でない場合に、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう。すなわち、切替制御部116は、DPのホットプラグ機能を用いて、スタンバイ状態であったSB#2,#3をON状態にすることで、これらのSB#2,#3を追加する。   When the switching of the SB 5 by the DP can not be immediately executed, the switching control unit 116 performs additional control of the SB 5 by the hot plug function of the DP. That is, the switching control unit 116 adds the SBs # 2 and # 3 by setting the SBs # 2 and # 3 in the standby state to the ON state using the hot plug function of the DP.

これにより、SB#0〜#3の全てがON状態になり、SB#0〜#3の間において負荷が分散される。従って、FAN#0,#2が冷却対象とするSB#0,#1の負荷が低減して発熱量が低下し、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。   As a result, all the SBs # 0 to # 3 are turned ON, and the load is distributed among the SBs # 0 to # 3. Therefore, the load of SBs # 0 and # 1 to be cooled by FAN # 0 and # 2 is reduced, the amount of heat generation is reduced, and the load (high temperature load) of FANs # 0 and # 2 is also reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

温度影響情報126を用いることで、短寿命FAN40に対して熱(熱影響)を与えやすいSB5を容易に特定することができる。   By using the temperature influence information 126, it is possible to easily identify SB5 which is likely to give heat (heat influence) to the short life FAN 40.

DPによる切り替えを実行不可である場合には、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なう。   When the switching by DP can not be performed, the switching control unit 116 switches the static SB 5 using the reserved SB 5.

リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合に、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行なう。すなわち、切替制御部116は、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。   When switching of static SB 5 using Reserved SB 5 can be immediately performed, the switching control unit 116 switches SB 5 using Reserved SB 5. That is, the switching control unit 116 sets the reserved SB # 2 to the ON state, and sets the SB # 0 to the standby state (SBY).

これにより、FAN#0,#2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。   As a result, in addition to FANs # 0 and # 2, fans # 1 and # 3 for cooling SB # 2 are also blown, and all fans # 0 to # 3 are blown and fans The # 0 and # 2 loads (high temperature loads) are also reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

リザーブドSB5を用いた静的なSB5の切り替えを即時に行なうことができない場合には、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう。すなわち、切替制御部116は、本サーバシステム1に稼働率が低い時間帯において、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。   If switching of static SB 5 using Reserved SB 5 can not be performed immediately, switching of SB 5 using Reserved SB 5 is performed in a partial time zone such as nighttime where the operation rate is low for this server system 1. Do. That is, in a time zone where the operation rate of the server system 1 is low, the switching control unit 116 sets the reserved SB # 2 to the ON state, and sets the SB # 0 to the standby state (SBY).

これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。   As a result, in addition to FANs # 0 and # 2, fans # 1 and # 3 for cooling SB # 2 are also blown, and all fans # 0 to # 3 are blown and fan # The load of 0, # 2 (high temperature load) is also reduced. As a result, the predicted lives of the FANs # 0 and # 2 are extended, the predicted lives of the FANs # 1 and # 3 are shortened, and the variation of the predicted lives between the FANs 40 can be eliminated.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する影響が小さいSB5をDPによりON状態とするSB5として優先的に選択することで、短寿命FAN40にかかる温度負荷を効率的に分散させることができる。   When there are a plurality of SB5 in the standby state, the switching control unit 116 preferentially selects the SB5 which has a small influence on the short life FAN40 as the SB5 to be turned on by the DP, thereby the temperature load applied to the short life FAN40. It can be distributed efficiently.

(D)その他
本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
(D) Others The present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present invention.

開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。   The disclosed technology is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present embodiment. The configurations and processes of the present embodiment can be selected as needed, or may be combined as appropriate.

上述した実施形態においては、切替制御部116が、DPのホットプラグ機能により、SB5の追加を行なうことで、稼働するSB5の数を増やし、作動するFAN40とを増やすことで短寿命FAN40の負荷を軽減しているが、これに限定されるものではない。例えば、切替制御部116は、SB切替えにより、リザーブドSB5を追加で稼働させることで、稼働するSB5の数を増やし、差動するFAN40とを増やすことで短寿命FAN40の負荷を軽減してもよい。   In the embodiment described above, the switching control unit 116 adds the SBs 5 by the hot plug function of the DP, thereby increasing the number of operating SBs 5 and increasing the number of operating FANs 40, thereby increasing the load of the short life FAN 40. Although it reduces, it is not limited to this. For example, the switching control unit 116 may reduce the load of the short-lived FAN 40 by increasing the number of SBs 5 being operated by additionally operating the reserved SB 5 by SB switching, and increasing the number of FANs 40 to be differentiated. .

また、上述した実施形態においては、切替制御部116が、短寿命FAN40に対する熱影響が最も低いSB5をDPのホットプラグ機能により稼働させることで、作動するFAN40を増やし、短寿命FAN40の負荷を軽減しているが、これに限定されるものではない。   Further, in the embodiment described above, the switching control unit 116 operates the SB5 having the lowest thermal influence on the short-life FAN 40 by using the hot plug function of the DP, thereby increasing the number of operating FANs 40 and reducing the load of the short-life FAN 40 Although it is not limited to this.

例えば、切替制御部116は、SB切替えにより、短寿命FAN40に対する熱影響が最も低いSB5をDPのホットプラグ機能により稼働させてもよく、これにより差動するFAN40を増やし、短寿命FAN40の負荷を軽減してもよい。   For example, the switching control unit 116 may operate SB5 which has the lowest thermal influence on the short life FAN 40 by SB switching using the hot plug function of the DP, thereby increasing the FAN 40 to be differential and loading the short life FAN 40. You may reduce it.

また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。   Moreover, it is possible for a person skilled in the art to carry out and manufacture the present embodiment from the above disclosure.

(E)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(E) Appendices The following appendices are further disclosed regarding the above embodiment.

(付記1)
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
前記複数の冷却部品の温度を検出する温度検出部と、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部と
を備えることを特徴とする、情報処理装置。
(Supplementary Note 1)
Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
A temperature detection unit that detects the temperatures of the plurality of cooling components;
A life prediction unit that performs life prediction of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. And a configuration change control unit configured to change the configuration of the component to be cooled.

(付記2)
前記構成変更制御部が、冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、付記1記載の情報処理装置。
(Supplementary Note 2)
The information processing apparatus according to claim 1, wherein the configuration change control unit performs configuration change of adding a cooling target component and operates a cooling component corresponding to the added cooling target component.

(付記3)
前記構成変更制御部が、前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、付記1記載の情報処理装置。
(Supplementary Note 3)
The configuration change control unit performs a configuration change in which the cooling target component having the lowest thermal influence on the predicted short-lived cooling component is operated among the plurality of cooling target components, and the cooling corresponding to the cooling target component operated. The information processing apparatus according to appendix 1, wherein the part is operated.

(付記4)
前記構成変更制御部が、当該情報処理装置を停止させることなくパーディションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
ことを特徴とする、付記1〜3のいずれか1項に記載の情報処理装置。
(Supplementary Note 4)
The configuration change control unit is configured to change the configuration of the component to be cooled using a first configuration change function capable of changing the hardware resource of the partition without stopping the information processing apparatus. The information processing apparatus according to any one of appendices 1 to 3.

(付記5)
前記構成変更制御部が、前記保守対象部品を切り離し、当該情報処理装置の再起動後に前記保守対象部品に代えて予備保守対象部品を動作させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
ことを特徴とする、付記1〜3のいずれか1項に記載の情報処理装置。
(Supplementary Note 5)
The configuration change control unit separates the maintenance target component, and uses the second configuration change function to operate the spare maintenance target component instead of the maintenance target component after restarting the information processing apparatus. The information processing apparatus according to any one of appendices 1 to 3, characterized in that a change is made.

(付記6)
前記構成変更制御部が、前記複数の冷却部品の回転速度を高くする制御を行なう
ことを特徴とする、付記1〜5のいずれか1項に記載の情報処理装置。
(Supplementary Note 6)
The information processing apparatus according to any one of appendices 1 to 5, wherein the configuration change control unit performs control to increase a rotational speed of the plurality of cooling components.

(付記7)
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
プロセッサとを備える情報処理装置において、
前記複数の冷却部品の温度を検出し、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行ない、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させる、冷却部品管理プログラム。
(Appendix 7)
Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
An information processing apparatus including a processor;
Detecting temperatures of the plurality of cooling components;
Predicting the life of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. A cooling component management program, which causes the processor to execute a process of changing the configuration of the component to be cooled, in the case where it is detected.

(付記8)
冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
処理を、前記プロセッサに実行させることを特徴とする、付記7記載の冷却部品管理プログラム。
(Supplementary Note 8)
The cooling component management program according to appendix 7, wherein the processor is caused to execute a process of changing the configuration of adding a cooling target component and operating the cooling component corresponding to the added cooling target component.

(付記9)
前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
処理を、前記プロセッサに実行させることを特徴とする、付記7記載の冷却部品管理プログラム。
(Appendix 9)
Among the plurality of parts to be cooled, a configuration change is made to operate the part to be cooled having the lowest thermal influence on the predicted short-lived parts to be cooled, and a process to operate the cooling parts corresponding to the operated parts to be cooled The cooling component management program according to appendix 7, characterized in that the program is executed by the processor.

(付記10)
当該情報処理装置を停止させることなくパーディションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜9のいずれか1項に記載の冷却部品管理プログラム。
(Supplementary Note 10)
The processor is caused to execute the process of changing the configuration of the part to be cooled using the first configuration change function capable of changing the hardware resource of the partition without stopping the information processing apparatus. The cooling component management program according to any one of appendices 7-9.

(付記11)
前記保守対象部品を切り離し、当該情報処理装置の再起動後に前記保守対象部品に代えて予備保守対象部品を動作させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜9のいずれか1項に記載の冷却部品管理プログラム。
(Supplementary Note 11)
Processing for separating the component to be cooled using the second configuration change function of operating the spare maintenance target component instead of the maintenance target component after separating the maintenance target component and restarting the information processing apparatus; The cooling component management program according to any one of appendices 7 to 9, which is executed by a processor.

(付記12)
前記複数の冷却部品の回転速度を高くする制御を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜11のいずれか1項に記載の冷却部品管理プログラム。
(Supplementary Note 12)
12. The cooling component management program according to any one of appendices 7 to 11, causing the processor to execute a process of performing control to increase the rotational speed of the plurality of cooling components.

1 サーバシステム
2 管理端末装置
21 CPU
22 FAN最適配置情報抽出部
23 結果表示制御部
3 サーバ装置
4 FRU4
5−1〜5−4,5 SB
51 CPU
52 DIMM
6 IOU
7 PCIeボックス
8 通信回線
10 MMB
11 CPU
111 構成情報管理部
112 温度情報管理部
113 FAN回転数管理部
114 FAN配置履歴管理部
115 FAN予測寿命管理部
116 切替制御部
12 メモリ
121 構成情報
122 温度情報
123 FAN回転数情報
124 FAN配置履歴情報
125 予測寿命履歴情報
126 温度影響情報
40−1〜40−4,40 FAN
41−1〜41−4,41 PSU
1 server system 2 management terminal device 21 CPU
22 FAN optimal arrangement information extraction unit 23 Result display control unit 3 Server device 4 FRU 4
5-1 to 5-4, 5 SB
51 CPU
52 DIMM
6 IOU
7 PCIe box 8 communication line 10 MMB
11 CPU
111 Configuration Information Management Unit 112 Temperature Information Management Unit 113 FAN Rotational Speed Management Unit 114 FAN Placement History Management Unit 115 FAN Expected Life Management Unit 116 Switching Control Unit 12 Memory 121 Configuration Information 122 Temperature Information 123 FAN Rotational Speed Information 124 FAN Placement History Information 125 Predicted life history information 126 Temperature influence information 40-1 to 40-4, 40 FAN
41-1 to 41-4, 41 PSU

Claims (7)

複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
前記複数の冷却部品の温度を検出する温度検出部と、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部と
を備えることを特徴とする、情報処理装置。
Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
A temperature detection unit that detects the temperatures of the plurality of cooling components;
A life prediction unit that performs life prediction of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. And a configuration change control unit configured to change the configuration of the component to be cooled.
前記構成変更制御部が、冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、請求項1記載の情報処理装置。
The information processing apparatus according to claim 1, wherein the configuration change control unit performs configuration change of adding a cooling target component and operates a cooling component corresponding to the added cooling target component.
前記構成変更制御部が、前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、請求項1記載の情報処理装置。
The configuration change control unit performs a configuration change in which the cooling target component having the lowest thermal influence on the predicted short-lived cooling component is operated among the plurality of cooling target components, and the cooling corresponding to the cooling target component operated. The information processing apparatus according to claim 1, wherein the component is operated.
前記構成変更制御部が、当該情報処理装置を停止させることなくパーディションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
ことを特徴とする、請求項1〜3のいずれか1項に記載の情報処理装置。
The configuration change control unit is configured to change the configuration of the component to be cooled using a first configuration change function capable of changing the hardware resource of the partition without stopping the information processing apparatus. The information processing apparatus according to any one of claims 1 to 3.
前記構成変更制御部が、前記保守対象部品を切り離し、当該情報処理装置の再起動後に前記保守対象部品に代えて予備保守対象部品を機能させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
ことを特徴とする、請求項1〜3のいずれか1項に記載の情報処理装置。
The configuration change control unit separates the maintenance target component, and uses the second configuration change function to cause the spare maintenance target component to function instead of the maintenance target component after restarting the information processing apparatus. The information processing apparatus according to any one of claims 1 to 3, wherein the change is made.
前記構成変更制御部が、前記複数の冷却部品の回転速度を高くする制御を行なう
ことを特徴とする、請求項1〜5のいずれか1項に記載の情報処理装置。
The information processing apparatus according to any one of claims 1 to 5, wherein the configuration change control unit performs control to increase a rotational speed of the plurality of cooling components.
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
プロセッサとを備える情報処理装置において、
前記複数の冷却部品の温度を検出し、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行ない、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させる、冷却部品管理プログラム。
Multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled;
An information processing apparatus including a processor;
Detecting temperatures of the plurality of cooling components;
Predicting the life of each of the plurality of cooling parts based on the temperature;
As a result of the life prediction, a difference between a predicted short life cooling component having the shortest predicted life among the plurality of cooling parts and a predicted long life cooling component having the longest predicted life is detected with a predicted life equal to or greater than a threshold. A cooling component management program, which causes the processor to execute a process of changing the configuration of the component to be cooled, in the case where it is detected.
JP2017232844A 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program Active JP6988414B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017232844A JP6988414B2 (en) 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017232844A JP6988414B2 (en) 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program

Publications (2)

Publication Number Publication Date
JP2019101822A true JP2019101822A (en) 2019-06-24
JP6988414B2 JP6988414B2 (en) 2022-01-05

Family

ID=66973776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017232844A Active JP6988414B2 (en) 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program

Country Status (1)

Country Link
JP (1) JP6988414B2 (en)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199052A (en) * 2005-12-28 2007-08-09 Nec Corp Lifetime prediction monitoring device, lifetime prediction monitoring method, and lifetime prediction monitoring program
JP2010097257A (en) * 2008-10-14 2010-04-30 Nec Corp Processor control system, method, and program
JP2011227709A (en) * 2010-04-20 2011-11-10 Nec Corp Raid controller device, raid device, and processing method and program for raid device
JP2012134209A (en) * 2010-12-20 2012-07-12 Nec Corp Fan controller, fan control method, and fan control program
JP2012169494A (en) * 2011-02-15 2012-09-06 Nec Corp Cooling system and method for efficiently cooling apparatus
JP2016126485A (en) * 2014-12-26 2016-07-11 株式会社Nttファシリティーズ Information processing system and program therefor
JP2017174065A (en) * 2016-03-23 2017-09-28 日本電気株式会社 Server device, server control method, and program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007199052A (en) * 2005-12-28 2007-08-09 Nec Corp Lifetime prediction monitoring device, lifetime prediction monitoring method, and lifetime prediction monitoring program
JP2010097257A (en) * 2008-10-14 2010-04-30 Nec Corp Processor control system, method, and program
JP2011227709A (en) * 2010-04-20 2011-11-10 Nec Corp Raid controller device, raid device, and processing method and program for raid device
JP2012134209A (en) * 2010-12-20 2012-07-12 Nec Corp Fan controller, fan control method, and fan control program
JP2012169494A (en) * 2011-02-15 2012-09-06 Nec Corp Cooling system and method for efficiently cooling apparatus
JP2016126485A (en) * 2014-12-26 2016-07-11 株式会社Nttファシリティーズ Information processing system and program therefor
JP2017174065A (en) * 2016-03-23 2017-09-28 日本電気株式会社 Server device, server control method, and program

Also Published As

Publication number Publication date
JP6988414B2 (en) 2022-01-05

Similar Documents

Publication Publication Date Title
US10519960B2 (en) Fan failure detection and reporting
JP5055192B2 (en) Management apparatus and storage apparatus control method
US7131019B2 (en) Method of managing power of control box
US11934889B2 (en) Risk-based scheduling of containerized application services
JP2017224285A (en) Chassis management system and chassis management method
JP2009294802A (en) Storage device and start-up control method for storage device
US20060161972A1 (en) System and method for license management in blade server system
JP5874484B2 (en) Processing system, device management apparatus, and program
JP2009015584A (en) Storage control device and method for controlling power supply of casing unit
JP6036819B2 (en) Information processing apparatus, replication method, and replication program
US10133330B2 (en) Cluster system, controller, method for controlling, and computer-readable recording medium having stored therein controlling program that operate node at the combination of the respective load setting values that satisfy required performance and lowers power consumption
JPWO2010018635A1 (en) Cooling method and computer
WO2018080556A1 (en) Unified power device management and analyzer
US10628338B2 (en) Selection of a location for installation of a CPU in a compute node using predicted performance scores
JP5975094B2 (en) Exchange candidate presentation method, information processing apparatus, and program
US11640377B2 (en) Event-based generation of context-aware telemetry reports
JP2019101822A (en) Information processing apparatus and cooling component management program
JP2018018177A (en) Information processing device, information processing system, information processing device control program and information processing device control method
KR102137891B1 (en) Server managing Method, Server, and Recording medium using User Specialized Operating Mechanism on BMC environment
JP6885626B2 (en) Server equipment, control methods and programs
US10877539B2 (en) System and method to prevent power supply failures based on data center environmental behavior
US10846184B2 (en) System and method to predict and prevent power supply failures based on data center environmental behavior
JP2012108794A (en) Repeating installation, repeating method, and device management apparatus
WO2021187128A1 (en) Monitoring system, monitoring device, and monitoring method
JP2020113113A (en) Storage device and data allocation method

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190607

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210727

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211115

R150 Certificate of patent or registration of utility model

Ref document number: 6988414

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150