JP6988414B2 - Information processing equipment and cooling parts management program - Google Patents

Information processing equipment and cooling parts management program Download PDF

Info

Publication number
JP6988414B2
JP6988414B2 JP2017232844A JP2017232844A JP6988414B2 JP 6988414 B2 JP6988414 B2 JP 6988414B2 JP 2017232844 A JP2017232844 A JP 2017232844A JP 2017232844 A JP2017232844 A JP 2017232844A JP 6988414 B2 JP6988414 B2 JP 6988414B2
Authority
JP
Japan
Prior art keywords
fan
life
cooling
predicted
control unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017232844A
Other languages
Japanese (ja)
Other versions
JP2019101822A (en
Inventor
佐輝子 西井
考司 武田
真紀子 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017232844A priority Critical patent/JP6988414B2/en
Publication of JP2019101822A publication Critical patent/JP2019101822A/en
Application granted granted Critical
Publication of JP6988414B2 publication Critical patent/JP6988414B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、情報処理装置および冷却部品管理プログラムに関する。 The present invention relates to an information processing apparatus and a cooling component management program.

サーバ等の情報処理装置(以下、サーバ装置という)は、CPU(Central Processing Unit)等の発熱源を冷却する冷却ファン(以下、FANという)を備える。また、サーバ装置においては、冗長化等の目的により複数個のFANを搭載することが一般的である。 An information processing device such as a server (hereinafter referred to as a server device) includes a cooling fan (hereinafter referred to as FAN) for cooling a heat generation source such as a CPU (Central Processing Unit). Further, in a server device, it is common to mount a plurality of FANs for the purpose of redundancy and the like.

サーバ装置の稼動開始後、保守対応期間(例えば、装置稼働開始後5年間)中に、FANの予期せぬ個別不良が発生した場合は、その都度、CE(Customer’s Engineer)によるスポット保守作業で故障FANの交換が行なわれる。 If an unexpected individual defect of FAN occurs during the maintenance response period (for example, 5 years after the start of operation of the server device) after the start of operation of the server device, the failure occurs in the spot maintenance work by CE (Customer's Engineer) each time. The FAN is exchanged.

また、サーバ装置に対する保守作業として、例えば、年一回の定期点検が実施され、FANはフィールドでの保守作業における点検対象となっている。FANに関する具体的な保守作業としては、FANの回転に異常がないかの確認が行なわれている。 Further, as maintenance work for the server device, for example, a periodic inspection is carried out once a year, and FAN is an inspection target in maintenance work in the field. As a specific maintenance work related to FAN, it is confirmed whether there is any abnormality in the rotation of FAN.

しかしながら、上述の如き定期点検を実施していても、以下の理由により、FANの寿命(交換時期)にばらつきが生じる。 However, even if the periodic inspection as described above is carried out, the life (replacement time) of the FAN varies due to the following reasons.

すなわち、故障により交換された新しいFANよりも、交換されていないFANの方が稼働時間が長いので先に寿命を迎える。また、一般的に、FANの経年での寿命はグリスの寿命で決まるが、グリスは高温になるほど劣化し寿命が短くなる。そのため、サーバ装置内部で高温のエアー(ユニット)に近い位置に搭載されるFANの寿命は短くなる。 That is, the non-replaced FAN has a longer operating time than the new FAN replaced due to a failure, and therefore reaches the end of its life earlier. In general, the life of FAN over time is determined by the life of grease, but the higher the temperature, the more the grease deteriorates and the life becomes shorter. Therefore, the life of the fan mounted in the server device near the high temperature air (unit) is shortened.

このようにFANの交換の有無や装置内における実装位置によって、サーバ装置に搭載される複数のFANの寿命にばらつきが生じる。 As described above, the life of a plurality of FANs mounted on the server device varies depending on whether or not the FAN is replaced and the mounting position in the device.

特開2010−186772号公報Japanese Unexamined Patent Publication No. 2010-186772 特開2013−115392号公報Japanese Unexamined Patent Publication No. 2013-115392 特開平8−278834号公報Japanese Unexamined Patent Publication No. 8-278834 特開2001−144484号公報Japanese Unexamined Patent Publication No. 2001-144484 特開平5−226868号公報Japanese Unexamined Patent Publication No. 5-226868

近年、社会的な節電要求に応じて、サーバ業界でも高温動作に適合するモデルの需要が高まっており、例えば、40℃の環境下での稼働を保証する40℃環境対応モデルの商品化も実現されている。 In recent years, in response to social power saving demands, the demand for models suitable for high-temperature operation has increased in the server industry. For example, the commercialization of a 40 ° C environment-friendly model that guarantees operation in a 40 ° C environment has been realized. Has been done.

通常のオフィス環境は年平均使用温度を25℃として設定されている。このような通常オフィス環境用のサーバ装置においては、保守対応期間(通常5年)内では寿命に至らないFANであっても、40℃環境対応モデルのような高温環境下での長期稼動を行なうことで、短期間で寿命に至る確率が高くなることが予想される。 In a normal office environment, the annual average operating temperature is set to 25 ° C. In such a server device for a normal office environment, long-term operation is performed in a high temperature environment such as a 40 ° C environment-friendly model even if the FAN does not reach the end of its life within the maintenance support period (usually 5 years). Therefore, it is expected that the probability of reaching the end of life in a short period of time will increase.

一般的にサーバ装置内部では、CPUに近い部分の温度が非常に高くなるため、CPUの周囲部品への影響が大きい。 Generally, inside the server device, the temperature of the portion close to the CPU becomes very high, so that the influence on the peripheral parts of the CPU is large.

万一、寿命のばらつきにより保守対応期間を満たさずに故障してしまうFANが発生した場合には、その都度、保守作業が発生し、ユーザに工数およびコストにかかる負担をかけ、ひいてはサーバに対する信頼を失うことになる。 In the unlikely event that a FAN occurs that fails to meet the maintenance response period due to variations in life, maintenance work will be required each time, placing a burden on the user for man-hours and costs, and eventually trusting the server. Will be lost.

また、40℃環境対応モデルにおいてFANに異常が生じると、サーバ装置内部の部品において高温による処理速度低下(サーマルスロットリング)が発生し、サーバ装置の処理性能の低下を招くおそれがある。 Further, if an abnormality occurs in the FAN in the 40 ° C. environment-friendly model, a processing speed decrease (thermal throttling) due to a high temperature may occur in a component inside the server device, which may lead to a decrease in the processing performance of the server device.

1つの側面では、本発明は、冷却部品の寿命のばらつきを解消することを目的とする。 In one aspect, the present invention aims to eliminate variations in the life of cooling components.

このため、この情報処理装置は、複数の冷却対象部品と、前記冷却対象部品を冷却する複数の冷却部品と、前記複数の冷却部品の温度を検出する温度検出部と、前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部とを備え、前記構成変更制御部が、前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる。 Therefore, this information processing apparatus is based on a plurality of cooling target parts, a plurality of cooling parts for cooling the cooling target parts, a temperature detection unit for detecting the temperature of the plurality of cooling parts, and the temperature. A life prediction unit that predicts the life of each of the plurality of cooling parts, a predicted short-life cooling component that has the shortest predicted life among the plurality of cooling parts as a result of the life prediction, and a predicted long life that has the longest predicted life. A configuration change control unit that changes the configuration of the cooling target component when a difference with a predicted life of more than a threshold value is detected between the cooling component and the cooling component is provided , and the configuration change control unit is the plurality of cooling targets. among the parts, performs the prediction configuration changes that thermal influence on the short-lived cooling components operating the lowest cooling target component, Ru activates the cooling device corresponding to the object to be cooled which was operated.

一実施形態によれば、冷却部品の寿命のばらつきを解消することができる。 According to one embodiment, it is possible to eliminate the variation in the life of the cooling component.

実施形態の一例としてのサーバシステムの構成を模式的に示す図である。It is a figure which shows typically the structure of the server system as an example of an embodiment. (a)〜(c)は実施形態の一例としてのサーバシステムの外観を模式的に示す図である。(A) to (c) are diagrams schematically showing the appearance of a server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおける構成情報を例示する図である。It is a figure which illustrates the configuration information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおける温度情報を例示する図である。It is a figure which illustrates the temperature information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおけるFAN回転数情報を例示する図である。It is a figure which illustrates the FAN rotation speed information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおけるFAN配置履歴情報を例示する図である。It is a figure which illustrates the FAN arrangement history information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおける予測寿命履歴情報を例示する図である。It is a figure which illustrates the predicted life history information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおける切替制御部によるSBの切り替え制御を説明するための図である。It is a figure for demonstrating the switching control of SB by the switching control part in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおける温度影響情報を例示する図である。It is a figure which illustrates the temperature influence information in the server system as an example of an embodiment. 実施形態の一例としてのサーバシステムにおけるFANとスロット位置との組み合わせをテーブル状に例示する図である。It is a figure exemplifying the combination of FAN and a slot position in a server system as an example of an embodiment in a table shape. 実施形態の一例としてのサーバシステムにおけるFANの最適配置制御方法の概要を説明するためのフローチャートである。It is a flowchart for demonstrating the outline of the optimum arrangement control method of FAN in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおけるFANの最適配置管理を実現するための各機能構成部の処理を説明するためのフローチャートである。It is a flowchart for demonstrating the processing of each function composition part for realizing the optimum arrangement management of FAN in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおけるFAN最適配置を行なうための制御を説明するためのフローチャートである。It is a flowchart for demonstrating the control for performing the FAN optimum arrangement in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおけるFAN最適配置を行なうための制御を説明するためのフローチャートである。It is a flowchart for demonstrating the control for performing the FAN optimum arrangement in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムのMMBの処理を説明するためのフローチャートである。It is a flowchart for demonstrating the processing of MMB of the server system as an example of Embodiment. 実施形態の一例としてのサーバシステムにおけるFAN予測寿命管理部によるFANの予測寿命の算出方法を説明するためのフローチャートである。It is a flowchart for demonstrating the calculation method of the predicted life of FAN by the FAN predicted life management part in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおける切替制御部によるFANの最適配置の決定方法を説明するフローチャートである。It is a flowchart explaining the method of determining the optimum arrangement of FAN by the switching control part in the server system as an example of embodiment. 実施形態の一例としてのサーバシステムにおける切替制御部によるDP機能を用いたSBの切り替え時のSBの選択方法を説明するためのフローチャートである。It is a flowchart for demonstrating the SB selection method at the time of SB switching using the DP function by the switching control unit in the server system as an example of embodiment.

以下、図面を参照して本情報処理装置および冷却部品管理プログラムに係る実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形(実施形態および各変形例を組み合わせる等)して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。 Hereinafter, embodiments relating to the information processing apparatus and the cooling component management program will be described with reference to the drawings. However, the embodiments shown below are merely examples, and there is no intention of excluding the application of various modifications and techniques not specified in the embodiments. That is, the present embodiment can be variously modified (combining the embodiment and each modified example, etc.) within a range that does not deviate from the purpose thereof. Further, each figure does not have the purpose of having only the components shown in the figure, but may include other functions and the like.

(A)構成
図1は実施形態の一例としてのサーバシステム1の構成を模式的に示す図である。
(A) Configuration FIG. 1 is a diagram schematically showing a configuration of a server system 1 as an example of an embodiment.

サーバシステム1は、図1に示すように、サーバ装置3および管理端末装置2を備える。サーバ装置3と管理端末装置2とは、通信回線8を介して通信可能に接続されている。 As shown in FIG. 1, the server system 1 includes a server device 3 and a management terminal device 2. The server device 3 and the management terminal device 2 are connected to each other so as to be able to communicate with each other via the communication line 8.

通信回線8は、例えば、LAN(Local Area Network)である。なお、通信回線8はLANに限定されるものではなく、種々変形して実施することができる。 The communication line 8 is, for example, a LAN (Local Area Network). The communication line 8 is not limited to the LAN, and can be modified in various ways.

サーバ装置3は、サーバ機能を備えたコンピュータであり、本サーバシステム1における保守対象装置の一例である。 The server device 3 is a computer having a server function, and is an example of a maintenance target device in the server system 1.

サーバ装置3は、MMB(Management Board)10,FRU(Field-Replaceable Unit)4,IOU(Input Output Unit)6,PCIeボックス7およびSB(System Board)5−1〜5−4を備える。 The server device 3 includes an MMB (Management Board) 10, a FRU (Field-Replaceable Unit) 4, an IOU (Input Output Unit) 6, a PCIe box 7, and an SB (System Board) 5-1 to 5-4.

[SB5]
SB5−1〜5−4は、本サーバシステム1における各種制御や演算処理を行なう処理装置である。図1に示す例においては、4つのSB5−1〜5−4が備えられている。これらのSB5−1〜5−4は同様の構成を有する。以下、SBを示す符号としては、複数のSBのうち1つを特定する必要があるときには符号5−1〜5−4を用いるが、任意のSBを指すときには符号5を用いる。
[SB5]
SB5-1 to 5-4 are processing devices that perform various controls and arithmetic processing in the server system 1. In the example shown in FIG. 1, four SB5-1 to 5-4 are provided. These SB5-1 to 5-4 have a similar configuration. Hereinafter, as the code indicating the SB, the reference numerals 5-1 to 5-4 are used when it is necessary to specify one of the plurality of SBs, but the reference numeral 5 is used when referring to an arbitrary SB.

また、以下、SB5−1をSB#0という場合がある。同様に、SB5−2,5−3,5−4を、それぞれ、SB#1,#2,#3という場合がある。 Further, hereinafter, SB5-1 may be referred to as SB # 0. Similarly, SB5-2, 5-3, 5-4 may be referred to as SB # 1, # 2, # 3, respectively.

図2(a)〜(c)は実施形態の一例としてのサーバシステム1の外観を模式的に示す図である。図2(a)はSB5(5−1)の外観を模式的に示す斜視図であり、図2(b)はサーバシステム1の筐体1a内におけるSB5の配置を例示する図である。また、図2(c)は図2(b)のA矢視図である。 2 (a) to 2 (c) are diagrams schematically showing the appearance of the server system 1 as an example of the embodiment. FIG. 2A is a perspective view schematically showing the appearance of SB5 (5-1), and FIG. 2B is a diagram illustrating the arrangement of SB5 in the housing 1a of the server system 1. Further, FIG. 2 (c) is a view taken along the line A of FIG. 2 (b).

各SB5においては、図2(a)に示すように、基板501上にCPU51やDIMM52が配置されている。 In each SB5, as shown in FIG. 2A, the CPU 51 and DIMM 52 are arranged on the substrate 501.

図2(b)に示す例においては、筐体1aの一方の面に沿って、4つのSB5が、互いに平行になるよう立設した状態で並べて配置されている。 In the example shown in FIG. 2B, four SB5s are arranged side by side in an upright state so as to be parallel to each other along one surface of the housing 1a.

また、図2(c)に示すように、筐体1aにおける、SB5が並ぶ面とは反対側には、FRU4とIOU6とが配置されている。 Further, as shown in FIG. 2 (c), the FRU 4 and the IOU 6 are arranged on the side of the housing 1a opposite to the surface where the SB 5s are lined up.

筐体1aの高さ方向における中央付近にはIOU6が備えられている。図2(c)においては、便宜上、1つのIOU6として図示されているが、このIOU6は、複数のIOU6および複数のPCIeボックス7を1つにまとめたものであってもよい。 An IOU6 is provided near the center of the housing 1a in the height direction. In FIG. 2 (c), although it is shown as one IOU6 for convenience, the IOU6 may be a combination of a plurality of IOUs 6 and a plurality of PCIe boxes 7.

IOU6の上面に沿ってFAN#0,#1が水平方向に並べて配置されている。そして、FAN#0の上方にはPSU#0が、FAN#1の上方にはPSU#1が、それぞれ配置されている。一方、IOU6の下面に沿って、FAN#2,#3が水平方向に並べて配置されている。そして、FAN#2の下方にはPSU#2が、FAN#3の下方にはPSU#3が、それぞれ配置されている。 FAN # 0 and # 1 are arranged side by side in the horizontal direction along the upper surface of the IOU6. PSU # 0 is arranged above FAN # 0, and PSU # 1 is arranged above FAN # 1. On the other hand, FANs # 2 and # 3 are arranged side by side in the horizontal direction along the lower surface of the IOU6. PSU # 2 is arranged below FAN # 2, and PSU # 3 is arranged below FAN # 3.

なお、筐体1a内におけるSB5,IOU6,FAN40,PSU41の位置はこれに限定されるものではなく、適宜変更して実施することができる。 The positions of SB5, IOU6, FAN40, and PSU41 in the housing 1a are not limited to these, and can be changed as appropriate.

SB5は、図1に示すように、BMC(Baseboard Management Controller)50,1つ以上(図1に示す例では2つ)のCPU51および1つ以上(図1に示す例では4つ)のDIMM(Dual Inline Memory Module)52を備える。 As shown in FIG. 1, the SB5 includes 50 BMCs (Baseboard Management Controllers), one or more (two in the example shown in FIG. 1) CPU 51 and one or more (four in the example shown in FIG. 1) DIMMs (4). Dual Inline Memory Module) 52 is provided.

DIMM52は、データや、OS(Operating System),プログラム等を一時的に格納する記憶領域であり、例えば、CPU51がプログラムを実行する際に、一次記憶メモリあるいはワーキングメモリとして利用される。DIMM52上のソフトウェアプログラムは、CPU51に適宜読み込まれて実行される。 The DIMM 52 is a storage area for temporarily storing data, an OS (Operating System), a program, and the like, and is used as a primary storage memory or a working memory when the CPU 51 executes a program, for example. The software program on the DIMM 52 is appropriately read and executed by the CPU 51.

CPU51は、種々の制御や演算を行なう処理装置であり、DIMM52に格納されたOSやプログラムを実行することにより、種々の機能を実現する。 The CPU 51 is a processing device that performs various controls and operations, and realizes various functions by executing an OS or a program stored in the DIMM 52.

CPU51やDIMM52はSB5としての処理の実行中に発熱する発熱源であり、これらのCPU51,DIMM52を備えるSB5は、FAN40による冷却対象部品である。 The CPU 51 and DIMM 52 are heat sources that generate heat during the execution of processing as the SB 5, and the SB 5 provided with these CPU 51 and DIMM 52 is a component to be cooled by the FAN 40.

BMC50は、SB5を管理するコントローラであり、CPU51やDIMM52,図示しない温度センサ等のハードウェアの監視やハードウェアイベントの記録等を行なう。BMC50は、例えば、IPMI(Intelligent Platform Management Interface)が定義する標準仕様に従った機能構成を有してもよい。 The BMC 50 is a controller that manages the SB 5, and monitors hardware such as the CPU 51, DIMM 52, and a temperature sensor (not shown), records hardware events, and the like. The BMC 50 may have, for example, a functional configuration according to a standard specification defined by IPMI (Intelligent Platform Management Interface).

BMC50は、SB5のMMB10に、SB5等の各種情報を送信する。例えば、BMC50は、FAN40に備えられた温度センサの検出値や、FAN40のモータの回転数をFRU4から取得し、MMB10に送信する。 The BMC 50 transmits various information such as the SB 5 to the MMB 10 of the SB 5. For example, the BMC 50 acquires the detection value of the temperature sensor provided in the FAN 40 and the rotation speed of the motor of the FAN 40 from the FRU 4, and transmits them to the MMB 10.

なお、SB5に搭載されるCPU51やDIMM52の数は、図1に示した例に限定されるものではなく、種々変形して実施することができる。 The number of CPUs 51 and DIMMs 52 mounted on the SB5 is not limited to the example shown in FIG. 1, and can be variously modified.

また、サーバシステム1に備えられるSB5の数は4つに限定されるものではなく、3つ以下、もしくは5つ以上のSB5を備えてもよく、種々変形して実施することができる。 Further, the number of SB5s provided in the server system 1 is not limited to four, and three or less or five or more SB5s may be provided, and various modifications can be made.

本サーバシステム1に備えられた4つのSB5のうち、少なくとも1つのSB5(例えば、SB5−3,5−4)は、リザーブドSB(Reserved SB)5として用いられる。 Of the four SB5s provided in the server system 1, at least one SB5 (for example, SB5-3, 5-4) is used as the Reserved SB (Reserved SB) 5.

リザーブドSB機能は、あらかじめ筐体1a内に予備のSB5を実装しておき、故障したSB5を自動的に切り離し、予備SB5を組み込んでパーティションを再起動することで、SB5の構成変更を実現する機能である。 The reserved SB function is a function that realizes the configuration change of SB5 by mounting a spare SB5 in the housing 1a in advance, automatically disconnecting the failed SB5, incorporating the spare SB5, and restarting the partition. Is.

また、障害発生時に切り替える目的の予備SB5をリザーブド(Reserved)SBという場合もある。 Further, the spare SB5 for the purpose of switching when a failure occurs may be referred to as a Reserved SB.

リザーブドSB5への切り替えにはシステムのシャットダウンが必要となる。 Switching to Reserved SB5 requires a system shutdown.

リザーブドSB5(例えば、SB5−4)は、サーバシステム1に備えられた他のSB5(例えばSB5−1〜5−3)のうちのいずれかに故障が検出された場合に、この故障が検出されたSB5に代えて用いられる予備のSB5である。リザーブドSB5は、スタンバイ状態で待機している。 The reserved SB5 (for example, SB5-4) detects this failure when a failure is detected in any of the other SB5s (for example, SB5-1 to 5-3) provided in the server system 1. It is a spare SB5 used in place of the SB5. Reserved SB5 is on standby in a standby state.

本サーバシステム1において、後述するMMB10は、故障したSB5をサーバシステム1から切り離し、この故障したSB5の代わりにリザーブドSB5を組み込み、パーティションを再起動するリザーブドSB機能を実現する。 In the server system 1, the MMB 10 described later separates the failed SB 5 from the server system 1, incorporates the reserved SB 5 in place of the failed SB 5, and realizes the reserved SB function of restarting the partition.

[IOU6]
IOU6は、外部装置との間でデータ等の入出力を行なう。IOU6は、例えば、PCIe(Peripheral Component Interconnect Express)の規格に従って、外部装置等と通信を行なう。図1に示す例においては、4つのIOU6が備えられ、複数のSB5のそれぞれに対して1つのIOU6が備えられている。4つのIOU6をIOU#0〜#3とそれぞれ表す場合がある。
[IOU6]
The IOU6 inputs / outputs data and the like to and from an external device. The IOU6 communicates with an external device or the like in accordance with a PCIe (Peripheral Component Interconnect Express) standard, for example. In the example shown in FIG. 1, four IOU6s are provided, and one IOU6 is provided for each of the plurality of SB5s. The four IOU6s may be represented as IOUs # 0 to # 3, respectively.

IOU6も処理の実行中に発熱する発熱源であり、FAN40による冷却対象である。 The IOU6 is also a heat generating source that generates heat during the execution of the process, and is a target of cooling by the FAN 40.

[PCIeボックス7]
PCIeボックス7は、PCIeスロットを増設可能な拡張ボックスであり、IOU6に対応して備えられる。図1に示す例においては、IOU6と同様に、4つのPCIeボックス7が備えられ、複数のIOU6のそれぞれに対して1つのPCIeボックス7が備えられている。4つのPCIeボックス7をPCIebox#0〜#3とそれぞれ表す場合がある。
[PCIe Box 7]
The PCIe box 7 is an expansion box to which a PCIe slot can be added, and is provided corresponding to the IOU6. In the example shown in FIG. 1, four PCIe boxes 7 are provided as in the IOU6, and one PCIe box 7 is provided for each of the plurality of IOU6s. The four PCIe boxes 7 may be represented as PCIebox # 0 to # 3, respectively.

IOU#0およびPCIebox#0はそれぞれSB#0に対応して備えられる。同様に、IOU#1およびPCIebox#1はそれぞれSB#1に、IOU#2およびPCIebox#2はそれぞれSB#2に、IOU#3およびPCIebox#3はそれぞれSB#3に、それぞれ対応して備えられる。 IOU # 0 and PCIebox # 0 are provided corresponding to SB # 0, respectively. Similarly, IOU # 1 and PCIebox # 1 correspond to SB # 1, IOU # 2 and PCIebox # 2 correspond to SB # 2, respectively, and IOU # 3 and PCIebox # 3 correspond to SB # 3, respectively. Be done.

[FRU4]
FRU4は、本サーバシステム1が稼働している現場で交換可能に構成された部品である。図1に示す例においては、FRU4は、4つのFAN40−1〜40−4と、4つのPSU(Power Supply Unit)41−1〜41−4を備える。
[FRU4]
The FRU 4 is a component that can be replaced at the site where the server system 1 is operating. In the example shown in FIG. 1, the FRU 4 includes four FANs 40-1 to 40-4 and four PSUs (Power Supply Units) 41-1 to 41-4.

FAN40−1〜40−4は、冷却風を発生させることで冷却対象部品を冷却する冷却装置である。FAN40−1〜40−4は、同様の構成を有する。以下、FANを示す符号としては、複数のFANのうち1つを特定する必要があるときには符号40−1〜40−4を用いるが、任意のFANを指すときには符号40を用いる。 FAN40-1 to 40-4 are cooling devices that cool the parts to be cooled by generating cooling air. FAN40-1 to 40-4 have a similar configuration. Hereinafter, as a code indicating a FAN, the reference numerals 40-1 to 40-4 are used when it is necessary to specify one of a plurality of FANs, but the reference numeral 40 is used when referring to an arbitrary FAN.

また、以下、FAN40−1をFAN#0という場合がある。同様に、FAN40−2,40−3,40−4を、それぞれ、FAN#1,#2,#3という場合がある。 Further, hereinafter, FAN40-1 may be referred to as FAN # 0. Similarly, FAN40-2, 40-3, 40-4 may be referred to as FAN # 1, # 2, # 3, respectively.

FAN#0〜#3はCEによる保守作業対象部品であり、故障等の障害が検出された場合には、CEによる保守作業により新たなFAN40に交換される。例えば、FAN#0に障害が検出された場合には、FAN#0として用いられていたFAN40が取り外され、新たなFAN40がFAN#0として取り付けられる。 FAN # 0 to # 3 are parts subject to maintenance work by CE, and when a failure such as a failure is detected, they are replaced with new FAN40 by maintenance work by CE. For example, when a failure is detected in FAN # 0, the FAN40 used as FAN # 0 is removed, and a new FAN40 is installed as FAN # 0.

なお、FAN40のそれぞれにはユニークな識別情報(FAN ID)が設定されており、FAN#0〜3としてFRU4に取り付けられるFAN40は、適宜交換される。なお、FAN#0〜3としてFRU4に取り付けられるFAN40のFAN IDは、後述するFAN配置履歴情報124によって管理される。以下、FAN IDを単に“ID”と表す場合がある。以下、4つのFAN40のIDが、それぞれ“A”,“B”,“C”,“D”である例について示す。 Unique identification information (FAN ID) is set for each of the FAN 40s, and the FAN 40 attached to the FRU 4 as FAN # 0 to 3 is appropriately replaced. The FAN ID of the FAN 40 attached to the FRU 4 as FAN # 0 to 3 is managed by the FAN arrangement history information 124 described later. Hereinafter, the FAN ID may be simply referred to as “ID”. Hereinafter, an example in which the IDs of the four FAN 40s are “A”, “B”, “C”, and “D”, respectively, will be shown.

本サーバシステム1において、FAN40は、FRU4に形成された複数のスロット(図示省略)のうちのいずれかに取り付けられる。以下、スロット位置を表す識別情報(スロットID)を“POS”と表す場合がある。以下、本サーバシステム1においてFRU4に4つのスロットが備えられ、これらの4つのスロットのPOSが、それぞれ“101”,“102”,“103”,“104”である例について示す。例えば、FAN#0,#1,#2,#3が、スロット“101”,“102”,“103”,“104”にそれぞれ取り付けられる。 In the server system 1, the FAN 40 is attached to one of a plurality of slots (not shown) formed in the FRU 4. Hereinafter, the identification information (slot ID) indicating the slot position may be expressed as “POS”. Hereinafter, an example will be described in which the FRU 4 is provided with four slots in the server system 1, and the POS of these four slots are “101”, “102”, “103”, and “104”, respectively. For example, FAN # 0, # 1, # 2, # 3 are installed in slots “101”, “102”, “103”, “104”, respectively.

また、サーバシステム1の筐体1a内におけるスロット位置がFAN40の寿命に影響を与える。 Further, the slot position in the housing 1a of the server system 1 affects the life of the FAN 40.

FRU4においては、FAN#0〜3として取り付けられている各FAN40のFAN IDと、各FAN40が取り付けられているスロット位置のスロットIDとをFAN配置情報として、図示しないメモリに記憶(管理)している。 In FRU4, the FAN ID of each FAN40 attached as FAN # 0 to 3 and the slot ID at the slot position where each FAN40 is attached are stored (managed) as FAN arrangement information in a memory (not shown). There is.

各FAN40には図示しない温度センサが備えられており、この温度センサにより、FAN40の温度(運転温度)もしくはFAN40の周囲の温度を検出する。なお、以下、便宜上、FAN40の温度もしくはFAN40の周囲の温度を、単にFAN40の温度という場合がある。 Each FAN 40 is provided with a temperature sensor (not shown), and the temperature sensor detects the temperature (operating temperature) of the FAN 40 or the temperature around the FAN 40. Hereinafter, for convenience, the temperature of the FAN 40 or the temperature around the FAN 40 may be simply referred to as the temperature of the FAN 40.

各FAN40の温度センサの検出値は、例えば、BMC50により採取され、このBMC50からMMB10にI2C(Inter-Integrated Circuit)通信を介して送信される。各FAN40の温度センサの検出値は、例えば、後述するMMB10の温度情報管理部112から取得要求が行なわれると、この取得要求に応答してBMC50により採取され、MMB10に送信される。 The detection value of the temperature sensor of each FAN 40 is collected by, for example, the BMC 50 and transmitted from the BMC 50 to the MMB 10 via I2C (Inter-Integrated Circuit) communication. The detection value of the temperature sensor of each FAN 40 is collected by the BMC 50 in response to the acquisition request, for example, when an acquisition request is made from the temperature information management unit 112 of the MMB 10, which will be described later, and is transmitted to the MMB 10.

本サーバシステム1においては、SB5(CPU51,DIMM52),IOU6等の発熱体にFAN40によって生成される冷却風を送風することで、これらの冷却を行なう。 In the server system 1, the cooling air generated by the FAN 40 is blown to a heating element such as SB5 (CPU51, DIMM52), IOU6, etc. to cool them.

各FAN40の回転速度等は、後述するMMB10によって制御される。また、各FAN40の動作状況を表す情報(例えば、FAN回転数)もBMC50を介して採取され、MMB10によって管理される。 The rotation speed and the like of each FAN 40 are controlled by the MMB 10 described later. In addition, information indicating the operating status of each FAN 40 (for example, the FAN rotation speed) is also collected via the BMC 50 and managed by the MMB 10.

PSU41−1〜41−4は、本サーバシステム1に備えられる各部に電力供給を行なう。以下、PSU41−1をPSU#0という場合がある。同様に、PSU41−2,41−3,41−4を、それぞれ、PSU#1,#2,#3という場合がある。 PSU41-1 to 41-4 supply electric power to each part provided in the server system 1. Hereinafter, PSU41-1 may be referred to as PSU # 0. Similarly, PSU41-2, 41-3, 41-4 may be referred to as PSU # 1, # 2, # 3, respectively.

例えば、PSU#0はFAN#0,SB#0,IOU#0およびPCIeボックス#0に電力を供給する。 For example, PSU # 0 powers FAN # 0, SB # 0, IOU # 0, and PCIe box # 0.

同様に、PSU#1はFAN#1,SB#1,IOU#1およびPCIeボックス#1に、PSU#2はFAN#2,SB#2,IOU#2およびPCIeボックス#2に、PSU#3はFAN#3,SB#3,IOU#3およびPCIeボックス#3に、それぞれ電力を供給する。 Similarly, PSU # 1 is in FAN # 1, SB # 1, IOU # 1 and PCIe box # 1, PSU # 2 is in FAN # 2, SB # 2, IOU # 2 and PCIe box # 2, and PSU # 3 Powers FAN # 3, SB # 3, IOU # 3 and PCIe box # 3, respectively.

PSU41も発熱源であり、FAN40による冷却対象である。 PSU41 is also a heat generating source and is a target of cooling by FAN40.

[MMB10]
MMB10は、本サーバシステム1における制御や監視、パーティション管理、システム初期化などの処理を行なうシステム制御ユニットである。
[MMB10]
The MMB 10 is a system control unit that performs processing such as control, monitoring, partition management, and system initialization in the server system 1.

MMB10は、図1に示すように、CPU11およびメモリ12を備える。 As shown in FIG. 1, the MMB 10 includes a CPU 11 and a memory 12.

メモリ12は、データや,OS,プログラム等を一時的に格納する記憶領域であり、例えば、CPU11がプログラムを実行する際に、一次記憶メモリあるいはワーキングメモリとして利用される。メモリ12上のソフトウェアプログラムは、CPU11に適宜読み込まれて実行される。 The memory 12 is a storage area for temporarily storing data, an OS, a program, and the like, and is used as a primary storage memory or a working memory when the CPU 11 executes a program, for example. The software program on the memory 12 is appropriately read and executed by the CPU 11.

ソフトウェアプログラムには、MMB10によって本実施形態のFAN管理機能を実現するためにCPU11によって実行されるFAN配置管理プログラムが含まれてもよい。FAN配置管理プログラムは、例えば、ファームウェアにモジュールとして組み込まれてもよい。 The software program may include a FAN placement management program executed by the CPU 11 in order to realize the FAN management function of the present embodiment by the MMB 10. The FAN placement management program may be incorporated as a module in the firmware, for example.

また、メモリ12には、構成情報121,温度情報112,FAN回転数情報123,FAN配置履歴情報124,予測寿命履歴情報125および温度影響情報126が記憶領域に格納される。 Further, the memory 12 stores the configuration information 121, the temperature information 112, the FAN rotation speed information 123, the FAN arrangement history information 124, the predicted life history information 125, and the temperature effect information 126 in the storage area.

図3は実施形態の一例としてのサーバシステム1における構成情報121を例示する図である。 FIG. 3 is a diagram illustrating configuration information 121 in the server system 1 as an example of the embodiment.

構成情報121は、例えば、各SB5のハードウェア構成を管理する情報であり、SB5を構成する部品の構成や性能を示す情報である。構成情報121は、各SB5に備えられたCPU51およびDIMM52の構成や性能を示す情報をSB5毎に対応付けて構成されている。図3に示す例においては、CPU51の構成や性能を示す情報としてプロセッサ種類(Xenon等)が、また、DIMM52の構成や性能を示す情報としては、種類,枚数,メモリサイズが、それぞれSB5毎に登録されている。 The configuration information 121 is, for example, information for managing the hardware configuration of each SB5, and is information indicating the configuration and performance of the components constituting the SB5. The configuration information 121 is configured by associating information indicating the configuration and performance of the CPU 51 and DIMM 52 provided in each SB 5 with each SB 5. In the example shown in FIG. 3, the processor type (Xenon, etc.) is used as information indicating the configuration and performance of the CPU 51, and the type, number of sheets, and memory size are used as information indicating the configuration and performance of the DIMM 52 for each SB5. It is registered.

なお、図3においてはx個(xは自然数)のDIMM52についての構成情報を示すものであり、図1に例示するサーバシステム1の構成においては、各SB5にそれぞれ4つのDIMM52が搭載されているのでx=4となる。 Note that FIG. 3 shows configuration information for x (x is a natural number) DIMM 52, and in the configuration of the server system 1 illustrated in FIG. 1, four DIMM 52s are mounted on each SB5. Therefore, x = 4.

構成情報121は、例えば、サーバシステム1の設定時や保守作業時に、担当CEやシステム管理者等によって設定されてもよい。 The configuration information 121 may be set by the responsible CE, the system administrator, or the like at the time of setting or maintenance work of the server system 1, for example.

なお、図3に例示する構成情報121はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。また、構成情報121において管理する情報は、図3に例示したものに限定されるものではなく、例えば、プロセッサの動作周波数等、他の情報を含めてもよく種々変形して実施することができる。 Although the configuration information 121 illustrated in FIG. 3 has a table-like configuration, the configuration information 121 is not limited to this, and the data structure thereof can be appropriately modified for implementation. Further, the information managed in the configuration information 121 is not limited to the information illustrated in FIG. 3, and may include other information such as the operating frequency of the processor, and can be variously modified and implemented. ..

図4は実施形態の一例としてのサーバシステム1における温度情報122を例示する図である。 FIG. 4 is a diagram illustrating temperature information 122 in the server system 1 as an example of the embodiment.

温度情報122は、各FAN40において検出された温度の履歴を管理する情報である。図4に例示する温度情報122においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)から、所定時間が経過する毎の各タイミングで測定(サンプリング)された各FAN40の温度がFAN40毎に登録されている。 The temperature information 122 is information for managing the history of the temperature detected in each FAN 40. In the temperature information 122 illustrated in FIG. 4, for example, the temperature of each FAN 40 measured (sampled) at each timing when a predetermined time elapses from the first startup (first AC-ON) of the server system 1. Is registered for each FAN40.

なお、図4においてはn個(nは自然数)のFAN#0〜#n−1についての温度情報122を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。 Note that FIG. 4 shows temperature information 122 for n (n is a natural number) FAN # 0 to # n-1, and in the configuration of the server system 1 illustrated in FIG. 1, four FAN 40s are used. Since it is installed, n = 4.

例えば、BMC50が、各FAN40に備えられた温度センサの検出値を採取し、温度情報122に定期的に記録してもよい。また、後述するMMB10の温度情報管理部112が、FRU4から各FAN40の温度を定期的に取得し、温度情報122に記録してもよい。 For example, the BMC 50 may collect the detection values of the temperature sensors provided in each FAN 40 and periodically record them in the temperature information 122. Further, the temperature information management unit 112 of the MMB 10, which will be described later, may periodically acquire the temperature of each FAN 40 from the FRU 4 and record it in the temperature information 122.

FAN40の温度は、所定時間が経過する毎の各タイミングで測定(サンプリング)された値に代えて、例えば所定経過時間毎の平均値であってもよく、種々変形して実施することができる。 The temperature of the FAN 40 may be, for example, an average value for each predetermined elapsed time instead of the value measured (sampled) at each timing when the predetermined time elapses, and can be variously modified and carried out.

図4に例示する温度情報122はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。 The temperature information 122 illustrated in FIG. 4 has a table-like structure, but is not limited to this, and the data structure thereof can be appropriately modified for implementation.

図5は実施形態の一例としてのサーバシステム1におけるFAN回転数情報123を例示する図である。 FIG. 5 is a diagram illustrating the FAN rotation speed information 123 in the server system 1 as an example of the embodiment.

FAN回転数情報123は、各FAN40の回転数(回転速度)の履歴を管理する情報である。図5に例示するFAN回転数情報123においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングで測定(サンプリング)された回転数の値がFAN40毎に登録されている。 The FAN rotation speed information 123 is information for managing the history of the rotation speed (rotation speed) of each FAN 40. In the FAN rotation speed information 123 illustrated in FIG. 5, for example, the rotation speed measured (sampled) at each timing when a predetermined time elapses from the first startup (first AC-ON) of the server system 1. The value of is registered for each FAN 40.

なお、図5においてはn個(nは自然数)のFAN#0〜#n−1についてのFAN回転数情報123を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。 Note that FIG. 5 shows FAN rotation speed information 123 for n (n is a natural number) FAN # 0 to # n-1, and in the configuration of the server system 1 illustrated in FIG. 1, four are shown. Since FAN40 is installed, n = 4.

例えば、BMC50が、FRU4に備えられた図示しない制御装置から各FAN40の回転数を採取し、FAN回転数情報123に定期的に記録してもよい。また、後述するMMB10のFAN回転数管理部113が、FRU4から各FAN40の回転数を定期的に取得し、FAN回転数情報123に記録してもよい。 For example, the BMC 50 may collect the rotation speed of each FAN 40 from a control device (not shown) provided in the FRU 4 and periodically record the rotation speed in the FAN rotation speed information 123. Further, the FAN rotation speed management unit 113 of the MMB 10, which will be described later, may periodically acquire the rotation speed of each FAN 40 from the FRU 4 and record it in the FAN rotation speed information 123.

FAN回転数情報123は、FAN回転数管理部113によって登録・管理される。 The FAN rotation speed information 123 is registered and managed by the FAN rotation speed management unit 113.

なお、FAN40の回転数は、所定時間が経過する毎の各タイミングで測定(サンプリング)された値に代えて、所定経過時間毎の平均値であってもよく、種々変形して実施することができる。 The rotation speed of the FAN 40 may be an average value for each predetermined elapsed time instead of the value measured (sampled) at each timing when the predetermined time elapses, and may be modified in various ways. can.

図5に例示するFAN回転数情報123はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。 The FAN rotation speed information 123 illustrated in FIG. 5 has a table-like structure, but is not limited to this, and the data structure thereof can be appropriately modified for implementation.

図6は実施形態の一例としてのサーバシステム1におけるFAN配置履歴情報124を例示する図である。 FIG. 6 is a diagram illustrating the FAN arrangement history information 124 in the server system 1 as an example of the embodiment.

FAN配置履歴情報124は、各FAN40の配置の履歴を管理する情報である。図6に例示するFAN配置履歴情報124においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングでの、FAN#0〜#n−1のサーバシステム1内での取り付けスロット位置(POS)が登録されている。 The FAN arrangement history information 124 is information for managing the arrangement history of each FAN 40. In the FAN arrangement history information 124 illustrated in FIG. 6, for example, FAN # 0 to # n at each timing when a predetermined time elapses from the first startup (first AC-ON) of the server system 1. The mounting slot position (POS) in the server system 1 of -1 is registered.

なお、図6においてはn個(nは自然数)のFAN#0〜#n−1についてのFAN配置履歴情報124を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。また、図6に例示するFAN配置履歴情報124においては、便宜上、具体的な値に代えて“POS”との文字が示されている。 Note that FIG. 6 shows FAN arrangement history information 124 for n (n is a natural number) FAN # 0 to # n-1, and in the configuration of the server system 1 illustrated in FIG. 1, four are shown. Since FAN40 is installed, n = 4. Further, in the FAN arrangement history information 124 illustrated in FIG. 6, for convenience, the character "POS" is shown instead of the specific value.

後述するFAN配置履歴管理部114が、FRU4において管理されるFAN配置情報から取得し、この取得した情報を用いてFAN配置履歴情報124が登録・管理される。 The FAN placement history management unit 114, which will be described later, acquires from the FAN placement information managed in the FRU 4, and the FAN placement history information 124 is registered and managed using the acquired information.

図6に例示するFAN配置履歴情報124はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。 The FAN arrangement history information 124 illustrated in FIG. 6 has a table-like structure, but is not limited to this, and the data structure thereof can be appropriately modified for implementation.

図7は実施形態の一例としてのサーバシステム1における予測寿命履歴情報125を例示する図である。 FIG. 7 is a diagram illustrating the predicted life history information 125 in the server system 1 as an example of the embodiment.

予測寿命履歴情報125は、各FAN40について算出された予測寿命の履歴を管理する情報である。図7に例示する予測寿命履歴情報125においては、例えば、本サーバシステム1の初回の起動時(初回AC−ON)からの所定時間が経過する毎の各タイミングでFAN予測寿命管理部115によって算出された、FAN#0〜#n−1の予測寿命(Life(ID,POS))が登録されている。FAN4の予測寿命の詳細については後述する。 The predicted life history information 125 is information for managing the history of the predicted life calculated for each FAN 40. In the predicted life history information 125 illustrated in FIG. 7, for example, it is calculated by the FAN predicted life management unit 115 at each timing when a predetermined time elapses from the first startup (first AC-ON) of the server system 1. The predicted life (Life (ID, POS)) of FAN # 0 to # n-1 is registered. The details of the predicted life of FAN4 will be described later.

Life(ID,POS)は、FAN予測寿命管理部115によって算出された予測寿命(単位:h(時間))に、当該予測寿命の算出の対象であるFAN40を特定するID(FAN ID)と、当該FAN40が取り付けられたスロットを特定するPOSとを関連付ける。 Life (ID, POS) includes an ID (FAN ID) that identifies FAN40, which is the target of calculation of the predicted life, in the predicted life (unit: h (hours)) calculated by the FAN predicted life management unit 115. It is associated with a POS that identifies the slot in which the FAN 40 is installed.

なお、図7においてはn個(nは自然数)のFAN#0〜#n−1についての予測寿命履歴情報125を示すものであり、図1に例示するサーバシステム1の構成においては、4つのFAN40が搭載されているのでn=4となる。 Note that FIG. 7 shows predicted life history information 125 for n (n is a natural number) FAN # 0 to # n-1, and in the configuration of the server system 1 illustrated in FIG. 1, four are shown. Since FAN40 is installed, n = 4.

予測寿命履歴情報125は、後述するFAN予測寿命管理部115によって登録・管理される。 The predicted life history information 125 is registered and managed by the FAN predicted life management unit 115, which will be described later.

図7に例示する予測寿命履歴情報125はテーブル状の構成を有するが、これに限定されるものではなく、そのデータ構造を適宜変更して実施することができる。 The predicted life history information 125 illustrated in FIG. 7 has a table-like structure, but the present invention is not limited to this, and the data structure thereof can be appropriately changed for implementation.

温度影響情報126については後述する。 The temperature effect information 126 will be described later.

CPU11は、種々の制御や演算を行なう処理装置であり、メモリ12に格納されたOSやプログラムを実行することにより、種々の機能を実現する。CPU11は、FAN管理プログラムを実行することで、本サーバシステム1に備えられた複数のFAN40を管理するFAN配置管理機能を実現する。 The CPU 11 is a processing device that performs various controls and operations, and realizes various functions by executing an OS or a program stored in the memory 12. By executing the FAN management program, the CPU 11 realizes a FAN arrangement management function for managing a plurality of FAN 40s provided in the server system 1.

具体的には、CPU11は、FAN配置管理プログラムを実行することで、図1に示すように、構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現する。 Specifically, the CPU 11 executes the FAN arrangement management program, and as shown in FIG. 1, the configuration information management unit 111, the temperature information management unit 112, the FAN rotation speed management unit 113, and the FAN arrangement history management unit 114. , FAN Predicted life management unit 115 and switching control unit 116 are realized.

なお、これらの構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現するためのプログラム(FAN配置管理プログラム)は、例えばフレキシブルディスク,CD(CD−ROM,CD−R,CD−RW等),DVD(DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RW,HD DVD等),ブルーレイディスク,磁気ディスク,光ディスク,光磁気ディスク等の、コンピュータ読取可能な記録媒体に記録された形態で提供される。そして、コンピュータはその記録媒体からプログラムを読み取って内部記憶装置または外部記憶装置に転送し格納して用いる。また、そのプログラムを、例えば磁気ディスク,光ディスク,光磁気ディスク等の記憶装置(記録媒体)に記録しておき、その記憶装置から通信経路を介してコンピュータに提供するようにしてもよい。 A program for realizing the functions of the configuration information management unit 111, the temperature information management unit 112, the FAN rotation speed management unit 113, the FAN arrangement history management unit 114, the FAN predicted life management unit 115, and the switching control unit 116. (FAN layout management program) includes, for example, flexible discs, CDs (CD-ROM, CD-R, CD-RW, etc.), DVDs (DVD-ROM, DVD-RAM, DVD-R, DVD + R, DVD-RW, DVD + RW, etc.). It is provided in the form of being recorded on a computer-readable recording medium such as an HD DVD), a Blu-ray disc, a magnetic disc, an optical disc, or a magneto-optical disc. Then, the computer reads the program from the recording medium, transfers it to the internal storage device or the external storage device, stores it, and uses it. Further, the program may be recorded in a storage device (recording medium) such as a magnetic disk, an optical disk, or a magneto-optical disk, and provided to the computer from the storage device via a communication path.

構成情報管理部111,温度情報管理部112,FAN回転数管理部113,FAN配置履歴管理部114,FAN予測寿命管理部115および切替制御部116としての機能を実現する際には、内部記憶装置(本実施形態ではメモリ12)に格納されたプログラムがコンピュータのマイクロプロセッサ(本実施形態ではCPU11)によって実行される。このとき、記録媒体に記録されたプログラムをコンピュータが読み取って実行するようにしてもよい。 When realizing the functions as the configuration information management unit 111, the temperature information management unit 112, the FAN rotation speed management unit 113, the FAN arrangement history management unit 114, the FAN predicted life management unit 115, and the switching control unit 116, an internal storage device is used. The program stored in (memory 12 in this embodiment) is executed by a microprocessor of a computer (CPU 11 in this embodiment). At this time, the computer may read and execute the program recorded on the recording medium.

構成情報管理部111は、各SB5のハードウェア構成を管理する。構成情報管理部111は、構成情報121から各SB5のハードウェア構成に関する情報を読み出し、メモリ12の所定の領域に格納する。 The configuration information management unit 111 manages the hardware configuration of each SB5. The configuration information management unit 111 reads information about the hardware configuration of each SB 5 from the configuration information 121 and stores it in a predetermined area of the memory 12.

温度情報管理部112は、各FAN40において検出された温度の履歴を管理する。温度情報管理部112は、メモリ12の温度情報122を用いて各FAN40の温度を管理する。例えば、温度情報管理部112は、FAN予測寿命管理部115からの要求に応じてFAN40の温度を随時取得し、FAN予測寿命管理部115に通知する。温度情報管理部112は、収集したFAN40の温度を温度情報122に記録する。 The temperature information management unit 112 manages the history of the temperature detected in each FAN 40. The temperature information management unit 112 manages the temperature of each FAN 40 by using the temperature information 122 of the memory 12. For example, the temperature information management unit 112 acquires the temperature of the FAN 40 at any time in response to a request from the FAN predicted life management unit 115, and notifies the FAN predicted life management unit 115. The temperature information management unit 112 records the collected temperature of the FAN 40 in the temperature information 122.

また、温度情報管理部112は、複数のFAN40の温度を検出する温度検出部として機能する。 Further, the temperature information management unit 112 functions as a temperature detection unit that detects the temperature of a plurality of FAN 40s.

FAN回転数管理部113は、各FAN40の回転数(回転速度)の履歴を管理する。FAN回転数管理部113は、メモリ12のFAN回転数情報123を用いて各FAN40の回転数を管理する。FAN回転数管理部113は、FAN予測寿命管理部115からの要求に応じてFAN40の回転数を随時取得し、FAN予測寿命管理部115に通知する。FAN回転数管理部113は、収集したFAN回転数をFAN回転数情報123に記録する。 The FAN rotation speed management unit 113 manages the history of the rotation speed (rotation speed) of each FAN 40. The FAN rotation speed management unit 113 manages the rotation speed of each FAN 40 by using the FAN rotation speed information 123 of the memory 12. The FAN rotation speed management unit 113 acquires the rotation speed of the FAN 40 at any time in response to a request from the FAN predicted life management unit 115, and notifies the FAN predicted life management unit 115. The FAN rotation speed management unit 113 records the collected FAN rotation speed in the FAN rotation speed information 123.

FAN配置履歴管理部114は、各FAN40の配置の履歴を管理する。FAN配置管理部114は、メモリ12のFAN配置履歴情報124を用いて各FAN40の配置履歴を管理する。FAN配置履歴管理部114は、FAN予測寿命管理部115からの要求に応じてFAN40の配置履歴を随時取得し、FAN予測寿命管理部115に通知する。例えば、FAN配置履歴管理部114は、FRU4から各スロットに取り付けられたFAN40のFAN IDを取得し、FAN配置履歴情報124に記録する。 The FAN placement history management unit 114 manages the placement history of each FAN 40. The FAN arrangement management unit 114 manages the arrangement history of each FAN 40 by using the FAN arrangement history information 124 of the memory 12. The FAN placement history management unit 114 acquires the placement history of the FAN 40 at any time in response to a request from the FAN prediction life management unit 115, and notifies the FAN prediction life management unit 115. For example, the FAN placement history management unit 114 acquires the FAN ID of the FAN 40 attached to each slot from the FRU 4, and records it in the FAN placement history information 124.

FAN予測寿命管理部(寿命予測部)115は、各FAN40の寿命を予測する演算(寿命予測演算)を行なうことで、各FAN40の寿命予測を行なう。 The FAN prediction life management unit (life prediction unit) 115 predicts the life of each FAN 40 by performing a calculation (life prediction calculation) for predicting the life of each FAN 40.

FAN40の寿命予測を行なうに際して、FAN予測寿命管理部115は、変数“life_fan(ID)”,変数“life_static(POS)”および変数“count”を用いる。 In predicting the life of the FAN 40, the FAN predicted life management unit 115 uses the variable “life_fan (ID)”, the variable “life_static (POS)”, and the variable “count”.

変数“life_fan(ID)”は、識別子がIDのFAN40の残寿命を表す。例えば、変数“life_fan(ID)”を1以下の数値とする。そして、life_fan(ID)= 1の場合に寿命がフルであるとし、その値が小さいほど残寿命が短いことを示すこととする。また、life_fan(ID)の初期値を1とする。 The variable "life_fan (ID)" represents the remaining life of FAN40 whose identifier is ID. For example, the variable "life_fan (ID)" is a numerical value of 1 or less. Then, it is assumed that the life is full when life_fan (ID) = 1, and the smaller the value is, the shorter the remaining life is. Also, set the initial value of life_fan (ID) to 1.

変数“life_static(POS)”は、識別子がPOSのスロット位置がFAN40の寿命に与える影響を表す数値である。例えば、変数“life_static(POS)”を1以下の数値とし、その値が小さいほど、FAN40の残寿命(life_fan(ID))を短くするよう作用する。また、life_fan(ID)の初期値を1とする。 The variable “life_static (POS)” is a numerical value indicating the influence of the slot position of the identifier POS on the life of the FAN 40. For example, the variable "life_static (POS)" is set to a numerical value of 1 or less, and the smaller the value, the shorter the remaining life (life_fan (ID)) of FAN40. Also, set the initial value of life_fan (ID) to 1.

変数“count”は、ループ回数を数える。countの初期値を1とする。 The variable “count” counts the number of loops. The initial value of count is 1.

FAN予測寿命管理部115は、サンプリングされた各FAN40の温度に基づき、FAN40の寿命予測を行なう。 The FAN predicted life management unit 115 predicts the life of the FAN 40 based on the temperature of each sampled FAN 40.

例えば、FAN予測寿命管理部115は、FANモータのグリス寿命の算出式に基づき、FAN40の寿命予測を行なう。具体的にはFAN予測寿命管理部115は、以下の式(1)〜(3)を用いて、各FAN40の予測寿命を算出する。 For example, the FAN predicted life management unit 115 predicts the life of the FAN 40 based on the calculation formula of the grease life of the FAN motor. Specifically, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40 using the following equations (1) to (3).

log(L1) = A - B*T1 ・・・(1)
log(L2) = A - B*T2 ・・・(2)
l= 10^(A - Bt) ・・・(3)
なお、上記式において、L1は温度T1(単位:℃)におけるFAN40のカタログ値(仕様値)としての寿命(単位:h(時間))であり、L2は温度T2(単位:℃)におけるFAN40のカタログ値としての寿命(単位:h(時間))である。A,Bは定数であり、例えばFAN40に用いられるグリスに固有の値である。そして、lは温度t(単位:℃)におけるFAN40の寿命(単位:h(時間))である。
log (L1) = A --B * T1 ・ ・ ・ (1)
log (L2) = A --B * T2 ・ ・ ・ (2)
l = 10 ^ (A --Bt) ・ ・ ・ (3)
In the above formula, L1 is the life (unit: h (hours)) of FAN40 as a catalog value (specification value) at temperature T1 (unit: ° C.), and L2 is the life (unit: h (hours)) of FAN40 at temperature T2 (unit: ° C.). Life as a catalog value (unit: h (hours)). A and B are constants, for example, values specific to the grease used for FAN40. And l is the life (unit: h (hours)) of FAN40 at the temperature t (unit: ° C.).

FAN予測寿命管理部115は、上記の式(1),(2)の連立式を解くことでA,Bを算出し、これらの算出したA,Bの値を式(3)に設定することで、FAN40の温度tにおける寿命lを算出する。 The FAN predicted life management unit 115 calculates A and B by solving the simultaneous equations of the above equations (1) and (2), and sets the calculated values of A and B in the equation (3). Then, the life l at the temperature t of FAN40 is calculated.

例えば、FAN#0〜#3に用いられる各FAN40は同種であり、FAN40の温度30℃(T1=30)で寿命70000h(L1=70000),40℃(T2=40)で寿命56000h(L2=56000)であるとする。 For example, each FAN40 used for FAN # 0 to # 3 is of the same type, and has a life of 70000h (L1 = 70000) at a temperature of 30 ° C (T1 = 30) and a life of 56000h (L2 =) at 40 ° C (T2 = 40). 56000).

上記式(1),(2)より
log(70000) = A - B*30
log(56000) = A - B*40
となる。これらの連立式を解くことで、
A = 5.1358
B = 0.0096910
が求められる。
From the above equations (1) and (2)
log (70000) = A --B * 30
log (56000) = A --B * 40
Will be. By solving these simultaneous equations,
A = 5.1358
B = 0.0096910
Is required.

次に、上記式(3)に基づき、以下の式が得られる。 Next, the following equation is obtained based on the above equation (3).

l = 10^(5.1358-0.0096910*t)
この式にサンプリングで読み取った温度tを代入すると、当該温度でのFAN40の予測寿命lが得られる。
l = 10 ^ (5.1358-0.0096910 * t)
By substituting the temperature t read by sampling into this equation, the predicted life l of FAN40 at the temperature can be obtained.

例えば、温度FAN40の動作温度においてt=50度が読み取れたとすると、
l=44797h
となる。
For example, if t = 50 degrees can be read at the operating temperature of the temperature FAN40,
l = 44977h
Will be.

なお、FAN予測寿命管理部115によって算出された各FAN40の予測寿命は、例えば、メモリ12の所定の記憶領域に予測寿命履歴情報125として記録される。 The predicted life of each FAN 40 calculated by the FAN predicted life management unit 115 is recorded as the predicted life history information 125 in a predetermined storage area of the memory 12, for example.

また、FAN予測寿命管理部115は、以下の式(4)に基づいて、FAN40の温度取得にかかるサンプリング間隔S中に消費した消費寿命laを算出する。すなわち、以下の式(4)に示すように、FAN予測寿命管理部115は上記式(3)で求めた予測寿命lに温度のサンプリング間隔S(単位:ms)を掛け算して逆数をとることで、サンプリング間隔S中に消費した消費寿命laを算出する。 Further, the FAN predicted life management unit 115 calculates the consumption life la consumed during the sampling interval S for acquiring the temperature of the FAN 40 based on the following equation (4). That is, as shown in the following equation (4), the FAN predicted lifetime management unit 115 multiplies the predicted lifetime l obtained by the above equation (3) by the temperature sampling interval S (unit: ms) and takes the reciprocal. Then, the consumption life la consumed during the sampling interval S is calculated.

la = 1/(t*S) ・・・(4)
例えば、温度のサンプリング間隔10msである場合には、上記式(4)に基づき、以下のように求められる。
la = 1 / (t * S) ・ ・ ・ (4)
For example, when the temperature sampling interval is 10 ms, it is obtained as follows based on the above equation (4).

la = 1/(0.01*(44797*60*60))
FAN予測寿命管理部115は、それぞれのサンプリングデータ毎に 消費寿命laを計算し、life_fan(ID), life_static(POS)から減算する。
la = 1 / (0.01 * (44797 * 60 * 60))
The FAN predicted life management unit 115 calculates the consumption life la for each sampling data and subtracts it from life_fan (ID) and life_static (POS).

切替制御部116は、FAN予測寿命管理部115による寿命予測の結果に基づき、予測寿命が短いと判断されるFAN40の負荷を軽減するための処理を行なう。 The switching control unit 116 performs a process for reducing the load of the FAN 40, which is determined to have a short predicted life, based on the result of the life prediction by the FAN predicted life management unit 115.

例えば、切替制御部116は、FAN予測寿命管理部115による寿命予測の結果、複数のFAN40のうち、予測寿命が最も長いFAN40(長寿命FAN40)と予測寿命が最も短いFAN40(短寿命FAN40)との予測寿命の差が所定値(例えば、1か月)以上であるかを確認する。すなわち、切替制御部116は、複数のFAN40間において予測寿命のばらつきが生じているかを確認する。 For example, as a result of the life prediction by the FAN predicted life management unit 115, the switching control unit 116 has a FAN40 (long life FAN40) having the longest predicted life and a FAN40 (short life FAN40) having the shortest predicted life among a plurality of FAN40s. It is confirmed whether the difference in the predicted lifespan of the above is equal to or more than a predetermined value (for example, one month). That is, the switching control unit 116 confirms whether or not the predicted life varies among the plurality of FAN 40s.

切替制御部116は、例えば、複数のFAN40間において予測寿命のばらつきが生じており(条件1)、且つ、本サーバシステム1においてDP(Dynamic Partitioning)機能が有効(条件2)である場合に、DP機能を用いて、短寿命FAN40の負荷を軽減させる制御を行なう。 The switching control unit 116 is, for example, when the predicted life varies among a plurality of FAN 40s (condition 1) and the DP (Dynamic Partitioning) function is effective in the server system 1 (condition 2). The DP function is used to control the load of the short-life FAN 40.

DPは、本サーバシステム1において、パーティションのシステム(サーバ装置3)を停止させることなくパーティション構成を動的に変更する機能である。DPにおいては、例えば、パーティションに対して、CPUやメモリ,IOユニット等のハードウェア資源を動的に追加,削除,交換(活性構成変更)することができる。なお、DPは既知の手法で実現することができ、その詳細な説明は省略する。 DP is a function of dynamically changing the partition configuration in the server system 1 without stopping the partition system (server device 3). In DP, for example, hardware resources such as CPU, memory, and IO unit can be dynamically added, deleted, and exchanged (active configuration change) for a partition. Note that DP can be realized by a known method, and detailed description thereof will be omitted.

本サーバシステム1において、DPにより追加・削除を行なう単位は、パーティション構成要素であるSB,LSB(Logical System Board),IOU(PCIeボックスを含む)である。
SBホットプラグ機能を利用することで、パーティション上で動作するOSの再起動なしに、SBをパーティションに組み込み・切り離しができる。
In this server system 1, the units to be added / deleted by DP are the partition components SB, LSB (Logical System Board), and IOU (including the PCIe box).
By using the SB hot plug function, SB can be incorporated / disconnected from the partition without restarting the OS running on the partition.

なお、このようなSBのパーティションへの組み込みや切り離しは、サーバシステム1において、事前にDP機能を有効にして一定の構成を構築済みであること、およびOSがDP機能をサポートしていること等が条件となる。 It should be noted that such embedding or disconnection of the SB into the partition means that the server system 1 has already built a certain configuration by enabling the DP function in advance, and that the OS supports the DP function. Is a condition.

図8は実施形態の一例としてのサーバシステム1における切替制御部116によるSB5の切り替え制御を説明するための図である。この図8においては、FAN40間において予測寿命のばらつきが生じていることが検知された場合における、この予測寿命のばらつきを解消するための5種類(パターン1〜5)の制御手法を例示する。 FIG. 8 is a diagram for explaining switching control of SB5 by the switching control unit 116 in the server system 1 as an example of the embodiment. FIG. 8 illustrates five types (patterns 1 to 5) of control methods for eliminating the variation in the predicted life when it is detected that the variation in the predicted life occurs between the FAN 40s.

図8に示す例において、元の状態(オリジナル)においては(符号A1参照)、SB#0,#1が稼働状態(ON状態)であり、SB#2,#3がスタンバイ状態(SBY状態)である。このオリジナルのサーバシステム1においては、ON状態のSB#0,#1に対して、FAN#0,#1が冷却風の送風を行なっている。また、稼働中の全てのFAN#0〜#3のFAN回転数は通常回転(Normal)である。 In the example shown in FIG. 8, in the original state (original) (see reference numeral A1), SB # 0 and # 1 are in the operating state (ON state), and SB # 2 and # 3 are in the standby state (SBY state). Is. In this original server system 1, FAN # 0 and # 1 blow cooling air to SB # 0 and # 1 in the ON state. Further, the FAN rotation speeds of all FAN # 0 to # 3 in operation are normal rotation speeds (Normal).

このような状態において、負荷が高いFAN#0,#2が高温状態となり、この高温状態がFAN40#0,#2の寿命に影響を与え短寿命化を招く。また、一部のFAN#0,#2だけが高温となることにより、本サーバシステム1に備えられた複数のFAN40間において予測寿命のばらつきが生じる。 In such a state, FAN # 0 and # 2 having a high load become a high temperature state, and this high temperature state affects the life of FAN 40 # 0 and # 2 and shortens the life. Further, since only some of the FANs # 0 and # 2 have high temperatures, the predicted life varies among the plurality of FANs 40 provided in the server system 1.

切替制御部116は、SB5の切り替え制御を行なうことで、これらのFAN40#0,#2の負荷を軽減する。これにより、特定のFAN40だけが高温となることを阻止し、本サーバシステム1に備えられた複数のFAN40間において予測寿命のばらつきを解消する。 The switching control unit 116 reduces the load on the FAN 40 # 0 and # 2 by performing the switching control of the SB5. As a result, it is possible to prevent only a specific FAN 40 from becoming hot, and to eliminate the variation in the predicted life among the plurality of FAN 40s provided in the server system 1.

切替制御部116は、FAN予測寿命管理部115による寿命予測の結果、複数のFAN40間において予測寿命が最も短い短寿命FAN40(予測短寿命冷却部品)と、予測寿命が最も長い長寿命FAN40(予測長寿命冷却部品)との間に、予測寿命が閾値以上(例えば、1か月以上)の差(ばらつき)が検出された場合に、SB5の構成変更を行なう構成変更制御部として機能する。 As a result of the life prediction by the FAN predicted life management unit 115, the switching control unit 116 has a short life FAN40 (predicted short life cooling component) having the shortest predicted life among a plurality of FAN40s and a long life FAN40 (predicted short life cooling component) having the longest predicted life. When a difference (variation) in which the predicted life is equal to or greater than a threshold value (for example, one month or more) is detected between the long-life cooling component), the SB 5 functions as a configuration change control unit for changing the configuration.

例えば、切替制御部116は、複数のFAN40間において予測寿命のばらつきが生じている場合に、本サーバシステム1がDPによる切り替えを実行可能であるかを確認する。 For example, the switching control unit 116 confirms whether the server system 1 can perform switching by DP when the predicted life varies among a plurality of FAN 40s.

本サーバシステム1がDPによる切り替えを実行可能である場合には、切替制御部116はこのDPの機能を用いたSB5の構成変更を行なう(符号A2参照)。 When the server system 1 is capable of switching by DP, the switching control unit 116 changes the configuration of SB5 using the function of this DP (see reference numeral A2).

そして、切替制御部116は本サーバシステム1において、DPを即時に実行可能であるかを確認する(符号A3参照)。 Then, the switching control unit 116 confirms whether the DP can be executed immediately in the server system 1 (see reference numeral A3).

例えば、切替制御部116は、メモリ12の所定の記憶領域に設定されている、本サーバシステム1においてDP機能を有効にするか否か等を示すフラグの設定値を確認することで、DPを即時実行可能であるかを判断する。 For example, the switching control unit 116 determines the DP by confirming the set value of the flag set in the predetermined storage area of the memory 12 indicating whether or not the DP function is enabled in the server system 1. Determine if it is immediately feasible.

確認の結果、本サーバシステム1において、DPによるSB5の切り替えを即時に実行可能である場合に、切替制御部116は、DPによるSB5の切替制御を行なう(パターン1)。 As a result of the confirmation, when the server system 1 can immediately switch the SB5 by the DP, the switching control unit 116 controls the switching of the SB5 by the DP (Pattern 1).

すなわち、切替制御部116は、DPのSB切替機能を用いて、SB#2,#3をON状態にする一方で、SB#0,#1をスタンバイ状態(SBY)にする。FAN#0,#2が冷却対象とするSB#0,#1をスタンバイ状態にすることで、これらのFAN#0,#2の負荷が低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。 That is, the switching control unit 116 uses the SB switching function of the DP to turn SB # 2 and # 3 into an ON state, while putting SB # 0 and # 1 into a standby state (SBY). By putting SB # 0 and # 1 to be cooled by FAN # 0 and # 2 into the standby state, the load of these FAN # 0 and # 2 is reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する熱影響が小さいSB5をDPによりON状態とするSB5として優先的に選択することが望ましい。これにより、短寿命FAN40にかかる温度負荷を効率的に分散させる。 When there are a plurality of SB5s in the standby state, it is desirable that the switching control unit 116 preferentially selects the SB5 having a small thermal effect on the short-life FAN 40 as the SB5 to be turned on by the DP. As a result, the temperature load applied to the short-life FAN 40 is efficiently dispersed.

図9は実施形態の一例としてのサーバシステム1における温度影響情報126を例示する図である。 FIG. 9 is a diagram illustrating temperature influence information 126 in the server system 1 as an example of the embodiment.

温度影響情報126は、FAN40に対するSB5の影響を数値として表す情報であり、個々のSB5の発熱が各FAN40に対して与える影響(温度影響)を表す。図9に示す例においては、SB5とFAN40との組み合わせのそれぞれに、係数Amnが設定されている(m,nはそれぞれ自然数)。係数Amnは各SB5がどのFAN40に対して熱を与えやすいかを示す値であり、熱を与えやすいほど大きな値が設定される。温度影響情報126は、事前に行なわれる試験結果等に基づいて具体的な各数値が設定されて作成され、予めメモリ12等に格納される。 The temperature influence information 126 is information expressing the influence of SB5 on FAN40 as a numerical value, and represents the influence (temperature influence) that the heat generation of each SB5 has on each FAN40. In the example shown in FIG. 9, a coefficient Amn is set for each combination of SB5 and FAN40 (m and n are natural numbers, respectively). The coefficient Amn is a value indicating which FAN 40 each SB5 is likely to give heat to, and a larger value is set as the heat is easily given. The temperature influence information 126 is created by setting specific numerical values based on the test results and the like performed in advance, and is stored in the memory 12 and the like in advance.

すなわち、温度影響情報126は、発熱しやすいユニットであるSB5が、どのFAN40に対して熱(熱影響)を与えやすいかを示す係数(Amn)を予め定義したものである。 That is, the temperature influence information 126 defines in advance a coefficient (Amn) indicating which FAN 40 the SB5, which is a unit that easily generates heat, is likely to give heat (heat influence).

なお、図9においてはn個(nは自然数)のFAN#0〜#n−1と、m個(mは自然数)のSB#0〜#m−1とについての温度影響情報126を示すものである。図1に例示するサーバシステム1の構成においては、4つのFAN40と4つのSB5が搭載されているのでn=m=4となる。 Note that FIG. 9 shows temperature effect information 126 for n FAN # 0 to # n-1 (n is a natural number) and SB # 0 to # m-1 for m (m is a natural number). Is. In the configuration of the server system 1 illustrated in FIG. 1, since four FAN 40s and four SB 5s are mounted, n = m = 4.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、この温度影響情報126を参照して、短寿命FAN40について係数Amnの値が最も小さいSB5をDPによりON状態とするSB5として選択する。すなわち、切替制御部116は、短寿命FAN40への熱影響が最も小さいSB5を選択する。これにより、短寿命FAN40にかかる温度負荷を効率的に分散させることができる。 When there are a plurality of SB5s in the standby state, the switching control unit 116 refers to the temperature effect information 126 and selects the SB5 having the smallest coefficient Amn value for the short-life FAN 40 as the SB5 for turning on the SB5 by DP. .. That is, the switching control unit 116 selects SB5, which has the smallest thermal effect on the short-life FAN 40. As a result, the temperature load applied to the short-life FAN 40 can be efficiently dispersed.

このように、パターン1においては、切替制御部116は、複数のSB5のうち、短寿命FAN40に対する熱影響が最も低いSB5を稼働させる構成変更を行なう。これにより、稼働させたSB5に対応するFAN40を作動させ、短寿命FAN40の負荷を軽減させるのである。 As described above, in the pattern 1, the switching control unit 116 changes the configuration to operate the SB5 having the lowest thermal influence on the short-life FAN 40 among the plurality of SB5s. As a result, the FAN40 corresponding to the operated SB5 is operated, and the load of the short-life FAN40 is reduced.

なお、切替制御部116は、スタンバイ状態のSB5が複数ある場合に、短寿命FAN40と物理的に近い位置にあるSB5をDPによりON状態とするSB5として優先して選択してもよい。 When there are a plurality of SB5s in the standby state, the switching control unit 116 may preferentially select the SB5s physically close to the short-life FAN40 as the SB5s to be turned on by the DP.

一方、確認の結果、本サーバシステム1において、DPによるSB5の切り替えを即時に実行可能でない場合に、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう(パターン2)。 On the other hand, as a result of the confirmation, when the switching of the SB 5 by the DP cannot be immediately executed in the server system 1, the switching control unit 116 additionally controls the SB 5 by the hot plug function of the DP (Pattern 2).

すなわち、切替制御部116は、DPのホットプラグ機能を用いて、スタンバイ状態であったSB#2,#3をON状態にすることで、これらのSB#2,#3を追加する。 That is, the switching control unit 116 adds these SB # 2 and # 3 by turning on the SB # 2 and # 3 that were in the standby state by using the hot plug function of the DP.

これにより、SB#0〜#3の全てがON状態になり、SB#0〜#3の間において負荷が分散される。従って、FAN#0,#2が冷却対象とするSB#0,#1の負荷が低減して発熱量が低下し、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。 As a result, all of SB # 0 to # 3 are turned on, and the load is distributed between SB # 0 to # 3. Therefore, the load of SB # 0 and # 1 to be cooled by FAN # 0 and # 2 is reduced, the calorific value is reduced, and the load of FAN # 0 and # 2 (high temperature load) is also reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

このように、パターン2においては、切替制御部116は、SB5を追加する構成変更を行ない、追加されたSB5に対応するFAN40を作動させることで、短寿命FAN40の負荷を軽減させるのである。 As described above, in the pattern 2, the switching control unit 116 makes a configuration change to add the SB5 and operates the FAN40 corresponding to the added SB5 to reduce the load of the short-life FAN40.

なお、スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40と物理的に遠い位置にあるSB5を優先してON状態にすることが望ましい。 When there are a plurality of SB5s in the standby state, it is desirable that the switching control unit 116 gives priority to the SB5s physically distant from the short-life FAN 40 and puts them in the ON state.

一方、本サーバシステム1がDPによる切り替えを実行不可である場合には、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なう。すなわち、リザーブドSB5をON状態にすることで、SB5の構成変更を行なう(符号A4参照)。 On the other hand, when the server system 1 cannot execute the switching by the DP, the switching control unit 116 performs the static switching of the SB5 using the reserved SB5. That is, by turning on the reserved SB5, the configuration of the SB5 is changed (see reference numeral A4).

切替制御部116は本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能であるかを確認する(符号A6参照)。例えば、切替制御部116は、メモリ12の所定の記憶領域に設定されている、本サーバシステム1においてリザーブドSB5を用いた静的なSB5の切り替えを有効にするか否か等を示すフラグの設定値を確認することで、当該切り替えを実行可能であるかを判断する。 The switching control unit 116 confirms whether the static SB5 switching using the reserved SB5 can be immediately executed in the server system 1 (see reference numeral A6). For example, the switching control unit 116 sets a flag set in a predetermined storage area of the memory 12 to indicate whether or not to enable static switching of the SB5 using the reserved SB5 in the server system 1. By checking the value, it is determined whether the switching can be performed.

確認の結果、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合に、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行なう(パターン3)。 As a result of the confirmation, when the static SB5 switching using the reserved SB5 can be immediately executed in the server system 1, the switching control unit 116 switches the SB5 using the reserved SB5 (Pattern 3). ).

すなわち、切替制御部116は、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。 That is, the switching control unit 116 puts the reserved SB # 2 in the ON state, while putting the SB # 0 in the standby state (SBY).

これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。 As a result, in addition to FAN # 0 and 2, FAN # 1 and # 3 whose cooling target is SB # 2 will also be blown, and all FAN # 0 to # 3 will be blown, and FAN # The load of 0 and # 2 (high temperature load) is also reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する影響が小さいリザーブドSB5をDPによりON状態とするSB5として優先的に選択することが望ましい。 When there are a plurality of SB5s in the standby state, it is desirable that the switching control unit 116 preferentially selects the reserved SB5 having a small influence on the short-life FAN 40 as the SB5 to be turned on by the DP.

一方、確認の結果、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に不可である場合には、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう(パターン4)。 On the other hand, as a result of the confirmation, if it is not possible to immediately switch the static SB5 using the reserved SB5 in the server system 1, the operation rate of the server system 1 is low at some times such as at night. In addition, the SB5 is switched using the reserved SB5 (Pattern 4).

すなわち、切替制御部116は、本サーバシステム1に稼働率が低い時間帯において、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。 That is, the switching control unit 116 puts the reserved SB # 2 in the ON state while putting the SB # 0 in the standby state (SBY) in the time zone when the operating rate of the server system 1 is low.

これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。 As a result, in addition to FAN # 0 and 2, FAN # 1 and # 3 whose cooling target is SB # 2 will also be blown, and all FAN # 0 to # 3 will be blown, and FAN # The load of 0 and # 2 (high temperature load) is also reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

また、リザーブドSB5を用いたSB5の切り替えが行なわれるまでの間は、稼働中のFAN#0〜#3のFAN回転数をそれぞれ上げる。これにより、本サーバシステム1の筐体1a内の温度が低下し、結果的にFAN#0,2の負荷が低減することになる。 Further, the FAN rotation speeds of FAN # 0 to # 3 in operation are increased until the SB5 is switched using the reserved SB5. As a result, the temperature inside the housing 1a of the server system 1 is lowered, and as a result, the load of FAN # 0 and 2 is reduced.

本サーバシステム1がDPによる切り替えと、リザーブドSB5を用いた静的なSB5の切り替えとのいずれも実行できない場合もある(符号A5参照)。 In some cases, the server system 1 cannot execute either the switching by DP or the static switching of SB5 using the reserved SB5 (see reference numeral A5).

このような場合においては、稼働中全てのFAN40のFAN回転数を上げてHighにする(パターン5)。これにより、本サーバシステム1の筐体1a内の温度が低下し、結果的にFAN#1,2の負荷(高温負荷)が低減することになる。 In such a case, the FAN rotation speed of all FAN 40s in operation is increased to High (Pattern 5). As a result, the temperature inside the housing 1a of the server system 1 is lowered, and as a result, the load (high temperature load) of FAN # 1 and 2 is reduced.

このように、切替制御部116は、複数のFAN40の回転速度を高くする制御を行なうことで、短寿命FAN40の負荷を軽減させるのである。 In this way, the switching control unit 116 reduces the load on the short-life FAN 40 by controlling the rotation speed of the plurality of FAN 40s to be increased.

また、切替制御部116は、FAN予測寿命管理部115によって算出された各FAN40の予測寿命に基づいて、本サーバシステム1内における複数のFAN40の最適配置を決定する機能(FAN最適配置決定機能)を有する。 Further, the switching control unit 116 has a function of determining the optimum arrangement of a plurality of FAN 40s in the server system 1 based on the predicted life of each FAN 40 calculated by the FAN predicted life management unit 115 (FAN optimum arrangement determination function). Have.

例えば、本サーバシステム1がn個のFAN40をスロット位置に搭載する場合に、その搭載のしかたは、n−1通り存在する。切替制御部116は、これらのn−1通りのFAN40とスロット位置との全ての組み合わせを列挙する。 For example, when the server system 1 mounts n FAN 40s at slot positions, there are n P n-1 ways of mounting them. The switching control unit 116 lists all the combinations of the FAN 40 and the slot positions in these n P n-1 ways.

図10は実施形態の一例としてのサーバシステム1におけるFAN40とスロット位置との組み合わせをテーブル状に例示する図である。 FIG. 10 is a diagram illustrating the combination of the FAN 40 and the slot position in the server system 1 as an example of the embodiment in a table shape.

この図10に示す例においては、4つのFAN40(FAN ID=A,B,C,D)を、識別子POSが“101”,“102”,“103”,“104”である4つのスロットに取り付ける全ての組み合わせ(=24通り)を示している。 In the example shown in FIG. 10, four FAN40s (FAN ID = A, B, C, D) are placed in four slots having identifiers POS of "101", "102", "103", and "104". All combinations to be installed ( 4 P 3 = 24 ways) are shown.

以下、FAN ID=Aで特定されるFAN40をFAN(A)と表す。同様に、FAN IDB,C,Dで特定されるFAN40を、それぞれFAN(B),FAN(C),FAN(D)と表す。 Hereinafter, the FAN 40 specified by FAN ID = A is referred to as FAN (A). Similarly, FAN40 specified by FAN IDB, C, and D is represented as FAN (B), FAN (C), and FAN (D), respectively.

また、FAN予測寿命管理部115によって算出されたFAN(A)の残寿命life_fan(A)=0.5とする。同様に、FAN(B)の残寿命life_fan(B)=0.7,FAN(C)の残寿命life_fan(C)=0.4,FAN(D)の残寿命life_fan(D)=0.3とする。 Further, it is assumed that the remaining life of FAN (A) life_fan (A) = 0.5 calculated by the FAN predicted life management unit 115. Similarly, the remaining life of FAN (B) is life_fan (B) = 0.7, the remaining life of FAN (C) is life_fan (C) = 0.4, and the remaining life of FAN (D) is life_fan (D) = 0.3.

さらに、識別子101のスロット位置が寿命に与える影響を表す数値life_static(101)=0.9とする。同様に、識別子102のスロット位置が寿命に与える影響を表す数値life_static(102)=0.9,識別子103のスロット位置が寿命に与える影響を表す数値life_static(103)=0.8,識別子104のスロット位置が寿命に与える影響を表す数値life_static(104)=0.7とする。 Furthermore, the numerical value life_static (101) = 0.9, which represents the influence of the slot position of the identifier 101 on the life, is set. Similarly, the numerical value life_static (102) = 0.9 indicating the effect of the slot position of the identifier 102 on the life, the numerical value life_static (103) = 0.8 indicating the effect of the slot position of the identifier 103 on the life, and the slot position of the identifier 104 is the life. The numerical value that represents the effect on life_static (104) = 0.7.

図10に示すテーブルには、各FAN40の組み合わせについて、スロット位置による影響を考慮した残寿命[life_fan(ID)-(1- life_static(POS))]が登録されている。 In the table shown in FIG. 10, the remaining life [life_fan (ID)-(1-life_static (POS))] in consideration of the influence of the slot position is registered for each combination of FAN 40s.

以下、スロット位置による影響を考慮した残寿命を更新済み残寿命といい、life(ID,POS)と表す場合がある。 Hereinafter, the remaining life considering the influence of the slot position is referred to as an updated remaining life, and may be expressed as life (ID, POS).

life(ID,POS) = life_fan(ID) - (1 - life_static(POS))
さらに、図10に例示するテーブルには、各組み合わせ毎に、当該組み合わせに含まれる各FAN40の更新済み残寿命life(ID,POS)を昇順に並べ換えた情報(更新済み残寿命の昇順)も、その右側に併記されている。
life (ID, POS) = life_fan (ID)-(1 --life_static (POS))
Further, in the table illustrated in FIG. 10, information (ascending order of updated remaining life) in which the updated remaining life life (ID, POS) of each FAN 40 included in the combination is sorted in ascending order is also included in the table. It is also written on the right side.

この昇順に並べ換えられた更新済み残寿命life(ID,POS)の組み合わせにおいて、その最小値を代表値とする。 In this combination of updated remaining life (ID, POS) sorted in ascending order, the minimum value is used as a representative value.

これにより、この図10に示すテーブルを参照することで、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせを容易に特定することができる。また、各組み合わせにおける代表値を参照することで、更新済み残寿命の最小値の比較を容易に行なうことができる。 Thereby, by referring to the table shown in FIG. 10, the combination of the FAN 40 having the largest minimum updated remaining life and the slot position can be easily specified. Further, by referring to the representative value in each combination, it is possible to easily compare the minimum value of the updated remaining life.

切替制御部116は、FAN40とスロット位置との全ての組み合わせの中から、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせを1組選択し、FAN40とスロット位置との最適な組み合わせ(FAN40の最適配置)として採用する。 The switching control unit 116 selects one set of the combination of the FAN 40 and the slot position, which has the largest minimum updated remaining life, from all the combinations of the FAN 40 and the slot position, and optimizes the FAN 40 and the slot position. Adopted as a combination (optimal arrangement of FAN40).

また、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせが複数ある場合には、更新済み残寿命の2番目に小さい値や3番目に小さい値を適宜順番に比較し、更新済み残寿命が最も大きい組み合わせを1組選択(採用)することが望ましい。 If there are multiple combinations of FAN40 with the maximum updated remaining life and the slot position, the second smallest value and the third smallest value of the updated remaining life are compared in order and updated. It is desirable to select (adopt) one set that has the longest remaining life.

例えば、図10に示す例においては、更新済み残寿命の最小値が最も大きい組み合わせは、更新済み残寿命の最小値が0.2である、No.6,12,17,18,20,22,24で特定される各組み合わせである。これらのうち、更新済み残寿命の最小値が2番目に小さい組み合わせは、更新済み残寿命の2番目に小さい値0.3である、No.17,18で特定される2つの組み合わせである(図10の符号P1参照)。 For example, in the example shown in FIG. 10, the combination having the largest minimum updated remaining life has a minimum updated remaining life of 0.2. It is each combination specified by 6,12,17,18,20,22,24. Among these, the combination in which the minimum value of the updated remaining life is the second smallest is No. 1, which is the second smallest value of the updated remaining life of 0.3. It is a combination of the two specified by 17 and 18 (see reference numeral P1 in FIG. 10).

これらの2つの組み合わせは、昇順に並べ換えた更新済み残寿命の組み合わせが同じであるので、切替制御部116は、これらのいずれの組み合わせを選択してもよい。 Since these two combinations have the same updated remaining life combination sorted in ascending order, the switching control unit 116 may select any of these combinations.

切替制御部116によって決定されたFAN40の最適配置は、FAN最適配置情報として管理端末装置2に作業指示情報とともに送信される。 The optimum arrangement of the FAN 40 determined by the switching control unit 116 is transmitted to the management terminal device 2 together with the work instruction information as the FAN optimum arrangement information.

作業指示情報は、保守作業員に対して提示される作業指示に関する情報であり、サーバシステム1におけるFAN40の配置を変更させる作業指示を含む。このFAN40の配置を変更させる作業指示は、FAN最適配置情報に示される配置(最適配置)従って、保守作業員に、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更させる。 The work instruction information is information related to the work instruction presented to the maintenance worker, and includes a work instruction for changing the arrangement of the FAN 40 in the server system 1. The work instruction for changing the arrangement of the FAN 40 causes the maintenance worker to change the position of the FAN 40 attached to the slot of the server system 1 according to the arrangement (optimal arrangement) shown in the FAN optimum arrangement information.

[管理端末装置2]
管理端末装置2は、CE等の保守作業員やシステム管理者が使用する情報処理装置であり、CPU21の他、図示しないメモリ,ディスプレイ,キーボードやマウス等の入力装置を備える。
[Management terminal device 2]
The management terminal device 2 is an information processing device used by maintenance workers such as CEs and system administrators, and includes an input device such as a memory, a display, a keyboard, and a mouse (not shown) in addition to the CPU 21.

CPU21は、メモリ等の記憶装置に格納されたOSや管理端末用プログラムを実行することで、FAN最適配置情報抽出部22および結果表示制御部23としての機能を実現する。 The CPU 21 realizes the functions as the FAN optimum arrangement information extraction unit 22 and the result display control unit 23 by executing the OS and the management terminal program stored in the storage device such as the memory.

FAN最適配置情報抽出部22は、サーバ装置3から作業指示情報とともに送信されたFAN最適配置情報を抽出する。 The FAN optimum placement information extraction unit 22 extracts the FAN optimum placement information transmitted from the server device 3 together with the work instruction information.

結果表示制御部23は、FAN最適配置情報抽出部22によって抽出されたFAN最適配置情報を、図示しないディスプレイに表示させたり、プリンタを介して印刷させることで出力させる。 The result display control unit 23 outputs the FAN optimum arrangement information extracted by the FAN optimum arrangement information extraction unit 22 by displaying it on a display (not shown) or printing it via a printer.

保守作業員は、このようにして出力されたFAN最適配置情報に従って、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更させる。 The maintenance worker changes the position of the FAN 40 installed in the slot of the server system 1 according to the FAN optimum arrangement information output in this way.

(B)動作
上述の如く構成された実施形態の一例としてのサーバシステム1におけるFAN40の最適配置制御方法の概要を、図11に示すフローチャート(ステップB1〜B9)に従って説明する。
(B) Operation An outline of the optimum arrangement control method of the FAN 40 in the server system 1 as an example of the embodiment configured as described above will be described with reference to the flowcharts (steps B1 to B9) shown in FIG.

本サーバシステム1に電源投入が行なわれると(装置パワーオン)、ステップB1において、各FAN40が回転を開始する。 When the power of the server system 1 is turned on (device power on), each FAN 40 starts rotating in step B1.

ステップB2において、MMB10が各種監視を開始する。具体的には、構成情報管理部111,温度情報管理部112およびFAN回転数管理部113が、本サーバシステム1に備えられた各SB5の構成や、各FAN40の温度,各FAN40の回転数の監視をそれぞれ行なう。 In step B2, the MMB 10 starts various monitoring. Specifically, the configuration information management unit 111, the temperature information management unit 112, and the FAN rotation speed management unit 113 determine the configuration of each SB5 provided in the server system 1, the temperature of each FAN40, and the rotation speed of each FAN40. Monitor each.

ステップB3において、FAN予測寿命管理部115が、各FAN40の予測寿命を演算する。ステップB4において、切替制御部116が、DPを用いたSB5の構成変更やリザーブドSB5を用いたSB5の切り替え、FAN回転数等を行なう。なお、これらのステップB3,B4の処理は、本サーバシステム1において日常的に行なわれる(デイリー監視)。 In step B3, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step B4, the switching control unit 116 changes the configuration of the SB5 using the DP, switches the SB5 using the reserved SB5, performs the FAN rotation speed, and the like. The processes of steps B3 and B4 are routinely performed in the server system 1 (daily monitoring).

また、本サーバシステム1の定期点検時において、以下のステップB5,B6の処理が行なわれる。 Further, at the time of periodic inspection of the server system 1, the following processes B5 and B6 are performed.

すなわち、ステップB5において、FAN予測寿命管理部115が各FAN40の予測寿命を演算する。ステップB6において、切替制御部116が、FAN40の最適配置を決定し、管理端末装置2を介して保守作業員等にFAN最適配置情報と作業指示情報とを通知する。保守作業員は、通知されたFAN最適配置情報に応じて、FAN40の配置交換等の作業を行なう。作業終了後には、必要に応じて装置パワーオンが行なわれ、本フローチャートの先頭からの処理が再度行なわれてもよい。 That is, in step B5, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step B6, the switching control unit 116 determines the optimum arrangement of the FAN 40, and notifies the maintenance worker or the like of the FAN optimum arrangement information and the work instruction information via the management terminal device 2. The maintenance worker performs work such as replacement of the FAN 40 according to the notified FAN optimum placement information. After the work is completed, the device may be powered on as necessary, and the process from the beginning of this flowchart may be performed again.

上記のステップB1〜B6の処理は、本サーバシステム1の保守対応期間において行なわれるものであり、本サーバシステム1が稼働を開始してから例えば5年が経過するまでの期間に行なわれる。 The above steps B1 to B6 are performed during the maintenance response period of the server system 1, and are performed during the period from the start of operation of the server system 1 to, for example, 5 years.

本サーバシステム1が稼働を開始してから例えば5年が経過した後は、保守対応期間が終了する。 For example, after 5 years have passed since the server system 1 started operation, the maintenance support period ends.

ステップB7において、本サーバシステム1のオーバーホールの実施の有無を確認する。確認の結果、オーバーホールを行なう場合には(ステップB7の“有”ルート参照)、オーバーホールを行なった後、装置パワーオンが行なわれ、本フローチャートの先頭からの処理が再度行なわれる。 In step B7, it is confirmed whether or not the server system 1 has been overhauled. As a result of the confirmation, when the overhaul is performed (see the “Yes” route in step B7), the device is powered on after the overhaul, and the process from the beginning of this flowchart is performed again.

ステップB7における確認の結果、オーバーホールを行なわない場合には(ステップB7の“無”ルート参照)、ステップB8に移行する。 As a result of the confirmation in step B7, if the overhaul is not performed (see the “no” route in step B7), the process proceeds to step B8.

ステップB8において、FAN予測寿命管理部115が、各FAN40の予測寿命を演算する。ステップB9において、切替制御部116が、DPを用いたSB5の構成変更やリザーブドSB5を用いたSB5の切り替え、FAN回転数等を行なう。なお、これらのステップB8,B9の処理も、本サーバシステム1において日常的に行なわれる(デイリー監視)。また、ステップB7〜B9の処理は、本サーバシステム1が稼働を開始してから例えば5年が経過した後に行なわれる。 In step B8, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step B9, the switching control unit 116 changes the configuration of the SB5 using the DP, switches the SB5 using the reserved SB5, performs the FAN rotation speed, and the like. The processes of steps B8 and B9 are also routinely performed in the server system 1 (daily monitoring). Further, the processes of steps B7 to B9 are performed, for example, after 5 years have passed since the server system 1 started operation.

その後、本サーバシステム1の稼働処理を終了する。 After that, the operation processing of the server system 1 is terminated.

次に、実施形態の一例としてのサーバシステム1におけるFAN40の最適配置管理を実現するための各機能構成部の処理を、図12に示すシーケンス図に従って説明する。 Next, the processing of each functional configuration unit for realizing the optimum arrangement management of the FAN 40 in the server system 1 as an example of the embodiment will be described with reference to the sequence diagram shown in FIG.

先ず、管理端末装置2において、保守プログラムの実行が開始される(符号C1参照)。 First, the management terminal device 2 starts executing the maintenance program (see reference numeral C1).

サーバ装置3の各SB5のBMC50が、自身が動作するSB5の構成を監視し、MMB10のメモリ12の構成情報121に記録する(符号C2参照)。 The BMC 50 of each SB 5 of the server device 3 monitors the configuration of the SB 5 in which it operates and records it in the configuration information 121 of the memory 12 of the MMB 10 (see reference numeral C2).

また、各SB5のBMC50が、自身が動作するSB5に対応するFAN40の温度を監視し、MMB10のメモリ12の温度情報122に記録する(符号C3参照)。さらに、BMC50が、自身が動作するSB5に対応するFAN40の回転数の監視を行ない、検出した各FAN40の回転数をFAN回転数情報123に記録する(符号C4参照)。 Further, the BMC 50 of each SB 5 monitors the temperature of the FAN 40 corresponding to the SB 5 in which the SB 5 operates, and records the temperature in the temperature information 122 of the memory 12 of the MMB 10 (see reference numeral C3). Further, the BMC 50 monitors the rotation speed of the FAN 40 corresponding to the SB 5 in which it operates, and records the detected rotation speed of each FAN 40 in the FAN rotation speed information 123 (see reference numeral C4).

MMB10において、構成情報管理部111が構成情報121からSB5の構成情報を取得する(符号C5参照)。 In the MMB 10, the configuration information management unit 111 acquires the configuration information of the SB 5 from the configuration information 121 (see reference numeral C5).

MMB10において、温度情報管理部112が温度情報122からFAN40の温度情報を取得する(符号C6参照)。 In the MMB 10, the temperature information management unit 112 acquires the temperature information of the FAN 40 from the temperature information 122 (see reference numeral C6).

MMB10において、FAN回転数管理部113がFAN回転数情報123からFAN40の回転数の履歴を取得する(符号C7参照)。 In the MMB 10, the FAN rotation speed management unit 113 acquires the history of the rotation speed of the FAN 40 from the FAN rotation speed information 123 (see reference numeral C7).

FRU4においては、FANの配置をFAN配置履歴情報124に記録する(符号C8参照)。 In FRU4, the arrangement of the FAN is recorded in the FAN arrangement history information 124 (see reference numeral C8).

MMB10において、FAN予測寿命管理部115が、各FAN40の寿命予測を行なう(符号C9参照)。FAN予測寿命管理部115は算出した各FAN40の予測寿命を予測寿命履歴情報125に記録する。 In the MMB 10, the FAN predicted life management unit 115 predicts the life of each FAN 40 (see reference numeral C9). The FAN predicted life management unit 115 records the calculated predicted life of each FAN 40 in the predicted life history information 125.

MMB10において、切替制御部116が、DPを用いたSB5の構成変更(DP切替え)やリザーブドSB5を用いたSB5の切り替え(SB切替え)、FAN回転数等を行なう(符号C10参照)。 In the MMB10, the switching control unit 116 changes the configuration of the SB5 using the DP (DP switching), switches the SB5 using the reserved SB5 (SB switching), performs the FAN rotation speed, and the like (see reference numeral C10).

また、切替制御部116は、FAN40の最適配置を決定する(符号C11参照)。決定されたFAN最適配置情報は、管理端末装置2のFAN最適配置情報抽出部22に通知され、FAN最適配置情報抽出部22はFAN最適配置情報を取得する(符号C12参照)。 Further, the switching control unit 116 determines the optimum arrangement of the FAN 40 (see reference numeral C11). The determined FAN optimum placement information is notified to the FAN optimum placement information extraction unit 22 of the management terminal device 2, and the FAN optimum placement information extraction unit 22 acquires the FAN optimum placement information (see reference numeral C12).

保守作業員は、管理端末装置2において、FAN最適配置情報を取得する。そして、このFAN最適配置情報に示される配置(最適配置)に従って、本サーバシステム1のスロットに取り付けられたFAN40の位置を変更する作業を行なう(符号C13参照)。 The maintenance worker acquires the FAN optimum arrangement information in the management terminal device 2. Then, according to the arrangement (optimal arrangement) shown in the FAN optimum arrangement information, the work of changing the position of the FAN 40 attached to the slot of the server system 1 is performed (see reference numeral C13).

次に、実施形態の一例としてのサーバシステム1におけるFAN最適配置を行なうための制御を、図13および図14に示すフローチャート(ステップD1〜D21)に従って説明する。図13はFAN最適配置を実現するための監視処理を示し(ステップD1〜D13)、図14はFAN最適配置にかかる保守作業の処理を示す(ステップD14〜D21)。 Next, the control for performing the FAN optimum arrangement in the server system 1 as an example of the embodiment will be described with reference to the flowcharts (steps D1 to D21) shown in FIGS. 13 and 14. FIG. 13 shows the monitoring process for realizing the FAN optimum arrangement (steps D1 to D13), and FIG. 14 shows the maintenance work process related to the FAN optimum arrangement (steps D14 to D21).

図13のステップD1において、FAN予測寿命管理部115は、各FAN40の予測寿命を算出する。 In step D1 of FIG. 13, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40.

図13のステップD2において、切替制御部116は、定期保守作業の実施であるかを確認する。確認の結果、定期保守作業の実施でない場合には(ステップD2のNOルート参照)、図13のステップD3に移行する。 In step D2 of FIG. 13, the switching control unit 116 confirms whether the periodic maintenance work is being carried out. As a result of the confirmation, if the periodic maintenance work is not performed (see the NO route in step D2), the process proceeds to step D3 in FIG.

ステップD3おいて、切替制御部116は、本サーバシステム1において、DPによるSB5の切り替えを実行可能であるかを確認する。 In step D3, the switching control unit 116 confirms whether the SB5 can be switched by the DP in the server system 1.

確認の結果、DPによるSB5の切り替えが可能である場合には(ステップD3のYESルート参照)、図13のステップD9に移行する。ステップD9において、切替制御部116は、DP機能によるSB5の切り替えを行なうための調整を開始する。図13のステップD10において、切替制御部116は、本サーバシステム1において、DPを即時に実行可能であるかを確認する。 As a result of the confirmation, if the SB5 can be switched by the DP (see the YES route in step D3), the process proceeds to step D9 in FIG. In step D9, the switching control unit 116 starts the adjustment for switching the SB5 by the DP function. In step D10 of FIG. 13, the switching control unit 116 confirms whether the DP can be executed immediately in the server system 1.

確認の結果、DPを即時実行可能である場合には(ステップD10のYESルート参照)、 図13のステップD11において、DP機能によるSB5の切替制御を行なう。その後、ステップD1に戻る。 As a result of the confirmation, if the DP can be executed immediately (see the YES route in step D10), in step D11 of FIG. 13, the SB5 switching control is performed by the DP function. Then, the process returns to step D1.

また、ステップD10における確認の結果、DPを即時実行可能でない場合には(ステップD10のNOルート参照)、図13のステップD12に移行する。ステップD12において、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう。これにより、SB#0〜#3の間において負荷が分散され、ステップD1において算出された短寿命FAN30の回転数を低下させ、その負荷を軽減させることができる。その後、処理はステップD1に戻る。 If, as a result of the confirmation in step D10, the DP cannot be executed immediately (see the NO route in step D10), the process proceeds to step D12 in FIG. In step D12, the switching control unit 116 additionally controls the SB5 by the hot plug function of the DP. As a result, the load is distributed between SB # 0 to # 3, and the rotation speed of the short-life FAN 30 calculated in step D1 can be reduced to reduce the load. After that, the process returns to step D1.

ステップD3における確認の結果、DPによるSB5の切り替えが可能でない場合には(ステップD3のNOルート参照)、図13のステップD4に移行する。ステップD4においては、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なうことが可能であるかを確認する。確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを行なうことができる場合には(ステップD4のYESルート参照)、図13のステップD5に移行する。 As a result of the confirmation in step D3, if the SB5 cannot be switched by DP (see the NO route in step D3), the process proceeds to step D4 in FIG. In step D4, the switching control unit 116 confirms whether it is possible to perform static switching of the SB5 using the reserved SB5. As a result of the confirmation, if the static SB5 can be switched using the reserved SB5 (see the YES route in step D4), the process proceeds to step D5 in FIG.

ステップD5においては、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なうための調整を開始する。図13のステップD6において、切替制御部116は、本サーバシステム1において、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能であるかを確認する。 In step D5, the switching control unit 116 starts the adjustment for static SB5 switching using the reserved SB5. In step D6 of FIG. 13, the switching control unit 116 confirms whether the static SB5 switching using the reserved SB5 can be immediately executed in the server system 1.

確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合には(ステップD6のYESルート参照)、図13のステップD13に移行する。 As a result of the confirmation, if the static SB5 switching using the reserved SB5 can be immediately executed (see the YES route in step D6), the process proceeds to step D13 in FIG.

ステップD13において、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行ない、その後、ステップD1に戻る。 In step D13, the switching control unit 116 switches the SB5 using the reserved SB5, and then returns to the step D1.

一方、ステップD6における確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能でない場合には(ステップD6のNOルート参照)、図13のステップD7に移行する。 On the other hand, as a result of the confirmation in step D6, if the static switching of SB5 using the reserved SB5 cannot be immediately executed (see the NO route in step D6), the process proceeds to step D7 in FIG.

ステップD7において、切替制御部116は、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう。その後、ステップD1に戻る。 In step D7, the switching control unit 116 switches the SB5 using the reserved SB5 during a part of the time zone when the operating rate of the server system 1 is low, such as at night. Then, the process returns to step D1.

ステップD4における確認の結果、リザーブドSB5を用いた静的なSB5の切り替えを行なうことができない場合には(ステップD4のNOルート参照)、図13のステップD8に移行する。 As a result of the confirmation in step D4, if the static SB5 switching using the reserved SB5 cannot be performed (see the NO route in step D4), the process proceeds to step D8 in FIG.

ステップD8において、切替制御部116は、稼働中の全てのFAN40のFAN回転数をHighに上げるよう調整(FAN回転数調整)を行なう。その後、ステップD1に戻る。 In step D8, the switching control unit 116 adjusts (FAN rotation speed adjustment) so as to raise the FAN rotation speed of all the FAN 40s in operation to High. Then, the process returns to step D1.

また、ステップD2における確認の結果、定期保守の実施である場合には(ステップD2のYESルート参照)、図14のステップD14に移行する。 Further, as a result of the confirmation in step D2, if periodic maintenance is performed (see the YES route in step D2), the process proceeds to step D14 in FIG.

ステップD14においては、例えばCEが、本サーバシステム1に対する保守作業を開始する。 In step D14, for example, CE starts maintenance work for the server system 1.

図14のステップD15において、CEは管理端末装置2を用いて保守プログラムを実行させる。 In step D15 of FIG. 14, CE uses the management terminal device 2 to execute the maintenance program.

図14のステップD16において、FAN予測寿命管理部115は、各FAN40の予測寿命の算出を行なう。図14のステップD17において、切替制御部116は、FAN40の予防交換が必要であるかを確認する。 In step D16 of FIG. 14, the FAN predicted life management unit 115 calculates the predicted life of each FAN 40. In step D17 of FIG. 14, the switching control unit 116 confirms whether preventive replacement of the FAN 40 is necessary.

ステップD17における確認の結果、FAN40の予防交換が必要であると判断された場合には(ステップD17におけるYESルート参照)、図14のステップD20において、CEによるFAN40の交換(予防交換)が行なわれる。その後、図14のステップD21において、CEによる保守作業が完了される。CEは、例えば、管理端末装置2において、保守作業が完了した旨の入力操作を行なう。 If, as a result of the confirmation in step D17, it is determined that preventive replacement of FAN40 is necessary (see YES route in step D17), replacement of FAN40 by CE (preventive replacement) is performed in step D20 of FIG. .. After that, in step D21 of FIG. 14, the maintenance work by CE is completed. For example, the CE performs an input operation indicating that the maintenance work has been completed in the management terminal device 2.

また、ステップD17における確認の結果、FAN40の予防交換が不要であると判断された場合には(ステップD17のNOルート参照)、図14のステップD18に移行する。 If, as a result of the confirmation in step D17, it is determined that preventive replacement of the FAN 40 is unnecessary (see the NO route in step D17), the process proceeds to step D18 in FIG.

ステップD18において、CEは、FAN40の配置換えが必要であるかを確認する。例えば、CEは、管理端末装置2において示されたFAN最適配置情報が、現状のサーバシステム1におけるFAN40の状態と同じである場合には、FAN40の配置換えは不要であると判断する。 In step D18, the CE confirms whether the FAN 40 needs to be rearranged. For example, the CE determines that the rearrangement of the FAN 40 is not necessary when the FAN optimum placement information shown in the management terminal device 2 is the same as the state of the FAN 40 in the current server system 1.

確認の結果、FAN40の配置換えが必要であると判断された場合には(ステップD18のYESルート参照)、図14のステップD19に移行する。 If, as a result of the confirmation, it is determined that the FAN 40 needs to be rearranged (see the YES route in step D18), the process proceeds to step D19 in FIG.

ステップD19においては、CEがFAN最適配置情報に合わせて、サーバシステム1におけるFAN40の配置換えを実施する。その後、ステップD21に移行する。 In step D19, the CE rearranges the FAN 40 in the server system 1 according to the FAN optimum placement information. After that, the process proceeds to step D21.

次に、実施形態の一例としてのサーバシステム1のMMB10の処理を、図15に示すフローチャート(ステップE1〜E16)に従って説明する。 Next, the processing of the MMB 10 of the server system 1 as an example of the embodiment will be described according to the flowchart (steps E1 to E16) shown in FIG.

ステップE1において、FAN予測寿命管理部115は、変数“life_fan(ID)”および変数“life_static(POS)”にそれぞれ1を設定することで初期化する(life_fan(ID) = 1,life_static(POS) = 1)。 In step E1, the FAN predicted life management unit 115 is initialized by setting 1 for each of the variable “life_fan (ID)” and the variable “life_static (POS)” (life_fan (ID) = 1, life_static (POS)). = 1).

なお、life_fan(ID)の初期化は全てのFAN40について行なう。また、life_static(POS)の初期化は全てのスロット位置について行なう。 The life_fan (ID) is initialized for all FAN40s. Also, life_static (POS) is initialized for all slot positions.

ステップE2において、温度情報管理部112は、各FAN40の温度をポーリングにより取得(サンプリング)する。また、変数“count”に0を設定することで初期化する。 In step E2, the temperature information management unit 112 acquires (samples) the temperature of each FAN 40 by polling. Also, it is initialized by setting the variable "count" to 0.

ステップE3において、構成情報管理部111は、各FAN40のFAN ID(ID)を確認し、構成情報121に登録されていない新たなFAN40が本サーバシステム1に取り付けられている(新設されている)かを確認する。 In step E3, the configuration information management unit 111 confirms the FAN ID (ID) of each FAN 40, and a new FAN 40 not registered in the configuration information 121 is attached to the server system 1 (newly installed). Check if.

新しいFAN40が取り付けられている場合には(ステップE3のYESルート参照)、ステップE4に移行する。ステップE4においては、この新設されたFAN40についてlife_fan(ID)=1とすることで初期化を行なう。 If a new FAN40 is installed (see YES route in step E3), the process proceeds to step E4. In step E4, the newly established FAN 40 is initialized by setting life_fan (ID) = 1.

その後、ステップE5において、温度情報管理部112は、各FAN40の温度を温度情報12に記録する。また、温度情報12は、一定時間Sだけ待機した後にcountに1を加算(インクリメント)する。 After that, in step E5, the temperature information management unit 112 records the temperature of each FAN 40 in the temperature information 12. Further, in the temperature information 12, 1 is added (incremented) to the count after waiting for S for a certain period of time.

その後、ステップE6において、温度情報管理部112は、countの値がN未満であるかを確認する。ここで、Nは、任意の正の整数であり、例えば、サンプリング数として経験上、充分であるとみなされる数が設定されることが望ましい。確認の結果、countの値がN未満である場合(count < N;ステップE6のYESルート参照)、ステップE5に戻る。 After that, in step E6, the temperature information management unit 112 confirms whether the value of count is less than N. Here, N is an arbitrary positive integer, and it is desirable that, for example, a number that is empirically considered to be sufficient as the number of samplings is set. As a result of the confirmation, if the value of count is less than N (count <N; refer to the YES route in step E6), the process returns to step E5.

一方、count が N以上である場合には(ステップE6のNOルート参照)、ステップE7に移行する。 On the other hand, if count is N or more (see the NO route in step E6), the process proceeds to step E7.

ステップE7においては、FAN予測寿命管理部115が、サンプリングしたFAN40の温度に基づき、FAN40の予測寿命を算出する。すなわち、FAN予測寿命管理部115は、上記の式(1)〜(3)を用いて、FAN40の予測寿命を算出する。FAN予測寿命管理部115は、各FAN40の温度を寿命に変換するのである。 In step E7, the FAN predicted life management unit 115 calculates the predicted life of the FAN 40 based on the sampled temperature of the FAN 40. That is, the FAN predicted life management unit 115 calculates the predicted life of the FAN 40 using the above equations (1) to (3). The FAN predicted life management unit 115 converts the temperature of each FAN 40 into a life.

なお、FAN40の温度に基づいてFAN40の予測寿命を算出する手法は、図16に示すフローチャートを用いて後述する。 A method for calculating the predicted life of the FAN 40 based on the temperature of the FAN 40 will be described later using the flowchart shown in FIG.

また、FAN予測寿命管理部115は、各FAN40について、それぞれのサンプリングデータ毎に消費寿命laを算出し、それぞれのサンプリングデータ毎に、life_fan(ID), life_static(SLOT)から消費寿命laを減算する。 Further, the FAN predicted life management unit 115 calculates the consumption life la for each sampling data of each FAN 40, and subtracts the consumption life la from life_fan (ID) and life_static (SLOT) for each sampling data. ..

ステップE8において、切替制御部116は、本サーバシステム1が保守作業モードであるか否かを確認する。すなわち、MMB10ファームウェアで定期保守の指示がされているかを確認する。 In step E8, the switching control unit 116 confirms whether or not the server system 1 is in the maintenance work mode. That is, it is confirmed whether the MMB10 firmware gives an instruction for periodic maintenance.

確認の結果、保守作業である場合(ステップE8のYESルート)、ステップE14に移行する。ステップE14において、切替制御部116は、FAN予測寿命管理部115によって算出された各FAN40の予測寿命に基づいて、本サーバシステム1内における複数のFAN40の最適配置を決定する。
なお、このFAN40の最適配置の決定方法の詳細は、図17に示すフローチャートを用いて後述する。
As a result of the confirmation, if the maintenance work is performed (YES route in step E8), the process proceeds to step E14. In step E14, the switching control unit 116 determines the optimum arrangement of a plurality of FAN 40s in the server system 1 based on the predicted life of each FAN 40 calculated by the FAN predicted life management unit 115.
The details of the method for determining the optimum arrangement of the FAN 40 will be described later using the flowchart shown in FIG.

切替制御部116は、決定したFAN40の最適配置を管理端末装置2に通知する。管理端末装置2においては、結果表示制御部23が、ディスプレイにFAN40の最適配置を表示させる。 The switching control unit 116 notifies the management terminal device 2 of the determined optimum arrangement of the FAN 40. In the management terminal device 2, the result display control unit 23 causes the display to display the optimum arrangement of the FAN 40.

ステップE15において、FAN予測寿命管理部115は、変数“life_static(POS)”に1を設定することで初期化する(life_static(POS) = 1)。その後、ステップE2に戻る。 In step E15, the FAN predicted life management unit 115 is initialized by setting the variable “life_static (POS)” to 1 (life_static (POS) = 1). Then, the process returns to step E2.

ステップE8における確認の結果、本サーバシステム1が保守作業モードでない場合には(ステップE8のNOルート参照)、ステップE9に移行する。 As a result of the confirmation in step E8, if the server system 1 is not in the maintenance work mode (see the NO route in step E8), the process proceeds to step E9.

ステップE9においては、切替制御部116は、予測寿命が最も長いFAN40(長寿命FAN40)と予測寿命が最も短いFAN40(短寿命FAN40)との予測寿命の差が所定値(例えば、1か月)以上であるかを確認する。 In step E9, in the switching control unit 116, the difference in the predicted life between the FAN40 (long-life FAN40) having the longest predicted life and the FAN40 (short-life FAN40) having the shortest predicted life is a predetermined value (for example, 1 month). Check if it is the above.

確認の結果、長寿命FAN40の予測寿命と短寿命FAN40の予測寿命との差が1ヶ月未満である場合には(ステップE9のNOルート参照)、ステップE2に戻る。 As a result of the confirmation, if the difference between the predicted life of the long-life FAN40 and the predicted life of the short-life FAN40 is less than one month (see the NO route in step E9), the process returns to step E2.

一方、長寿命FAN40の予測寿命と短寿命FAN40の予測寿命との差が1ヶ月以上である場合には(ステップE9のYESルート参照)、ステップE10において、切替制御部116は、次に、DP機能が使用可能であるか否かを確認する。 On the other hand, when the difference between the predicted life of the long-life FAN40 and the predicted life of the short-life FAN40 is one month or more (see the YES route in step E9), in step E10, the switching control unit 116 is then subjected to DP. Check if the function is available.

確認の結果、DP機能が使用可能である場合には(ステップE10のYESルート参照)、ステップE16に移行する。ステップE16において、切替制御部116は、SB5の切り替えを行なう。なお、このSB5の切替処理におけるSB5の選択方法の詳細は、図18に示すフローチャートを用いて後述する。その後、処理はステップE2に戻る。 As a result of the confirmation, if the DP function is available (see the YES route in step E10), the process proceeds to step E16. In step E16, the switching control unit 116 switches SB5. The details of the SB5 selection method in the SB5 switching process will be described later using the flowchart shown in FIG. After that, the process returns to step E2.

ステップE10における確認の結果、DP機能が使用可能でない場合には(ステップE10のNOルート参照)、ステップE11に移行する。 As a result of the confirmation in step E10, if the DP function is not available (see the NO route in step E10), the process proceeds to step E11.

ステップE11においては、本サーバシステム1においてリザーブドSB5が使用可能であるかを確認する。 In step E11, it is confirmed whether the reserved SB5 can be used in the server system 1.

リザーブドSB5が使用可能でない場合には(ステップE11のNOルート参照)、ステップE2に戻る。 If Reserved SB5 is not available (see NO route in step E11), the process returns to step E2.

また、リザーブドSB5が使用可能である場合には(ステップE11のYESルート参照)、ステップE12に移行する。 If the reserved SB5 can be used (see the YES route in step E11), the process proceeds to step E12.

ステップE12においては、本サーバシステム1がパワーオフ(POFF)しているかを確認する。確認の結果、本サーバシステム1がパワーオフしている場合には(ステップE12のYESルート参照)、ステップE16に移行する。 In step E12, it is confirmed whether the server system 1 is powered off (POFF). As a result of the confirmation, if the server system 1 is powered off (see the YES route in step E12), the process proceeds to step E16.

また、ステップE12における確認の結果、本サーバシステム1がパワーオフしていない場合には(ステップE12のNOルート参照)、ステップE13に移行する。 If, as a result of the confirmation in step E12, the server system 1 is not powered off (see the NO route in step E12), the process proceeds to step E13.

ステップE13においては、切替制御部116は、本サーバシステム1内の各FAN40の回転数を上げる。その後、ステップE2に戻る。 In step E13, the switching control unit 116 increases the rotation speed of each FAN 40 in the server system 1. Then, the process returns to step E2.

次に、実施形態の一例としてのサーバシステム1におけるFAN予測寿命管理部115によるFAN40の予測寿命を算出方法を、図16に示すフローチャート(ステップF1〜F4)に従って説明する。以下の処理は、各FAN40のそれぞれに対して行なわれる。 Next, a method of calculating the predicted life of the FAN 40 by the FAN predicted life management unit 115 in the server system 1 as an example of the embodiment will be described with reference to the flowchart (steps F1 to F4) shown in FIG. The following processing is performed for each of the FAN 40s.

ステップF1において、FAN予測寿命管理部115は、FAN40に関して、2通りの温度T1,T2のそれぞれでの寿命を、カタログ値や実験値に基づいて取得する。これらの値は、予めメモリ12に格納してもよく、また、CE等が入力してもよい。 In step F1, the FAN predicted life management unit 115 acquires the life at each of the two temperatures T1 and T2 with respect to the FAN 40 based on the catalog value and the experimental value. These values may be stored in the memory 12 in advance, or may be input by CE or the like.

FAN予測寿命管理部115は、上記式(1),(2)に基づいて2つの式(連立方程式)を立て(ステップF2)、定数A,Bについて解く(ステップF3)。 The FAN predicted life management unit 115 formulates two equations (simultaneous equations) based on the above equations (1) and (2) (step F2), and solves the constants A and B (step F3).

ステップF4において、FAN予測寿命管理部115は、上記式(3)に基づき、消費寿命lを算出し、処理を終了する。 In step F4, the FAN predicted life management unit 115 calculates the consumption life l based on the above equation (3), and ends the process.

次に、実施形態の一例としてのサーバシステム1における切替制御部116によるFAN40の最適配置の決定方法を図17に示すフローチャート(ステップG1〜G5)に従って説明する。 Next, a method of determining the optimum arrangement of the FAN 40 by the switching control unit 116 in the server system 1 as an example of the embodiment will be described with reference to the flowchart (steps G1 to G5) shown in FIG.

ステップG1において、切替制御部116は、本サーバシステム1がn個のFAN40を搭載する場合に、切替制御部116は、これらのFAN40とスロット位置との全ての組み合わせ(n−1通り)を列挙する。 In step G1, when the server system 1 is equipped with n FAN 40s, the switching control unit 116 has all combinations of these FAN 40s and slot positions ( n P n-1 ways). To enumerate.

ステップG2において、切替制御部116は、n−1通りのFAN40とスロット位置との組み合わせの中から1つの組み合わせを選択し、スロット位置による影響を考慮した更新済み残寿命life(ID,POS)を算出する。 In step G2, the switching control unit 116 selects one combination from the combinations of the FAN 40 and the slot position in n P n-1 ways, and the updated remaining life life (ID, POS) considering the influence of the slot position. ) Is calculated.

更新済み残寿命life(ID,POS) = life_fan(ID) - (1 - life_static(POS))
ステップG3において、切替制御部116は、ステップG2において選択した組み合わせ内における更新済み残寿命life(ID,POS)の最小値を求め、当該組み合わせの代表値とする。
Updated remaining life life (ID, POS) = life_fan (ID)-(1 --life_static (POS))
In step G3, the switching control unit 116 obtains the minimum value of the updated remaining life (ID, POS) in the combination selected in step G2, and uses it as the representative value of the combination.

ステップG4において、切替制御部116は、FAN40とスロット位置との全ての組み合わせについて、ステップG2,G3の処理を行なったかを確認する。 In step G4, the switching control unit 116 confirms whether the processes of steps G2 and G3 have been performed for all combinations of the FAN 40 and the slot position.

確認の結果、処理がまだ行なわれていない組み合わせがある場合には(ステップG4のNOルート参照)、ステップG2に戻る。 As a result of the confirmation, if there is a combination that has not been processed yet (see the NO route in step G4), the process returns to step G2.

全ての組み合わせについて、ステップG2,G3の処理を行なった場合に(ステップG4のYESルート参照)、ステップG5に移行する。 When the processes of steps G2 and G3 are performed for all combinations (see the YES route of step G4), the process proceeds to step G5.

ステップG5において、切替制御部116は、全ての組み合わせの内、最も代表値の大きい組み合わせを、FAN40の最適配置として決定する。 In step G5, the switching control unit 116 determines the combination having the largest representative value among all the combinations as the optimum arrangement of the FAN 40.

また、更新済み残寿命の最小値が最も大きいFAN40とスロット位置との組み合わせが複数ある場合には、更新済み残寿命の2番目に小さい値や3番目に小さい値を適宜順番に比較し、更新済み残寿命が最も大きい組み合わせを1組選択(採用)することが望ましい。 If there are multiple combinations of FAN40 with the maximum updated remaining life and the slot position, the second smallest value and the third smallest value of the updated remaining life are compared in order and updated. It is desirable to select (adopt) one set that has the longest remaining life.

切替制御部116は、決定したFAN40の最適配置を管理端末装置2に通知し、管理端末装置2においては、結果表示制御部23がディスプレイに表示させる。 The switching control unit 116 notifies the management terminal device 2 of the determined optimum arrangement of the FAN 40, and in the management terminal device 2, the result display control unit 23 displays the result display on the display.

その後、処理を終了する。 After that, the process ends.

次に、実施形態の一例としてのサーバシステム1における切替制御部116によるDP機能を用いたSB5の切り替え時のSB5の選択方法を、図18に示すフローチャート(ステップH1〜H4)に従って説明する。 Next, a method of selecting the SB5 at the time of switching the SB5 using the DP function by the switching control unit 116 in the server system 1 as an example of the embodiment will be described according to the flowchart (steps H1 to H4) shown in FIG.

ステップH1において、発熱しやすいユニットであるSB5がどのFAN40に対して熱を起こしやすいかを示す係数(Amn)を予め定義した温度影響情報126を用意する。 In step H1, the temperature influence information 126 in which the coefficient (Amn) indicating which FAN 40 the SB5, which is a unit that easily generates heat, tends to generate heat is defined in advance is prepared.

ステップH2において、切替制御部116は、複数のFAN40のうち、予測寿命が短いものから順に、処理対象FAN40として選択する。 In step H2, the switching control unit 116 selects the FAN 40 to be processed in order from the plurality of FAN 40s having the shortest predicted life.

ステップH3において、切替制御部116は、温度影響情報126を参照して、処理対象FAN40(短寿命FAN40)について、当該処理対象FAN40に対応するSB5以外のSB5であって、最も係数Amnの値が小さいSB5を選択する。 In step H3, the switching control unit 116 refers to the temperature influence information 126, and for the processing target FAN40 (short-life FAN40), the SB5 other than the SB5 corresponding to the processing target FAN40 has the highest coefficient Amn value. Select the smaller SB5.

ステップH4において、切替制御部116は、全てのFAN40について、当該FAN40への熱影響が最も小さいSB5の選択を行なったかを確認する。 In step H4, the switching control unit 116 confirms whether the SB5 having the smallest thermal effect on the FAN40 has been selected for all the FAN40s.

確認の結果、当該FAN40への熱影響が最も小さいSB5の選択が行なわれていないFAN40がある場合には(ステップH4のNOルート参照)、ステップH2に戻る。また、全てのFAN40について、当該FAN40への熱影響が最も小さいSB5の選択が行なわれた場合には(ステップH4のYESルート参照)、処理を終了する。 As a result of the confirmation, if there is a FAN40 in which the SB5 having the smallest thermal effect on the FAN40 has not been selected (see the NO route in step H4), the process returns to step H2. Further, when the SB5 having the smallest thermal influence on the FAN40 is selected for all the FAN40s (see the YES route in step H4), the process is terminated.

(C)効果
このように、本発明の一実施形態としてのサーバシステム1によれば、DPによるSB5の切り替えを即時に実行可能である場合に、切替制御部116は、DPによるSB5の切替制御を行なう。切替制御部116は、DPのSB切替機能を用いて、SB#2,#3をON状態にする一方で、SB#0,#1をスタンバイ状態(SBY)にする。FAN#0,#2が冷却対象とするSB#0,#1をスタンバイ状態にすることで、これらのFAN#0,#2の負荷が低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。
(C) Effect As described above, according to the server system 1 as one embodiment of the present invention, when the switching of SB5 by DP can be executed immediately, the switching control unit 116 controls the switching of SB5 by DP. To do. The switching control unit 116 uses the SB switching function of the DP to turn SB # 2 and # 3 into an ON state, while putting SB # 0 and # 1 into a standby state (SBY). By putting SB # 0 and # 1 to be cooled by FAN # 0 and # 2 into the standby state, the load of these FAN # 0 and # 2 is reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

また、DPによるSB5の切り替えを即時に実行可能でない場合に、切替制御部116は、DPのホットプラグ機能によるSB5の追加制御を行なう。すなわち、切替制御部116は、DPのホットプラグ機能を用いて、スタンバイ状態であったSB#2,#3をON状態にすることで、これらのSB#2,#3を追加する。 Further, when the switching of the SB5 by the DP cannot be executed immediately, the switching control unit 116 additionally controls the SB5 by the hot plug function of the DP. That is, the switching control unit 116 adds these SB # 2 and # 3 by turning on the SB # 2 and # 3 that were in the standby state by using the hot plug function of the DP.

これにより、SB#0〜#3の全てがON状態になり、SB#0〜#3の間において負荷が分散される。従って、FAN#0,#2が冷却対象とするSB#0,#1の負荷が低減して発熱量が低下し、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。 As a result, all of SB # 0 to # 3 are turned on, and the load is distributed between SB # 0 to # 3. Therefore, the load of SB # 0 and # 1 to be cooled by FAN # 0 and # 2 is reduced, the calorific value is reduced, and the load of FAN # 0 and # 2 (high temperature load) is also reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

温度影響情報126を用いることで、短寿命FAN40に対して熱(熱影響)を与えやすいSB5を容易に特定することができる。 By using the temperature effect information 126, it is possible to easily identify the SB5 that easily gives heat (heat effect) to the short-life FAN 40.

DPによる切り替えを実行不可である場合には、切替制御部116は、リザーブドSB5を用いた静的なSB5の切り替えを行なう。 When switching by DP cannot be executed, the switching control unit 116 performs static switching of SB5 using the reserved SB5.

リザーブドSB5を用いた静的なSB5の切り替えを即時に実行可能である場合に、切替制御部116は、リザーブドSB5を用いたSB5の切り替えを行なう。すなわち、切替制御部116は、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。 When the static SB5 switching using the reserved SB5 can be immediately executed, the switching control unit 116 switches the SB5 using the reserved SB5. That is, the switching control unit 116 puts the reserved SB # 2 in the ON state, while putting the SB # 0 in the standby state (SBY).

これにより、FAN#0,#2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。 As a result, in addition to FAN # 0 and # 2, FAN # 1 and # 3 whose cooling target is SB # 2 will also be blown, and all FAN # 0 to # 3 will be blown, and FAN will be blown. The load of # 0 and # 2 (high temperature load) is also reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

リザーブドSB5を用いた静的なSB5の切り替えを即時に行なうことができない場合には、夜間等の本サーバシステム1に稼働率が低い一部の時間帯に、リザーブドSB5を用いたSB5の切り替えを行なう。すなわち、切替制御部116は、本サーバシステム1に稼働率が低い時間帯において、リザーブドSB#2をON状態にする一方で、SB#0をスタンバイ状態(SBY)にする。 If static SB5 switching using Reserved SB5 cannot be performed immediately, switch SB5 using Reserved SB5 during some hours when the operating rate of this server system 1 is low, such as at night. Do it. That is, the switching control unit 116 puts the reserved SB # 2 in the ON state while putting the SB # 0 in the standby state (SBY) in the time zone when the operating rate of the server system 1 is low.

これにより、FAN#0,2に加えて、SB#2を冷却対象とするFAN#1,#3も送風を行なうことになり、全てのFAN#0〜#3による送風が行なわれ、FAN#0,#2の負荷(高温負荷)も低減される。これにより、FAN#0,#2の予測寿命が延びるとともに、FAN#1,#3の予測寿命が短くなり、FAN40間における予測寿命のばらつきを解消することができる。 As a result, in addition to FAN # 0 and 2, FAN # 1 and # 3 whose cooling target is SB # 2 will also be blown, and all FAN # 0 to # 3 will be blown, and FAN # The load of 0 and # 2 (high temperature load) is also reduced. As a result, the predicted life of FAN # 0 and # 2 is extended, the predicted life of FAN # 1 and # 3 is shortened, and the variation in the predicted life between FAN 40 can be eliminated.

スタンバイ状態のSB5が複数ある場合には、切替制御部116は、短寿命FAN40に対する影響が小さいSB5をDPによりON状態とするSB5として優先的に選択することで、短寿命FAN40にかかる温度負荷を効率的に分散させることができる。 When there are a plurality of SB5s in the standby state, the switching control unit 116 preferentially selects the SB5 having a small influence on the short-life FAN40 as the SB5 for turning on the short-life FAN40 by DP, thereby reducing the temperature load on the short-life FAN40. It can be efficiently dispersed.

(D)その他
本発明は上述した実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で種々変形して実施することができる。
(D) Others The present invention is not limited to the above-described embodiment, and can be variously modified and implemented without departing from the spirit of the present invention.

開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。 The disclosed technique is not limited to the above-described embodiment, and can be variously modified and implemented without departing from the spirit of the present embodiment. Each configuration and each process of the present embodiment can be selected as necessary, or may be combined as appropriate.

上述した実施形態においては、切替制御部116が、DPのホットプラグ機能により、SB5の追加を行なうことで、稼働するSB5の数を増やし、作動するFAN40とを増やすことで短寿命FAN40の負荷を軽減しているが、これに限定されるものではない。例えば、切替制御部116は、SB切替えにより、リザーブドSB5を追加で稼働させることで、稼働するSB5の数を増やし、差動するFAN40とを増やすことで短寿命FAN40の負荷を軽減してもよい。 In the above-described embodiment, the switching control unit 116 increases the number of operating SB5s by adding SB5 by the hot plug function of DP, and increases the number of operating FAN40s to increase the load of the short-life FAN40. It is mitigated, but not limited to this. For example, the switching control unit 116 may additionally operate the reserved SB5 by SB switching to increase the number of operating SB5s and increase the differential FAN40 to reduce the load on the short-life FAN40. ..

また、上述した実施形態においては、切替制御部116が、短寿命FAN40に対する熱影響が最も低いSB5をDPのホットプラグ機能により稼働させることで、作動するFAN40を増やし、短寿命FAN40の負荷を軽減しているが、これに限定されるものではない。 Further, in the above-described embodiment, the switching control unit 116 operates the SB5, which has the lowest thermal effect on the short-life FAN40, by the hot plug function of the DP, thereby increasing the operating FAN40 and reducing the load on the short-life FAN40. However, it is not limited to this.

例えば、切替制御部116は、SB切替えにより、短寿命FAN40に対する熱影響が最も低いSB5をDPのホットプラグ機能により稼働させてもよく、これにより差動するFAN40を増やし、短寿命FAN40の負荷を軽減してもよい。 For example, the switching control unit 116 may operate the SB5 having the lowest thermal effect on the short-life FAN40 by the hot plug function of the DP by SB switching, thereby increasing the differential FAN40 and loading the short-life FAN40. It may be reduced.

また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。 Further, according to the above-mentioned disclosure, it is possible to carry out and manufacture this embodiment by a person skilled in the art.

(E)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(E) Additional notes The following additional notes will be further disclosed with respect to the above embodiments.

(付記1)
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
前記複数の冷却部品の温度を検出する温度検出部と、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部と
を備えることを特徴とする、情報処理装置。
(Appendix 1)
With multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled, and
A temperature detection unit that detects the temperature of the plurality of cooling components, and
A life prediction unit that predicts the life of each of the plurality of cooling components based on the temperature.
As a result of the life prediction, a difference having a predicted life of more than a threshold is detected between the predicted short-life cooling component having the shortest predicted life and the predicted long-life cooling component having the longest predicted life among the plurality of cooling parts. In this case, the information processing apparatus includes a configuration change control unit that changes the configuration of the cooling target component.

(付記2)
前記構成変更制御部が、冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、付記1記載の情報処理装置。
(Appendix 2)
The information processing apparatus according to Appendix 1, wherein the configuration change control unit performs a configuration change to add a cooling target component and operates a cooling component corresponding to the added cooling target component.

(付記3)
前記構成変更制御部が、前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、付記1記載の情報処理装置。
(Appendix 3)
The configuration change control unit performs a configuration change to operate the cooling target component having the lowest thermal effect on the predicted short-life cooling component among the plurality of cooling target components, and the cooling corresponding to the operated cooling target component is performed. The information processing apparatus according to Appendix 1, wherein the parts are operated.

(付記4)
前記構成変更制御部が、当該情報処理装置を停止させることなくパーィションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
ことを特徴とする、付記1〜3のいずれか1項に記載の情報処理装置。
(Appendix 4)
The configuration change control unit, using a changeable first configurable functionality, hardware resources per Te Ishon without stopping the information processing apparatus, and performing the reconfiguration of the object to be cooled , The information processing apparatus according to any one of Supplementary Provisions 1 to 3.

(付記5)
前記構成変更制御部が、前記冷却対象部品を切り離し、当該情報処理装置の再起動後に前記冷却対象部品に代えて予備の冷却対象部品を動作させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
ことを特徴とする、付記1〜3のいずれか1項に記載の情報処理装置。
(Appendix 5)
The configuration change control unit, the disconnect object to be cooled, the cooling target component using the second configuration change function for operating the spare cooling target component in place of the object to be cooled after the restart of the information processing apparatus The information processing apparatus according to any one of Items 1 to 3, wherein the configuration is changed.

(付記6)
前記構成変更制御部が、前記複数の冷却部品の回転速度を高くする制御を行なう
ことを特徴とする、付記1〜5のいずれか1項に記載の情報処理装置。
(Appendix 6)
The information processing apparatus according to any one of Supplementary note 1 to 5, wherein the configuration change control unit controls to increase the rotation speed of the plurality of cooling components.

(付記7)
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
プロセッサとを備える情報処理装置において、
前記複数の冷却部品の温度を検出し、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行ない、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させる、冷却部品管理プログラム。
(Appendix 7)
With multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled, and
In an information processing device equipped with a processor
Detecting the temperatures of the plurality of cooling components,
Based on the temperature, the life of each of the plurality of cooling components is predicted.
As a result of the life prediction, a difference having a predicted life of more than a threshold is detected between the predicted short-life cooling component having the shortest predicted life and the predicted long-life cooling component having the longest predicted life among the plurality of cooling parts. In this case, a cooling component management program that causes the processor to execute a process of changing the configuration of the component to be cooled.

(付記8)
冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
処理を、前記プロセッサに実行させることを特徴とする、付記7記載の冷却部品管理プログラム。
(Appendix 8)
The cooling component management program according to Appendix 7, wherein the processor performs a process of operating a cooling component corresponding to the added cooling target component by making a configuration change to add a cooling target component.

(付記9)
前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
処理を、前記プロセッサに実行させることを特徴とする、付記7記載の冷却部品管理プログラム。
(Appendix 9)
Among the plurality of cooling target parts, a process of changing the configuration for operating the cooling target component having the lowest thermal effect on the predicted short-life cooling component and operating the cooling component corresponding to the operated cooling target component is performed. The cooling component management program according to Appendix 7, wherein the processor is executed.

(付記10)
当該情報処理装置を停止させることなくパーィションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜9のいずれか1項に記載の冷却部品管理プログラム。
(Appendix 10)
And characterized in that the information processing apparatus using the first configuration changing function capable of changing the hardware resources per Te Ishon without stopping, the process for configuration change of the object to be cooled, to be executed by the processor The cooling component management program according to any one of Supplementary note 7 to 9.

(付記11)
前記冷却対象部品を切り離し、当該情報処理装置の再起動後に前記冷却対象部品に代えて予備の冷却対象部品を動作させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜9のいずれか1項に記載の冷却部品管理プログラム。
(Appendix 11)
Disconnecting the object to be cooled, the process of performing the configuration change of the object to be cooled by using the second configuration change function for operating the spare cooling target component in place of the object to be cooled after the restart of the information processing apparatus, The cooling component management program according to any one of Supplementary note 7 to 9, wherein the processor is executed.

(付記12)
前記複数の冷却部品の回転速度を高くする制御を行なう
処理を、前記プロセッサに実行させることを特徴とする、付記7〜11のいずれか1項に記載の冷却部品管理プログラム。
(Appendix 12)
The cooling component management program according to any one of Supplementary note 7 to 11, wherein the processor executes a process of controlling the rotation speed of the plurality of cooling components.

1 サーバシステム
2 管理端末装置
21 CPU
22 FAN最適配置情報抽出部
23 結果表示制御部
3 サーバ装置
4 FRU4
5−1〜5−4,5 SB
51 CPU
52 DIMM
6 IOU
7 PCIeボックス
8 通信回線
10 MMB
11 CPU
111 構成情報管理部
112 温度情報管理部
113 FAN回転数管理部
114 FAN配置履歴管理部
115 FAN予測寿命管理部
116 切替制御部
12 メモリ
121 構成情報
122 温度情報
123 FAN回転数情報
124 FAN配置履歴情報
125 予測寿命履歴情報
126 温度影響情報
40−1〜40−4,40 FAN
41−1〜41−4,41 PSU
1 Server system 2 Management terminal device 21 CPU
22 FAN optimal placement information extraction unit 23 Result display control unit 3 Server device 4 FRU4
5-1 to 54,5 SB
51 CPU
52 DIMM
6 IOU
7 PCIe box 8 communication line 10 MMB
11 CPU
111 Configuration information management unit 112 Temperature information management unit 113 FAN rotation speed management unit 114 FAN placement history management unit 115 FAN predicted life management unit 116 Switching control unit 12 Memory 121 Configuration information 122 Temperature information 123 FAN rotation speed information 124 FAN placement history information 125 Predicted life history information 126 Temperature effect information 40-1 to 40-4,40 FAN
41-1 to 41-4,41 PSU

Claims (6)

複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
前記複数の冷却部品の温度を検出する温度検出部と、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行なう寿命予測部と、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行なう構成変更制御部と
を備え
前記構成変更制御部が、前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、情報処理装置。
With multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled, and
A temperature detection unit that detects the temperature of the plurality of cooling components, and
A life prediction unit that predicts the life of each of the plurality of cooling components based on the temperature.
As a result of the life prediction, a difference having a predicted life of more than a threshold is detected between the predicted short-life cooling component having the shortest predicted life and the predicted long-life cooling component having the longest predicted life among the plurality of cooling parts. In this case, it is provided with a configuration change control unit that changes the configuration of the cooling target component.
The configuration change control unit performs a configuration change to operate the cooling target component having the lowest thermal effect on the predicted short-life cooling component among the plurality of cooling target components, and the cooling corresponding to the operated cooling target component is performed. An information processing device characterized by operating parts.
前記構成変更制御部が、冷却対象部品を追加する構成変更を行ない、追加された前記冷却対象部品に対応する冷却部品を作動させる
ことを特徴とする、請求項1記載の情報処理装置。
The configuration change control unit may perform the configuration change of adding the object to be cooled, characterized in that to operate the cooling device corresponding to the added said cooling target component, the information processing equipment according to claim 1, wherein.
前記構成変更制御部が、当該情報処理装置を停止させることなくパーィションのハードウェアリソースを変更可能な第1構成変更機能を用いて、前記冷却対象部品の構成変更を行なう
ことを特徴とする、請求項1または2に記載の情報処理装置。
The configuration change control unit, using a changeable first configurable functionality, hardware resources per Te Ishon without stopping the information processing apparatus, and performing the reconfiguration of the object to be cooled , The information processing apparatus according to claim 1 or 2.
前記構成変更制御部が、前記冷却対象部品を切り離し、当該情報処理装置の再起動後に前記冷却対象部品に代えて予備の冷却対象部品を機能させる第2構成変更機能を用いて前記冷却対象部品の構成変更を行なう
ことを特徴とする、請求項1または2に記載の情報処理装置。
The configuration change control unit, the disconnect object to be cooled, the cooling target component using the second configuration change function to function spare cooling target component in place of the object to be cooled after the restart of the information processing apparatus The information processing apparatus according to claim 1 or 2 , wherein the configuration is changed.
前記構成変更制御部が、前記複数の冷却部品の回転速度を高くする制御を行なう
ことを特徴とする、請求項1〜のいずれか1項に記載の情報処理装置。
The information processing apparatus according to any one of claims 1 to 4 , wherein the configuration change control unit controls to increase the rotation speed of the plurality of cooling components.
複数の冷却対象部品と、
前記冷却対象部品を冷却する複数の冷却部品と、
プロセッサとを備える情報処理装置において、
前記複数の冷却部品の温度を検出し、
前記温度に基づいて、前記複数の冷却部品のそれぞれの寿命予測を行ない、
前記寿命予測の結果、前記複数の冷却部品間において予測寿命が最も短い予測短寿命冷却部品と、予測寿命が最も長い予測長寿命冷却部品との間に、予測寿命が閾値以上の差が検出された場合に、前記冷却対象部品の構成変更を行ない、
前記複数の冷却対象部品のうち、前記予測短寿命冷却部品に対する熱影響が最も低い冷却対象部品を稼働させる構成変更を行ない、稼働させた前記冷却対象部品に対応する冷却部品を作動させる
処理を、前記プロセッサに実行させる、冷却部品管理プログラム。
With multiple parts to be cooled,
A plurality of cooling parts for cooling the parts to be cooled, and
In an information processing device equipped with a processor
Detecting the temperatures of the plurality of cooling components,
Based on the temperature, the life of each of the plurality of cooling components is predicted.
As a result of the life prediction, a difference having a predicted life of more than a threshold is detected between the predicted short-life cooling component having the shortest predicted life and the predicted long-life cooling component having the longest predicted life among the plurality of cooling parts. If the row stomach configuration changes of the object to be cooled,
Among the plurality of cooling target parts, the configuration change is made to operate the cooling target component having the lowest thermal effect on the predicted short-life cooling component, and the cooling component corresponding to the operated cooling target component is operated. > A cooling component management program that causes the processor to perform processing.
JP2017232844A 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program Active JP6988414B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017232844A JP6988414B2 (en) 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017232844A JP6988414B2 (en) 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program

Publications (2)

Publication Number Publication Date
JP2019101822A JP2019101822A (en) 2019-06-24
JP6988414B2 true JP6988414B2 (en) 2022-01-05

Family

ID=66973776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017232844A Active JP6988414B2 (en) 2017-12-04 2017-12-04 Information processing equipment and cooling parts management program

Country Status (1)

Country Link
JP (1) JP6988414B2 (en)

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4349408B2 (en) * 2005-12-28 2009-10-21 日本電気株式会社 Life prediction monitoring apparatus, life prediction monitoring method, and life prediction monitoring program
JP4867969B2 (en) * 2008-10-14 2012-02-01 日本電気株式会社 Processor control system, method, and program
JP2011227709A (en) * 2010-04-20 2011-11-10 Nec Corp Raid controller device, raid device, and processing method and program for raid device
JP5287841B2 (en) * 2010-12-20 2013-09-11 日本電気株式会社 Fan control device, fan control method, and fan control program
JP5748047B2 (en) * 2011-02-15 2015-07-15 日本電気株式会社 Cooling system and efficient device cooling method
JP6401054B2 (en) * 2014-12-26 2018-10-03 株式会社Nttファシリティーズ Information processing system and information processing system program
JP6191718B1 (en) * 2016-03-23 2017-09-06 日本電気株式会社 Server device, server control method, program

Also Published As

Publication number Publication date
JP2019101822A (en) 2019-06-24

Similar Documents

Publication Publication Date Title
US10519960B2 (en) Fan failure detection and reporting
JP4853344B2 (en) Fan rotation control method, fan rotation control system, and fan rotation control program
JP6287073B2 (en) Cooling device and cooling method
JP5290044B2 (en) Air conditioner monitoring system and air conditioner monitoring method
US20080313492A1 (en) Adjusting a Cooling Device and a Server in Response to a Thermal Event
JP4606233B2 (en) Storage device, storage device fan control method, and fan control program
JP5874484B2 (en) Processing system, device management apparatus, and program
JP5413514B2 (en) Management apparatus, information processing apparatus, control method, and program
JPWO2010018635A1 (en) Cooling method and computer
US20060161972A1 (en) System and method for license management in blade server system
JP2006228220A (en) System and method for client reassignment in blade server
JP2015161489A (en) Data center, control program of control device and control method of data center
TW201720282A (en) System and method for controlling air flow in a server rack
JP2009015584A (en) Storage control device and method for controlling power supply of casing unit
WO2016151779A1 (en) Information processing device and management device
US20200326760A1 (en) Control fan using neural network
JP6988414B2 (en) Information processing equipment and cooling parts management program
JP6589299B2 (en) COOLING CONTROL DEVICE, CIRCUIT BOARD, COOLING METHOD, AND PROGRAM
US11585351B2 (en) Fan failure compensation
JP2006064253A (en) Air conditioner monitoring system and method
JP2007018034A (en) Control unit and control method
JP2018018177A (en) Information processing device, information processing system, information processing device control program and information processing device control method
CN108150442B (en) Cabinet fan control method and module
TW201931820A (en) Equipment rack and method of ensuring status reporting thereof
JP6885626B2 (en) Server equipment, control methods and programs

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190607

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200911

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210712

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210727

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210927

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211115

R150 Certificate of patent or registration of utility model

Ref document number: 6988414

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150