WO2013031006A1 - 情報処理システム、制御装置および制御方法 - Google Patents

情報処理システム、制御装置および制御方法 Download PDF

Info

Publication number
WO2013031006A1
WO2013031006A1 PCT/JP2011/069930 JP2011069930W WO2013031006A1 WO 2013031006 A1 WO2013031006 A1 WO 2013031006A1 JP 2011069930 W JP2011069930 W JP 2011069930W WO 2013031006 A1 WO2013031006 A1 WO 2013031006A1
Authority
WO
WIPO (PCT)
Prior art keywords
fan
control means
fan control
information processing
controller
Prior art date
Application number
PCT/JP2011/069930
Other languages
English (en)
French (fr)
Inventor
小口孝
Original Assignee
富士通株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士通株式会社 filed Critical 富士通株式会社
Priority to PCT/JP2011/069930 priority Critical patent/WO2013031006A1/ja
Publication of WO2013031006A1 publication Critical patent/WO2013031006A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K7/00Constructional details common to different types of electric apparatus
    • H05K7/20Modifications to facilitate cooling, ventilating, or heating
    • H05K7/20009Modifications to facilitate cooling, ventilating, or heating using a gaseous coolant in electronic enclosures
    • H05K7/20209Thermal management, e.g. fan control

Definitions

  • the present invention relates to an information processing system including a plurality of cooling devices, a control device, and a control method.
  • FIG. 1 is a diagram showing an overview of an information processing system 100 with redundant fans.
  • the information processing system 100 includes a plurality of system boards (SB) SB # 0-SB # 3, FAN # 0A- # 3A and FAN # 0B- # 3B, fan controllers #A and #B, and a system A management board 110.
  • SB system boards
  • Each of SB # 0 to SB # 3 includes a CPU (Central Processing Unit), a memory module, a memory controller, a system controller, an IO controller, and the like (not shown).
  • Each of SB # 0 to SB # 3 can function as a single independent information processing unit.
  • SB # 0-SB # 3 has a partitioning function for performing independent information processing by connecting a plurality of system boards among SB # 0-SB # 3. A unit for performing independent information processing by connecting a plurality of system boards to each other in this way is called a “partition”.
  • SB # 0-SB # 3 are provided with temperature sensors # 0- # 3, respectively.
  • the temperature sensor # 0 measures the temperature around the SB # 0 and notifies the system management board 110 of it.
  • the temperature sensors # 1, # 2, and # 3 measure the temperatures around the SBs # 1, # 2, and # 3, respectively, and notify the system management board 110 of them.
  • FAN # 0A and FAN # 0B are cooling devices that cool SB # 0 by rotating a fan and blowing air. Similarly, FAN # 1A and FAN # 1B, FAN # 2A and FAN # 2B, FAN # 3A and FAN # 3B rotate the fan to blow air, respectively, so that SB # 1, SB # 2, and SB # 3 respectively. It is the cooling device which cools.
  • the fan controller #A is a device that simultaneously drives the A-system fan, that is, FAN # 0A- # 3A.
  • the fan controller #A adjusts the fan speed of FAN # 0A- # 3A according to the instruction from the system management board 110.
  • the fan controller #B is a device that simultaneously drives the B-system fan, that is, FAN # 0B- # 3B.
  • the fan controller #B adjusts the fan rotation speed of FAN # 0B- # 3B according to the instruction from the system management board 110.
  • the system management board 110 is a device that controls fans included in the information processing system 100, that is, FAN # 0A- # 3A and FAN # 0B- # 3B.
  • the system management board 110 determines the number of fan rotations necessary to maintain a temperature suitable for the operation of the SB # 0- # 3 based on the temperature notified from the temperature sensors # 0- # 3. Then, the system management board 110 notifies the fan controllers #A and #B of the determined fan rotation speed.
  • FIG. 2 is a diagram illustrating an example in which the information processing system 100 is divided into a plurality of partitions.
  • the information processing system 100 shows an example in which the information processing system 100 is divided into two partitions, that is, a partition # 0 including SB # 0 and a partition # 1 including SB # 1- # 3. .
  • each SB # n is cooled by two FAN # nA and #nB, where n is an integer from 0 to 3.
  • the fan controller which drives each fan is made redundant in two systems, A system and B system.
  • the fan controller #A controls the rotation speed of the A-system fans of the partition # 0 and the partition # 1, that is, FAN # nA.
  • the fan controller #B controls the rotation speed of the B-system fans included in the partition # 0 and the partition # 1, that is, FAN # nB.
  • each SB # n is cooled by two fans, namely FAN # nA and #nB.
  • FAN # nA and #nB are each driven at a fan speed that outputs an air volume of 50% of the air volume required for cooling SB # n.
  • the amount of heat generated by SB # n differs depending on the operating state of the partition, the number of system boards included in the partition, and the mounted items such as CPU and memory modules.
  • the system management board 110 determines the fan rotation speed using the highest temperature among the temperatures notified from the temperature sensors # 0 to # 3. Then, the system management board 110 causes all the fans to operate at the determined fan rotation speed by the fan controllers #A and #B.
  • the system management board 110 outputs the A-type FAN # nA, which has been driven at the fan speed that outputs 50% of the air volume necessary for cooling, to 100% of the air volume required for cooling. Drive at the fan speed.
  • FIG. 3 is a diagram showing an overview of an information processing system 300 including a fan controller made redundant for each fan.
  • the information processing system 300 includes one fan for each of the SBs # 0 to # 3 and a fan for cooling the SB.
  • FAN # n is a fan that cools SB # n.
  • Two fan controllers that drive FAN # n, that is, main fan controller #nA and standby fan controller #nB, are connected to FAN # n via a switch 31n.
  • Main system fan controller #nA and standby system fan controller #nB drive FAN #n in accordance with instructions from system management board 320. Based on the temperature notified from temperature sensor #n, system management board 320 determines the number of fan rotations necessary to maintain a temperature suitable for the operation of SB # n. During normal operation, the system management board 320 uses the fan controller #nA to drive FAN # n at the determined fan speed.
  • the system management board 320 switches the fan controller from the fan controller #nA to #nB. And the system management board 320 drives FAN # n using fan controller #nB.
  • a forced air cooling system in which redundancy is provided to an electronic device cooling system to provide a backup function to one of two types of air moving devices to increase the reliability of equipment.
  • a fan filter unit control device that maintains a predetermined air volume and maintains the cleanliness by maintaining a predetermined air flow even when a fan fails in the fan filter unit.
  • the information processing system 100 described with reference to FIG. 1 uniformly controls the fan rotation speeds of all fans according to the highest temperature obtained from the temperature sensors. Therefore, for example, in FIG. 2, if partition # 0 is operating, system management board 110 cools SB # 1- # 3 included in partition # 1 even if partition # 1 is stopped. FAN # 1A- # 3A and # 1B- # 3B are driven. In this case, useless power is consumed by cooling the SBs # 1- # 3 included in the partition # 1.
  • the information processing system 300 described with reference to FIG. 3 prepares a main fan controller and a standby fan controller for each system board, and controls the rotation speed for each system board while the main fan controller fails. Switch to the standby fan controller. In this case, the number of fan controllers controlled by the system management board 320 increases. For this reason, the circuit scale of the fan controller and the system management board 320 increases, and the manufacturing cost also increases.
  • This information processing system aims at providing the information processing system which can cool efficiently according to the device composition of this information processing system in one side.
  • the information processing system includes a plurality of fans, a plurality of fan control means, a plurality of selection means, and a control means.
  • the fan is a blower that can be classified into two or more groups.
  • the fan control means is means for controlling the fan.
  • the selection unit is a unit that is provided in association with each of the plurality of fans, and that selects a fan control unit that controls the corresponding fan from the plurality of fan control units.
  • the control means is means for controlling the plurality of selection means so as to select a common fan control means as a fan control means for controlling fans belonging to the same group.
  • the information processing system can efficiently perform cooling according to the apparatus configuration of the information processing system.
  • FIG. 10 is a diagram illustrating an example in which SB # 0- # 3 included in the information processing system 400 is divided into three partitions # 0- # 2.
  • 6 is a diagram showing an example of partition setting information 600.
  • FIG. It is a figure which shows the example of the fan control group setting information 700.
  • FIG. It is a figure which shows the example of the fan controller allocation information.
  • FIG. 5 is a flowchart showing the operation of the system management board 410. It is a figure which shows the example of the fan controller allocation information 1400 at the time of allocating fan controller # 1 to the main system fan controller of fan control group # 0. It is a figure which shows the example of the fan control group setting information 1500 at the time of producing fan control group # 4 which put together fan control group # 0 and # 1. Fan controller assignment information when fan controller # 2 that operates normally among the main fan controllers included in the fan control group grouped in fan control group # 4 is assigned to the main fan controller of fan control group # 4 2 is a diagram illustrating an example of 1600. FIG.
  • FIGS. 13 An example of an embodiment of the present invention will be described with reference to FIGS. Note that the embodiments described below are merely examples, and are not intended to exclude various modifications and technical applications that are not explicitly described below. That is, the present invention can be implemented with various modifications such as a combination of the described techniques without departing from the spirit of the present invention. Further, the processing procedure shown in the form of a flowchart in FIG. 13 is not intended to limit the order of processing. Therefore, it is natural that the processing order may be changed when possible.
  • FIG. 4 is a diagram illustrating a configuration example of an information processing system 400 according to an embodiment.
  • the information processing system 400 includes a plurality of system boards SB # 0- # 3, fans FAN # 0- # 3, and a system management board 410.
  • Each of SB # 0- # 3 includes a CPU, a memory module, a memory controller, a system controller, an IO controller, etc. (not shown).
  • Each of the SBs # 0 to # 3 can function as a single independent information processing unit.
  • SB # 0-SB # 3 have a partitioning function for performing independent information processing by connecting to a plurality of system boards among SB # 0-SB # 3.
  • a unit for performing independent information processing by connecting a plurality of system boards to each other in this way is called a “partition”.
  • system board is the minimum unit of the partition.
  • some or all of the resources included in one or more system boards may be the minimum unit of the partition.
  • the SBs # 0 to # 3 included in the information processing system 400 have the same configuration. Therefore, SB # 0 will be described below as a representative. However, the SBs # 0 to # 3 are not limited to the same configuration. Similarly, since FAN # 0 to # 3 included in the information processing system 400 have the same configuration, FAN # 0 will be described as a representative.
  • SB # 0 includes an IO input / output port # 0, a temperature sensor # 0, a fan controller # 0, and a switch # 0.
  • SB # 0 has shown the case where one fan controller is provided, you may provide two or more fan controllers.
  • the fan controller # 0 is mounted on SB # 0, but may not be mounted on SB # 0.
  • the fan controllers # 0 to # 3 can be provided in the information processing system 400 as units different from the SB # 0 to 3, respectively.
  • it is desirable that the number of fan controllers corresponds to the maximum number of partitions that can be constructed, in this embodiment, the number of SBs.
  • the IO input / output port # 0 is an interface having a plurality of ports for connecting the inter-SB connection bus.
  • the IO input / output port # 0 switches between valid / invalid of the port according to the port control signal output from the system management board 410. For example, when a port connecting SB # 0 to # 1 becomes valid, SB # 0 to # 1 are connected so that they can communicate with each other. As a result, the SBs # 0 to # 1 can be connected to each other and perform independent information processing.
  • Temperature sensor # 0 is a sensor that measures the temperature around SB # 0.
  • the temperature sensor # 0 notifies the system management board 410 of the measured temperature by outputting a temperature information signal including the measured temperature to the system management board 410.
  • Fan controller # 0 receives the rotation speed setting signal from the system management board 410. Then, the fan controller # 0 generates a rotation speed instruction signal.
  • the rotation speed instruction signal is a signal for rotating the motor included in the fan that rotates the rotor blades at the rotation speed included in the rotation speed setting signal. In this embodiment, the rotational speed of the motor included in the fan is referred to as “fan rotational speed”.
  • Fan controller # 0 drives FAN # 0- # 3 by outputting a rotation speed instruction signal to FAN # 0- # 3 included in information processing system 400.
  • fan controller # 0 when the motors that rotate the rotor blades included in FAN # 0- # 3 are controlled by PWM (Pulse Width Modulation) control, fan controller # 0 includes FAN # 0- # 3 included in information processing system 400. On the other hand, a PWM signal is output as a rotation speed instruction signal. Fan controller # 0 adjusts the duty ratio of the PWM signal so that the fan rotation speed becomes the rotation speed included in the rotation speed setting signal received from system management board 410.
  • PWM Pulse Width Modulation
  • Switcher # 0 receives a switch instruction signal from the system management board 410.
  • the switch # 0 outputs, to FAN # 0, the rotation speed instruction signal input from the fan controller designated by the switching instruction signal among the rotation speed instruction signals input from the fan controllers # 0 to # 3.
  • FAN # 0 is a blower including a rotary blade 420a and a motor 420b for rotating the rotary blade 420a.
  • FAN # 0 cools SB # 0 by rotating and rotating the rotating blades 420a.
  • FAN # 0 rotates the motor 420b in accordance with the rotation speed instruction signal input from the switch # 0.
  • the rotation speed instruction signal is a PWM signal
  • FAN # 0 rotates the motor 420b by PWM control using the PWM signal input from the switch # 0.
  • FAN # 0 notifies the system management board 410 of the current fan rotational speed by outputting a rotational speed information signal including the current rotational speed of the motor 420b as information to the system management board 410.
  • a single fan is associated with one system board, but a fan group including a plurality of fans may be associated with one system board.
  • this fan group may be considered as an element corresponding to the “fan” in FIG. 4, and a single fan controller controls a plurality of fans constituting the fan group. .
  • a switch is provided for each fan group.
  • the system management board 410 is a control device that controls the entire device included in the information processing system 400.
  • the system management board 410 includes a storage device 411.
  • the storage device 411 stores partition setting information 600, fan control group setting information 700, fan controller allocation information 800, SB temperature information 900, air volume definition information 1000, fan rotation speed setting information 1100, and fan rotation speed information 1200.
  • a volatile memory such as a RAM (Random Access Memory) or a nonvolatile memory such as an EPROM (Erasable Programmable Read Only Memory) can be used.
  • the system management board 410 acquires a partition configuration arbitrarily set by the user via a user interface 412 including an input / output device such as a display, a keyboard, and a mouse. Then, the system management board 410 stores the acquired partition configuration in the storage device 411 as the partition setting information 600.
  • the system management board 410 connects the SBs in the same partition with the SB connection bus according to the partition setting information 600. Specifically, the system management board 410 outputs a port control signal to the input / output ports # 0 to # 3 provided in the SBs # 0 to # 3, and connects the SBs in the same partition. Enable and disable other ports. Then, the input / output ports # 0 to # 3 enable or disable the ports instructed from the system management board 410.
  • the system management board 410 creates a fan control group for each partition based on the partition setting information 600.
  • the system management board 410 stores the created fan control group in the storage device 411 as fan control group setting information 700.
  • the system management board 410 assigns a fan controller to be used for each fan control group. This assigned fan controller is referred to as “main fan controller”. When there are a plurality of fan controllers in the fan control group, the system management board 410 selects one arbitrary fan controller from the plurality of fan controllers existing in the fan control group and assigns it to the fan control group.
  • a fan controller other than the main fan controller is referred to as a “standby fan controller”.
  • the standby fan controller is used when an arbitrary main fan controller does not operate normally due to a failure or the like.
  • the system management board 410 stores the main system fan controller assigned for each fan control group in the storage device 411 as fan controller assignment information 800.
  • the system management board 410 stores the temperature information as SB temperature information 900 in the storage device 411. .
  • the system management board 410 refers to the SB temperature information 900. Then, the system management board 410 acquires temperature information of each SB included in the fan control group for each fan control group. For each fan control group, the system management board 410 determines, for example, the number of fan rotations that is an air volume necessary for cooling the hottest SB included in the fan control group. At this time, the system management board 410 determines the fan speed based on the air volume definition information 1000.
  • the system management board 410 sets the fan rotation speed in each main fan controller by outputting a rotation speed setting signal including the determined fan rotation speed as information to each main fan controller. Further, the system management board 410 stores the fan rotation speed set for each main fan controller in the storage device 411 as fan rotation speed setting information 1100.
  • the system management board 410 periodically acquires the fan rotation speed of each FAN # 0- # 3 from the rotation speed information signal output by each FAN # 0- # 3. Then, the system management board 410 stores the acquired fan rotation speed in the storage device 411 as fan rotation speed information 1200.
  • the system management board 410 detects a failure of the main fan controller. For example, the system management board 410 compares the fan rotation speed setting information 1100 and the fan rotation speed information 1200, and can determine that the fan controller has failed if there is a certain difference in fan rotation speed.
  • the system management board 410 When the system management board 410 detects a failure of the main fan controller, the system management board 410 refers to the fan controller allocation information 800 and selects the standby fan controller. At this time, for example, the system management board 410 selects one of the standby fan controllers from among the standby fan controllers. Then, the system management board 410 assigns the selected standby fan controller to the main fan controller instead of the failed main fan controller.
  • the system management board 410 When there is no standby fan controller, the system management board 410 creates one fan control group by combining the fan control group including the main fan controller that detected the failure and other fan control groups that are arbitrarily selected. To do. Then, the system management board 410 assigns the main fan controller included in another arbitrarily selected fan control group to the created fan control group.
  • FIG. 5 shows an example in which SB # 0- # 3 included in the information processing system 400 is divided into three partitions # 0- # 2.
  • the partition setting information 600 is as shown in FIG.
  • FIG. 5 is different from FIG. 4 in the arrangement of devices included in the information processing system 400, but this is to facilitate understanding of the configuration of each partition. It is not intended to limit the arrangement of
  • Ports connecting SB # 0- # 1 included in partition # 0 that is, port C of input / output port # 0 and port A of input / output port # 1 are valid, and between SBs between SB # 0- # 1 They are connected to each other via a connection bus. Also, ports other than the port connecting SB # 0- # 1 included in partition # 0 are invalid.
  • the system management board 410 creates a fan control group for each partition.
  • a fan control group # 0 corresponding to partition # 0 a fan control group # 1 corresponding to partition # 1
  • a fan control group ## 2 a fan control group corresponding to partition # 2 are created.
  • the fan control group setting information 700 is as shown in FIG.
  • the system management board 410 assigns a main fan controller for each fan control group.
  • fan controller # 0 is assigned to the main fan controller for fan control group # 0.
  • the other fan controller # 1 included in the fan control group # 0 is assigned to a standby fan controller common to all fan control groups.
  • fan controller # 2 is assigned to the main fan controller for fan control group # 1
  • fan controller # 3 is assigned to the main fan controller for fan control group # 2.
  • the fan controller allocation information 800 is as shown in FIG.
  • FIG. 6 is a diagram illustrating an example of the partition setting information 600.
  • the partition setting information 600 is information including a partition and SB configuration information indicating the SB included in each partition.
  • the partition setting information 600 in FIG. 6 includes partition setting information when SB # 0 and SB # 1 are included in partition # 0, SB # 2 is included in partition # 1, and SB # 3 is included in partition # 2. Is illustrated.
  • FIG. 7 is a diagram illustrating an example of the fan control group setting information 700.
  • the fan control group setting information 700 is information including a fan control group and partition configuration information indicating partitions included in each fan control group.
  • the partition is abbreviated as “PT”.
  • the fan control group setting information 700 of FIG. 7 the fan control group # 0 includes PT # 0, the fan control group # 1 includes PT # 1, and the fan control group # 2 includes PT # 2.
  • the fan control group setting information is illustrated.
  • FIG. 8 is a diagram illustrating an example of fan controller allocation information 800.
  • the fan controller assignment information 800 is information including a fan controller and an assignment destination fan control group to which the fan controller is assigned as the main fan controller.
  • the fan controller assignment information 800 may include information indicating the state of each fan controller, for example, normality or failure.
  • fan controllers # 0, # 2 and # 3 are assigned to the fan control groups # 0, # 1 and # 2 as main system fan controllers, respectively.
  • standby is described in the fan controller assignment information 800, this indicates that the fan controller # 1 is assigned to the standby fan controller.
  • FIG. 9 is a diagram illustrating an example of the SB temperature information 900.
  • the SB temperature information 900 is information including the SB and the current temperature of the SB.
  • the system management board 410 obtains temperature information from the temperature information signals output from the temperature sensors # 0 to # 3 at regular intervals and updates the current temperature of the SB.
  • FIG. 10 is a diagram showing an example of the air volume definition information 1000.
  • the air volume definition information 1000 is information including the temperature of the SB and the rotational speed set for the fan in order to obtain the air volume necessary for cooling the SB at that temperature.
  • the rotation speed set for the fan is defined for each specific temperature range of SB. The number of rotations set for the fan can be determined in advance by performing an evaluation test or the like.
  • the rotation speed set for the fan is shown as a ratio to the maximum rotation speed of the fan.
  • the rotational speeds of FIGS. 11 and 12 described later are also shown as a ratio to the maximum rotational speed of the fan.
  • FIG. 11 is a diagram showing an example of fan rotation speed setting information 1100.
  • the fan rotation speed setting information 1100 is information including a fan and the rotation speed set for each fan.
  • the system management board 410 stores the set fan rotation speed in the storage device 411 as fan rotation speed setting information 1100.
  • FIG. 12 is a diagram illustrating an example of the fan rotation speed information 1200.
  • the fan speed information 1200 is information including the fans and the current speed of each fan.
  • the system management board 410 acquires the current rotation speed of each fan from the rotation speed information signal output by each fan at regular intervals, and stores it in the storage device 411 as fan rotation speed information 1200.
  • FIG. 13 is a flowchart showing the operation of the system management board 410.
  • the system management board 410 executes the following process (step S1300).
  • step S1301 the system management board 410 creates a fan control group in units of partitions.
  • the partition is divided into partitions # 0 to # 2.
  • the system management board 410 creates fan control groups # 0- # 2 corresponding to the partitions # 0- # 2, respectively, like the fan control group setting information 700 shown in FIG.
  • the system management board 410 assigns a main fan controller to each fan control group.
  • the partition # 0 is included in the fan control group # 0.
  • SB # 0 and SB # 1 are included in the partition # 0.
  • the system management board 410 selects one fan controller # 0 in ascending order from the fan controllers in the partition # 0, that is, the fan controllers # 0 and # 1 included in the SBs # 0 and # 1. .
  • the system management board 410 assigns the selected fan controller # 0 to the main fan controller of the fan control group # 0 as in the fan controller assignment information 800 shown in FIG.
  • the system management board 410 assigns a fan controller # 1 other than the selected fan controller # 0 in the partition # 0 to the standby fan controller.
  • step S1303 If a plurality of fan controllers are included in the fan control group (step S1303: YES), the system management board 410 moves the process to step S1304. In this case, the system management board 410 allocates a fan controller other than the fan controller selected as the main fan controller among the fan controllers in the fan control group to the standby fan controller (step S1304).
  • the standby fan controller in this embodiment is a standby fan controller common to all fan control groups.
  • step S1305 the system management board 410 switches the fan controller used in each fan control group to the main fan controller assigned to each fan control group in the process of step S1302, S1310, or S1313.
  • the switching of the fan controller can be performed by switching the rotation speed instruction signals from the fan controllers # 0 to # 3 that are output from the respective switching devices to the fans. This switching can be performed by the system management board 410 outputting a switching instruction signal to the switch.
  • the system management board 410 determines the fan rotation speed for each fan control group. For example, the system management board 410 determines the fan rotation speed as follows. First, the system management board 410 acquires the SB temperature information included in the fan control group from the SB temperature information 900. Then, the system management board 410 selects the highest temperature among the temperatures included in the acquired temperature information. Then, the system management board 410 determines the fan speed necessary for obtaining the air volume necessary for cooling the SB at the selected temperature based on the air volume definition information 1000.
  • step S1307 the system management board 410 sets the fan rotation speed determined in step S1306 to the main fan controller of each fan control group. Then, the main fan controller of each fan control group drives the fans according to the set fan rotation speed.
  • the system management board 410 repeats the processes in steps S1306 to S1308. If any of the fan control groups detects a failure of the main fan controller (YES in step S1308), the system management board 410 sets “failed” in the state of the failed main fan controller in the fan controller allocation information 800. "Is set. Then, the system management board 410 determines whether or not there is a standby fan controller (step S1309).
  • step S1310 the system management board 410 refers to the fan controller assignment information 800 and selects one fan controller assigned to the standby fan controller. Then, the system management board 410 assigns the selected standby system fan controller to the main system fan controller instead of the failed main system fan controller (step S1310).
  • step S1310 when the failure of the fan controller # 0 shown in FIG. 8 is detected in step S1308, in step S1310, the system management board 410 changes the fan controller # 1 to the fan control group # 0 as shown in FIG. Assign to the main fan controller.
  • the system management board 410 moves the process to step S1305.
  • the system management board 410 determines whether or not there is a fan control group including the main system fan controller that operates normally (step S1311).
  • the presence / absence of a fan control group including a main fan controller that operates normally is determined by referring to the fan controller assignment information 800 and the fan control group to which a fan controller whose state is “normal” is assigned as the main fan controller. It can be determined by the presence or absence.
  • step S1311 When there is a fan control group including a main system fan controller that operates normally (step S1311: NO), the system management board 410 moves the process to step S1312. In this case, the system management board 410 creates a fan control group in which the fan control group including the fan controller in which the failure is detected in step S1308 and the fan control group including the main fan controller that operates normally are collected ( Step S1312).
  • step S1308 the system management board 410 in step S1312, the fan control that combines the fan control groups # 0 and # 1 as shown in FIG. Create group # 4.
  • step S1313 the system management board 410 assigns the main fan controller to the fan control group created in step S1312.
  • the main fan controller to be assigned at this time a normally operating one of the main fan controllers assigned to the fan control group collected in the fan control group created in step S1312 can be used.
  • step S1312 For example, consider a case where a failure of the fan controller # 1 shown in FIG. 14 is detected in step S1308, and a fan control group # 4 shown in FIG. 15 is created in step S1312.
  • the fan controller # 2 that operates normally is changed to the fan control group. It can be assigned to the # 4 main fan controller.
  • step S1313 the system management board 410 shifts the process to step S1305. If there is no fan control group including a main fan controller that operates normally (YES in step S1311), the system management board 410 stops the system of all partitions (step S1314). Then, the system management board 410 ends the process of the information processing system 400 (step S1315).
  • FIG. 14 is a diagram showing an example of fan controller assignment information 1400 when fan controller # 0 shown in FIG. 8 fails and fan controller # 1 is assigned to the primary fan controller of fan control group # 0. is there.
  • FIG. 15 is a diagram showing an example of fan control group setting information 1500 when fan controller # 1 shown in FIG. 14 fails and fan control group # 4 in which fan control groups # 0 and # 1 are combined is created. is there.
  • FIG. 16 shows fan controller assignment information 1600 when fan controller # 1 shown in FIG. 14 fails and fan controller # 2 is assigned to the primary fan controller of fan control group # 4 shown in FIG. It is a figure which shows the example of.
  • control groups # 0 to # 2 are examples of groups that classify fans.
  • FAN # 0- # 3 is an example of a fan.
  • Fan controllers # 0- # 3 are examples of fan control means.
  • the switches # 0 to # 3 are listed as an example of a selection unit.
  • the system management board 410 is an example of a control unit.
  • the standby fan controller is an example of a preliminary control means.
  • the temperature sensors # 0 to # 3 are examples of temperature detection means.
  • SB # 0-SB # 3 are examples of information processing means.
  • Partitions # 0- # 2 are an example of a group to which the information processing means belongs.
  • the information processing system 400 creates a control group for each partition. Then, the information processing system 400 assigns one main fan controller for each control group. Then, the information processing system 400 uses the main fan controller for each control group to cool the SB by the fan.
  • the information processing system 400 can perform fan operation with an air volume appropriate for cooling the SB included in the fan control group in accordance with the operating state of the SB included in the fan control group for each fan control group. . As described above, the information processing system 400 can efficiently cool the devices in the information processing system 400 according to the device configuration of the information processing system 400.
  • the information processing system 400 operates the fan with an air volume appropriate for cooling the SB included in the fan control group for each fan control group, it is possible to suppress unnecessary power consumption due to excessive fan operation.
  • the information processing system 400 uses a fan controller that has not been assigned to the control group as the main fan controller as a standby fan controller.
  • the information processing system 400 detects a failure in the main fan controller, the information processing system 400 replaces the failed main fan controller with the standby fan controller in the control group to which the failed main fan controller is assigned. Assign as a fan controller.
  • the information processing system 400 does not prepare a dedicated fan controller for redundancy of the fan controller.
  • the information processing system 400 uses a surplus fan controller as a standby fan controller when it is assigned to a control group as a main fan controller.
  • the information processing system 400 can provide fan controller redundancy while suppressing an increase in the number of devices such as a redundant dedicated fan controller and a control circuit necessary for the control.
  • the manufacturing cost of the information processing system 400 can be reduced as compared with a case where the dedicated fan controller is used to make the fan controller redundant.
  • the information processing system 400 detects a failure in the main fan controller in a state where there is no standby fan controller, the control group to which the main fan controller in which the failure has occurred is assigned, the other control groups, A new control group is created. Then, the information processing system 400 assigns the main fan controller assigned to the other control group to the main fan controller of the newly created control group. Then, the information processing system 400 continues the FAN operation for each fan control group with an air volume appropriate for cooling the SB included in the fan control group in accordance with the operating state of the SB included in the fan control group.
  • the information processing system 400 is configured in accordance with the apparatus configuration of the information processing system 400 even if a failure occurs in the main fan controller assigned to the control group in a state where there is no standby fan controller.
  • the inside device can be efficiently cooled.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Thermal Sciences (AREA)
  • Cooling Or The Like Of Electrical Apparatus (AREA)

Abstract

 情報処理システムに、2以上のグループに分類可能な複数のファンと、ファンを制御する複数のファン制御手段と、複数のファンのそれぞれに対応づけて設けられ、複数のファン制御手段の中から対応するファンを制御するファン制御手段を選択する複数の選択手段と、同じグループに属するファンを制御するファン制御手段として共通のファン制御手段を選択するように、複数の選択手段を制御する制御手段と、を備える。

Description

情報処理システム、制御装置および制御方法
 本発明は、複数の冷却装置を備える情報処理システム、制御装置および制御方法に関する。
 従来、内蔵する回転翼をモータ等で回転して送風するファンを複数備える情報処理システムがある。
 図1は、ファンを冗長化した情報処理システム100の概要を示す図である。
 情報処理システム100は、複数のシステムボード(SB;System Board)SB#0-SB#3と、FAN#0A-#3AおよびFAN#0B-#3Bと、ファンコントローラ#Aおよび#Bと、システムマネジメントボード110と、を備える。
 SB#0-SB#3は、それぞれ、図示しないが、CPU(Central Processing Unit)、メモリモジュール、メモリコントローラ、システムコントローラおよびIOコントローラなどを備える。そして、SB#0-SB#3は、それぞれ、単体で独立した一つの情報処理ユニットとして機能することができる。また、SB#0-SB#3は、SB#0-SB#3のうち複数のシステムボードを相互に接続して1つの独立した情報処理を行なうパーティショニングの機能を備える。このように、複数のシステムボードを相互に接続して1つの独立した情報処理を行なう単位を、「パーティション」という。
 また、SB#0-SB#3は、それぞれ温度センサ#0-#3を備える。温度センサ#0は、SB#0周囲の温度を計測してシステムマネジメントボード110に通知する。同様に、温度センサ#1、#2および#3は、それぞれSB#1、#2および#3の周囲の温度を計測してシステムマネジメントボード110に通知する。
 FAN#0AおよびFAN#0Bは、ファンを回転して送風することによってSB#0を冷却する冷却装置である。同様に、FAN#1AおよびFAN#1B、FAN#2AおよびFAN#2B、FAN#3AおよびFAN#3Bは、ファンを回転して送風することによって、それぞれSB#1、SB#2、SB#3を冷却する冷却装置である。
 ファンコントローラ#Aは、A系のファン、すなわち、FAN#0A-#3Aを同時に駆動させる装置である。ファンコントローラ#Aは、システムマネジメントボード110からの指示にしたがって、FAN#0A-#3Aのファン回転数を調整する。また、ファンコントローラ#Bは、B系のファン、すなわち、FAN#0B-#3Bを同時に駆動させる装置である。ファンコントローラ#Bは、システムマネジメントボード110からの指示にしたがって、FAN#0B-#3Bのファン回転数を調整する。
 システムマネジメントボード110は、情報処理システム100に含まれるファン、すなわち、FAN#0A-#3AおよびFAN#0B-#3B、を制御する装置である。システムマネジメントボード110は、温度センサ#0-#3から通知される温度に基づいて、SB#0-#3の動作に適した温度を維持するために必要なファン回転数を決定する。そして、システムマネジメントボード110は、決定したファン回転数を、ファンコントローラ#Aおよび#Bに通知する。
 図2は、情報処理システム100を複数のパーティションに分割した場合の例を示す図である。
 情報処理システム100は、2つのパーティション、すなわち、SB#0を含むパーティション#0と、SB#1-#3を含むパーティション#1と、に情報処理システム100を分割した場合の例を示している。
 図1で説明したように、各SB#nは、それぞれ2個のFAN#nAおよび#nB、ただしnは0から3までの整数、によって冷却される。そして、各ファンを駆動するファンコントローラは、A系とB系の2系統に冗長化されている。例えば、ファンコントローラ#Aは、パーティション#0およびパーティション#1のA系のファン、すなわち、FAN#nA、の回転数を制御する。また、ファンコントローラ#Bは、パーティション#0およびパーティション#1に含まれるB系のファン、すなわち、FAN#nB、の回転数を制御する。
 通常の運用では、各SB#nは、2個のファン、すなわち、FAN#nAおよび#nBによって冷却される。この場合、FAN#nAおよび#nBは、それぞれ、SB#nの冷却に必要な風量の50%の風量を出力するファン回転数で駆動する。
 ここで、SB#n発熱量は、パーティションの稼動状態、パーティションに含まれるシステムボードの数や搭載物、例えば、CPU、メモリモジュール等の違い、によって異なる。システムマネジメントボード110は、温度センサ#0-#3から通知される温度のうち、最も高温の温度を用いてファン回転数を決定する。そして、システムマネジメントボード110は、ファンコントローラ#Aおよび#Bにより、全てのファンを、決定したファン回転数で動作させる。
 また、例えば、ファンコントローラ#Bが故障すると、ファンコントローラ#Bに接続されているB系のFAN#nBのファン回転数を制御できなくなる。この場合、システムマネジメントボード110は、冷却に必要な風量の50%の風量を出力するファン回転数で駆動していたA系のFAN#nAを、冷却に必要な風量の100%の風量を出力するファン回転数で駆動させる。
 図3は、ファン毎に冗長化したファンコントローラを備える情報処理システム300の概要を示す図である。
 情報処理システム300は、SB#0-#3それぞれに1台ずつ、SBを冷却するファンを備える。例えば、FAN#nは、SB#nを冷却するファンである。そして、FAN#nには、FAN#nを駆動する2つのファンコントローラ、すなわち、主系ファンコントローラ#nAと待機系ファンコントローラ#nBが、切替器31nを介して接続されている。
 主系ファンコントローラ#nAおよび待機系ファンコントローラ#nBは、システムマネジメントボード320の指示にしたがってFAN#nを駆動する。
 システムマネジメントボード320は、温度センサ#nから通知される温度に基づいて、SB#nの動作に適した温度を維持するために必要なファン回転数を決定する。そして、通常運用時、システムマネジメントボード320は、ファンコントローラ#nAを使用して、決定したファン回転数でFAN#nを駆動する。
 また、ファンコントローラ#nAが故障すると、システムマネジメントボード320は、ファンコントローラをファンコントローラ#nAから#nBに切り替える。そして、システムマネジメントボード320は、ファンコントローラ#nBを使用してFAN#nを駆動する。
 上記技術に関連して、電子装置の冷却システムに冗長性をもたせることにより2種ある空気移動装置のいずれかにバックアップ機能を付与して器材の信頼性をたかめる強制空冷システムが知られている。
 ファンフィルタユニットでファンが故障した場合にも、バックアップ機能を働かせることにより、所定の風量を維持して運転を継続させて清浄度を保つ、ファンフィルタユニットの制御装置が知られている。
 主系マイクロプロセッサからファンコントローラへのファン制御信号が一定時間以上停止するとファン回転数を最高回転に維持し、待機系マイクロプロセッサからファン制御信号の送出が再開するとファンの回転数を最高回転から解除するファン制御装置が知られている。
特開平06-209177号公報 特開2007-107830号公報 特開2008-169784号公報
 図1で説明した情報処理システム100は、全てのファンのファン回転数を、温度センサから得られる温度のうち最も高い温度に合わせて一律に制御する。そのため、例えば、図2において、パーティション#0が稼動していれば、システムマネジメントボード110は、パーティション#1が停止していても、パーティション#1に含まれるSB#1-#3を冷却するために、FAN#1A-#3Aおよび#1B-#3Bを駆動する。この場合、パーティション#1に含まれるSB#1-#3に対する冷却により、無駄な電力を消費することになる。
 このように、各SB#0-#3の冷却に必要な風量は、パーティションの稼動状態や、パーティションの搭載物、例えば、CPUやメモリモジュール等の違いなど、によって発熱量が異なるため、ファンのファン回転数を一律に制御することに問題がある。
 また、図3で説明した情報処理システム300は、システムボードごとに主系ファンコントローラと待機系ファンコントローラを用意することでシステムボードごとに回転数を制御しつつ、主系ファンコントローラが故障した際には待機系ファンコントローラに切り替える。この場合、システムマネジメントボード320が制御するファンコントローラ数が多くなる。そのため、ファンコントローラやシステムマネジメントボード320の回路規模が増大するため、製造コストも増大する。
 本情報処理システムは、1つの側面では、本情報処理システムの装置構成に合わせて効率よく冷却を行なうことができる情報処理システムを提供することを目的とする。
 本情報処理システムの1つの観点によれば、本情報処理システムは、複数のファンと、複数のファン制御手段と、複数の選択手段と、制御手段と、を備える。
 前記ファンは、2以上のグループに分類可能な送風装置である。
 前記ファン制御手段は、前記ファンを制御する手段である。
 前記選択手段は、前記複数のファンのそれぞれに対応づけて設けられ、前記複数のファン制御手段の中から対応するファンを制御するファン制御手段を選択する手段である。
 前記制御手段は、同じグループに属するファンを制御するファン制御手段として共通のファン制御手段を選択するように、前記複数の選択手段を制御する手段である。
 本情報処理システムは、1つの態様では、本情報処理システムの装置構成に合わせて効率よく冷却を行なうことができる。
ファンを冗長化した情報処理システム100の概要を示す図である。 情報処理システム100を複数のパーティションに分割した場合の例を示す図である。 ファン毎に冗長化したファンコントローラを備える情報処理システム300の概要を示す図である。 一実施例に係る情報処理システム400の構成例を示す図である。 情報処理システム400に含まれるSB#0-#3を、3つのパーティション#0-#2に分割した場合の例を示す図である。 パーティション設定情報600の例を示す図である。 ファン制御グループ設定情報700の例を示す図である。 ファンコントローラ割り当て情報800の例を示す図である。 SB温度情報900の例を示す図である。 風量定義情報1000の例を示す図である。 ファン回転数設定情報1100の例を示す図である。 ファン回転数情報1200の例を示す図である。 システムマネジメントボード410の動作を示すフローチャートである。 ファンコントローラ#1を、ファン制御グループ#0の主系ファンコントローラに割り当てた場合のファンコントローラ割り当て情報1400の例を示す図である。 ファン制御グループ#0と#1をまとめたファン制御グループ#4を作成した場合のファン制御グループ設定情報1500の例を示す図である。 ファン制御グループ#4にまとめられたファン制御グループに含まれる主系ファンコントローラのうち正常に動作するファンコントローラ#2を、ファン制御グループ#4の主系ファンコントローラに割り当てた場合のファンコントローラ割り当て情報1600の例を示す図である。
 以下、本発明の実施形態の一例について、図4~図16に基づいて説明する。なお、以下に説明する実施形態はあくまでも例示であり、以下に明示しない種々の変形や技術の適用を排除する意図ではない。すなわち、本発明は、その趣旨を逸脱しない範囲で、記載した技術を組み合わせるなど種々変形して実施することができる。また、図13にフローチャートの形式で示した処理手順は、処理の順番を限定する趣旨ではない。したがって、可能な場合には、処理の順番を入れ替えても良いのは当然である。
 ≪実施例≫
 図4は、一実施例に係る情報処理システム400の構成例を示す図である。
 情報処理システム400は、複数のシステムボードSB#0-#3と、ファンFAN#0-#3と、システムマネジメントボード410と、を備える。
 SB#0-#3は、それぞれ、図示しないが、CPU、メモリモジュール、メモリコントローラ、システムコントローラおよびIOコントローラなどを備える。そして、SB#0-#3は、それぞれ、単体で独立した一つの情報処理ユニットとして機能することができる。また、SB#0-SB#3は、SB#0-SB#3のうち複数のシステムボードと相互に接続して1つの独立した情報処理を行なうパーティショニングの機能を備える。このように、複数のシステムボードを相互に接続して1つの独立した情報処理を行なう単位を、「パーティション」という。
 なお、本実施例では、システムボードをパーティションの最小単位としているが、例えば、1または2以上のシステムボードに含まれる資源の一部または全部をパーティションの最小単位としてもよい。
 情報処理システム400に含まれるSB#0-#3は、それぞれ同様の構成を有する。そのため、以下では、代表して、SB#0について説明する。ただし、SB#0-#3が、それぞれ同様の構成であることに限定する趣旨ではない。同様に、情報処理システム400に含まれるFAN#0-#3は、それぞれ同様の構成を有するので、代表して、FAN#0について説明する。
 SB#0は、IO入出力ポート#0と、温度センサ#0と、ファンコントローラ#0と、切り替え器#0と、を備える。なお、SB#0は、ファンコントローラを1台備える場合を示しているが、2台以上ファンコントローラを備えてもよい。また、本実施例では、ファンコントローラ#0はSB#0上に搭載されているが、SB#0上に搭載されていなくてもよい。例えば、ファンコントローラ#0-#3は、それぞれSB#0-3とは別のユニットとして、情報処理システム400に備えることもできる。ただし、ファンコントローラの数は、パーティションを構築できる最大数、本実施例ではSBの数、に対応することが望ましい。
 IO入出力ポート#0は、SB間接続バスを接続するための複数のポートを備えるインタフェースである。IO入出力ポート#0は、システムマネジメントボード410から出力されるポート制御信号にしたがって、ポートの有効/無効を切り替える。例えば、SB#0-#1間を接続するポートが有効になると、SB#0-#1は、相互に通信可能に接続される。これにより、SB#0-#1は、相互に接続して1つの独立した情報処理を行なうことができる。
 温度センサ#0は、SB#0周囲の温度を計測するセンサである。温度センサ#0は、計測した温度を含む温度情報信号をシステムマネジメントボード410に出力することにより、計測した温度をシステムマネジメントボード410に通知する。
 ファンコントローラ#0は、システムマネジメントボード410から回転数設定信号を受信する。すると、ファンコントローラ#0は回転数指示信号を生成する。回転数指示信号は、ファンに含まれる、回転翼を回転させるモータ、を回転数設定信号に含まれる回転数で回転させるための信号である。本実施例では、ファンに含まれるモータの回転数を「ファン回転数」という。ファンコントローラ#0は、情報処理システム400に含まれるFAN#0-#3に対して回転数指示信号を出力することによって、FAN#0-#3を駆動させる。
 例えば、FAN#0-#3に含まれる、回転翼を回転させるモータをPWM(Pulse Width Modulation)制御によって制御する場合、ファンコントローラ#0は、情報処理システム400に含まれるFAN#0-#3に対して、回転数指示信号としてPWM信号を出力する。ファンコントローラ#0は、ファン回転数が、システムマネジメントボード410から受信した回転数設定信号に含まれる回転数となるように、PWM信号のデューティ比を調整する。
 切り替え器#0は、システムマネジメントボード410から切替指示信号を受信する。切り替え器#0は、ファンコントローラ#0-#3から入力される回転数指示信号のうち、切替指示信号で指定されたファンコントローラから入力された回転数指示信号をFAN#0に出力する。
 FAN#0は、回転翼420aと、回転翼420aを回転させるためのモータ420bと、を備える送風機である。FAN#0は、回転翼420aを回転して送風することによってSB#0を冷却する。
 FAN#0は、切り替え器#0から入力される回転数指示信号にしたがって、モータ420bを回転する。例えば、回転数指示信号がPWM信号の場合、FAN#0は、切り替え器#0から入力されるPWM信号を使用したPWM制御によって、モータ420bを回転させる。
 FAN#0は、現在のモータ420bの回転数を情報として含む回転数情報信号をシステムマネジメントボード410に出力することにより、現在のファン回転数をシステムマネジメントボード410に通知する。
 なお、図4では単一のファンをひとつのシステムボードに対応付けているが、複数のファンからなるファン群をひとつのシステムボードに対応付けてもよい。システムボードにファン群が対応付けられている場合には、このファン群を図4の「ファン」に相当する要素として考えればよく、ファン群を構成する複数ファンを単一のファンコントローラが制御する。また、切り替え器は各ファン群に対して設けられる。
 システムマネジメントボード410は、情報処理システム400に含まれる装置全体を制御する制御装置である。
 システムマネジメントボード410は記憶装置411を備える。記憶装置411は、パーティション設定情報600、ファン制御グループ設定情報700、ファンコントローラ割り当て情報800、SB温度情報900、風量定義情報1000、ファン回転数設定情報1100およびファン回転数情報1200を記憶する。記憶装置411には、例えば、RAM(Random Access Memory)などの揮発性メモリやEPROM(Erasable Programmable Read Only Memory)などの不揮発性メモリなどを使用することができる。
 システムマネジメントボード410は、ディスプレイやキーボード、マウスなどの入出力装置等を含むユーザインタフェース412を介して、ユーザが任意に設定するパーティションの構成を取得する。すると、システムマネジメントボード410は、取得したパーティションの構成をパーティション設定情報600として記憶装置411に記憶する。
 システムマネジメントボード410は、パーティション設定情報600にしたがって、同一パーティション内のSB間をSB間接続バスで接続する。具体的には、システムマネジメントボード410は、SB#0-#3それぞれに備わる入出力ポート#0-#3に対して、ポート制御信号を出力して、同一パーティション内のSB間を接続するポートの有効化と、その他のポートの無効化と、を指示する。すると、入出力ポート#0-#3は、システムマネジメントボード410から指示されたポートを有効化または無効化にする。
 システムマネジメントボード410は、パーティション設定情報600を基に、パーティション毎のファン制御グループを作成する。システムマネジメントボード410は、作成したファン制御グループをファン制御グループ設定情報700として記憶装置411に記憶する。
 システムマネジメントボード410は、ファン制御グループ毎に、使用するファンコントローラを割り当てる。この割り当てたファンコントローラを「主系ファンコントローラ」という。ファン制御グループ内に複数のファンコントローラが存在する場合、システムマネジメントボード410は、ファン制御グループ内に存在する複数のファンコントローラから任意のファンコントローラを1つ選択してファン制御グループに割り当てる。
 なお、主系ファンコントローラ以外のファンコントローラを、「待機系ファンコントローラ」という。待機系ファンコントローラは、任意の主系ファンコントローラが故障などして正常に動作しない場合に使用される。
 システムマネジメントボード410は、ファン制御グループ毎に割り当てた主系ファンコントローラなどを、ファンコントローラ割り当て情報800として記憶装置411に記憶する。
 システムマネジメントボード410は、各温度センサ#0-#3が出力する温度情報信号から、各温度センサ#0-#3が計測した温度情報を取得すると、SB温度情報900として記憶装置411に記憶する。
 システムマネジメントボード410は、SB温度情報900を参照する。そして、システムマネジメントボード410は、ファン制御グループ毎に、ファン制御グループに含まれる各SBの温度情報を取得する。そして、システムマネジメントボード410は、ファン制御グループ毎に、例えば、ファン制御グループに含まれる最も高温のSBを冷却するために必要な風量となるファン回転数を決定する。このとき、システムマネジメントボード410は、ファン回転数を、風量定義情報1000に基づいて決定する。
 システムマネジメントボード410は、決定したファン回転数を情報として含む回転数設定信号を各主系ファンコントローラに出力することにより、各主系ファンコントローラにファン回転数を設定する。また、システムマネジメントボード410は、各主系ファンコントローラに設定したファン回転数を、ファン回転数設定情報1100として記憶装置411に記憶する。
 システムマネジメントボード410は、定期的に、各FAN#0-#3が出力する回転数情報信号から、各FAN#0-#3のファン回転数を取得する。そして、システムマネジメントボード410は、取得したファン回転数をファン回転数情報1200として記憶装置411に記憶する。
 システムマネジメントボード410は、主系ファンコントローラの故障を検出する。例えば、システムマネジメントボード410は、ファン回転数設定情報1100とファン回転数情報1200とを比較し、ファン回転数に一定以上の差がある場合、ファンコントローラが故障したと判別することができる。
 システムマネジメントボード410は、主系ファンコントローラの故障を検出すると、ファンコントローラ割り当て情報800を参照して、待機系ファンコントローラを選択する。このとき、システムマネジメントボード410は、例えば、待機系ファンコントローラのうち、若番のファンコントローラを1つ選択する。そして、システムマネジメントボード410は、選択した待機系ファンコントローラを、故障した主系ファンコントローラの代わりに、主系ファンコントローラに割り当てる。
 待機系ファンコントローラがない場合、システムマネジメントボード410は、故障を検出した主系ファンコントローラを含むファン制御グループと、任意に選択した他のファン制御グループと、を合わせて1つのファン制御グループを作成する。そして、システムマネジメントボード410は、作成したファン制御グループに、任意に選択した他のファン制御グループに含まれていた主系ファンコントローラを割り当てる。
 図5は、情報処理システム400に含まれるSB#0-#3を、3つのパーティション#0-#2に分割した場合の例を示している。この場合、パーティション設定情報600は、図6のようになる。
 なお、図5は、情報処理システム400に含まれる装置の配置が図4と異なっているが、これはパーティション毎の構成の理解を容易にするためであって、情報処理システム400に含まれる装置の配置を限定する趣旨ではない。
 パーティション#0に含まれるSB#0-#1を接続するポート、すなわち、入出力ポート#0のポートCと入出力ポート#1のポートAは有効となり、SB#0-#1間はSB間接続バスで相互に接続している。また、パーティション#0に含まれるSB#0-#1を接続するポート以外のポートは無効となっている。
 システムマネジメントボード410は、パーティション毎にファン制御グループを作成する。図5では、パーティション#0に対応するファン制御グループ#0と、パーティション#1に対応するファン制御グループ#1と、パーティション#2に対応するファン制御グループ##2と、が作成されている。この場合、ファン制御グループ設定情報700は、図7に示すようになる。
 システムマネジメントボード410は、ファン制御グループ毎に、主系ファンコントローラを割り当てる。図5では、ファン制御グループ#0に対してファンコントローラ#0が主系ファンコントローラに割り当てられている。また、ファン制御グループ#0に含まれる他のファンコントローラ#1は、全ファン制御グループ共通の待機系ファンコントローラに割り当てられている。同様に、ファン制御グループ#1に対してファンコントローラ#2が主系ファンコントローラに割り当てられ、ファン制御グループ#2に対してファンコントローラ#3が主系ファンコントローラに割り当てられている。この場合、ファンコントローラ割り当て情報800は、図8に示すようになる。
 図6は、パーティション設定情報600の例を示す図である。
 パーティション設定情報600は、パーティションと、各パーティションに含まれるSBを示すSB構成情報と、を含む情報である。図6のパーティション設定情報600は、パーティション#0にSB#0およびSB#1が含まれ、パーティション#1にSB#2が含まれ、パーティション#2にSB#3が含まれる場合のパーティション設定情報を例示している。
 図7は、ファン制御グループ設定情報700の例を示す図である。
 ファン制御グループ設定情報700は、ファン制御グループと、各ファン制御グループに含まれるパーティションを示すパーティション構成情報と、を含む情報である。図7では、パーティションを「PT」と略記している。図7のファン制御グループ設定情報700は、ファン制御グループ#0にPT#0が含まれ、ファン制御グループ#1にPT#1が含まれ、ファン制御グループ#2にPT#2が含まれる場合のファン制御グループ設定情報を例示している。
 図8は、ファンコントローラ割り当て情報800の例を示す図である。
 ファンコントローラ割り当て情報800は、ファンコントローラと、ファンコントローラを主系ファンコントローラとして割り当てた割り当て先のファン制御グループと、を含む情報である。また、ファンコントローラ割り当て情報800には、各ファンコントローラの状態、例えば、正常または故障を示す情報を含むことができる。
 図8のファンコントローラ割り当て情報800の例では、ファンコントローラ#0、#2および#3が、主系ファンコントローラとして、それぞれファン制御グループ#0、#1および#2に割り当てられている。なお、ファンコントローラ割り当て情報800に「待機」と記載されているが、これは、ファンコントローラ#1が、待機系ファンコントローラに割り当てられていることを示している。
 図9は、SB温度情報900の例を示す図である。
 SB温度情報900は、SBと、SBの現在の温度と、を含む情報である。システムマネジメントボード410は、一定時間毎に、各温度センサ#0-#3が出力する温度情報信号から温度情報を取得してSBの現在の温度を更新する。
 図10は、風量定義情報1000の例を示す図である。
 風量定義情報1000は、SBの温度と、その温度のSBを冷却するために必要な風量を得るためにファンに設定する回転数と、を含む情報である。本実施例に係る風量定義情報1000は、SBの特定の温度範囲毎に、ファンに設定する回転数が定義されている。ファンに設定する回転数は、あらかじめ評価試験などを行なって決定することができる。なお、図10では、ファンの最大回転数に対する割合で、ファンに設定する回転数を示している。同様に、後述する図11および図12の回転数も、ファンの最大回転数に対する割合で示している。
 図11は、ファン回転数設定情報1100の例を示す図である。
 ファン回転数設定情報1100は、ファンと、各ファンに設定した回転数と、を含む情報である。システムマネジメントボード410は、各FANにファン回転数を設定すると、その設定したファン回転数をファン回転数設定情報1100として記憶装置411に記憶する。
 図12は、ファン回転数情報1200の例を示す図である。
 ファン回転数情報1200は、ファンと、各ファンの現在の回転数と、を含む情報である。システムマネジメントボード410は、一定時間毎に、各ファンが出力する回転数情報信号から、各ファンの現在の回転数を取得してファン回転数情報1200として記憶装置411に記憶する。
 図13は、システムマネジメントボード410の動作を示すフローチャートである。
 システムマネジメントボード410は、以下の処理を実行する(ステップS1300)。
 ステップS1301において、システムマネジメントボード410は、パーティション単位でファン制御グループを作成する。例えば、図6に示すパーティション設定情報600では、パーティションが、パーティション#0-#2に分割されている。この場合、システムマネジメントボード410は、図7に示すファン制御グループ設定情報700のように、パーティション#0-#2それぞれに対応したファン制御グループ#0-#2を作成する。
 ステップS1302において、システムマネジメントボード410は、各ファン制御グループに、主系ファンコントローラを割り当てる。例えば、図7に示すファン制御グループ設定情報700の例では、ファン制御グループ#0にパーティション#0が含まれる。そして、図6に示すパーティション設定情報600の例では、パーティション#0内にSB#0とSB#1が含まれる。この場合、システムマネジメントボード410は、パーティション#0内のファンコントローラ、すなわち、SB#0および#1に含まれるファンコントローラ#0および#1から、若番順に、ファンコントローラ#0を1つ選択する。そして、システムマネジメントボード410は、図8に示すファンコントローラ割り当て情報800のように、選択したファンコントローラ#0をファン制御グループ#0の主系ファンコントローラに割り当てる。また、ステップS1303およびS1304で後述するように、システムマネジメントボード410は、パーティション#0内の、選択したファンコントローラ#0以外のファンコントローラ#1を、待機系ファンコントローラに割り当てる。
 ファン制御グループ内に複数のファンコントローラが含まれる場合(ステップS1303 YES)、システムマネジメントボード410は、処理をステップS1304に移行する。この場合、システムマネジメントボード410は、ファン制御グループ内のファンコントローラのうち、主系ファンコントローラとして選択したファンコントローラ以外のファンコントローラを待機系ファンコントローラに割り当てる(ステップS1304)。なお、本実施例における待機系ファンコントローラは、全てのファン制御グループ共通の待機系ファンコントローラである。
 ステップS1305において、システムマネジメントボード410は、各ファン制御グループで使用するファンコントローラを、ステップS1302、S1310またはS1313の処理で各ファン制御グループに割り当てた主系ファンコントローラに切り替える。
 ファンコントローラの切り替えは、各切り替え器がファンに出力する、ファンコントローラ#0-#3からの回転数指示信号、を切り替えることにより行なうことができる。この切り替えは、システムマネジメントボード410が切り替え器に切替指示信号を出力することによって行なうことができる。
 ステップS1306において、システムマネジメントボード410は、ファン制御グループ毎に、ファン回転数を決定する。例えば、システムマネジメントボード410は、次のようにしてファン回転数を決定する。まず、システムマネジメントボード410は、ファン制御グループに含まれるSBの温度情報を、SB温度情報900から取得する。そして、システムマネジメントボード410は、取得した温度情報に含まれる温度のうち、最も高温の温度を選択する。そして、システムマネジメントボード410は、選択した温度のSBの冷却に必要な風量を得るために必要なファン回転数を、風量定義情報1000に基づいて決定する。
 ステップS1307において、システムマネジメントボード410は、各ファン制御グループの主系ファンコントローラに、ステップS1306で決定したファン回転数を設定する。すると、各ファン制御グループの主系ファンコントローラは、設定されたファン回転数にしたがってファンを駆動させる。
 故障している主系ファンコントローラがない場合(ステップS1308 NO)、システムマネジメントボード410は、ステップS1306-S1308の処理を繰返し行なう。また、いずれかのファン制御グループで、主系ファンコントローラの故障を検出すると(ステップS1308 YES)、システムマネジメントボード410は、ファンコントローラ割り当て情報800のうち、故障した主系ファンコントローラの状態に「故障」と設定する。そして、システムマネジメントボード410は、待機系ファンコントローラの有無を判別する(ステップS1309)。
 待機系ファンコントローラが少なくとも1つ以上ある場合(ステップS1309 NO)、システムマネジメントボード410は、処理をステップS1310に移行する。この場合、システムマネジメントボード410は、ファンコントローラ割り当て情報800を参照し、待機系ファンコントローラに割り当てられているファンコントローラを1つ選択する。そして、システムマネジメントボード410は、故障した主系ファンコントローラに替えて、選択した待機系ファンコントローラを主系ファンコントローラに割り当てる(ステップS1310)。
 例えば、ステップS1308で、図8に示したファンコントローラ#0の故障を検出すると、ステップS1310で、システムマネジメントボード410は、図14に示すように、ファンコントローラ#1を、ファン制御グループ#0の主系ファンコントローラに割り当てる。
 ステップS1310の処理が終了すると、システムマネジメントボード410は、処理をステップS1305に移行する。
 一方、待機系ファンコントローラがない場合(ステップS1309 YES)、システムマネジメントボード410は、正常に動作する主系ファンコントローラを含むファン制御グループの有無を判別する(ステップS1311)。正常に動作する主系ファンコントローラを含むファン制御グループの有無は、ファンコントローラ割り当て情報800を参照して、状態が「正常」であるファンコントローラが主系ファンコントローラとして割り当てられているファン制御グループの有無により判別することができる。
 正常に動作する主系ファンコントローラを含むファン制御グループがある場合(ステップS1311 NO)、システムマネジメントボード410は、処理をステップS1312に移行する。この場合、システムマネジメントボード410は、ステップS1308で故障を検出したファンコントローラを含むファン制御グループと、正常に動作する主系ファンコントローラを含むファン制御グループと、をまとめたファン制御グループを作成する(ステップS1312)。
 例えば、ステップS1308で、図14に示すファンコントローラ#1の故障を検出すると、ステップS1312で、システムマネジメントボード410は、図15に示すように、ファン制御グループ#0と#1をまとめたファン制御グループ#4を作成する。
 ステップS1313において、システムマネジメントボード410は、ステップS1312で作成したファン制御グループに主系ファンコントローラを割り当てる。このとき割り当てる主系ファンコントローラには、ステップS1312で作成したファン制御グループにまとめられたファン制御グループに割り当てられていた主系ファンコントローラのうち正常に動作しているものを使用することができる。
 例えば、ステップS1308で、図14に示すファンコントローラ#1の故障を検出し、ステップS1312で、図15に示すファン制御グループ#4を作成した場合を考える。この場合、図16のように、ファン制御グループ#4にまとめられたファン制御グループ#0および#1に割り当てられていた主系ファンコントローラのうち正常に動作するファンコントローラ#2を、ファン制御グループ#4の主系ファンコントローラに割り当てることができる。
 ステップS1313の処理が終了すると、システムマネジメントボード410は、処理をステップS1305に移行する。
 正常に動作する主系ファンコントローラを含むファン制御グループがない場合(ステップS1311 YES)、システムマネジメントボード410は、全てのパーティションのシステムを停止する(ステップS1314)。そして、システムマネジメントボード410は、情報処理システム400の処理を終了する(ステップS1315)。
 図14は、図8に示したファンコントローラ#0が故障し、ファンコントローラ#1が、ファン制御グループ#0の主系ファンコントローラに割り当てられた場合のファンコントローラ割り当て情報1400の例を示す図である。
 図15は、図14に示すファンコントローラ#1が故障し、ファン制御グループ#0と#1をまとめたファン制御グループ#4が作成された場合のファン制御グループ設定情報1500の例を示す図である。
 図16は、図14に示したファンコントローラ#1が故障して、図15に示したファン制御グループ#4の主系ファンコントローラに、ファンコントローラ#2が割り当てられた場合のファンコントローラ割り当て情報1600の例を示す図である。
 以上の説明において、制御グループ#0-#2は、ファンを分類するグループの一例として挙げられる。FAN#0-#3は、ファンの一例として挙げられる。ファンコントローラ#0-#3は、ファン制御手段の一例として挙げられる。切り替え器#0-#3は、選択手段の一例として挙げられる。システムマネジメントボード410は、制御手段の一例として挙げられる。
 待機系ファンコントローラは、予備制御手段の一例として挙げられる。温度センサ#0-#3は、温度検出手段の一例として挙げられる。SB#0-SB#3は、情報処理手段の一例として挙げられる。パーティション#0-#2は、情報処理手段が属するグループの一例として挙げられる。
 以上に説明したように、情報処理システム400は、パーティション毎に制御グループを作成する。そして、情報処理システム400は、制御グループ毎に主系ファンコントローラを1つ割り当てる。そして、情報処理システム400は、制御グループ毎に、主系ファンコントローラを使用して、ファンによるSBの冷却を行なう。
 その結果、情報処理システム400は、ファン制御グループ毎に、ファン制御グループに含まれるSBの稼働状態に合わせて、ファン制御グループに含まれるSBの冷却に適切な風量でファン運転を行なうことができる。このように、情報処理システム400は、情報処理システム400の装置構成に合わせて、情報処理システム400内の装置を効率よく冷却することができる。
 また、情報処理システム400は、ファン制御グループ毎に、ファン制御グループに含まれるSBの冷却に適切な風量でファン運転するので、過剰なファン運転などによる余計な電力消費を抑えることができる。
 また、情報処理システム400は、制御グループに主系ファンコントローラとして割り当てなかったファンコントローラを、待機系ファンコントローラとして使用する。情報処理システム400は、主系ファンコントローラに障害を検出すると、障害が発生した主系ファンコントローラが割り当てられていた制御グループに、故障した主系ファンコントローラに替えて、待機系ファンコントローラを主系ファンコントローラとして割り当てる。
 このように、情報処理システム400は、ファンコントローラの冗長のために専用のファンコントローラを用意しない。情報処理システム400は、制御グループに主系ファンコントローラとして割り当てた際に余ったファンコントローラを待機系ファンコントローラとして使用する。その結果、情報処理システム400は、冗長専用のファンコントローラやその制御のために必要な制御回路などによる装置の増大を抑えつつ、ファンコントローラの冗長性を備えることができる。また、専用のファンコントローラを用いてファンコントローラを冗長構成にする場合に比べて、情報処理システム400の製造コストを抑えることができる。
 また、情報処理システム400は、待機系ファンコントローラがない状態で、主系ファンコントローラに障害を検出すると、障害が発生した主系ファンコントローラが割り当てられていた制御グループと、他の制御グループと、をまとめて1つの制御グループを新たに作成する。そして、情報処理システム400は、他の制御グループに割り当てられていた主系ファンコントローラを、新たに作成した制御グループの主系ファンコントローラに割り当てる。そして、情報処理システム400は、ファン制御グループ毎に、ファン制御グループに含まれるSBの稼働状態に合わせて、ファン制御グループに含まれるSBの冷却に適切な風量でFAN運転を継続する。
 このように、情報処理システム400は、待機系ファンコントローラがない状態で、制御グループに割り当てた主系ファンコントローラに障害が生じても、情報処理システム400の装置構成に合わせて、情報処理システム400内の装置を効率よく冷却することができる。

Claims (7)

  1.  2以上のグループに分類可能な複数のファンと、
     前記ファンを制御する複数のファン制御手段と、
     前記複数のファンのそれぞれに対応づけて設けられ、前記複数のファン制御手段の中から対応するファンを制御するファン制御手段を選択する複数の選択手段と、
     同じグループに属するファンを制御するファン制御手段として共通のファン制御手段を選択するように、前記複数の選択手段を制御する制御手段と、
     を備えたことを特徴とする情報処理システム。
  2.  前記制御手段は、
     前記共通のファン制御手段として選択されなかったファン制御手段を予備制御手段として設定し、
     いずれかのグループにおける前記共通のファン制御手段に障害が生じた場合、前記選択手段に対して、前記障害が生じたファン制御手段に替えて、前記予備制御手段を共通のファン制御手段として選択するように、前記複数の選択手段を制御する、
     ことを特徴とする請求項1に記載の情報処理システム。
  3.  前記共通のファン制御手段として選択されなかったファン制御手段が存在しない状態で、いずれかのグループにおける前記共通のファン制御手段に障害が生じた場合、前記制御手段は、前記障害が生じたファン制御手段のグループと他のいずれかのグループとを合わせて1つのグループを作成する、
     ことを特徴とする請求項1に記載の情報処理システム。
  4.  前記制御手段は、前記作成したグループにおける共通のファン制御手段として、前記他のいずれかのグループにおける共通のファン制御手段を選択するように、前記複数の選択手段を制御する、
     ことを特徴とする請求項3に記載の情報処理システム。
  5.  前記グループ毎に、グループに含まれる、所定の情報処理を行なう情報処理手段の温度を検出する温度検出手段を有し、
     前記制御手段は、前記グループに含まれる温度検出手段が検出した温度に基づいて、前記グループに含まれるファンを前記ファン制御手段に制御させる、
     ことを特徴とする請求項1に記載の情報処理システム。
  6.  ファンを制御する複数のファン制御手段から、2以上のグループに分類可能な複数のファンのうち同じグループに属するファンを制御するファン制御手段として共通のファン制御手段を特定する特定手段と、
     前記複数のファンのそれぞれに対応づけて設けられ、前記複数のファン制御手段の中から対応するファンを制御するファン制御手段を選択する複数の選択手段が、前記特定した共通のファン制御手段を選択するように制御する制御手段と、
     を備えたことを特徴とする情報処理システム。
  7.  ファンを制御する複数のファン制御手段から、2以上のグループに分類可能な複数のファンのうち同じグループに属するファンを制御するファン制御手段として共通のファン制御手段を特定し、
     前記複数のファンのそれぞれに対応づけて設けられ、前記複数のファン制御手段の中から対応するファンを制御するファン制御手段を選択する複数の選択手段が、前記特定した共通のファン制御手段を選択するように制御する、
     処理を情報処理装置に行なわせる制御方法。
PCT/JP2011/069930 2011-09-01 2011-09-01 情報処理システム、制御装置および制御方法 WO2013031006A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/069930 WO2013031006A1 (ja) 2011-09-01 2011-09-01 情報処理システム、制御装置および制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/069930 WO2013031006A1 (ja) 2011-09-01 2011-09-01 情報処理システム、制御装置および制御方法

Publications (1)

Publication Number Publication Date
WO2013031006A1 true WO2013031006A1 (ja) 2013-03-07

Family

ID=47755554

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/069930 WO2013031006A1 (ja) 2011-09-01 2011-09-01 情報処理システム、制御装置および制御方法

Country Status (1)

Country Link
WO (1) WO2013031006A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04275095A (ja) * 1991-03-01 1992-09-30 Fujitsu Ltd 記憶ディスク装置
JPH1140971A (ja) * 1997-07-15 1999-02-12 Fujitsu Ltd 冷却制御装置
JP2000187975A (ja) * 1998-12-22 2000-07-04 Nec Corp ディスクアレイ装置
JP2005057119A (ja) * 2003-08-06 2005-03-03 Nec Engineering Ltd 空冷方法および電子機器用冷却装置
JP2010205154A (ja) * 2009-03-05 2010-09-16 Fujitsu Ltd クロック供給方法及び情報処理装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04275095A (ja) * 1991-03-01 1992-09-30 Fujitsu Ltd 記憶ディスク装置
JPH1140971A (ja) * 1997-07-15 1999-02-12 Fujitsu Ltd 冷却制御装置
JP2000187975A (ja) * 1998-12-22 2000-07-04 Nec Corp ディスクアレイ装置
JP2005057119A (ja) * 2003-08-06 2005-03-03 Nec Engineering Ltd 空冷方法および電子機器用冷却装置
JP2010205154A (ja) * 2009-03-05 2010-09-16 Fujitsu Ltd クロック供給方法及び情報処理装置

Similar Documents

Publication Publication Date Title
US9801312B2 (en) Data center with air flow control
TWI582585B (zh) 機櫃的監控系統
EP3213611B1 (en) Data center pressure anomaly detection and remediation
EP1875139B1 (en) Intelligent fan assisted tiles for adaptive environmental management
US6932696B2 (en) Cooling system including redundant fan controllers
US20130171006A1 (en) Cooling system and control method
JP5290044B2 (ja) 空調機監視システム、および空調機監視方法
JP2015161489A (ja) データセンタ、制御装置の制御プログラムおよびデータセンタの制御方法
JP6191718B1 (ja) サーバ装置、サーバ制御方法、プログラム
JP2006064254A (ja) 空調機監視システム、および空調機監視方法
US11500435B2 (en) Information handling system having regional cooling
US20170024353A1 (en) Dedicated lan interface per ipmi instance on a multiple baseboard management controller (bmc) system with single physical network interface
US20160113154A1 (en) Liquid Cooling System and Control Method Thereof
JP2012060701A (ja) 複数台運転ファン駆動装置およびその故障処理方法
CN107420336A (zh) 一种基于服务器的高可靠性风扇控制装置及方法
US20160081232A1 (en) Fan Control Method and Network Device
US11585351B2 (en) Fan failure compensation
US20170083077A1 (en) Power management for heterogeneous computing systems
US20220408590A1 (en) Fan controller for fans of a multi-node computer system
WO2013031006A1 (ja) 情報処理システム、制御装置および制御方法
US8626343B2 (en) Monitor and control system and method for server model
US20160249491A1 (en) Heat-dissipating structure for vsd, and control method and device
CN103218281A (zh) 刀片式服务器监控系统
US20140327384A1 (en) Electronic device and control method
US10367881B2 (en) Management of computing infrastructure under emergency peak capacity conditions

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11871673

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11871673

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: JP