JP2011076158A - Server operation system and server operation method - Google Patents

Server operation system and server operation method Download PDF

Info

Publication number
JP2011076158A
JP2011076158A JP2009223962A JP2009223962A JP2011076158A JP 2011076158 A JP2011076158 A JP 2011076158A JP 2009223962 A JP2009223962 A JP 2009223962A JP 2009223962 A JP2009223962 A JP 2009223962A JP 2011076158 A JP2011076158 A JP 2011076158A
Authority
JP
Japan
Prior art keywords
management device
subsystem
server
master
servers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009223962A
Other languages
Japanese (ja)
Other versions
JP5454058B2 (en
Inventor
Takahiro Koishi
高裕 小石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2009223962A priority Critical patent/JP5454058B2/en
Publication of JP2011076158A publication Critical patent/JP2011076158A/en
Application granted granted Critical
Publication of JP5454058B2 publication Critical patent/JP5454058B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a technique for keeping temperature distribution inside a server room uniform, without fail. <P>SOLUTION: In a server system 100, a master management device 120 acquires temperature information representing the temperature at a location where the server 110 is placed, and provides a control device 130 with the acquired temperature information for each server 110 in the system. Based on the temperature information from the master management device 120, the control device 130 adjusts the load distribution among the servers 110 so as to uniform the temperature distribution among the locations where the respective servers 110 are installed. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、複数のサーバを備えたシステムの冷却に関する。   The present invention relates to cooling a system including a plurality of servers.

昨今のITインフラ統合に向けて、データセンターなどのサーバ室にブレードサーバを導入する動きが活発化している。ブレードサーバに代表される高密度サーバは、省スペースなどの利点があるものの、発熱密度が高いという問題がある。例えば、ブレードサーバを高密度に実装した場合、ラック1本あたりの発熱量は5〜30kwとなる場合もある。   For the recent IT infrastructure integration, the movement to introduce blade servers in server rooms such as data centers has become active. High-density servers represented by blade servers have the advantage of high heat generation density, although they have advantages such as space saving. For example, when blade servers are mounted at high density, the heat generation amount per rack may be 5 to 30 kW.

これに対して、従来のサーバ室の冷却設備は、通常、ラック1本あたりの発熱量を0.5〜2kw程度に想定して設けられている。そのため、ブレードサーバが導入したサーバ室では、十分な冷却が出来ずにホットスポットが発生し、ホットスポットの位置にあるサーバやIT機器がオーバーヒートを起こす可能性がある。一方、このようなことを解消するために、冷却設備の運転を強めると、ホットスポット以外の箇所にとって冷却過多となり、電力を無駄に消費してしまう。   On the other hand, conventional server room cooling equipment is usually provided with a calorific value per rack of about 0.5 to 2 kw. For this reason, in the server room where the blade server is introduced, there is a possibility that a hot spot is generated without sufficient cooling, and the server and IT equipment at the hot spot position may overheat. On the other hand, if the operation of the cooling facility is strengthened in order to solve such a problem, excessive cooling is caused for portions other than the hot spot, and power is consumed wastefully.

ホットスポットによるオーバーヒートを防止し、サーバ室の過冷却による電力ロスを防ぐためには、サーバ室の温度を均一に保つ事が重要である。これについて、様々な手法が試みされてきた   In order to prevent overheating due to hot spots and to prevent power loss due to overcooling of the server room, it is important to keep the temperature of the server room uniform. Various methods have been tried for this.

例えば、サーバルームの温度シミュレーションを行い、冷却設備とラックの最適な配置を事前に算出する手法が知られている。   For example, a method is known in which a temperature simulation of a server room is performed and an optimal arrangement of cooling equipment and racks is calculated in advance.

また、ラックに冷却装置を実装し、ラック単位やラック列単位で冷却する手法も知られている。   There is also known a method in which a cooling device is mounted on a rack and cooling is performed in units of racks or rack rows.

また、ホットアイルとコールドアイルを分離し、排気が他のサーバの吸気側に回り込まないようにサーバを配置する手法もある。   There is also a method in which the server is arranged so that the hot aisle and the cold aisle are separated so that the exhaust does not enter the intake side of another server.

また、システムに備えられた複数のサーバの負荷を分散させる技術として、各サーバの負荷状況を監視し、負荷の高いサーバのジョブやVM(Virtual Machine:仮想機械)を、負荷の低いサーバへ移動し、各サーバの負荷を均一にする手法が知られている。   In addition, as a technology to distribute the load of multiple servers provided in the system, the load status of each server is monitored, and high-load server jobs and virtual machines (VMs) are moved to low-load servers A method for making the load on each server uniform is known.

しかし、温度シミュレーションによる手法では、シミュレーション結果に応じてサーバを配置するが、シミュレーションデータの精度や、サーバ数の増減および動作状況などによっては、必ずしもシミュレーション通りの温度分布を得るとは限らない。   However, in the method based on the temperature simulation, the servers are arranged according to the simulation result. However, the temperature distribution according to the simulation is not always obtained depending on the accuracy of the simulation data, the increase / decrease in the number of servers, and the operation status.

また、ラックに冷却装置を実装し、ラック単位やラック列単位で冷却する手法では、ラックへの冷却装置の実装によるラックのサイズ増大、コストアップなどの問題がある。   Further, the method of mounting a cooling device in a rack and cooling in units of racks or rack rows has problems such as an increase in rack size and an increase in cost due to the mounting of the cooling device in the rack.

また、ホットアイルとコールドアイルを分離する手法では、サーバ室の冷却設備の位置の調整や、吸気/排気が同じ方向のサーバで統一する必要があるなど、運用上の制限が多い。   In addition, the method of separating hot aisle and cold aisle has many operational limitations such as adjustment of the position of the cooling equipment in the server room and the need to unify the intake / exhaust between servers in the same direction.

また、各サーバの負荷が均一であってもサーバ室内の温度分布が均一とは限らないため、サーバの負荷を均一化させる手法を適用してもサーバ室の温度を均一に保つ事が困難である。例えば、冷却設備の正面の空間は良く冷えるが、冷却装置から遠く離れた入り組んだ位置にある空間は、冷気が届かずあまり冷えない。これらの位置にあるサーバに同じ負荷を与えても、サーバ室の室温は均一にならず、ホットスポットが発生する可能性がある。   Also, even if the load on each server is uniform, the temperature distribution in the server room is not always uniform, so it is difficult to keep the temperature in the server room uniform even if a method for equalizing the server load is applied. is there. For example, the space in front of the cooling facility cools well, but the space in an intricate position far away from the cooling device does not reach the cooling air so much. Even if the same load is applied to the servers at these positions, the room temperature of the server room is not uniform, and a hot spot may occur.

本発明は、上記事情に鑑みてなされたものであり、サーバ室の温度分布を確実に均一に保つ技術を提供する。   The present invention has been made in view of the above circumstances, and provides a technique for reliably maintaining a uniform temperature distribution in a server room.

本発明の1つの態様は、サーバ運用システムである。このサーバ運用システムは、複数のサーバと、マスタ管理装置と、制御装置を備える。   One aspect of the present invention is a server operation system. This server operation system includes a plurality of servers, a master management device, and a control device.

マスタ管理装置は、上記複数のサーバが設けられた夫々の場所の温度を示す温度情報を取得可能である。   The master management apparatus can acquire temperature information indicating the temperature of each place where the plurality of servers are provided.

制御装置は、マスタ管理装置が得た温度情報に基づいて、上記複数のサーバが設けられた夫々の場所間での温度分布が均一になるように、該複数のサーバ間で負荷分布の調整を行う。   The control device adjusts the load distribution among the plurality of servers based on the temperature information obtained by the master management device so that the temperature distribution between the respective locations where the plurality of servers are provided is uniform. Do.

本発明の別の態様も、サーバ運用システムである。このサーバ運用システムは、エンクロージャ単位の複数のサブシステムにより構成される。   Another aspect of the present invention is also a server operation system. This server operation system is composed of a plurality of subsystems in units of enclosures.

サブシステムは、該サブシステムが設けられた場所の温度を示す温度情報を取得可能な管理装置と、1つ以上のサーバを格納するエンクロージャとを備える。   The subsystem includes a management device that can acquire temperature information indicating the temperature of a place where the subsystem is provided, and an enclosure that stores one or more servers.

これらの複数のサブシステムの管理装置のうちの1つはマスタ管理装置であり、他の管理装置はスレーブ管理装置である。   One of the management devices of the plurality of subsystems is a master management device, and the other management device is a slave management device.

各スレーブ管理装置は、自身が属するサブシステムの温度情報をマスタ管理装置に提供し、マスタ管理装置は、自身が属するサブシステムの温度情報と、各スレーブ管理装置から提供された夫々のサブシステムの温度情報とを制御装置に供する。   Each slave management device provides temperature information of the subsystem to which the slave management device belongs to the master management device, and the master management device provides temperature information of the subsystem to which the slave management device belongs and each subsystem provided by each slave management device. Provide temperature information to the controller.

制御装置は、マスタ管理装置が得た温度情報に基づいて、各サブシステムが設けられた夫々の場所間での温度分布が均一になるように、これらのサブシステムに格納されたサーバ間で負荷分布の調整を行う。   Based on the temperature information obtained by the master management device, the control device loads the servers among the servers stored in these subsystems so that the temperature distribution between the locations where each subsystem is provided is uniform. Adjust the distribution.

なお、上記態様のサーバ運用システムを方法に置き換えて表現したもの、該サーバ運用システムの一部の構成要素例えばサブシステムや管理装置、またはこれらの構成要素の一部の機能をコンピュータに実行せしめるプログラムも、本発明の態様としては有効である。   It should be noted that what is expressed by replacing the server operation system of the above aspect with a method, some components of the server operation system, such as a subsystem or a management device, or a program that causes a computer to execute some functions of these components Is also effective as an embodiment of the present invention.

本発明にかかる技術によれば、サーバ室の温度を均一に保つことを確実にできる。   According to the technology of the present invention, it is possible to ensure that the temperature of the server room is kept uniform.

本発明にかかる技術の原理を説明するためのサーバ運用システムを示す図である(その1)。It is a figure which shows the server operation system for demonstrating the principle of the technique concerning this invention (the 1). 本発明にかかる技術の原理を説明するためのサーバ運用システムを示す図である(その2)。It is a figure which shows the server operation system for demonstrating the principle of the technique concerning this invention (the 2). 本発明の実施の形態にかかるサーバ運用システムを示す図である。It is a figure which shows the server operation system concerning embodiment of this invention. 図3に示すサーバ運用システムにおけるサブシステムを示す図である。It is a figure which shows the subsystem in the server operation system shown in FIG. 図3に示すサーバ運用システムにおける各管理装置の状態の遷移を示す図である。It is a figure which shows the transition of the state of each management apparatus in the server operation system shown in FIG. 図3に示すサーバ運用システムにおけるマスタ管理装置とスレーブ管理装置の自律的な決定シーケンスを示す図である(その1)。FIG. 4 is a diagram showing an autonomous determination sequence of a master management device and a slave management device in the server operation system shown in FIG. 3 (No. 1). 図3に示すサーバ運用システムにおけるマスタ管理装置とスレーブ管理装置の自律的な決定シーケンスを示す図である(その2)。It is a figure which shows the autonomous determination sequence of the master management apparatus and slave management apparatus in the server operation system shown in FIG. 3 (the 2). 図3に示すサーバ運用システムにおけるマスタ管理装置とスレーブ管理装置の自律的な決定シーケンスを示す図である(その3)。FIG. 6 is a diagram showing an autonomous determination sequence of a master management device and a slave management device in the server operation system shown in FIG. 3 (No. 3). 図3に示すサーバ運用システムにおけるマスタ管理装置とスレーブ管理装置の自律的な決定シーケンスを示す図である(その4)。It is a figure which shows the autonomous determination sequence of the master management apparatus and slave management apparatus in the server operation system shown in FIG. 3 (the 4). マスタ管理装置とスレーブ管理装置の通信パターンを説明するための図である。It is a figure for demonstrating the communication pattern of a master management apparatus and a slave management apparatus.

説明の明確化のため、以下の記載及び図面は、適宜、省略及び簡略化がなされている。また、様々な処理を行う機能ブロックとして図面に記載される各要素は、ハードウェア的には、CPU、メモリ、その他の回路で構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現される。したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、またはそれらの組合せによっていろいろな形で実現できることは当業者には理解されるところであり、いずれかに限定されるものではない。   For clarity of explanation, the following description and drawings are omitted and simplified as appropriate. Each element described in the drawings as a functional block for performing various processes can be configured by a CPU, a memory, and other circuits in terms of hardware, and a program loaded in the memory in terms of software. Etc. Therefore, it is understood by those skilled in the art that these functional blocks can be realized in various forms by hardware only, software only, or a combination thereof, and is not limited to any one.

本発明にかかる具体的な実施の形態の前に、まず、本発明にかかるサーバ運用技術の原理を説明する。
図1は、本発明にかかる技術の原理を説明するためのサーバ運用システム100を示す。サーバ運用システム100は、例えばサーバ室に設けられており、複数のサーバ110と、マスタ管理装置120と、制御装置130を備える。
Prior to a specific embodiment according to the present invention, first, the principle of the server operation technique according to the present invention will be described.
FIG. 1 shows a server operation system 100 for explaining the principle of the technology according to the present invention. The server operation system 100 is provided in a server room, for example, and includes a plurality of servers 110, a master management device 120, and a control device 130.

マスタ管理装置120は、各サーバ110が設けられた夫々の場所の温度を示す温度情報を取得可能である。制御装置130は、マスタ管理装置120が得た各温度情報に基づいて、各サーバ110が設けられた夫々の場所間での温度分布が均一になるように、これらのサーバ間で負荷分布の調整を行う。なお、負荷分布の調整は、例えばジョブやVMの移動を含む。   The master management device 120 can acquire temperature information indicating the temperature of each place where each server 110 is provided. Based on the temperature information obtained by the master management device 120, the control device 130 adjusts the load distribution among these servers so that the temperature distribution between the locations where the servers 110 are provided is uniform. I do. Note that adjustment of the load distribution includes, for example, movement of jobs and VMs.

図1において、構成要素間の線は、情報の受渡しが可能であることを示し、必ずしも実際の接続形態を示すものではない。マスタ管理装置120は、各サーバ110から該サーバの温度情報を取得可能であり、制御装置130は、マスタ管理装置120から温度情報を得ることができ、かつ各サーバ110間で負荷調整を行うことができれば、いかなる接続形態であってもよい。例えば、各サーバ110とマスタ管理装置120はネットワークにより接続され、該ネットワークを介して温度情報を受け渡し、制御装置130は、ネットワークを介して各サーバ110と接続する一方、マスタ管理装置120とは直接接続されるような接続形態が考えられる。また、マスタ管理装置120と各サーバ110とを接続するネットワークは、制御装置130と各サーバ110とを接続するネットワークとは異なるものであってもよい。さらに、マスタ管理装置120と制御装置130の片方または両方は、いずれかのサーバ110に設けられるようにしてもよい。両方がいずれかのサーバサーバ110に設けられる場合には、夫々が設けられるサーバは、同一であってもよく異なってもよい。   In FIG. 1, lines between components indicate that information can be exchanged, and do not necessarily indicate an actual connection form. The master management device 120 can obtain the temperature information of the server from each server 110, and the control device 130 can obtain the temperature information from the master management device 120 and adjust the load between the servers 110. As long as it is possible, any connection form may be used. For example, each server 110 and the master management device 120 are connected via a network, and temperature information is exchanged via the network. The control device 130 is connected to each server 110 via the network, while being directly connected to the master management device 120. A connection form that can be connected is conceivable. The network connecting the master management apparatus 120 and each server 110 may be different from the network connecting the control apparatus 130 and each server 110. Furthermore, one or both of the master management device 120 and the control device 130 may be provided in any server 110. When both are provided in any one of the server servers 110, the servers provided in each may be the same or different.

また、制御装置230は、マスタ管理装置120から情報を受け取ることができ、サーバ間で負荷分布の調整を行うことができるものであれば、その構築の形態は1つに限定されることが無い。例えば、1つの構成要素として制御装置をいずれかのサブシステムにサーバとは別に設けるようにしてもよいし、いずれかのサーバに設けるようにしてもよい。さらに、例えば、各サーバ内で制御モジュールを設け、制御モジュール間での情報交換の結果に応じて負荷分布の調整を行うようにしてもよい。この場合、制御装置は、これらの制御モジュールにより構成される。   The control device 230 is not limited to one configuration as long as it can receive information from the master management device 120 and can adjust the load distribution between servers. . For example, the control device as one component may be provided in any subsystem separately from the server, or may be provided in any server. Furthermore, for example, a control module may be provided in each server, and the load distribution may be adjusted according to the result of information exchange between the control modules. In this case, the control device is configured by these control modules.

このサーバ運用システム100によれば、各サーバが設けられた場所の実際の温度に基づいて、これらの場所間での温度分布が均一になるようにサーバ間の負荷分布が調整されるので、サーバ運用システム100が設けられたサーバ室の温度を確実に均一に保つことができる。   According to the server operation system 100, the load distribution between the servers is adjusted so that the temperature distribution between these locations is uniform based on the actual temperature at the location where each server is provided. The temperature of the server room in which the operation system 100 is provided can be reliably kept uniform.

本発明に係る技術は、1つのエンクロージャに集合された集合型サーバ装置により構成されたサーバ運用システムにも適用することができる。図2を参照して説明する。   The technology according to the present invention can also be applied to a server operation system configured by a collective server device that is aggregated in one enclosure. This will be described with reference to FIG.

図2に示すサーバ運用システム200は、集合型サーバ装置(以下サブシステムという)を複数備える。図2において、例としてサブシステム210、サブシステム220、サブシステム230の3つのみを示す。これらのサブシステムは、ネットワーク290を介して接続されている。   The server operation system 200 shown in FIG. 2 includes a plurality of collective server devices (hereinafter referred to as subsystems). In FIG. 2, only three subsystems 210, 220, and 230 are shown as examples. These subsystems are connected via a network 290.

各サブシステムは、エンクロージャ単位に構成されている。図示のように、サブシステム210は、複数のサーバ214と、管理装置216と、制御装置280と、これらを格納するエンクロージャ212を有する。サブシステム220は、複数のサーバ224と、管理装置226と、これらを格納するエンクロージャ222を有する。サブシステム230は、複数のサーバ234と、管理装置236と、これらを格納するエンクロージャ232を有する。   Each subsystem is configured in units of enclosures. As illustrated, the subsystem 210 includes a plurality of servers 214, a management device 216, a control device 280, and an enclosure 212 for storing them. The subsystem 220 includes a plurality of servers 224, a management device 226, and an enclosure 222 for storing them. The subsystem 230 includes a plurality of servers 234, a management device 236, and an enclosure 232 for storing them.

マスタ管理装置216、スレーブ管理装置226、スレーブ管理装置236は、自身が属するサブシステムが設けられた場所(すなわち該サブシステムのエンクロージャが設けられた場所)の温度情報を取得可能である。すなわち、マスタ管理装置216はサブシステム210の温度情報を取得可能であり、スレーブ管理装置226はサブシステム220の温度情報を取得可能であり、スレーブ管理装置236はサブシステム230の温度情報を取得可能である。   The master management device 216, the slave management device 226, and the slave management device 236 can acquire temperature information of a place where the subsystem to which the master management apparatus 216 belongs, that is, a place where the enclosure of the subsystem is provided. That is, the master management device 216 can acquire the temperature information of the subsystem 210, the slave management device 226 can acquire the temperature information of the subsystem 220, and the slave management device 236 can acquire the temperature information of the subsystem 230 It is.

これらの管理装置のうちの1つはマスタ管理装置であり、他はスレーブ管理装置である。例として、マスタ管理装置216はマスタ管理装置であり、スレーブ管理装置226とスレーブ管理装置236はスレーブ管理装置であるとする。   One of these management devices is a master management device and the other is a slave management device. As an example, it is assumed that the master management device 216 is a master management device, and the slave management device 226 and the slave management device 236 are slave management devices.

スレーブ管理装置226とスレーブ管理装置236は、自身が属するサブシステムの温度情報を取得してネットワーク290を介してマスタ管理装置216に提供する。   The slave management device 226 and the slave management device 236 acquire temperature information of the subsystem to which the slave management device 226 and slave management device 236 belong, and provide them to the master management device 216 via the network 290.

マスタ管理装置216は、サブシステム210の温度情報、およびスレーブ管理装置226とスレーブ管理装置236が提供したサブシステム220とサブシステム230の温度情報を制御装置280に供する。   The master management device 216 provides the temperature information of the subsystem 210 and the temperature information of the subsystem 220 and the subsystem 230 provided by the slave management device 226 and the slave management device 236 to the control device 280.

制御装置280は、マスタ管理装置216からの各温度情報に基づいて、各々のサブシステムが設けられた場所間での温度分布が均一になるように、サーバ間での負荷分布を調整する。   Based on the temperature information from the master management device 216, the control device 280 adjusts the load distribution between the servers so that the temperature distribution between the locations where the respective subsystems are provided is uniform.

図2に示すサーバ運用システム200は、集合型サーバ装置が設けられた場所の温度が、該集合型サーバ装置に含まれる各サーバが設けられた場所の温度とほぼ一致であることを利用し、各サブシステムが設けられた場所の実際の温度に基づいて、これらの場所間での温度分布が均一になるようにサーバ間の負荷分布を調整するので、サーバ運用システム200が設けられたサーバ室の温度を確実に均一に保つことができる。   The server operation system 200 shown in FIG. 2 utilizes the fact that the temperature of the place where the collective server apparatus is provided is substantially the same as the temperature of the place where each server included in the collective server apparatus is provided, Based on the actual temperature of the place where each subsystem is provided, the load distribution between the servers is adjusted so that the temperature distribution between these places is uniform, so the server room in which the server operation system 200 is provided The temperature can be maintained uniformly.

また、サブシステム単位で温度情報を取得するので、サーバ毎に温度情報を取得することより、処理が簡単である。   Further, since temperature information is acquired in units of subsystems, processing is simpler than acquiring temperature information for each server.

なお、いずれの管理装置をマスタ管理装置とするかについて、固定であってもよいが、システム構築者などユーザにより設定できることが好ましい。こうすることによって、サブシステムの増減などの変動にも対応することができる。   Note that which management device is the master management device may be fixed, but is preferably set by a user such as a system builder. By doing so, it is possible to cope with fluctuations such as increase / decrease of subsystems.

さらに、各管理装置がネットワークを介した通信により自律的にマスタ管理装置とスレーブ管理装置の決定がなされることがより好ましい。こうすることにより、サブシステムの増減などの変動をより簡単に対応することができる。   Furthermore, it is more preferable that each management device autonomously determines a master management device and a slave management device by communication via a network. By doing so, it is possible to more easily cope with fluctuations such as increase / decrease in subsystems.

また、管理装置が温度情報を取得する方法としては、例えば、サブシステム毎に温度センサを設け、温度センサの測定値を温度情報として取得することができる。この温度センサは、例えば当該サブシステムのエンクロージャに設ければよい。   Moreover, as a method for the management device to acquire the temperature information, for example, a temperature sensor can be provided for each subsystem, and a measurement value of the temperature sensor can be acquired as the temperature information. For example, the temperature sensor may be provided in the enclosure of the subsystem.

昨今のサーバには吸気温度センサを設けられているものが多く、エンクロージャに格納されたサーバの吸気温度センサにより測定した温度と該エンクロージャ周辺の温度とがほぼ一致であることを利用して、管理装置は、自身が属するサブシステム内のサーバに元々備えられている吸気温度センサの測定値を該サブシステムの温度情報として取得するようにしてもよい。サーバに元々備えられた吸気温度センサを利用し、サブシステムの温度を測定する装置を別に設ける必要が無いため、この手法による温度情報の取得が好ましい。   Many recent servers are equipped with an intake air temperature sensor, and management is performed by utilizing the fact that the temperature measured by the intake air temperature sensor of the server stored in the enclosure is almost the same as the temperature around the enclosure. The apparatus may acquire the measured value of the intake air temperature sensor originally provided in the server in the subsystem to which the apparatus belongs as temperature information of the subsystem. Since it is not necessary to separately provide a device for measuring the temperature of the subsystem using the intake air temperature sensor originally provided in the server, it is preferable to acquire temperature information by this method.

なお、サーバに複数の吸気温度センサが備えられている場合には、いずれか1つの吸気温度センサの測定値を用いてもよく、これらの複数の吸気温度センサのうちの1つ以上の測定値の平均値を用いるようにしてもよい。エンクロージャに格納されたサーバのうち、吸気温度センサが備えられたサーバが複数ある場合においても、同様である。   If the server is provided with a plurality of intake air temperature sensors, the measured value of any one of the intake air temperature sensors may be used, and one or more measured values of the plurality of intake air temperature sensors may be used. You may make it use the average value of. The same applies when there are a plurality of servers provided with the intake air temperature sensor among the servers stored in the enclosure.

さらに、マスタ管理装置が、各サブシステムの設置された場所の位置を示す位置情報を取得し、制御装置が、各サブシステムの温度情報と位置情報とに基づいて調整を行うことが好ましい。   Furthermore, it is preferable that the master management apparatus acquires position information indicating the position of the place where each subsystem is installed, and the control apparatus adjusts based on the temperature information and position information of each subsystem.

例えば、制御装置は、サーバ間の負荷分布の調整のために負荷を移動する際に、サブシステム間での温度分布が均一になる前提下で、位置情報に基づいてサブシステムの密集度を求め、密集度が高い場所に設けられたサブシステムに含まれるサーバよりも、密集度の低い場所に設けられたサブシステムに含まれるサーバを優先的に移動先のサーバとして選定するようにすることができる。こうすることによって、温度分布の均一化をより効率良く行うことができる。   For example, when the load is moved to adjust the load distribution between servers, the control device calculates the density of the subsystem based on the position information on the assumption that the temperature distribution between the subsystems is uniform. It is possible to preferentially select a server included in a subsystem provided in a low-density place as a destination server over a server included in a subsystem provided in a high-density place. it can. By doing so, the temperature distribution can be made more uniform.

また例えば、制御装置は、サーバ間の負荷分布の調整のために負荷を移動する際に、サブシステム間での温度分布が均一になる前提下で、サーバ室に設けられた冷却装置の位置と、マスタ管理装置が得た位置情報とに基づいて、冷却装置までの距離が近いサブシステムに含まれるサーバほど該サーバを優先的に移動先のサーバとして選定するようにしてもよい。この手法も、温度分布の均一化をより効率良く行うことができる。   Further, for example, when the load is moved to adjust the load distribution between the servers, the control device assumes that the temperature distribution between the subsystems is uniform and the position of the cooling device provided in the server room. Based on the position information obtained by the master management device, the servers included in the subsystems closer to the cooling device may be preferentially selected as destination servers. This method can also make the temperature distribution uniform more efficiently.

なお、位置情報の具体的な取得手法については、実施の形態と共に説明する。
以下、上述した原理を踏まえ、本発明にかかる実施の形態を説明する。
図3は、本発明の実施の形態にかかるサーバ運用システム300を示す。サーバ運用システム300は、サーバ室310内に設けられており、サブシステム400と、1つ以上のサブシステム500と、冷却装置320および冷却装置340を備える。各サブシステムは、ネットワーク390を介して接続されている。なお、サブシステムおよび冷却装置の配置および数は、図示の例に限られることがない。
A specific method for acquiring position information will be described together with the embodiment.
Hereinafter, based on the above-described principle, an embodiment according to the present invention will be described.
FIG. 3 shows a server operation system 300 according to the embodiment of the present invention. The server operation system 300 is provided in the server room 310 and includes a subsystem 400, one or more subsystems 500, a cooling device 320, and a cooling device 340. Each subsystem is connected via a network 390. The arrangement and number of subsystems and cooling devices are not limited to the illustrated example.

サブシステム400は、制御装置402を備える。制御装置402は、ネットワーク390を介して各サブシステム(サブシステム400およびサブシステム500)内に含まれるサーバ間の負荷を調整可能である。制御装置402による調整の詳細は、後に説明する。制御装置402を備える点を除き、サブシステム400は、各サブシステム500と同じ構成を有し、ここでサブシステム500の詳細構成について説明する。   The subsystem 400 includes a control device 402. The control device 402 can adjust the load between servers included in each subsystem (subsystem 400 and subsystem 500) via the network 390. Details of the adjustment by the control device 402 will be described later. Except for the point provided with the control apparatus 402, the subsystem 400 has the same structure as each subsystem 500, and demonstrates the detailed structure of the subsystem 500 here.

図4は、サブシステム500を示す。サブシステム500は、エンクロージャ単位に構成されており、図4の上部は、エンクロージャの上からの透視図であり、図4の下部は、エンクロージャの背面図である。   FIG. 4 shows the subsystem 500. The subsystem 500 is configured in units of enclosures. The upper part of FIG. 4 is a perspective view from above the enclosure, and the lower part of FIG. 4 is a rear view of the enclosure.

サブシステム500は、エンクロージャ510と、複数のサーバ520と、管理装置530と、発信機540と、3つのレシーバ(レシーバ552、レシーバ554、レシーバ556)を備える。なお、サブシステム400は、図4に示す各構成要素を備え、さらに制御装置402を有する。   The subsystem 500 includes an enclosure 510, a plurality of servers 520, a management device 530, a transmitter 540, and three receivers (receiver 552, receiver 554, receiver 556). The subsystem 400 includes the components illustrated in FIG. 4 and further includes a control device 402.

管理装置530と複数のサーバ520は、エンクロージャ510に格納されている。各サーバ520は、1つ以上の吸気温度センサ522を有する。吸気温度センサ522の測定値は、管理装置530に送信される。   The management device 530 and the plurality of servers 520 are stored in the enclosure 510. Each server 520 has one or more intake air temperature sensors 522. The measured value of the intake air temperature sensor 522 is transmitted to the management device 530.

管理装置530は、プロセッサ(以下MPUという)531、MPU531による処理時のデータを記憶するRAM532と、ネットワーク390と接続するためのLANボード534とNIC533、発信機540を制御するための制御回路(以下CNTという)535と、レシーバ552〜556を制御するためのCNT536を有する。MPU531は、NIC533を制御して、LANボード534を介してネットワーク390による通信を行う。また、MPU531は、CNT535を介して発信機540を制御し、CNT536を介して3つのレシーバ554〜556を制御する。管理装置530の各構成要素は、協働して管理装置530の機能を担い、それらの協働動作は、通常のコンピュータに備えられた相対応のものの動作と同様である。したがって、以下の説明において、管理装置530の機能についてのみ説明し、これらの機能を実現するために各構成要素の具体的な動作を省略する。   The management device 530 includes a processor (hereinafter referred to as MPU) 531, a RAM 532 that stores data during processing by the MPU 531, a LAN board 534 for connection to the network 390, a NIC 533, and a control circuit for controlling the transmitter 540. CNT) 535 and CNT 536 for controlling the receivers 552 to 556. The MPU 531 controls the NIC 533 and performs communication via the network 390 via the LAN board 534. The MPU 531 controls the transmitter 540 via the CNT 535 and controls the three receivers 554 to 556 via the CNT 536. Each component of the management device 530 cooperates to carry out the function of the management device 530, and their cooperative operation is the same as the operation of the corresponding components provided in a normal computer. Therefore, in the following description, only functions of the management device 530 will be described, and specific operations of each component will be omitted in order to realize these functions.

発信機540と3つのレシーバ554〜556は、エンクロージャ510に装着されている。発信機540は、管理装置530の制御に従って電波を発信でき、レシーバ554〜556は、管理装置530の制御に従って他のサブシステムにおける発信機からの電波を受信できる。   The transmitter 540 and the three receivers 554 to 556 are mounted on the enclosure 510. The transmitter 540 can transmit radio waves according to the control of the management apparatus 530, and the receivers 554 to 556 can receive radio waves from transmitters in other subsystems according to the control of the management apparatus 530.

サブシステム400と各サブシステム500における管理装置530は、該管理装置がマスタ管理装置であるかスレーブ管理装置かによって一部の動作が異なる。マスタ管理装置は、複数の管理装置530のうちの1つであり、マスタ管理装置以外の管理装置530は、スレーブ管理装置である。   Some operations of the management device 530 in the subsystem 400 and each subsystem 500 differ depending on whether the management device is a master management device or a slave management device. The master management device is one of the plurality of management devices 530, and the management devices 530 other than the master management device are slave management devices.

本実施の形態のサーバ運用システム300において、マスタ管理装置とスレーブ管理装置の決定は、各々の管理装置530間の調停により自律的に決定される。また、調停のためには、P0〜P3の4種類のパケットが使用される。P0は、マスタ名要求パケット(Master_Name_Inquiry)であり、P1は、マスタ宣言パケット(Master_Announcement)である。また、P2は、エントリ・リクエストパケット(Entry_Request)であり、P3は、エントリ受付パケット(Entry_Acceptance)である。以下の説明及び図示において、パケット名の後に「(Unicast)」を付けることにより該パケットがユニキャストのパケットであることを示し、「(Broadcast)」を付けることにより該パケットがブロードキャストのパケットであることを示す。また、「(Unicast)」と「(Broadcast)」のいずれも付けない場合には、該パケットが、ユニキャストとブロードキャストのいずれでもよいことを示す。   In the server operation system 300 according to the present embodiment, the determination of the master management device and the slave management device is autonomously determined by arbitration between the management devices 530. For arbitration, four types of packets P0 to P3 are used. P0 is a master name request packet (Master_Name_Inquiry), and P1 is a master declaration packet (Master_Announcement). P2 is an entry request packet (Entry_Request), and P3 is an entry acceptance packet (Entry_Acceptance). In the following description and illustration, “(Unicast)” is appended to the packet name to indicate that the packet is a unicast packet, and “(Broadcast)” is appended to indicate that the packet is a broadcast packet. It shows that. If neither “(Unicast)” nor “(Broadcast)” is attached, it indicates that the packet may be either unicast or broadcast.

図5は、管理装置530の状態遷移図である。説明しやすいように、複数の管理装置により形成されたネットワークを、以下管理装置ネットワークという。   FIG. 5 is a state transition diagram of the management apparatus 530. For ease of explanation, a network formed by a plurality of management devices is hereinafter referred to as a management device network.

管理装置ネットワークに新規に参加する管理装置530の状態は、初期状態の状態0である。なお、新規に参加する管理装置とは、マスタ管理装置であるかスレーブ管理装置であるかの設定がまだなされておらず、例えば既存のサーバ運用システムに追加されたサブシステムに含まれる管理装置である。   The state of the management device 530 newly participating in the management device network is state 0 in the initial state. Note that the newly participating management device has not yet been set as a master management device or a slave management device, and is, for example, a management device included in a subsystem added to an existing server operation system. is there.

状態0にある管理装置530は、管理装置ネットワークに参加するために、ブロードキャストのマスタ名要求パケットP0を送出し、マスタ管理装置からの返答を待つ状態(状態1)に遷移する。   In order to participate in the management apparatus network, the management apparatus 530 in the state 0 transmits a broadcast master name request packet P0 and transitions to a state waiting for a response from the master management apparatus (state 1).

管理装置ネットワークに既にマスタ管理装置がある場合には、該マスタ管理装置は、マスタ名要求パケットP0を受信してから所定の時間内にユニキャストのマスタ宣言パケットP1を返答する。マスタ名要求パケットP0を送出した新規の管理装置530は、所定の時間内に自身宛てのマスタ宣言パケットP1(Unicast)を受信すると、マスタ管理装置にユニキャストのエントリ・リクエストパケットP2を送信して、登録要求中状態(状態2)に遷移する。図5において、この遷移は、状態1から状態2までの実線で表されている。   When there is already a master management device in the management device network, the master management device returns a unicast master declaration packet P1 within a predetermined time after receiving the master name request packet P0. Upon receiving the master declaration packet P1 (Unicast) addressed to itself within a predetermined time, the new management device 530 that has transmitted the master name request packet P0 transmits a unicast entry request packet P2 to the master management device. , Transition to the registration requesting state (state 2). In FIG. 5, this transition is represented by a solid line from state 1 to state 2.

一方、マスタ名要求パケットP0を送信した新規の管理装置530は、所定の時間内に自身宛のマスタ宣言パケットP1(Unicast)を受信できない場合には、ブロードキャストのマスタ宣言パケットP1を送出して、マスタ管理装置(状態4)になる。図5において、この遷移は、状態1から状態4までの点線で表されている。   On the other hand, if the new management device 530 that has transmitted the master name request packet P0 cannot receive the master declaration packet P1 (Unicast) addressed to itself within a predetermined time, it sends out a broadcast master declaration packet P1. It becomes a master management device (state 4). In FIG. 5, this transition is represented by a dotted line from state 1 to state 4.

登録要求中状態(状態2)にある管理装置530は、エントリ・リクエストパケットP2の送信から所定の時間以内にエントリ受付パケットP3を受信すると、スレーブ管理装置(状態3)になる。図5において、この遷移は、状態2から状態3までの実線で表されている。   When the management device 530 in the registration requesting state (state 2) receives the entry acceptance packet P3 within a predetermined time from the transmission of the entry request packet P2, the management device 530 enters the slave management device (state 3). In FIG. 5, this transition is represented by a solid line from state 2 to state 3.

一方、登録要求中状態(状態2)にある管理装置530は、エントリ・リクエストパケットP2の送信から所定の時間が経過しても自身宛のエントリ受付パケットP3を受信できなかった場合には、初期状態(状態0)に戻る。   On the other hand, if the management apparatus 530 in the registration requesting state (state 2) fails to receive the entry acceptance packet P3 addressed to itself even after a predetermined time has elapsed since the entry request packet P2 was transmitted, Return to state (state 0).

また、スレーブ管理装置(状態3)が情報要求パケットP4を所定時間以上受信できなかった場合には、該管理装置530も初期状態(状態0)に戻る。これについて、マスタ管理装置とスレーブ管理装置の動作の説明時に説明する。   If the slave management apparatus (state 3) has not received the information request packet P4 for a predetermined time or more, the management apparatus 530 also returns to the initial state (state 0). This will be described when the operations of the master management device and the slave management device are described.

上述した管理装置530の状態遷移を踏まえ、本実施の形態における各管理装置530による調停についてのいくつかのケースを説明する。   Based on the state transition of the management device 530 described above, some cases of arbitration by each management device 530 in the present embodiment will be described.

図6は、既に形成された管理装置ネットワークに新規の管理装置530が参加するシーケンスの1例を示す。既に形成された管理装置ネットワークとは、マスタ管理装置が既に決定された管理装置ネットワークを意味する。   FIG. 6 shows an example of a sequence in which a new management device 530 participates in a management device network that has already been formed. An already formed management device network means a management device network for which a master management device has already been determined.

図6に示すように、新規の管理装置530は、管理装置ネットワークに参加するために、ブロードキャストのマスタ名要求パケットP0を送信する。   As shown in FIG. 6, the new management apparatus 530 transmits a broadcast master name request packet P0 in order to participate in the management apparatus network.

このマスタ名要求パケットP0を受信したマスタ管理装置は、所定の時間内に、上記新規の管理装置530にユニキャストのマスタ宣言パケットP1を返答する。   Upon receiving this master name request packet P0, the master management apparatus returns a unicast master declaration packet P1 to the new management apparatus 530 within a predetermined time.

新規の管理装置530は、ブロードキャストのマスタ名要求パケットP0の送信後の所定の時間内に自分宛のマスタ宣言パケットP1を受信すると、マスタ宣言パケットP1を送信したマスタ管理装置にユニキャストのエントリ・リクエストパケットP2を送信する。   When the new management device 530 receives the master declaration packet P1 addressed to itself within a predetermined time after the transmission of the broadcast master name request packet P0, the new management device 530 transmits a unicast entry to the master management device that has transmitted the master declaration packet P1. Request packet P2 is transmitted.

マスタ管理装置は、エントリ・リクエストパケットP2を受信すると、所定の時間内にエントリ受付パケットP3を返送する。   When receiving the entry request packet P2, the master management apparatus returns the entry acceptance packet P3 within a predetermined time.

エントリ・リクエストパケットP2の送信後の所定の時間内にエントリ受付パケットP3を受信すると、上記新規の管理装置530はスレーブ管理装置になり、管理装置ネットワークへの参加が完了する。   When the entry acceptance packet P3 is received within a predetermined time after the entry request packet P2 is transmitted, the new management device 530 becomes a slave management device, and the participation in the management device network is completed.

図7は、既に形成された管理装置ネットワークに新規の管理装置530が参加するシーケンスの別の例を示す。   FIG. 7 shows another example of a sequence in which a new management apparatus 530 participates in an already formed management apparatus network.

図6に示す例と同様に、管理装置ネットワークに参加するために、新規の管理装置530は、ブロードキャストのマスタ名要求パケットP0を送信する。   Similar to the example shown in FIG. 6, in order to participate in the management apparatus network, the new management apparatus 530 transmits a broadcast master name request packet P0.

このマスタ名要求パケットP0を受信したマスタ管理装置は、所定の時間内に、上記新規の管理装置530にユニキャストのマスタ宣言パケットP1を返答する。   Upon receiving this master name request packet P0, the master management apparatus returns a unicast master declaration packet P1 to the new management apparatus 530 within a predetermined time.

新規の管理装置530は、ブロードキャストのマスタ名要求パケットP0の送信後の所定の時間内に自分宛のマスタ宣言パケットP1を受信すると、マスタ宣言パケットP1を送信したマスタ管理装置にユニキャストのエントリ・リクエストパケットP2を送信する。   When the new management device 530 receives the master declaration packet P1 addressed to itself within a predetermined time after the transmission of the broadcast master name request packet P0, the new management device 530 transmits a unicast entry to the master management device that has transmitted the master declaration packet P1. Request packet P2 is transmitted.

マスタ管理装置は、エントリ・リクエストパケットP2を受信すると、所定の時間内にエントリ受付パケットP3を返送する。しかし、このエントリ・リクエストパケットP2は、何らかの弾みで新規管理装置に到達する前に消滅してしまう。   When receiving the entry request packet P2, the master management apparatus returns the entry acceptance packet P3 within a predetermined time. However, the entry request packet P2 disappears before reaching the new management device due to some momentum.

そのため、新規管理装置は、エントリ・リクエストパケットP2の送信後に所定時間が経過してもエントリ受付パケットP3を受信できないため(タイムアウト)、初期状態に戻り、ブロードキャストのマスタ名要求パケットP0を再度送信する。   For this reason, the new management device cannot receive the entry acceptance packet P3 even if a predetermined time has elapsed after the transmission of the entry request packet P2 (timeout), so returns to the initial state and transmits the broadcast master name request packet P0 again. .

その後、図6に示すシーケンスと同様の流れを経て、新規管理装置は、スレーブ管理装置になり、管理装置ネットワークへの参加が完了する。   Thereafter, through a flow similar to the sequence shown in FIG. 6, the new management device becomes a slave management device, and participation in the management device network is completed.

図8は、管理装置ネットワークがまだ形成されておらず、各管理装置530が管理装置ネットワークを形成するシーケンスの例を示す。   FIG. 8 shows an example of a sequence in which the management apparatus network is not yet formed and each management apparatus 530 forms the management apparatus network.

図8は、管理装置ネットワークがまだ形成されておらず、各管理装置530が管理装置ネットワークを形成するシーケンスの例を示す。また、分かりやすいように、3つの管理装置についてのみ図示および説明する。   FIG. 8 shows an example of a sequence in which the management apparatus network is not yet formed and each management apparatus 530 forms the management apparatus network. For ease of understanding, only three management devices are shown and described.

この場合、全ての管理装置(新規1、新規2、新規3)は新規の管理装置である。これらの管理装置は、ブロードキャストのマスタ名要求パケットP0を送信する。   In this case, all the management devices (new 1, new 2, new 3) are new management devices. These management apparatuses transmit a broadcast master name request packet P0.

マスタ管理装置が無いため、各管理装置は、マスタ宣言パケットP1(Unicast)を受信できない。ここで、最も先にタイムアウトが発生した管理装置(図示の例では新規1)は、ブロードキャストのマスタ宣言パケットP1を送信し、マスタ管理装置になる。   Since there is no master management device, each management device cannot receive the master declaration packet P1 (Unicast). Here, the management device (new 1 in the illustrated example) that has timed out first transmits a broadcast master declaration packet P1 and becomes the master management device.

ブロードキャストのマスタ宣言パケットP1を受信した他の管理装置(新規2と新規3)は、マスタ管理装置である新規1にエントリ・リクエストパケットP2を送信する。   The other management devices (new 2 and new 3) that have received the broadcast master declaration packet P1 transmit the entry request packet P2 to the new 1 that is the master management device.

新規1は、他の管理装置からのエントリ・リクエストパケットP2を受信すると、発信元の管理装置にエントリ受付パケットP3を夫々送信する。   When the new 1 receives the entry request packet P2 from another management apparatus, the new 1 transmits an entry acceptance packet P3 to the originating management apparatus.

新規2と新規3は、エントリ受付パケットP3を受信すると夫々スレーブ管理装置になる。
これにより、管理装置ネットワークが形成される。
New 2 and new 3 respectively become slave management devices when they receive the entry acceptance packet P3.
Thereby, a management apparatus network is formed.

図9は、マスタ管理装置の競合が生じた場合に行われるシーケンスの例を示す。この例では、既に形成されている管理装置ネットワークに新規の管理装置の参加時に競合が起きている。   FIG. 9 shows an example of a sequence performed when a conflict of the master management devices occurs. In this example, there is a conflict when a new management device joins the already formed management device network.

新規の管理装置は、管理装置ネットワークに参加するために、ブロードキャストのマスタ名要求パケットP0を送信する。   The new management device transmits a broadcast master name request packet P0 in order to participate in the management device network.

マスタ名要求パケットP0を受信したマスタ装置は、ユニキャストのマスタ宣言パケットP1を新規管理装置に送信するが、このマスタ宣言パケットP1は、何らかの弾みで新規管理装置に到達する前に消滅してしまう。   The master device that has received the master name request packet P0 transmits a unicast master declaration packet P1 to the new management device, but this master declaration packet P1 disappears before reaching the new management device due to some momentum. .

そのため、新規管理装置は、マスタ名要求パケットP0の送信後に所定時間が経過してもマスタ宣言パケットP1を受信できないため、マスタ管理装置になり、ブロードキャストのマスタ宣言パケットP1を送信する。   Therefore, the new management apparatus cannot receive the master declaration packet P1 even if a predetermined time has elapsed after the transmission of the master name request packet P0. Therefore, the new management apparatus becomes the master management apparatus and transmits the broadcast master declaration packet P1.

すなわち、管理装置ネットワークにマスタ管理装置が2つもあり、競合が起きている。区別するために、マスタ管理装置になった新規管理装置を「新マスタ管理装置」といい、元々あったマスタ管理装置を「元マスタ管理装置」という。   That is, there are two master management devices in the management device network, and a conflict occurs. In order to make a distinction, a new management apparatus that has become a master management apparatus is referred to as a “new master management apparatus”, and an original master management apparatus is referred to as an “original master management apparatus”.

元マスタ管理装置は、新マスタ管理装置からのマスタ宣言パケットP1を受信すると、マスタ宣言パケットP1に含まれた新マスタ管理装置のMACアドレスと自分のMACアドレスを比較する。本実施の形態において、競合が起きた場合に、MACアドレスの大きい方がマスタ管理装置になるように定められている。   When receiving the master declaration packet P1 from the new master management apparatus, the former master management apparatus compares the MAC address of the new master management apparatus included in the master declaration packet P1 with its own MAC address. In this embodiment, when a conflict occurs, it is determined that the larger MAC address becomes the master management device.

例として、元マスタ管理装置のMACアドレスが新マスタ管理装置のMACアドレスが大きいであるとする。そのため、元マスタ管理装置は、自身の状態を維持すべく、ブロードキャストのマスタ宣言パケットP1を送信する。   As an example, assume that the MAC address of the original master management device is larger than the MAC address of the new master management device. Therefore, the original master management apparatus transmits a broadcast master declaration packet P1 in order to maintain its own state.

元マスタ管理装置からのブロードキャストのマスタ宣言パケットP1を受信した新マスタ管理装置も、該マスタ宣言パケットP1に含まれた元マスタ管理装置のMACアドレスと自身のMACアドレスを比較する。そして、比較の結果に応じて、元マスタ管理装置にエントリ・リクエストパケットP2を送信し、スレーブ管理装置になる。
これにてマスタ管理装置の競合が解消される。
The new master management device that has received the broadcast master declaration packet P1 from the original master management device also compares the MAC address of the original master management device included in the master declaration packet P1 with its own MAC address. Then, according to the comparison result, the entry request packet P2 is transmitted to the original master management device, and the slave management device is obtained.
This eliminates the conflict of the master management device.

このように、サーバ運用システム300において、各々の管理装置530により、自律的にマスタ管理装置とスレーブ管理装置の決定や更新がなされる。   In this way, in the server operation system 300, each management device 530 autonomously determines and updates the master management device and the slave management device.

ここで、マスタ管理装置とスレーブ管理装置の機能を説明する。
サーバ運用システム300における全ての管理装置530は、自身の属するサブシステムが設けられた場所の温度を示す温度情報を取得可能である。具体的には、自身の属するサブシステムに含まれる各サーバに備えられた吸気温度センサ522の測定値の平均値を温度情報として算出する。
Here, functions of the master management device and the slave management device will be described.
All the management apparatuses 530 in the server operation system 300 can acquire temperature information indicating the temperature of the place where the subsystem to which the server operation system 300 belongs is provided. Specifically, the average value of the measured values of the intake air temperature sensor 522 provided in each server included in the subsystem to which it belongs is calculated as temperature information.

スレーブ管理装置は、マスタ管理装置から定期的に送られてくる情報要求パケットP4を受信する度に、自身のサブシステムの温度情報を取得してネットワーク390を介してマスタ管理装置に送信すると共に、発信機540を発信させる。なお、発信機540から発信された電波には、発信時刻と、当該管理装置530内のNIC533のMACアドレスが含まれている。   Each time the slave management device receives the information request packet P4 sent periodically from the master management device, it acquires the temperature information of its subsystem and transmits it to the master management device via the network 390. Transmit the transmitter 540. Note that the radio wave transmitted from the transmitter 540 includes the transmission time and the MAC address of the NIC 533 in the management device 530.

また、スレーブ管理装置は、前回の情報要求パケットP4の受信から所定の時間が経過しても次の情報要求パケットP4を受信できなかった場合には、初期状態(状態0)に戻る。これは、図5の状態遷移図における状態3(スレーブ状態)から状態0までの実線で表されている。   In addition, the slave management apparatus returns to the initial state (state 0) when the next information request packet P4 cannot be received even after a predetermined time has elapsed since the reception of the previous information request packet P4. This is represented by a solid line from state 3 (slave state) to state 0 in the state transition diagram of FIG.

マスタ管理装置は、ネットワーク390を介して定期的に情報要求パケットP4を各スレーブ管理装置に送信すると共に、情報要求パケットP4に応じて各スレーブ管理装置が送られてきた温度情報で管理リストを更新する。管理リストは、例えばRAM532に格納されている。   The master management device periodically transmits an information request packet P4 to each slave management device via the network 390, and updates the management list with the temperature information sent by each slave management device in response to the information request packet P4. To do. The management list is stored in the RAM 532, for example.

図10は、マスタ管理装置が管理する管理リスト、マスタ管理装置とスレーブ管理装置間での通信パターンを示す。   FIG. 10 shows a management list managed by the master management apparatus, and a communication pattern between the master management apparatus and the slave management apparatus.

分かりやすいように、スレーブ管理装置については、3つのスレーブ管理装置(スレーブ管理装置#1、スレーブ管理装置#2、スレーブ管理装置#3)を例にする。   For easy understanding, the slave management device is exemplified by three slave management devices (slave management device # 1, slave management device # 2, and slave management device # 3).

管理リストには、スレーブ管理装置毎に、MACアドレス、IPアドレス、温度情報、位置情報とは対応付けて登録されている。位置情報は、当該スレーブ管理装置が属するサブシステムが設けられた場所の位置を示すものであり、それの詳細については後述する。   In the management list, the MAC address, the IP address, the temperature information, and the position information are registered in association with each slave management apparatus. The position information indicates the position of the place where the subsystem to which the slave management apparatus belongs is provided, and details thereof will be described later.

マスタ管理装置は、スレーブ管理装置が管理装置ネットワークに参加する際に発行したエントリ・リクエストパケットP2から該スレーブ管理装置のMACアドレスとIPアドレスを取得する。また、マスタ管理装置は、ネットワーク390を介して、管理リストに登録してある各IPアドレス宛に、定期的に情報要求パケットP4を発行し温度情報を要求する。マスタ管理装置は、情報要求パケットP4に応じて各スレーブ管理装置が送ってきた最新の温度情報を、該スレーブ管理装置のMACアドレスとIPアドレスとを対応付けて管理リストに保持する。   The master management device acquires the MAC address and IP address of the slave management device from the entry request packet P2 issued when the slave management device joins the management device network. Further, the master management apparatus periodically issues an information request packet P4 to each IP address registered in the management list to request temperature information via the network 390. The master management device holds the latest temperature information sent by each slave management device in response to the information request packet P4 in the management list in association with the MAC address and IP address of the slave management device.

図10において、スレーブ管理装置#1とマスタ管理装置間の通信パターンは、最も多い通信パターンである。この通信パターンでは、マスタ管理装置が定期的に発行する情報要求パケットP4はスレーブ管理装置#1に届いており、スレーブ管理装置#1は、情報要求パケットP4を受信する度に、自身のサブシステムの温度情報(図中温度情報#1)を取得してマスタ管理装置に返送する。マスタ管理装置は、スレーブ管理装置#1から温度情報#1を受信する度に、受信した温度情報#1で、スレーブ管理装置#1に対応して保持されていた温度情報#1を更新する。   In FIG. 10, the communication pattern between the slave management apparatus # 1 and the master management apparatus is the most common communication pattern. In this communication pattern, the information request packet P4 periodically issued by the master management apparatus reaches the slave management apparatus # 1, and the slave management apparatus # 1 receives its own subsystem every time it receives the information request packet P4. Temperature information (temperature information # 1 in the figure) is acquired and returned to the master management apparatus. Each time the master management device receives the temperature information # 1 from the slave management device # 1, the master management device updates the temperature information # 1 held corresponding to the slave management device # 1 with the received temperature information # 1.

スレーブ管理装置#2とマスタ管理装置間の通信パターンは、情報要求パケットP4を受信してから所定の時間が経過しても、次の情報要求パケットP4がスレーブ管理装置に届かなかった場合のものである。図示のように、この場合、スレーブ管理装置#2は、マスタ名要求パケットP0(ブロードキャスト)を発行する。これにより、マスタ管理装置の再選出が行われ、システム変更や故障などにより前のマスタ管理装置が機能しない状態になったとしても、新しいマスタ管理装置が自律的に選出される。なお、これにより選出された新しいマスタ管理装置は、新たに管理リストを作成する。   The communication pattern between the slave management device # 2 and the master management device is a case where the next information request packet P4 does not reach the slave management device even after a predetermined time has elapsed after receiving the information request packet P4. It is. As illustrated, in this case, the slave management apparatus # 2 issues a master name request packet P0 (broadcast). As a result, the master management device is re-selected, and a new master management device is autonomously selected even if the previous master management device does not function due to a system change or failure. Note that the new master management device selected in this way newly creates a management list.

スレーブ管理装置#3とマスタ管理装置間の通信パターンは、マスタ管理装置が情報要求パケットP4の送信後、送信先のスレーブ管理装置から温度情報を受信できなかった場合のものである。図示のように、この場合、マスタ管理装置は、当該スレーブ管理装置(図中スレーブ管理装置#3)についての登録内容を削除する。これにより、例えばシステム変更などによりスレーブ管理装置#3の属するサブシステムが撤去された場合にも対応可能である。   The communication pattern between the slave management apparatus # 3 and the master management apparatus is a case where the master management apparatus cannot receive the temperature information from the transmission destination slave management apparatus after transmitting the information request packet P4. As shown in the figure, in this case, the master management device deletes the registered content for the slave management device (slave management device # 3 in the figure). Thereby, it is possible to cope with a case where the subsystem to which the slave management apparatus # 3 belongs is removed due to, for example, a system change.

マスタ管理装置による位置情報の取得について説明する。本実施の形態において、マスタ管理装置は、三点測位法により、各スレーブ管理装置と自身の相対位置を当該スレーブ管理装置の位置情報として取得する。具体的には、マスタ管理装置は、自身のサブシステムのエンクロージャ510に設けられた3つのレシーバ552、554、556がスレーブ管理装置の属するサブシステム内の発信機540からの電波を受信する時間の差から該スレーブ管理装置と自身の相対位置を求める。すなわち、レシーバ552、レシーバ554、レシーバ556、およびMPU531は、測位デバイスを構成する。なお、三点測位法は、一般的に用いられる測距方法であるため、ここで詳細な説明を省略する。   Acquisition of position information by the master management apparatus will be described. In the present embodiment, the master management device acquires each slave management device and its relative position as position information of the slave management device by the three-point positioning method. Specifically, the master management device has a time period during which the three receivers 552, 554, and 556 provided in the enclosure 510 of its own subsystem receive radio waves from the transmitter 540 in the subsystem to which the slave management device belongs. The relative position between the slave management device and itself is obtained from the difference. That is, the receiver 552, the receiver 554, the receiver 556, and the MPU 531 constitute a positioning device. Note that the three-point positioning method is a distance measuring method that is generally used, and thus detailed description thereof is omitted here.

マスタ管理装置は、このようにして取得した各サブシステムの温度情報と位置情報を、サブシステム400に設けられた制御装置402に送信する。制御装置402は、マスタ管理装置から温度情報と位置情報に基づいて、各サブシステムが設けられた場所間で温度分布が均一になるように、各々のサーバ間で負荷分布の調整を行う。   The master management device transmits the temperature information and position information of each subsystem acquired in this way to the control device 402 provided in the subsystem 400. Based on the temperature information and the position information from the master management device, the control device 402 adjusts the load distribution between the servers so that the temperature distribution is uniform between the locations where the subsystems are provided.

具体的には、制御装置402は、まず、各サブシステムの温度情報に基づいて、各サブシステムが設けられた場所間での温度分布の偏りの有無を確認する。例えば、制御装置402は、各サブシステムの温度情報が示す温度の平均値を求め、該平均値との差が所定の閾値以上の温度のサブシステムがあれば、温度分布の偏りがあるとし、全てのサブシステムについて、その温度と上記平均値との差が所定の閾値より小さければ、温度分布の偏りが無いとする。   Specifically, the control device 402 first confirms whether or not there is a bias in temperature distribution between locations where each subsystem is provided, based on the temperature information of each subsystem. For example, the control device 402 calculates the average value of the temperature indicated by the temperature information of each subsystem, and if there is a subsystem whose temperature is equal to or greater than a predetermined threshold, the temperature distribution is biased. For all subsystems, if the difference between the temperature and the average value is smaller than a predetermined threshold value, it is assumed that there is no temperature distribution bias.

温度分布の偏りが無い場合、制御装置402は、負荷分布の調整をしない。温度分布の偏りがあれば、制御装置402は、温度分布の偏りが無くなるように、サーバ間で負荷分布を調整する。この調整は、例えば温度の高いサブシステム内のサーバの負荷を、温度の低いサブシステム内に移動する手法が挙げられるが、温度分布の偏りを無くすことができれば、従来知られているいかなる負荷分布の調整手法を用いてもよい。   When there is no temperature distribution bias, the control device 402 does not adjust the load distribution. If there is an uneven temperature distribution, the control device 402 adjusts the load distribution between servers so that the uneven temperature distribution is eliminated. This adjustment can be done by, for example, moving the server load in the subsystem with a high temperature into the subsystem with a low temperature. If the bias in the temperature distribution can be eliminated, any known load distribution can be used. This adjustment method may be used.

制御装置402は、負荷分布の調整のために負荷を移動する際に、位置情報を参照して移動先のサーバの優先順位を決定する。図3に戻って説明する。   When the load is moved for adjusting the load distribution, the control device 402 refers to the position information and determines the priority of the destination server. Returning to FIG.

図3に示すサーバ運用システム300において、点線により囲まれた4つの領域(領域1〜領域4)のうち、領域1と領域3は、冷却装置320または冷却装置340に近い場所であり、領域2と領域4は、冷却装置320と冷却装置340のいずれからも離れた場所である。そのため、領域2と領域4は、領域1と領域3よりホットスポットになりやすい。また、領域2と領域4がホットスポットにならないように、従来のように単に冷却装置の冷却能力を強めれば、領域1と領域3は過冷却され、システム全体の冷却効率が悪い。   In the server operation system 300 illustrated in FIG. 3, among the four regions (region 1 to region 4) surrounded by the dotted line, the region 1 and the region 3 are locations close to the cooling device 320 or the cooling device 340, and the region 2 The region 4 is a place away from both the cooling device 320 and the cooling device 340. Therefore, the regions 2 and 4 are more likely to be hot spots than the regions 1 and 3. Further, if the cooling capacity of the cooling device is simply increased as in the past so that the regions 2 and 4 do not become hot spots, the regions 1 and 3 are supercooled, and the cooling efficiency of the entire system is poor.

それに対して、上述した本実施の形態のサーバ運用システム300のように、各サブシステムが設けられた場所間での温度分布が均一になるようにサーバ間で負荷分布を調整することにより、冷却装置の冷却能力を効率よく利用できる。ここで、例えば、温度分布の偏りを解消するために、領域4内のサブシステムのサーバの負荷を温度の低いサブシステム内のサーバに移動する必要があり、温度の低いサブシステムが領域1と領域3内のサブシステムである場合を考える。この場合、領域1と領域3のいずれの領域内のサブシステムのサーバに負荷を移動するかを決める必要がある。   On the other hand, like the server operation system 300 of the present embodiment described above, cooling is performed by adjusting the load distribution between servers so that the temperature distribution between the locations where each subsystem is provided is uniform. The cooling capacity of the device can be used efficiently. Here, for example, in order to eliminate the uneven temperature distribution, it is necessary to move the server load of the subsystem in the region 4 to the server in the subsystem having a low temperature. Consider the case of a subsystem in region 3. In this case, it is necessary to decide whether to move the load to the server of the subsystem in the area 1 or the area 3.

本実施の形態において、制御装置402は、負荷分布の調整のために負荷を移動する際に、マスタ管理装置からの位置情報に基づいて、サブシステムの密集度が高い場所に設けられたサブシステムに含まれるサーバよりも、密集度の低い場所に設けられたサブシステムに含まれるサーバを優先的に移動先のサーバとして選定する。上記の例の場合、移動先として、領域1と領域3のいずれの領域内のサーバも移動先のサーバとすることができるが、本実施の形態では、制御装置402は、サブシステムの密集度が低いほうの領域1内のサーバを優先的に選定する。こうすることにより、より冷却効率を高めることができる。   In the present embodiment, when the control device 402 moves a load to adjust the load distribution, the subsystem 402 is provided in a place where the subsystem density is high based on position information from the master management device. A server included in a subsystem provided in a place with a low density is preferentially selected as a destination server. In the case of the above example, the server in any of the areas 1 and 3 can be the destination server as the destination, but in this embodiment, the control device 402 is the density of the subsystems. A server in the region 1 having a lower value is preferentially selected. By carrying out like this, cooling efficiency can be raised more.

本実施の形態のサーバ運用システム300は、本発明の技術的原理を説明する際に用いられたサーバ運用システム100とサーバ運用システム200を具現化したものであり、本発明の原理を説明する際に挙げた本発明の技術の効果を得ることができる。   The server operation system 300 according to the present embodiment embodies the server operation system 100 and the server operation system 200 used when explaining the technical principle of the present invention, and when explaining the principle of the present invention. The effects of the technology of the present invention described in the above can be obtained.

以上、実施の形態をもとに本発明を説明した。実施の形態は例示であり、本発明の主旨から逸脱しない限り、さまざまな変更、増減を加えてもよい。これらの変更、増減が加えられた変形例も本発明の範囲にあることは当業者に理解されるところである。   The present invention has been described above based on the embodiment. The embodiment is an exemplification, and various changes and increases / decreases may be added without departing from the gist of the present invention. It will be understood by those skilled in the art that modifications to which these changes and increases / decreases are also within the scope of the present invention.

例えば、サーバ運用システム300において、制御装置402は、サブシステムの密集度に基づいて負荷の移動先のサーバの優先度を決めるようにしているが、サーバ室に設けられた冷却装置の位置と、マスタ管理装置が得た位置情報とに基づいて、冷却装置までの距離が近いサブシステムに含まれるサーバほど該サーバを優先的に移動先のサーバとして選定するようにしてもよい。この手法も、温度分布の均一化をより効率良く行うことができる。例えば図3に示す配置例において、温度分布の均一化のみを考えると、領域4と領域3のいずれの領域内のサーバも負荷の移動先のサーバとすることができる場合、冷却装置340に近い位置の領域3に設けられたサブシステム内のサーバを優先的に選定する。   For example, in the server operation system 300, the control device 402 determines the priority of the server to which the load is moved based on the density of the subsystem, and the position of the cooling device provided in the server room, Based on the position information obtained by the master management device, the servers included in the subsystems closer to the cooling device may be preferentially selected as destination servers. This method can also make the temperature distribution uniform more efficiently. For example, in the arrangement example shown in FIG. 3, considering only the uniform temperature distribution, if the servers in both the region 4 and the region 3 can be the load destination server, they are close to the cooling device 340. A server in the subsystem provided in the location area 3 is preferentially selected.

なお、冷却装置の位置情報は、例えば予め制御装置402に対して設定すればよい。   In addition, what is necessary is just to set the positional information on a cooling device with respect to the control apparatus 402 previously, for example.

また、各サブシステムの位置情報を取得することができれば、マスタ管理装置による各サブシステムの位置情報の取得手法も上述した手法に限られることが無い。例えば、各サブシステム内例えばエンクロージャにGPSレシーバを備え、各スレーブ管理装置が自身のサブシステム内のGPSレシーバの測定値を位置情報としてネットワークを介してマスタ管理装置に送信するようにしてもよい。この手法による位置情報は、マルチパスや電波の回り込みなどに影響されず、より精確である。   Further, if the position information of each subsystem can be acquired, the method for acquiring the position information of each subsystem by the master management apparatus is not limited to the above-described method. For example, a GPS receiver may be provided in each subsystem, for example, in an enclosure, and each slave management device may transmit the measurement value of the GPS receiver in its own subsystem to the master management device via the network as position information. The position information obtained by this method is more accurate without being affected by multipath or radio wave wraparound.

また例えば、サーバ運用システム300による位置情報の取得と同じように三点測位法を用いるが、電波の代わりに超音波を利用してもよい。   Further, for example, the three-point positioning method is used in the same manner as the acquisition of position information by the server operation system 300, but ultrasonic waves may be used instead of radio waves.

さらに、ネットワーク390を無線LANで構成し、無線LANの搬送波の強度を利用して各サブシステムの位置情報を得るようにしてもよい。この場合、予め3エンクロージャ以上に基準となる座標を与える必要があるが、ネットワークデバイスを測位デバイスとして用いることができるため、安価である。   Further, the network 390 may be configured by a wireless LAN, and the position information of each subsystem may be obtained using the strength of the wireless LAN carrier wave. In this case, it is necessary to give reference coordinates to three enclosures or more in advance, but it is inexpensive because a network device can be used as a positioning device.

100 サーバ運用システム 110 サーバ
120 マスタ管理装置 130 制御装置
200 サーバ運用システム 210 サブシステム
212 エンクロージャ 214 サーバ
216 マスタ管理装置 220 サブシステム
222 エンクロージャ 224 サーバ
226 スレーブ管理装置 230 サブシステム
232 エンクロージャ 234 サーバ
236 スレーブ管理装置 280 制御装置
290 ネットワーク 300 サーバ運用システム
310 サーバ室 320 冷却装置
340 冷却装置 390 ネットワーク
400 サブシステム 402 制御装置
500 サブシステム 510 エンクロージャ
520 サーバ 522 吸気温度センサ
530 管理装置 531 MPU
532 RAM 533 NIC
534 LANボード 535 CNT
536 CNT 540 発信機
552 レシーバ 554 レシーバ
556 レシーバ
DESCRIPTION OF SYMBOLS 100 Server operation system 110 Server 120 Master management apparatus 130 Control apparatus 200 Server operation system 210 Subsystem 212 Enclosure 214 Server 216 Master management apparatus 220 Subsystem 222 Enclosure 224 Server 226 Slave management apparatus 230 Subsystem 232 Enclosure 234 Server 236 Slave management apparatus 280 Control device 290 Network 300 Server operation system 310 Server room 320 Cooling device 340 Cooling device 390 Network 400 Subsystem 402 Control device 500 Subsystem 510 Enclosure 520 Server 522 Intake air temperature sensor 530 Management device 531 MPU
532 RAM 533 NIC
534 LAN board 535 CNT
536 CNT 540 Transmitter 552 Receiver 554 Receiver 556 Receiver

Claims (15)

複数のサーバと、
前記複数のサーバが設けられた夫々の場所の温度を示す温度情報を取得可能なマスタ管理装置と、
前記マスタ管理装置が得た温度情報に基づいて、前記複数のサーバが設けられた夫々の場所間での温度分布が均一になるように、該複数のサーバ間で負荷分布の調整を行う制御装置とを備えることを特徴とするサーバ運用システム。
Multiple servers,
A master management device capable of acquiring temperature information indicating the temperature of each location where the plurality of servers are provided;
A control device that adjusts the load distribution among the plurality of servers based on the temperature information obtained by the master management device so that the temperature distribution between the respective locations where the plurality of servers are provided is uniform. A server operation system comprising:
エンクロージャ単位の複数のサブシステムにより構成され、
前記サブシステムは、
該サブシステムが設けられた場所の温度を示す温度情報を取得可能な管理装置と、
前記複数のサーバのうちの1つ以上を格納するエンクロージャとを有し、
前記複数のサブシステムの管理装置のうちの1つは前記マスタ管理装置であり、他の管理装置はスレーブ管理装置であり、
各前記スレーブ管理装置は、自身が属するサブシステムの温度情報を前記マスタ管理装置に提供し、
前記マスタ管理装置は、自身が属するサブシステムの温度情報と、各スレーブ管理装置から提供された夫々のサブシステムの温度情報とを前記制御装置に供し、
前記制御装置は、前記複数のサブシステムが設けられた夫々の場所間での温度分布が均一になるように、前記複数のサーバ間で負荷分布の調整を行うことを特徴とする請求項1に記載のサーバ運用システム。
Consists of multiple subsystems per enclosure,
The subsystem is
A management device capable of acquiring temperature information indicating the temperature of the place where the subsystem is provided;
An enclosure for storing one or more of the plurality of servers,
One of the management devices of the plurality of subsystems is the master management device, and the other management device is a slave management device,
Each slave management device provides temperature information of the subsystem to which it belongs to the master management device,
The master management device provides temperature information of the subsystem to which the master management device belongs and temperature information of each subsystem provided from each slave management device to the control device,
2. The control device according to claim 1, wherein the control device adjusts the load distribution among the plurality of servers so that the temperature distribution is uniform between the locations where the plurality of subsystems are provided. The server operation system described.
前記複数のサブシステムの管理装置は、ネットワークにより接続されており、該ネットワークを介して通信することにより自律的にマスタ管理装置とスレーブ管理装置の決定がなされることを特徴とする請求項2に記載のサーバ運用システム。   3. The management devices of the plurality of subsystems are connected by a network, and a master management device and a slave management device are autonomously determined by communicating via the network. The server operation system described. 前記管理装置は、自身が属するサブシステムに含まれる少なくとも1つのサーバに備えられた吸気温度センサの測定値を該サブシステムの温度情報として取得することを特徴とする請求項2または3に記載のサーバ運用システム。   The said management apparatus acquires the measured value of the intake temperature sensor with which the at least 1 server contained in the subsystem to which it belongs belongs as temperature information of this subsystem. Server operation system. 前記マスタ管理装置は、さらに、各前記サブシステムが設けられた場所の位置を示す位置情報を取得可能であり、
前記制御装置は、前記負荷分布の調整のために負荷を移動する際に、前記マスタ管理装置が得た位置情報に基づいて、サブシステムの密集度が高い場所に設けられたサブシステムに含まれるサーバよりも、前記密集度の低い場所に設けられたサブシステムに含まれるサーバを優先的に移動先のサーバとして選定することを特徴とする請求項2から4のいずれ1項に記載のサーバ運用システム。
The master management device can further acquire position information indicating the position of the place where each of the subsystems is provided,
The control device is included in a subsystem provided in a place where the density of the subsystem is high based on the positional information obtained by the master management device when moving the load for adjusting the load distribution. The server operation according to any one of claims 2 to 4, wherein a server included in a subsystem provided in a place with a lower density than a server is preferentially selected as a destination server. system.
冷却装置が設けられたサーバ室に設置されており、
前記マスタ管理装置は、さらに、各前記サブシステムが設けられた夫々の場所の位置を示す位置情報を取得可能であり、
前記制御装置は、前記負荷分布の調整のために負荷を移動する際に、冷却装置の位置と、前記マスタ管理装置が得た位置情報とに基づいて、冷却装置までの距離が近いサブシステムに含まれるサーバほど該サーバを優先的に移動先のサーバとして選定することを特徴とする請求項2から4のいずれか1項記載のサーバ運用システム。
It is installed in the server room where the cooling device is installed,
The master management device can further acquire position information indicating the position of each location where each of the subsystems is provided,
When the control device moves the load to adjust the load distribution, the control device determines whether the distance to the cooling device is close based on the position of the cooling device and the position information obtained by the master management device. 5. The server operation system according to claim 2, wherein the servers are preferentially selected as destination servers for the included servers. 6.
スレーブ管理装置を含むサブシステムは、発信器をさらに有し、
マスタ管理装置を含むサブシステムは、測位デバイスをさらに有し、
前記スレーブ管理装置は、温度情報の提供に際して、自身のサブシステムに設けられた発信器を発信させ、
前記測位デバイスは、三点測位法により前記発信器から受信した信号に基づいて該発信器が設けられたサブシステムの位置情報を取得することを特徴とする請求項5または6に記載のサーバ運用システム。
The subsystem including the slave management device further includes a transmitter,
The subsystem including the master management device further includes a positioning device,
The slave management device, when providing temperature information, causes a transmitter provided in its own subsystem to transmit,
The server operation according to claim 5 or 6, wherein the positioning device acquires position information of a subsystem provided with the transmitter based on a signal received from the transmitter by a three-point positioning method. system.
前記発信器と前記測位デバイスは、該発信器または該測位デバイスが属するサブシステムのエンクロージャに設けられていることを特徴とする請求項7に記載のサーバ運用システム。   The server operation system according to claim 7, wherein the transmitter and the positioning device are provided in an enclosure of a subsystem to which the transmitter or the positioning device belongs. 各管理装置は、GPS受信機を備え、
スレーブ管理装置は、温度情報と共に、自身のサブシステムに設けられたGPS受信機が得たGPS情報を位置情報としてマスタ管理装置に提供することを特徴とする請求項5または6に記載のサーバ運用システム。
Each management device includes a GPS receiver,
7. The server operation according to claim 5, wherein the slave management apparatus provides the master management apparatus with the temperature information and GPS information obtained by a GPS receiver provided in its subsystem as position information. system.
複数のサーバを備えたサーバシステムにおける各前記サーバに対して、該サーバが設けられた場所の温度を示す温度情報を取得し、
前記温度情報に基づいて、前記複数のサーバが設けられた夫々の場所間での温度分布が均一になるように、該複数のサーバ間で負荷分布の調整を行うことを特徴とするサーバ運用方法。
For each of the servers in a server system having a plurality of servers, obtain temperature information indicating the temperature of the place where the server is provided,
Based on the temperature information, the load distribution is adjusted between the plurality of servers so that the temperature distribution between the respective locations where the plurality of servers are provided is uniform. .
前記サーバシステムは、エンクロージャ単位の複数のサブシステムにより構成され、
前記サブシステムは、該サブシステムが設けられた場所の温度を示す温度情報を取得可能な管理装置と、前記複数のサーバのうちの1つ以上を格納するエンクロージャとを有し、
前記複数のサブシステムの管理装置のうちの1つであるマスタ管理装置以外の他の管理装置であるスレーブ管理装置により、該スレーブ管理装置自身が属するサブシステムの温度情報を前記マスタ管理装置に提供し、
前記マスタ管理装置により、自身が属するサブシステムの温度情報と、各スレーブ管理装置から提供された夫々のサブシステムの温度情報とを集約し、
前記マスタ管理装置により集約された温度情報に基づいて、前記複数のサブシステムが設けられた夫々の場所間での温度分布が均一になるように、前記複数のサーバ間で負荷分布の調整を行うことを特徴とする請求項10に記載のサーバ運用方法。
The server system is composed of a plurality of subsystems in units of enclosures,
The subsystem includes a management device that can acquire temperature information indicating a temperature of a place where the subsystem is provided, and an enclosure that stores one or more of the plurality of servers.
The slave management device other than the master management device that is one of the plurality of subsystem management devices provides the master management device with temperature information of the subsystem to which the slave management device itself belongs And
The master management device aggregates the temperature information of the subsystem to which it belongs and the temperature information of each subsystem provided from each slave management device,
Based on the temperature information collected by the master management device, the load distribution is adjusted among the plurality of servers so that the temperature distribution between the respective locations where the plurality of subsystems are provided is uniform. The server operation method according to claim 10.
前記複数のサブシステムの管理装置をネットワークにより接続し、
該複数の管理装置間で、前記ネットワークを介した通信により自律的にマスタ管理装置とスレーブ管理装置の決定がなされることを特徴とする請求項11に記載のサーバ運用方法。
Connecting the management devices of the plurality of subsystems via a network;
12. The server operation method according to claim 11, wherein a master management device and a slave management device are autonomously determined between the plurality of management devices through communication via the network.
前記管理装置により、自身が属するサブシステムに含まれる少なくとも1つのサーバに備えられた吸気温度センサの測定値を該サブシステムの温度情報として取得することを特徴とする請求項11または12に記載のサーバ運用方法。   The measurement value of an intake air temperature sensor provided in at least one server included in the subsystem to which the management apparatus belongs is acquired as temperature information of the subsystem by the management device. Server operation method. 前記マスタ管理装置により、さらに、各前記サブシステムが設けられた場所の位置を示す位置情報を取得し、
前記負荷分布の調整のために負荷を移動する際に、前記マスタ管理装置が得た位置情報に基づいて、サブシステムの密集度が高い場所に設けられたサブシステムに含まれるサーバよりも、前記密集度の低い場所に設けられたサブシステムに含まれるサーバを優先的に移動先のサーバとして選定することを特徴とする請求項11から13のいずれ1項に記載のサーバ運用方法。
The master management device further acquires position information indicating the position of the place where each of the subsystems is provided,
When moving the load for adjusting the load distribution, based on the position information obtained by the master management device, than the server included in the subsystem provided in a place where the density of the subsystem is high, the server The server operation method according to any one of claims 11 to 13, wherein a server included in a subsystem provided in a place with low congestion is preferentially selected as a destination server.
前記サーバシステムは、冷却装置が設けられたサーバ室に設置されており、
前記マスタ管理装置により、さらに、各前記サブシステムが設けられた夫々の場所の位置を示す位置情報を取得し、
前記負荷分布の調整のために負荷を移動する際に、冷却装置の位置と、前記マスタ管理装置が得た位置情報とに基づいて、冷却装置までの距離が近いサブシステムに含まれるサーバほど該サーバを優先的に移動先のサーバとして選定することを特徴とする請求項11から13のいずれか1項記載のサーバ運用方法。
The server system is installed in a server room provided with a cooling device,
The master management device further acquires position information indicating the position of each location where each of the subsystems is provided,
When moving the load to adjust the load distribution, the server included in the subsystem that is closer to the cooling device based on the position of the cooling device and the position information obtained by the master management device. 14. The server operation method according to claim 11, wherein the server is preferentially selected as a destination server.
JP2009223962A 2009-09-29 2009-09-29 Server operation system and server operation method Expired - Fee Related JP5454058B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009223962A JP5454058B2 (en) 2009-09-29 2009-09-29 Server operation system and server operation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009223962A JP5454058B2 (en) 2009-09-29 2009-09-29 Server operation system and server operation method

Publications (2)

Publication Number Publication Date
JP2011076158A true JP2011076158A (en) 2011-04-14
JP5454058B2 JP5454058B2 (en) 2014-03-26

Family

ID=44020116

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009223962A Expired - Fee Related JP5454058B2 (en) 2009-09-29 2009-09-29 Server operation system and server operation method

Country Status (1)

Country Link
JP (1) JP5454058B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016186712A (en) * 2015-03-27 2016-10-27 日本電気株式会社 system
JP2017126238A (en) * 2016-01-15 2017-07-20 日本電気株式会社 System management device, information processing system, system management method, and program
JP2018018340A (en) * 2016-07-28 2018-02-01 富士通株式会社 Program, management method and management device
US10158526B2 (en) 2015-03-27 2018-12-18 Nec Corporation System that manages server function

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126968A (en) * 2002-10-03 2004-04-22 Fujitsu Ltd Job scheduling system for parallel computer
JP2007179437A (en) * 2005-12-28 2007-07-12 Fujitsu Ltd Management system, management program and management method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004126968A (en) * 2002-10-03 2004-04-22 Fujitsu Ltd Job scheduling system for parallel computer
JP2007179437A (en) * 2005-12-28 2007-07-12 Fujitsu Ltd Management system, management program and management method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016186712A (en) * 2015-03-27 2016-10-27 日本電気株式会社 system
US10158526B2 (en) 2015-03-27 2018-12-18 Nec Corporation System that manages server function
JP2017126238A (en) * 2016-01-15 2017-07-20 日本電気株式会社 System management device, information processing system, system management method, and program
JP2018018340A (en) * 2016-07-28 2018-02-01 富士通株式会社 Program, management method and management device

Also Published As

Publication number Publication date
JP5454058B2 (en) 2014-03-26

Similar Documents

Publication Publication Date Title
US8428629B2 (en) Methods and apparatus for determining a communications mode and/or using a determined communications mode
KR101332095B1 (en) Packet communication system, communication method, and program
US9445226B2 (en) Method for improving location accuracy in multi-channel wireless networks
KR101850802B1 (en) Systems and methods for enhanced discovery
CN105450555A (en) Network on chip system and establishment method of network on chip communication link
Mardini et al. Rotated hybrid, energy-efficient and distributed (R-HEED) clustering protocol in WSN
JP5454058B2 (en) Server operation system and server operation method
US20150281074A1 (en) Data transfer control device and data transfer control method
AU2004237633A1 (en) Route discovery device and method in a mobile ad-hoc network
JP2013026926A (en) Radio communication system, slave station device, master station device, and radio communication system control method
CN108055156B (en) AP management method and device
Jan et al. Dependability and reliability analysis of intra cluster routing technique
KR20210086702A (en) Geographical area message distribution
WO2020161561A1 (en) Local service announcement in a stretched cluster
JP2010068050A (en) Wireless synchronization system and wireless synchronization method
JP2020098459A (en) Communication system, communication device, and control program
CN109547959A (en) A kind of fire-fighting wireless sensor network optimizing method, device and server
WO2018098748A1 (en) Communication method in distributed network, node, and system
JPWO2009123202A1 (en) Monitoring system
WO2018098752A1 (en) Message broadcast method for distributed network and node
CN114885413A (en) Ad-hoc network communication system, method and frame structure based on lightweight clock synchronization mechanism
JP6274913B2 (en) Mesh network system, relay device, mesh network control method, and program
JP6898014B1 (en) Wireless communication system, wireless communication method, relay station and wireless communication program
WO2018098749A1 (en) Message broadcasting method in distributed network and node
Branch et al. ESCORT: energy-efficient sensor network communal routing topology using signal quality metrics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120809

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131002

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131008

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131223

R150 Certificate of patent or registration of utility model

Ref document number: 5454058

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees