JP2007072768A - Server, job scheduling method, program, and recording medium - Google Patents

Server, job scheduling method, program, and recording medium Download PDF

Info

Publication number
JP2007072768A
JP2007072768A JP2005259198A JP2005259198A JP2007072768A JP 2007072768 A JP2007072768 A JP 2007072768A JP 2005259198 A JP2005259198 A JP 2005259198A JP 2005259198 A JP2005259198 A JP 2005259198A JP 2007072768 A JP2007072768 A JP 2007072768A
Authority
JP
Japan
Prior art keywords
job scheduling
program
server
clustering system
external
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005259198A
Other languages
Japanese (ja)
Inventor
Yoshiharu Takeuchi
義晴 竹内
Koji Matsuoka
浩司 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005259198A priority Critical patent/JP2007072768A/en
Publication of JP2007072768A publication Critical patent/JP2007072768A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a server and the like performing job scheduling considering external conditions in a PC clustering system. <P>SOLUTION: In this server 100, job scheduling is carried out based on the external condition for regulating a program to be applied to each PC in the PC clustering system or for controlling ON/OFF of power supply in the respective PC. The server 100 is provided with a job scheduling means 110 carrying out job scheduling on the program applied from user terminal 300, an external condition notifying means 120 notifying the external conditions acquired from a power consumption sensor 500 and a room temperature sensor 600 to the job scheduling means 110, and a control policy registration means 130 registering a control policy about the external conditions inputted from an operation manager terminal 400. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、大多数のPC(Personal Computer)が連結したPCクラスタリングシステムのジョブスケジューリングを行うサーバ、及び、その方法、プログラム、記録媒体に関するものである。   The present invention relates to a server that performs job scheduling in a PC clustering system in which a large number of PCs (Personal Computers) are connected, and a method, program, and recording medium therefor.

近年、汎用のPCの性能が向上し、そのPCを高性能ネットワークハードウェアで多数連結するPCクラスタリングシステムが、HPC(High Perfomance Computing)システムとして普及し、その認知度は全世界で加速されつつある。それに伴い、自動車の設計などにおいても計算機シミュレーションが実用されるようになってきた。このようなPCクラスタリングシステムは、何十、あるいは何千というPCを、ある部屋に高密度で設置することになる。   In recent years, the performance of general-purpose PCs has improved, and a PC clustering system that connects many PCs with high-performance network hardware has become widespread as an HPC (High Perfomance Computing) system, and its recognition is being accelerated worldwide. . Along with this, computer simulation has come into practical use in automobile design and the like. In such a PC clustering system, dozens or thousands of PCs are installed in a room at a high density.

このような大多数のPCを稼動させれば、その消費電力は非常に大きなものとなり、利用可能な電力を超えてしまう可能性がある。また、PCクラスタリングシステム全体の発熱も非常に大きなものとなり、部屋の室温が上昇する。そしてその熱によりCPU(Central Processing Unit)に負荷がかかり、PCが故障する場合がある。なお、部屋に設けられている空調を働かせて室温を下げようとする行為は、消費電力が増大するという結果を招くため有効な策とはいえない。   If such a large number of PCs are operated, the power consumption becomes very large, which may exceed the available power. Moreover, the heat generation of the entire PC clustering system becomes very large, and the room temperature of the room rises. Then, a load is applied to the CPU (Central Processing Unit) due to the heat, and the PC may break down. Note that the act of lowering the room temperature by operating the air conditioner provided in the room is not an effective measure because it results in an increase in power consumption.

上記事情を考慮すれば、CPUの負荷を一定以下に抑え、PCの稼動条件を逸脱しないように消費電力と室温上昇を一定の範囲内に抑えることが重要な課題となる。勿論、消費電力と室温を確認しながら、手動でそれらのジョブスケジューリングを行うことはできる。しかし、常時それらを監視する必要があり、運用上それは非常に困難である。従って、それらのジョブスケジューリングは自動で行われることが必要である。   Considering the above circumstances, it is important to keep the CPU load below a certain level and to keep the power consumption and room temperature rise within a certain range so as not to deviate from the operating conditions of the PC. Of course, it is possible to perform job scheduling manually while checking the power consumption and the room temperature. However, it is necessary to constantly monitor them, which is very difficult in operation. Therefore, these job scheduling needs to be performed automatically.

特許文献1の「ジョブスケジューリング方式」は、スケジューリング更新ルールを設定しておくことによりシステム(上記CPUに相当)の負荷状態に合わせて自動的にジョブスケジューリングルールを変更し、容易に効率的なシステム運用を行う技術について開示している。   The “job scheduling method” disclosed in Patent Document 1 automatically changes the job scheduling rule according to the load state of the system (corresponding to the CPU) by setting a scheduling update rule, and can easily and efficiently perform the system. It discloses the technology to operate.

しかし、この技術を上記PCクラスタリングシステムという環境に適用することは困難である。大規模なPCクラスタリングシステムでは個々のCPUの負荷だけでなく、他のCPUの負荷状態も考慮してジョブスケジューリングを行う必要がある。しかし、この技術では単に、一のCPUの負荷状態による更新ルールの設定を行うだけであり、多数のCPUに単純に適用できるものではないからである。   However, it is difficult to apply this technique to the environment of the PC clustering system. In a large-scale PC clustering system, it is necessary to perform job scheduling in consideration of not only the load of individual CPUs but also the load states of other CPUs. However, this technique simply sets an update rule according to the load state of one CPU, and cannot simply be applied to many CPUs.

また、上述したようにCPUの負荷状態は消費電力や室温の上昇といった外部の条件(以下、「外部条件」という。)に影響を受ける。PCクラスタリングシステムのジョブスケジューリングを行うときは外部条件も考慮する必要がある。しかし、特許文献1には外部条件については何ら開示されていない。
特開平5−88917号公報
Further, as described above, the load state of the CPU is affected by external conditions (hereinafter referred to as “external conditions”) such as power consumption and an increase in room temperature. When performing job scheduling of the PC clustering system, it is necessary to consider external conditions. However, Patent Document 1 does not disclose any external conditions.
Japanese Patent Laid-Open No. 5-888917

上記事情を鑑みて、本発明はPCクラスタリングシステムにおいて、外部条件を考慮したジョブスケジューリングを行うサーバ等を提供することを目的とする。   In view of the above circumstances, an object of the present invention is to provide a server that performs job scheduling in consideration of external conditions in a PC clustering system.

上記目的を達成する本発明の態様は、外部条件に基づいてジョブスケジューリングを行い、PCクラスタリングシステムの各PCに投入するプログラムを調節、または、各PCの電源のON/OFFを制御するサーバに関するものである。   An aspect of the present invention that achieves the above object relates to a server that performs job scheduling based on external conditions, adjusts a program to be input to each PC of a PC clustering system, or controls power ON / OFF of each PC. It is.

このサーバは、端末より投入されたプログラムに対して前記ジョブスケジューリングを行うジョブスケジューリング手段と、前記外部条件を前記ジョブスケジューリング手段に通知する外部状況通知手段と、端末より入力された前記外部条件に関する制御ポリシーを登録する制御ポリシー登録手段を有するものである。   The server includes a job scheduling unit that performs the job scheduling for a program input from a terminal, an external status notification unit that notifies the job scheduling unit of the external condition, and a control related to the external condition input from the terminal. Control policy registration means for registering a policy is provided.

本発明の他の態様は、外部条件に関する制御ポリシーを登録する登録工程と、前記外部条件を検出する検出工程を有し、前記外部条件に基づいてジョブスケジューリングを行い、PCクラスタリングシステムの各PCに投入するプログラムを調節、または、各PCの電源のON/OFFを制御するジョブスケジューリング方法に関するものである。   Another aspect of the present invention includes a registration step of registering a control policy related to an external condition and a detection step of detecting the external condition, and performs job scheduling based on the external condition, and each PC of the PC clustering system The present invention relates to a job scheduling method for adjusting a program to be input or controlling power ON / OFF of each PC.

ここで、前記ジョブスケジューリングにより前記PCクラスタリングシステムのPCが休止状態または停止状態にある場合、前記検出工程において前記外部条件を検出し、前記外部条件が前記制御ポリシーに従えば、当該休止状態または停止状態のPCを起動することを特徴とする。   Here, when the PC of the PC clustering system is in a dormant state or a stopped state by the job scheduling, the external condition is detected in the detection step, and if the external condition is in accordance with the control policy, the dormant state or the stopped state is detected. It is characterized by starting the PC in a state.

また、本発明の他の態様は、コンピュータに、外部条件に基づいてジョブスケジューリングを行い、PCクラスタリングシステムの各PCに投入するプログラムを調節、または、各PCの電源のON/OFFを制御するサーバとして機能させるプログラムに関するものであり、または、そのプログラムを格納する記録媒体に関するものである。   Another aspect of the present invention is a server that performs job scheduling on a computer based on external conditions, adjusts a program to be input to each PC of a PC clustering system, or controls power ON / OFF of each PC. Or a recording medium for storing the program.

本発明により、室温や消費電力といった外部条件に従ったプログラムのスケジューリングを行うことにより、自動で、外部条件を一定範囲内に維持でき、ひいては、PCクラスタリングシステムの各PCの故障率を下げることができる。   According to the present invention, by scheduling a program in accordance with external conditions such as room temperature and power consumption, the external conditions can be automatically maintained within a certain range, and thus the failure rate of each PC of the PC clustering system can be reduced. it can.

以下、本発明のサーバによるジョブスケジューリングを実施するための最良の形態について説明する。説明する際には、本明細書と同時に提出する図面を適宜参照することにする。   The best mode for carrying out job scheduling by the server of the present invention will be described below. In the description, the drawings submitted at the same time as this specification will be appropriately referred to.

図1は本形態のサーバとPCクラスタリングシステムを有して構成されるネットワークシステムの構成を図示したものである。このネットワークシステムはサーバ100、PCクラスタリングシステム200、利用者端末300、運用管理者端末400を有し構成されている。また、サーバ100には消費電力センサ500と室温センサ600が接続されている。   FIG. 1 illustrates the configuration of a network system that includes a server and a PC clustering system according to the present embodiment. This network system includes a server 100, a PC clustering system 200, a user terminal 300, and an operation manager terminal 400. In addition, a power consumption sensor 500 and a room temperature sensor 600 are connected to the server 100.

サーバ100はPCクラスタリングシステム200を管理する情報処理装置である。その管理を行うための中央処理制御を行うCPUと、当該中央処理制御を行うために読み出すプログラムを格納するROM(Read Only Memory)と、他の情報処理装置と送受信される種々の情報を記憶するRAM(Random Access Memory)を有している。   The server 100 is an information processing apparatus that manages the PC clustering system 200. A CPU that performs central processing control to perform the management, a ROM (Read Only Memory) that stores a program to be read to perform the central processing control, and various information transmitted to and received from other information processing apparatuses It has RAM (Random Access Memory).

PCクラスタリングシステム200は大規模な計算を要するシミュレーションなどを行うために多数のPCが連結されて構成される情報処理システムである。サーバ100より受信するプログラムが投入されることにより、対応する計算処理を実行する。   The PC clustering system 200 is an information processing system configured by connecting a large number of PCs in order to perform a simulation that requires a large-scale calculation. When a program received from the server 100 is input, a corresponding calculation process is executed.

利用者端末300はPCクラスタリングシステム200に所望の計算を実行させるために利用者がプログラムを投入するための情報処理装置である。このネットワークシステムには多数の利用者端末300が接続されており、各利用者端末から種々のプログラムが投入されるものとする。運用管理者端末400はPCクラスタリングシステム200による処理を調節するために運用管理者がポリシー制御を行うための情報処理装置である。適当な制御ポリシーをサーバ100に登録することによりPCクラスタリングシステム200に対するプログラムの投入を調節することができる。詳しくは後述する。   The user terminal 300 is an information processing apparatus for a user to input a program in order to cause the PC clustering system 200 to execute a desired calculation. A number of user terminals 300 are connected to the network system, and various programs are input from each user terminal. The operation manager terminal 400 is an information processing apparatus for the operation manager to perform policy control in order to adjust processing by the PC clustering system 200. By registering an appropriate control policy in the server 100, the program input to the PC clustering system 200 can be adjusted. Details will be described later.

消費電力センサ500はPCクラスタリングシステム200を運用することにより消費される電力を測定する機能を有するセンサである。その測定結果はサーバ100に送信される。室温センサ600はPCクラスタリングシステム200が配置されている部屋の室温を測定する機能を有するセンサである。その測定結果はサーバ100に送信される。   The power consumption sensor 500 is a sensor having a function of measuring power consumed by operating the PC clustering system 200. The measurement result is transmitted to the server 100. The room temperature sensor 600 is a sensor having a function of measuring the room temperature of the room where the PC clustering system 200 is arranged. The measurement result is transmitted to the server 100.

なお、PCクラスタリングシステム200の各PC、利用者端末300、運用管理者端末400は何れもサーバ100と同様にCPU、ROM、RAMを有している。   Note that each PC, user terminal 300, and operation manager terminal 400 of the PC clustering system 200 has a CPU, a ROM, and a RAM, as with the server 100.

次に、本形態のサーバ100におけるソフトウェアの構成について説明する。図2はサーバ100におけるソフトウェアの構成及びサーバ100にて送受信される種々の情報を図示したものである。サーバ100のソフトウェアはジョブスケジューリング手段110、外部状況通知手段120、制御ポリシー登録手段130、制御ポリシーデータベース140を有して構成されている。   Next, a software configuration in the server 100 of this embodiment will be described. FIG. 2 illustrates a software configuration in the server 100 and various information transmitted and received by the server 100. The software of the server 100 includes a job scheduling unit 110, an external status notification unit 120, a control policy registration unit 130, and a control policy database 140.

ジョブスケジューリング手段110は利用者端末300からのプログラムの投入に従ってキュー111に一時的に投入する。キュー111に投入されたプログラムを「APi」(i=0、1、…)と表記する。そして、PCクラスタリングシステム200の各PCのCPUのリソースの空き状況に応じて、キュー111に投入されたプログラムをリソースの空いたPCに投入する機能を有する。また、PCクラスタリングシステム200の消費電力、部屋の室温に応じて各PCの電源のON/OFF(シャットダウン)を制御する。つまり、PCクラスタリングシステム200のスケジューラとして機能する。   The job scheduling unit 110 temporarily enters the queue 111 according to the program input from the user terminal 300. A program placed in the queue 111 is represented as “APi” (i = 0, 1,...). In addition, the PC clustering system 200 has a function of inputting a program input to the queue 111 to a PC having free resources in accordance with the CPU resource free status of each PC. Further, the power ON / OFF (shutdown) of each PC is controlled according to the power consumption of the PC clustering system 200 and the room temperature of the room. That is, it functions as a scheduler of the PC clustering system 200.

外部状況通知手段120は消費電力センサ500よりPCクラスタリングシステム200における消費電力を電力情報として受信し、ジョブスケジューリング手段110に現在の消費電力を通知する。また、室温センサ600よりPCクラスタリングシステム200の部屋の室温を温度情報として受信し、ジョブスケジューリング手段110に現在の室温を通知する。   The external status notification unit 120 receives the power consumption in the PC clustering system 200 from the power consumption sensor 500 as power information, and notifies the job scheduling unit 110 of the current power consumption. Further, the room temperature of the room of the PC clustering system 200 is received from the room temperature sensor 600 as temperature information, and the current room temperature is notified to the job scheduling unit 110.

制御ポリシー登録手段130は運用管理者端末400より設定される制御ポリシーをサーバ100に登録する。また、制御ポリシーデータベース140は制御ポリシー登録手段130にて設定される制御ポリシーを記録する。この制御ポリシーはPCクラスタリングシステム200の消費電力、PCクラスタリングシステム200の部屋の室温などの外部条件に基づいてPCクラスタリングシステム200の運用を制御するためのポリシーを主にいう。設定される制御ポリシーとしては、例えば、「室温が30℃以上になった場合には、PCの1割をシャットダウンする」といったものがある。   The control policy registration unit 130 registers the control policy set by the operation manager terminal 400 in the server 100. The control policy database 140 records the control policy set by the control policy registration unit 130. This control policy mainly refers to a policy for controlling the operation of the PC clustering system 200 based on external conditions such as the power consumption of the PC clustering system 200 and the room temperature of the room of the PC clustering system 200. As a control policy to be set, for example, “If the room temperature becomes 30 ° C. or higher, 10% of the PC is shut down”.

本形態でなされるジョブスケジューリングはPCクラスタリングシステム200の消費電力と室温に連動して、各PCへのプログラムの投入を制御し、または、電源のON/OFFを制御する。   The job scheduling performed in this embodiment is linked to the power consumption of the PC clustering system 200 and the room temperature, and controls program input to each PC or power ON / OFF.

つまり、外部状況通知手段120は消費電力センサ500、室温センサ600より測定された消費電力、室温をジョブスケジューリング手段110に通知する。一方、制御ポリシー登録手段130は事前に、どのような外部条件において、PCへのジョブ投入をどのように制御するか、PCのシャットダウンと起動をどのように制御するか、といった制御ポリシーを登録する。登録された制御ポリシーは制御ポリシーデータベース140に記録される。   That is, the external status notification unit 120 notifies the job scheduling unit 110 of the power consumption measured by the power consumption sensor 500 and the room temperature sensor 600 and the room temperature. On the other hand, the control policy registration unit 130 registers in advance control policies such as how to control job input to the PC under what external conditions and how to control shutdown and activation of the PC. . The registered control policy is recorded in the control policy database 140.

そして、ジョブスケジューリング手段110は通知された消費電力、室温と設定された制御ポリシーに従って、利用者端末300により投入されたプログラムをPCクラスタリングシステム200の各PCに投入する。必要に応じてPCの電源をOFFする場合もある。これにより、自動的に消費電力、室温などの外部状況を一定範囲内に維持する。   Then, the job scheduling unit 110 inputs the program input by the user terminal 300 to each PC of the PC clustering system 200 in accordance with the notified power consumption and room temperature and the set control policy. The PC may be turned off as necessary. This automatically maintains external conditions such as power consumption and room temperature within a certain range.

PCクラスタリングシステム200の各PCに対しプログラムを投入するときの具体的なジョブスケジューリングの動作について説明する。図3は実行中のプログラムが終了する時のジョブスケジューリングを示すフローチャートである。また、図4はジョブスケジューリング手段110へプログラムが投入される時のジョブスケジューリングを示すフローチャートである。   A specific job scheduling operation when a program is input to each PC of the PC clustering system 200 will be described. FIG. 3 is a flowchart showing job scheduling when the program being executed ends. FIG. 4 is a flowchart showing job scheduling when a program is input to the job scheduling unit 110.

まず、図3のジョブスケジューリングについて説明する。   First, job scheduling in FIG. 3 will be described.

ジョブスケジューリング手段110はPCクラスタリングシステム200のあるPCで実行中のプログラムが終了した場合には、キュー111に溜まったプログラムを順次、空いたPCに投入する。その際、外部状況通知手段120によって通知された消費電力状態をチェックし(S01)、また、室温状態をチェックする(S02)。消費電力および室温ともに制限範囲内であれば(S01でYes、S02でYes)、キュー111にプログラムが在るか否かをチェックする(S03)。キュー111にプログラムがあれば(S03でYes)、キュー111の先頭のプログラムを、今、プログラムが終了したばかりで空き状態となったPCに投入する(S04)。キューが空であれば(S03でNo)、待ち状態になる(S06)。   When the program being executed on the PC having the PC clustering system 200 is completed, the job scheduling unit 110 sequentially puts the programs accumulated in the queue 111 into the free PC. At that time, the power consumption state notified by the external state notifying unit 120 is checked (S01), and the room temperature state is checked (S02). If both the power consumption and the room temperature are within the limits (Yes in S01, Yes in S02), it is checked whether or not there is a program in the queue 111 (S03). If there is a program in the queue 111 (Yes in S03), the program at the head of the queue 111 is put into a PC that has just ended and is in an empty state (S04). If the queue is empty (No in S03), it enters a waiting state (S06).

また、消費電力または室温が制限範囲外である場合には(S01でNoまたはS02でNo)、制御ポリシー登録手段130によって、制御ポリシーデータベース140に登録された制御ポリシーに従って、プログラムのPCへの投入を抑止し、または、PCをシャットダウンするなどの処理を実施し、外部条件が制限範囲内に収まるのを待つ(S05)。   If the power consumption or room temperature is outside the limit range (No in S01 or No in S02), the control policy registration unit 130 inputs the program to the PC according to the control policy registered in the control policy database 140. Is performed or processing such as shutting down the PC is performed, and the process waits for the external condition to fall within the limit range (S05).

次に、図4のジョブスケジューリングについて説明する。   Next, job scheduling in FIG. 4 will be described.

ジョブスケジューリング手段110はスケジューラとして利用者端末300からプログラムが投入されたとき、そのプログラムをキュー111に積む。キュー111にプログラムがあれば(S02でYes)、待機する(S07)。キュー111が空で(S02でNo)、かつ、空きPCがあれば(S03でYes)、そのPCにプログラムを投入する(S08)。   When a program is input from the user terminal 300 as a scheduler, the job scheduling unit 110 loads the program in the queue 111. If there is a program in the queue 111 (Yes in S02), it waits (S07). If the queue 111 is empty (No in S02) and there is an empty PC (Yes in S03), a program is input to that PC (S08).

空きPCが無く(S03でNo)、外部状況通知手段120によって通知された消費電力状態および室温ともに制限範囲内でもなく、ジョブスケジューリング手段110によりプログラムの投入を抑止された休止中または停止中のPCも無ければ(S04でNo)、待機する。空きPCがない場合にも(S03でNo)、外部状況通知手段120によって通知された消費電力状態および室温ともに制限範囲内となっているか、休止中または停止中のPCがあれば(S04でYes)、そのPCを起動して(S05)、そのPCにキュー111から取り出したプログラムを投入する(S06)。なお、PCが休止中であるとは、電源は投入されているが、稼動状態を保存して消費電力を抑えている状態をいい、PCが停止中であるとは電源が投入されていない状態、つまり、シャットダウンの状態をいう。   There is no free PC (No in S03), neither the power consumption state nor the room temperature notified by the external status notifying unit 120 is within the limit range, and the PC that is suspended or stopped whose job scheduling unit 110 has suppressed program input If not (No in S04), the process waits. Even when there is no free PC (No in S03), if both the power consumption state and the room temperature notified by the external status notifying unit 120 are within the limited range, or there is a PC that is in a suspended state or stopped (Yes in S04). The PC is activated (S05), and the program taken out from the queue 111 is input to the PC (S06). Note that the PC is in a paused state means that the power is turned on, but the operating state is saved to reduce power consumption. The PC is in a stopped state in which the power is not turned on. That is, it means the state of shutdown.

このように過負荷により、一旦、PCの稼動を抑止した場合にも、キュー111にプログラムが投入された場合には、外部条件を考慮して可能な範囲で、自動でPCを再稼動させ、プログラムを実行することが可能となる。   In this way, even if the operation of the PC is once suppressed due to an overload, if the program is input to the queue 111, the PC is automatically restarted as much as possible in consideration of the external conditions. The program can be executed.

以上のように本形態のジョブスケジューリングを実施することにより、外部状況通知手段120によって通知された室温と消費電力、および、制御ポリシー登録手段130により事前に登録された制御ポリシーに従って、PCの稼動の抑止、電源のON/OFF(シャットダウン)を自動的に行うことができる。これによって、自動的に室温や消費電力を一定範囲内に抑えることができる。また、一旦、稼動を抑止したPCも、室温や消費電力が一定範囲内に戻り、キュー111にプログラムが投入された際には、稼動を抑止されたPCは再稼動され、プログラムがそのPC上でも実行することができる。   As described above, by performing the job scheduling according to the present embodiment, the operation of the PC is performed according to the room temperature and power consumption notified by the external status notification unit 120 and the control policy registered in advance by the control policy registration unit 130. Suppression and power ON / OFF (shutdown) can be performed automatically. Thereby, the room temperature and power consumption can be automatically suppressed within a certain range. Also, once the PC whose operation has been suppressed returns to a certain range in room temperature and power consumption, and the program is input to the queue 111, the PC whose operation has been suppressed is restarted, and the program is stored on the PC. But you can do it.

なお、上述した形態は本発明を実施するための最良のものであるがこれに限定する趣旨ではない。従って、本発明の要旨を変更しない範囲においてその実施形式を種々変形することが可能である。   The above-described embodiment is the best for carrying out the present invention, but the present invention is not limited to this. Therefore, various modifications can be made to the implementation form without changing the gist of the present invention.

上記ではPCクラスタリングシステムのPC単位でジョブスケジューリングを行っていたが、例えば、1台のPCに複数CPUを搭載できるマシンもある。従って、そのようなPCがPCクラスタリングシステムに属しているのであれば、CPU単位でポリシー制御を行うほうがプログラムの投入をより精度よく制御できる。   In the above, job scheduling is performed for each PC of the PC clustering system. However, for example, there is a machine in which a plurality of CPUs can be mounted on one PC. Therefore, if such a PC belongs to the PC clustering system, it is possible to control the input of the program more accurately by performing the policy control in units of CPUs.

また、室温センサ600は、PCクラスタリングシステム200が配置されている部屋に一つだけ設けても良いが、複数個設けることにより各PCに対するジョブスケジューリングをより細かく行うことができる。例えば、PCクラスタリングシステムの各PCは約20台程度を1単位として扱い、1つのラックに収容されている。このラックの各々に室温センサ600を設置する。そして、ジョブスケジューリング手段110によって温度の低いラックに搭載されたPCに優先的にプログラムを投入するように調節することができる。このような処理により、一部のPCの温度が上昇し、その周辺のPCの故障を引き起こすといった事態を解消することができる。   Further, only one room temperature sensor 600 may be provided in the room where the PC clustering system 200 is disposed, but providing a plurality of room temperature sensors 600 enables more detailed job scheduling for each PC. For example, each PC of the PC clustering system handles about 20 units as one unit and is accommodated in one rack. A room temperature sensor 600 is installed in each rack. Then, the job scheduling means 110 can be adjusted so that the program is preferentially input to a PC mounted on a rack having a low temperature. By such processing, it is possible to eliminate a situation in which the temperature of some of the PCs rises and the peripheral PCs fail.

本形態のサーバとPCクラスタリングシステムを有して構成されるネットワークシステムの構成を図示したものである。1 is a diagram illustrating a configuration of a network system including a server and a PC clustering system according to the present embodiment. サーバ100におけるソフトウェアの構成及びサーバ100にて送受信される種々の情報を図示したものである。The software configuration in the server 100 and various information transmitted and received by the server 100 are illustrated. 実行中のプログラムが終了する時のジョブスケジューリングを示すフローチャートである。It is a flowchart which shows the job scheduling when the program in execution is complete | finished. ジョブスケジューリング手段110へプログラムが投入される時のジョブスケジューリングを示すフローチャートである。4 is a flowchart showing job scheduling when a program is submitted to job scheduling means 110.

符号の説明Explanation of symbols

100 サーバ
200 PCクラスタリングシステム
300 利用者端末
400 運用管理者端末
500 消費電力センサ
600 室温センサ
110 ジョブスケジューリング手段
111 キュー
120 外部情報通知手段
130 制御ポリシー登録手段
140 制御ポリシーデータベース
DESCRIPTION OF SYMBOLS 100 Server 200 PC clustering system 300 User terminal 400 Operation manager terminal 500 Power consumption sensor 600 Room temperature sensor 110 Job scheduling means 111 Queue 120 External information notification means 130 Control policy registration means 140 Control policy database

Claims (6)

外部条件に基づいてジョブスケジューリングを行い、PCクラスタリングシステムの各PCに投入するプログラムを調節、または、各PCの電源のON/OFFを制御するサーバ。   A server that performs job scheduling based on external conditions, adjusts a program to be input to each PC of the PC clustering system, or controls power ON / OFF of each PC. 端末より投入されたプログラムに対して前記ジョブスケジューリングを行うジョブスケジューリング手段と、
前記外部条件を前記ジョブスケジューリング手段に通知する外部状況通知手段と、
端末より入力された前記外部条件に関する制御ポリシーを登録する制御ポリシー登録手段を有する請求項1に記載のサーバ。
Job scheduling means for performing the job scheduling on a program input from a terminal;
External status notification means for notifying the job scheduling means of the external condition;
The server according to claim 1, further comprising a control policy registration unit that registers a control policy related to the external condition input from a terminal.
外部条件に関する制御ポリシーを登録する登録工程と、
前記外部条件を検出する検出工程を有し、
前記外部条件に基づいてジョブスケジューリングを行い、PCクラスタリングシステムの各PCに投入するプログラムを調節、または、各PCの電源のON/OFFを制御するジョブスケジューリング方法。
A registration process for registering a control policy for external conditions;
A detection step of detecting the external condition;
A job scheduling method that performs job scheduling based on the external conditions, adjusts a program to be input to each PC of the PC clustering system, or controls power ON / OFF of each PC.
前記ジョブスケジューリングにより前記PCクラスタリングシステムのPCが休止状態または停止状態にある場合、前記検出工程において前記外部条件を検出し、前記外部条件が前記制御ポリシーに従えば、当該休止状態または停止状態のPCを起動することを特徴とする請求項3に記載のジョブスケジューリング方法。   When the PC of the PC clustering system is in a dormant state or a stopped state by the job scheduling, the external condition is detected in the detection step, and if the external condition is in accordance with the control policy, the PC in the dormant state or the stopped state The job scheduling method according to claim 3, wherein: コンピュータに、外部条件に基づいてジョブスケジューリングを行い、PCクラスタリングシステムの各PCに投入するプログラムを調節、または、各PCの電源のON/OFFを制御するサーバとして機能させるプログラム。   A program that causes a computer to perform job scheduling based on external conditions, adjust a program to be input to each PC of the PC clustering system, or function as a server for controlling power ON / OFF of each PC. 請求項5に記載のプログラムを格納する記録媒体。   A recording medium for storing the program according to claim 5.
JP2005259198A 2005-09-07 2005-09-07 Server, job scheduling method, program, and recording medium Pending JP2007072768A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005259198A JP2007072768A (en) 2005-09-07 2005-09-07 Server, job scheduling method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005259198A JP2007072768A (en) 2005-09-07 2005-09-07 Server, job scheduling method, program, and recording medium

Publications (1)

Publication Number Publication Date
JP2007072768A true JP2007072768A (en) 2007-03-22

Family

ID=37934151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005259198A Pending JP2007072768A (en) 2005-09-07 2005-09-07 Server, job scheduling method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP2007072768A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010086423A (en) * 2008-10-01 2010-04-15 Hitachi Ltd Virtual pc management method, virtual pc management system, and virtual pc management program
JP2011518393A (en) * 2008-04-21 2011-06-23 アダプティブ コンピューティング エンタープライジズ インク System and method for managing energy consumption in a computing environment
CN102200928A (en) * 2010-03-24 2011-09-28 富士施乐株式会社 Computation resource control apparatus, computation resource control method, and non-transitory computer-readable recording medium
US8799690B2 (en) 2009-06-21 2014-08-05 International Business Machines Corporation Prioritized workload routing in a data center
US9405348B2 (en) 2008-04-21 2016-08-02 Adaptive Computing Enterprises, Inc System and method for managing energy consumption in a compute environment

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9405348B2 (en) 2008-04-21 2016-08-02 Adaptive Computing Enterprises, Inc System and method for managing energy consumption in a compute environment
JP2011518393A (en) * 2008-04-21 2011-06-23 アダプティブ コンピューティング エンタープライジズ インク System and method for managing energy consumption in a computing environment
US8549333B2 (en) 2008-04-21 2013-10-01 Adaptive Computing Enterprises, Inc. System and method for managing energy consumption in a compute environment
US9026807B2 (en) 2008-04-21 2015-05-05 Adaptive Computing Enterprises, In. System and method for managing energy consumption in a compute environment
US9411393B2 (en) 2008-04-21 2016-08-09 Adaptive Computing Enterprises, Inc. System and method for managing energy consumption in a compute environment
JP2010086423A (en) * 2008-10-01 2010-04-15 Hitachi Ltd Virtual pc management method, virtual pc management system, and virtual pc management program
US8799690B2 (en) 2009-06-21 2014-08-05 International Business Machines Corporation Prioritized workload routing in a data center
US9361161B2 (en) 2009-06-21 2016-06-07 International Business Machines Corporation Workload routing for managing energy in a data center
US10571997B2 (en) 2009-06-21 2020-02-25 International Business Machines Corporation Workload routing for managing energy in a data center
US10963039B2 (en) 2009-06-21 2021-03-30 International Business Machines Corporation Workload routing for managing energy in a data center
CN102200928A (en) * 2010-03-24 2011-09-28 富士施乐株式会社 Computation resource control apparatus, computation resource control method, and non-transitory computer-readable recording medium
JP2012089103A (en) * 2010-03-24 2012-05-10 Fuji Xerox Co Ltd Calculation resource control device and calculation resource control program
CN102200928B (en) * 2010-03-24 2015-09-23 富士施乐株式会社 Computational resource opertaing device and computational resource control method

Similar Documents

Publication Publication Date Title
CN103744734B (en) A kind of Mission Operations processing method, apparatus and system
US9671839B2 (en) Information handling system dynamic acoustical management
JP5946068B2 (en) Computation method, computation apparatus, computer system, and program for evaluating response performance in a computer system capable of operating a plurality of arithmetic processing units on a computation core
US8677160B2 (en) Managing power consumption of a computer
US8103884B2 (en) Managing power consumption of a computer
US10817039B2 (en) Adjusting a power limit in response to a temperature difference
JP2007072768A (en) Server, job scheduling method, program, and recording medium
JP2016085727A (en) Method and system of preventing device from turning power on after unrecoverable failure
TWI542995B (en) Resource monitoring system and method thereof
US10928883B2 (en) System management device
EP3571568B1 (en) System and method for context-aware thermal management and workload scheduling in a portable computing device
CN117999541A (en) Dynamic policy adjustment based on resource consumption
US20170160778A1 (en) Method and device for monitoring power-consuming applications, user terminal, computer program and storage medium
TWI512629B (en) Apparatus and method for table driven multiple passive trip platform passive thermal management, computeing system, and computer-readable medium
US20200326760A1 (en) Control fan using neural network
CN114510134A (en) Method, device and storage medium for adjusting single-board fan
JP6148129B2 (en) Information processing apparatus, firmware update method, and firmware update program
US20210271300A1 (en) Dynamic thermal control
JP5939620B2 (en) Computer system, server device, load balancing method, and program
CN114911332A (en) Server fan regulation and control method, system, electronic equipment and storage medium
JP5692137B2 (en) Power consumption control device, information processing device, power consumption control method, and program
US10719107B2 (en) Method and apparatus to maintain node power budget for systems that share a power supply
JP2016051399A (en) Management access control system and management access control method
JP2021093066A (en) Detection device, detection method, program, and storage medium
KR20220084900A (en) Apparatus and method for interrupt control

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080902