JP7124592B2 - ジョブ実行システムおよびジョブ実行方法 - Google Patents
ジョブ実行システムおよびジョブ実行方法 Download PDFInfo
- Publication number
- JP7124592B2 JP7124592B2 JP2018176732A JP2018176732A JP7124592B2 JP 7124592 B2 JP7124592 B2 JP 7124592B2 JP 2018176732 A JP2018176732 A JP 2018176732A JP 2018176732 A JP2018176732 A JP 2018176732A JP 7124592 B2 JP7124592 B2 JP 7124592B2
- Authority
- JP
- Japan
- Prior art keywords
- job
- throttling
- computing node
- node
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Power Sources (AREA)
Description
図1は、本発明の第1の実施形態に係るジョブ実行システム500の構成例を示すブロック図である。ジョブ実行システム500は、割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノード530と、第1計算ノード530と別の計算ノードである第2計算ノード540と、を備えるサーバ520と、ジョブを管理するジョブスケジューラ510と、を備える。第1計算ノード530および第2計算ノード540は、それぞれに1つ以上のプロセッサを搭載する。プロセッサは、たとえば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)である。GPUは、近年では汎用の高速な数値計算装置として様々な分野(たとえば、科学技術計算や暗号処理、仮想通貨、音声認識・合成、人工知能)で利用されるようになっている。このようなGPUは、GPGPU(General Purpose GPU)あるいはGPUコンピューティングと呼ばれる。また、プロセッサは、CPUにGPUの機能を統合したものであってもよい。
[第2の実施形態]
(構成の説明)
図3は、本発明の第2の実施形態に係るジョブ実行システム1の構成例を示すブロック図である。
(動作の説明)
図5は、図3に示すジョブ実行システム1の動作例(計算処理方法)を説明するためのフローチャートである。
(効果の説明)
図6は、以上説明した第2の実施形態による効果を説明するための図である。以下では、たとえば、ファンの故障等で冷却性能が低下した計算ノード40でジョブを実行したケースを想定して説明する。
10 ジョブスケジューラ
20 サーバ
30 計算ノード制御部
40 計算ノード
41 計算ノード
400 温度センサ
401 スロットリング制御部
402 スロットリングカウンタ
403 超過判定部
500 ジョブ実行システム
510 ジョブスケジューラ
520 サーバ
530 第1計算ノード
540 第2計算ノード
Claims (5)
- 割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノードと、前記第1計算ノードと別の計算ノードである第2計算ノードと、を備えるサーバと、
前記ジョブを管理するジョブスケジューラと、
を備え、
前記ジョブを実行する前記第1計算ノードは、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、前記累計時間が前記時間閾値を超えた場合、その旨の通知を前記ジョブスケジューラに送信し、
前記通知を受信した前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させ、一時停止させた前記ジョブを第2計算ノードに割り当て、割り当てた前記ジョブをリスタートさせる
ことを特徴とするジョブ実行システム。 - 前記第1計算ノードは、
前記ジョブが割り付けられる際にカウント値をリセットし、前記第1計算ノードにおいて前記スロットリングがオンになるとカウントを開始し、前記スロットリングがオフされるとカウントを停止し、前記カウントの値であるカウント値を計測し、前記カウント値を前記累計時間として前記スロットリングがオフされるたびに送信するスロットリングカウンタと、
前記時間閾値を予め記憶し、前記累計時間が前記時間閾値を超えた場合、その旨を示す通知を、前記ジョブスケジューラに送信する超過判定部と
を備える請求項1記載のジョブ実行システム。 - 前記第1計算ノードは、さらに、
温度を検出する温度センサと、
前記スロットリングをオンする温度閾値である第1温度閾値と、前記スロットリングをオフする温度閾値である第2温度閾値とを、あらかじめ保持し、前記温度センサによって検出された温度が前記第1温度閾値を上回る場合に前記スロットリングをオンにし、前記スロットリングカウンタに対して前記スロットリングをオンした旨の通知を送信し、一方、前記温度が前記第2温度閾値を下回る場合、前記スロットリングをオフにし、前記スロットリングカウンタに対して前記スロットリングをオフした旨の通知を送信するスロットリング制御部と
を備える請求項2記載のジョブ実行システム。 - 前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させる際、当該ジョブに対して中断した位置を示すチェックポイントを設定する請求項1乃至3のいずれか1項に記載のジョブ実行システム。
- 割り当てられたジョブおよびスロットリングをそれぞれに実行する、第1計算ノードと、前記第1計算ノードと別の計算ノードである第2計算ノードと、を備えるサーバと、
前記ジョブを管理するジョブスケジューラと、
をジョブ実行システムに設け、
前記ジョブを実行する前記第1計算ノードは、所定時間内においてスロットリングが実行された時間の累計である累計時間が所定の時間閾値を超えたか否かを判定し、前記累計時間が前記時間閾値を超えた場合、その旨の通知を前記ジョブスケジューラに送信し、
前記通知を受信した前記ジョブスケジューラは、前記第1計算ノードで実行中の前記ジョブを一時停止させ、一時停止させた前記ジョブを第2計算ノードに割り当て、割り当てた前記ジョブをリスタートさせる
ことを特徴とするジョブ実行方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018176732A JP7124592B2 (ja) | 2018-09-21 | 2018-09-21 | ジョブ実行システムおよびジョブ実行方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018176732A JP7124592B2 (ja) | 2018-09-21 | 2018-09-21 | ジョブ実行システムおよびジョブ実行方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020047140A JP2020047140A (ja) | 2020-03-26 |
JP7124592B2 true JP7124592B2 (ja) | 2022-08-24 |
Family
ID=69901487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018176732A Active JP7124592B2 (ja) | 2018-09-21 | 2018-09-21 | ジョブ実行システムおよびジョブ実行方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7124592B2 (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122337A (ja) | 2005-10-27 | 2007-05-17 | Sonac Kk | 演算装置 |
JP2009223637A (ja) | 2008-03-17 | 2009-10-01 | Fujitsu Ltd | ジョブ割当装置、ジョブ割当方法、及び、ジョブ割当プログラム |
JP2014126891A (ja) | 2012-12-25 | 2014-07-07 | Fujitsu Ltd | 情報処理装置、情報処理装置の冷却制御方法、冷却制御プログラム |
JP2016200923A (ja) | 2015-04-09 | 2016-12-01 | 富士通株式会社 | 並列計算制御装置、並列計算システムおよびマイグレーション時間推定プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4922255B2 (ja) * | 2008-06-30 | 2012-04-25 | 株式会社日立製作所 | 情報処理システムおよびそのシステムにおける省電力制御方法 |
-
2018
- 2018-09-21 JP JP2018176732A patent/JP7124592B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007122337A (ja) | 2005-10-27 | 2007-05-17 | Sonac Kk | 演算装置 |
JP2009223637A (ja) | 2008-03-17 | 2009-10-01 | Fujitsu Ltd | ジョブ割当装置、ジョブ割当方法、及び、ジョブ割当プログラム |
JP2014126891A (ja) | 2012-12-25 | 2014-07-07 | Fujitsu Ltd | 情報処理装置、情報処理装置の冷却制御方法、冷却制御プログラム |
JP2016200923A (ja) | 2015-04-09 | 2016-12-01 | 富士通株式会社 | 並列計算制御装置、並列計算システムおよびマイグレーション時間推定プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020047140A (ja) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11212235B2 (en) | Cloud compute scheduling using a heuristic contention model | |
EP2430538B1 (en) | Allocating computing system power levels responsive to service level agreements | |
EP2430541B1 (en) | Power management in a multi-processor computer system | |
US10025686B2 (en) | Generating and communicating platform event digests from a processor of a system | |
US11907762B2 (en) | Resource conservation for containerized systems | |
US20120137295A1 (en) | Method for displaying cpu utilization in a multi-processing system | |
US9417927B2 (en) | Runtime capacity planning in a simultaneous multithreading (SMT) environment | |
JP2011145956A (ja) | 仮想計算機、仮想計算機モニタ、および計算機の制御方法 | |
JP2015507771A (ja) | 消費電力を低減する優先度に基づくアプリケーションイベント制御(paec) | |
JP2014048972A (ja) | 処理装置、情報処理装置、及び消費電力管理方法 | |
JPWO2009150815A1 (ja) | マルチプロセッサシステム | |
JP6189553B2 (ja) | 仮想計算機システムの制御方法及び仮想計算機システム | |
JP2015148890A (ja) | 情報処理装置、情報処理システム、および情報処理システムの制御方法 | |
JP2010160565A (ja) | タスクスケジューリング装置、タスクスケジューリング制御方法、及びタスクスケジューリング制御プログラム | |
JP2012141864A (ja) | Smtプロセッサにおけるプロセッサ使用率の算出方法 | |
JP7124592B2 (ja) | ジョブ実行システムおよびジョブ実行方法 | |
CN109753338A (zh) | 虚拟gpu使用率的检测方法和装置 | |
US9285865B2 (en) | Dynamic link scaling based on bandwidth utilization | |
JP2011233057A (ja) | マルチプロセッサシステム、マルチプロセッサの制御方法およびマルチプロセッサの制御方法のプログラム | |
WO2017171977A1 (en) | Enhanced directed system management interrupt mechanism | |
JP2010205046A (ja) | 情報処理装置 | |
CN118535522A (zh) | 指定具有保险型核和机会型核的处理器 | |
JP2010191522A (ja) | プログラム検査方法 | |
JP2014089622A (ja) | システム管理モード処理時間最適化装置、システム管理モード処理時間最適化システム、システム管理モード処理時間最適化方法、及び、システム管理モード処理時間最適化プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210816 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20211015 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220725 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7124592 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |