JP2017084148A - Control apparatus, control method, and control program - Google Patents
Control apparatus, control method, and control program Download PDFInfo
- Publication number
- JP2017084148A JP2017084148A JP2015212562A JP2015212562A JP2017084148A JP 2017084148 A JP2017084148 A JP 2017084148A JP 2015212562 A JP2015212562 A JP 2015212562A JP 2015212562 A JP2015212562 A JP 2015212562A JP 2017084148 A JP2017084148 A JP 2017084148A
- Authority
- JP
- Japan
- Prior art keywords
- processing
- processing devices
- cpu
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Power Sources (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
本発明は、マルチプロセッサシステムの制御技術に関する。 The present invention relates to a control technique for a multiprocessor system.
CoD(Capacity On Demand)の機能が実装されたマルチプロセッサシステムは、ユーザに提供する物理CPU(Central Processing Unit)リソースの量を状況に応じて機動的に変更することができる。例えば、マルチプロセッサシステム上で実行されるドメインの処理に割り当てられる物理CPUリソースが不足し、ドメインの処理性能が低下した場合、ドメインの処理に割り当てる物理CPUコアの数をユーザの要求に従って増やし、ドメインの処理性能を向上させる。なお、ここではドメインに物理的なリソースが割り当てられる場合のCoDを例にしたが、仮想的なドメイン(以降、単に仮想マシンと呼ぶ)に物理的なリソースが割り当てられる仮想環境でのCoDであってもよい。むしろ近年では、このような、仮想マシンに物理的なリソースが割り当てられる仮想環境下でのCoDが広く普及している。 A multiprocessor system in which a function of CoD (Capacity On Demand) is implemented can flexibly change the amount of physical CPU (Central Processing Unit) resources provided to a user according to the situation. For example, when the physical CPU resource allocated to the domain processing executed on the multiprocessor system is insufficient and the processing performance of the domain is reduced, the number of physical CPU cores allocated to the domain processing is increased according to the user request. Improve the processing performance. In this example, CoD is used when a physical resource is allocated to a domain. However, this is a CoD in a virtual environment where a physical resource is allocated to a virtual domain (hereinafter simply referred to as a virtual machine). May be. Rather, in recent years, CoD in a virtual environment in which physical resources are allocated to virtual machines has become widespread.
例えば、仮想環境下でのCoDの機能が実装されたマルチプロセッサシステムにおいて、CoDの契約によって定められた数の物理CPUコアをユーザの仮想マシンに対して割り当てると、動作する物理CPUコアの配置によっては仮想マシンの性能が低下する。これは、物理CPUコアの配置によっては物理CPU内のL(Level)1キャッシュ及びL2キャッシュについて競合が発生するためである。 For example, in a multiprocessor system in which a CoD function is implemented in a virtual environment, when a number of physical CPU cores determined by a CoD contract are allocated to a user's virtual machine, Will reduce the performance of the virtual machine. This is because contention for the L (Level) 1 cache and the L2 cache in the physical CPU occurs depending on the arrangement of the physical CPU cores.
また、動作する物理CPUコアの配置によっては、局所的に高温の場所が生じることがある。CPU温度が許容できない温度に達した場合には物理CPUが正常に動作しなくなるだけでなく、物理CPUが故障する原因にもなるため、マルチプロセッサシステム内に高温の場所が生じた状態は好ましくない。 Further, depending on the arrangement of the operating physical CPU core, a locally hot place may occur. When the CPU temperature reaches an unacceptable temperature, not only does the physical CPU fail to operate normally, but it also causes the physical CPU to fail, so it is not preferable that a high-temperature location occurs in the multiprocessor system. .
マルチプロセッサシステムに関する従来技術は存在するが、上記のような問題に関して、動作させる物理CPUコアを適切に選択可能な技術は存在しない。 Although there is a conventional technique related to a multiprocessor system, there is no technique that can appropriately select a physical CPU core to be operated with respect to the above problems.
従って、本発明の目的は、1つの側面では、マルチプロセッサシステムにおいて適切な物理CPUコアを動作させるための技術を提供することである。 Accordingly, an object of the present invention, in one aspect, is to provide a technique for operating an appropriate physical CPU core in a multiprocessor system.
本発明に係る制御装置は、情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部と、記憶部に記憶された、複数の処理装置の各々の物理位置の情報に基づき、複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、決定の結果に従い、記憶部に記憶された管理情報の更新と、1又は複数の第1処理装置を動作させるための処理とを実行する制御部とを有する。 A control device according to the present invention includes a storage unit that stores information on a physical position of each of a plurality of processing devices in an information processing system, and management information indicating whether or not the processing device is operating, and a storage unit Based on the stored physical position information of each of the plurality of processing devices, one or more first processing devices to be operated are determined from among the plurality of processing devices, and stored in the storage unit according to the determination result. And a control unit that executes updating of the management information and processing for operating one or more first processing devices.
1つの側面では、マルチプロセッサシステムにおいて適切な物理CPUコアを動作させることができるようになる。 In one aspect, an appropriate physical CPU core can be operated in a multiprocessor system.
[実施の形態1]
図1乃至図5を用いて、第1の実施の形態の概要を説明する。
[Embodiment 1]
The outline of the first embodiment will be described with reference to FIGS. 1 to 5.
図1に、CPU1p乃至4pを有する情報処理システムを示す。CPU1p乃至4pの各々は、ソケットに装着されている。CPU1p乃至4pの各々は、各々が複数の物理CPUコア(以下、単にコアと呼ぶ)及び1つのL1キャッシュを有する複数のLCU(Local Cache Unit)と、1つのL2キャッシュとを有する。図1の例では、CPU1pはLCU11l乃至14lを有し、CPU2pはLCU21l乃至24lを有し、CPU3pはLCU31l乃至34lを有し、CPU4pはLCU41l乃至44lを有する。また、CPU1p乃至4pの各々はメモリに接続される。同一のLCUに含まれる複数のコアは、そのLCUに含まれるL1キャッシュにアクセスする。また、同一のCPUに含まれる複数のコアは、そのCPUに含まれるL2キャッシュにアクセスする。第1の実施の形態においては、LCU単位で電源の投入及び切断が行われる。
FIG. 1 shows an information processing
図1においては、番号が付されたコアはライセンスが割り当てられたコアであり、ライセンスが割り当てられたコアが動作する。すなわち、CPU1pにおいては1番から8番までのコアが動作し、CPU2pにおいては13番から20番までのコアが動作し、CPU3pにおいては25番から30番までのコアが動作し、CPU4pにおいては37番から42番までのコアが動作する。なお、第1乃至第4の実施の形態においては、動作するコアとは、電源が投入され且つライセンスが割り当てられたコアのことを意味し、単に電源が投入されたコア(或いは、電源が投入されているもののライセンスが割り当てられていないコア)のことを意味しない。
In FIG. 1, a numbered core is a core to which a license is assigned, and a core to which a license is assigned operates. That is,
上で述べたように、動作するコアの配置は性能等に影響を及ぼす。そこで第1の実施の形態においては、ユーザ或いは管理者等によって指定された電源モードに従って、動作するコアの配置を切り替えることができるようにする。具体的には、図2に示すように、性能モードと、バランスモードと、省電力モードとを指定可能とする。そして、性能モードにおいては、動作するコアが含まれるCPUが分散され且つ動作するコアが含まれるLCUが分散されるように配置が行われる。バランスモードにおいては、動作するコアが含まれるCPUが分散され且つ動作するコアが特定のLCUに集められるように配置が行われる。省電力モードにおいては、動作するコアが特定のCPUに集められ且つ動作するコアが特定のLCUに集められるように配置が行われる。 As described above, the arrangement of operating cores affects performance and the like. Therefore, in the first embodiment, the arrangement of operating cores can be switched according to the power supply mode designated by the user or the administrator. Specifically, as shown in FIG. 2, the performance mode, the balance mode, and the power saving mode can be specified. In the performance mode, the arrangement is performed so that the CPUs including the operating cores are distributed and the LCUs including the operating cores are distributed. In the balance mode, the arrangement is performed such that the CPUs including the operating cores are distributed and the operating cores are collected in a specific LCU. In the power saving mode, the arrangement is performed such that the operating cores are collected by a specific CPU and the operating cores are collected by a specific LCU.
図3に、性能モードの配置の一例を示す。図3に示すように、性能モードにおいては、動作するコアはCPU1p乃至4pに分散され、且つ、動作するコアは各CPU内の複数のLCUに分散される。これにより、各CPUのL2キャッシュについて競合が発生しにくくなるとともに、各LCUのL1キャッシュについて競合が発生しにくくなる。よって、CPU1p乃至4pを使用して実現されるシステムの性能を向上させることができる。
FIG. 3 shows an example of the arrangement of performance modes. As shown in FIG. 3, in the performance mode, the operating cores are distributed to the
図4に、バランスモードの配置の一例を示す。図4に示すように、バランスモードにおいては、動作するコアはCPU1p乃至4pに分散され、且つ、動作するコアは各CPU内の特定のLCUに集められる。これにより、各CPUのL2キャッシュについて競合が発生しにくくなるとともに、電源が投入されるLCUの数を減らし電力消費を抑制することができる。
FIG. 4 shows an example of the arrangement of the balance mode. As shown in FIG. 4, in the balance mode, the operating cores are distributed to the
図5に、省電力モードの配置の一例を示す。図5に示すように、省電力モードにおいては、動作するコアはCPUは特定のCPUに集められ、且つ、動作するコアは各CPU内の特定のLCUに集められる。これにより、電源が投入されるLCUの数を減らし、電力消費をさらに抑制することができるようになる。なお、図4と比較した場合、電源が投入されるLCUの数は減っていないが、動作するコアの数によっては電源が投入されるLCUの数は減る。 FIG. 5 shows an example of the arrangement of the power saving mode. As shown in FIG. 5, in the power saving mode, the operating cores are collected by a specific CPU, and the operating cores are collected by a specific LCU in each CPU. As a result, the number of LCUs to be powered on can be reduced and power consumption can be further suppressed. Compared with FIG. 4, the number of LCUs to be powered on is not reduced, but the number of LCUs to be powered on is reduced depending on the number of operating cores.
以下では、第1の実施の形態をより具体的に説明する。ここでは、1つの筐体内において動作させるコアの物理的配置を、性能あるいは消費電力に基づいて最適化する機能を提供する例を説明するが、これに限定されるわけではない。例えば、仮想的なマッピングデータ処理を併用することで仮想環境下での実施に適用してもよい。 Hereinafter, the first embodiment will be described more specifically. Here, an example will be described in which a function for optimizing the physical arrangement of the cores to be operated in one casing based on performance or power consumption is provided, but the present invention is not limited to this. For example, you may apply to implementation in a virtual environment by using virtual mapping data processing together.
図6に、第1の実施の形態の情報処理システム1の構成を示す。情報処理システム1は、例えばサービスプロセッサであり且つハードウエア12の監視及び制御を行う監視装置100と、ハードウエア12とを有する。ハードウエア12はマザーボード13を含み、マザーボード13はCPU1p乃至4pとメモリ14とを含む。図6においてはCPUの数は4であるが、数に限定は無い。また、図面を見やすくするため、CPU1p乃至4pとメモリ14との間の接続は省略されている。
FIG. 6 shows the configuration of the
仮想化ソフトウエア11は、メモリ14に展開され、CPU1p乃至4pに実行される。また、OS(Operating System)10のプログラムも、メモリ14に展開され、CPU1p乃至4pに実行される。OS10上では仮想化ソフトウエア11によって実現される仮想マシンのアプリケーションプログラム等が実行されるが、図面を簡単にするため説明が省略されている。
The
図7に、CPU1pのハードウエア構成の一例を示す。マルチコアプロセッサであるCPU1pは、各々複数のコアとL1キャッシュを含む複数のLCU11l乃至14lと、L2キャッシュ1cと、メモリアクセスコントローラ1mcとを有する。LCU11l乃至14lはL2キャッシュ1cに接続され、L2キャッシュ1cはメモリアクセスコントローラ1mcに接続される。図7においては、コアの数が3であり、LCUの数が4であるが、数に限定は無い。また、ここではCPU1pを例として説明をしたが、CPU2p乃至4pのハードウエア構成はCPU1pのハードウエア構成と同じである。
FIG. 7 shows an example of the hardware configuration of the
図8を用いて、コアの物理位置の特定について説明する。図を見やすくするため、CPU1pのL2キャッシュ1c及びメモリアクセスコントローラ1mcは省略されている。第1の実施の形態においては、コアの物理位置を、そのコアが含まれるCPUが取り付けられたソケットの番号l(図8の例においてはl=1)と、LCUの番号m(図8の例においては、mは1≦m≦4を満たす自然数)と、LCU内でのコアの位置を表す番号n(図8の例においては、nは1≦n≦3を満たす自然数)とを用いて特定される。例えば、図8における、ID(IDentifier)が「c−08」であるコアの物理位置は、(l,m,n)=(1,3,2)という3次元座標によって表される。以下、コアのIDをC−IDと表す。
The specification of the physical position of the core will be described with reference to FIG. In order to make the figure easy to see, the L2 cache 1c and the memory access controller 1mc of the
図6の説明に戻り、監視装置100は、ライセンス管理部101と、第2管理データ格納部102と、電源モード管理部103と、第1管理データ格納部104、割当決定部105と、コア位置データ格納部106と、電源投入管理部107と、LCU位置データ格納部108と、電源制御部109とを含む。
Returning to the description of FIG. 6, the
ライセンス管理部101は、契約ライセンス数(すなわち、動作させるコアの数)の入力指示を受け付け、契約ライセンス数を割当決定部105に通知する。また、ライセンス管理部101は、割当決定部105によって決定されたライセンス割当に従って、第2管理データ格納部102に格納されているデータを更新する。
The
電源モード管理部103は、電源モードの入力指示を受け付け、電源モードを割当決定部105に通知する。
The power
割当決定部105は、コア位置データ格納部106に格納されたデータに基づき処理を実行し、コア位置データ格納部106に格納されたデータを処理結果に基づき更新するとともに、第1管理データ格納部104に格納されたデータを処理結果に基づき更新する。
The
電源投入管理部107は、コア位置データ格納部106に格納されたデータに基づき処理を実行し、LCU位置データ格納部108に格納されたデータを処理結果に基づき更新する。
The power-on
電源制御部109は、LCU位置データ格納部108に格納されたデータに従って、LCUへの電源の投入及び切断を実行する。
The
図9に、監視装置100のハードウエア構成図を示す。監視装置100は、CPU111と、RAM(Random Access Memory)112と、ROM(Read Only Memory)113と、バス115とを有する。CPU111、RAM112及びROM113は、バス115を介して接続される。ROM113は、システム制御ファームウエア114を格納する。システム制御ファームウエア114は、CPU111によってRAM112に読み出され、CPU111によって実行される。図6に示したライセンス管理部101、電源モード管理部103、割当決定部105、電源投入管理部107及び電源制御部109は、CPU111がシステム制御ファームウエア114を実行することによって実現される。第2管理データ格納部102、第1管理データ格納部104、コア位置データ格納部106及びLCU位置データ格納部108は、例えばRAM112に設けられる。
FIG. 9 shows a hardware configuration diagram of the
図10に、コア位置データ格納部106に格納されるデータの一例を示す。図10の例では、C−IDと、ソケット番号lと、LCU番号mと、コア番号nと、ライセンス割当フラグとが格納される。ライセンス割当フラグが「ON」であるCPUは動作し、ライセンス割当フラグが「OFF」であるCPUは動作しない。
FIG. 10 shows an example of data stored in the core position
図11に、LCU位置データ格納部108に格納されるデータの一例を示す。図11の例では、LCUのIDであるLCU−IDと、ソケット番号lと、LCU番号mと、電源投入フラグとが格納される。電源投入フラグが「ON」であるLCUには電源が投入され、電源投入フラグが「OFF」であるLCUには電源は投入されない。
FIG. 11 shows an example of data stored in the LCU position
図12に、第1管理データ格納部104に格納されるデータの一例を示す。図12の例では、CPUが取り付けられたソケットのソケット番号と、割り当てられたライセンスの数とが格納される。図12の例であれば、ソケット番号が2であるソケットにおいては4つのコアが動作することになる。
FIG. 12 shows an example of data stored in the first management
図13に、第2管理データ格納部102に格納されるデータの一例を示す。図13の例では、通番と、ライセンスが割り当てられたコアのC−IDとが格納される。 FIG. 13 shows an example of data stored in the second management data storage unit 102. In the example of FIG. 13, the serial number and the C-ID of the core to which the license is assigned are stored.
次に、図14乃至図28を用いて、監視装置100が実行する処理を説明する。本処理の開始時点においては、いずれのコアに対しても電源は投入されていないものとする。
Next, processing executed by the
まず、監視装置100のライセンス管理部101は、例えば情報処理システム1の管理者による契約ライセンス数の入力指示を受け付ける(図14:ステップS1)。ライセンス管理部101は、契約ライセンス数を割当決定部105に通知する。
First, the
電源モード管理部103は、電源モードの選択指示を受け付ける(ステップS3)。電源モード管理部103は、電源モードを割当決定部105に通知する。
The
そして、割当決定部105は、ライセンス割当処理を実行する(ステップS5)。ライセンス割当処理については、図15乃至図24を用いて説明する。
Then, the
まず、割当決定部105は、電源モードが「省電力」であるか判定する(図15:ステップS21)。電源モードが「省電力」である場合(ステップS21:Yesルート)、割当決定部105は、第1集中割当処理を実行する(ステップS23)。第1集中割当処理については、図16乃至図18を用いて説明する。
First, the
まず、割当決定部105は、第1管理データ格納部104に格納された、各CPUに割り当てるライセンス数を0に設定する(図16:ステップS41)。ステップS41の処理によって、第1管理データ格納部104には、例えば図17に示すようなデータが格納されるようになる。
First, the
割当決定部105は、予め保存された、CPU当たりのコア数KをRAM112から読み出す(ステップS43)。本実施の形態においては、各CPUが有するコアの数は同一であるとする。
The
割当決定部105は、ソケット番号を表す変数lをl=1と設定し且つ未割り当てのライセンス数を表す変数countをcount=契約ライセンス数と設定する(ステップS45)。契約ライセンス数は、ライセンス管理部101から通知された契約ライセンス数である。
The
割当決定部105は、count−K≧0が成立するか判定する(ステップS47)。count−K≧0が成立する場合(ステップS47:Yesルート)、割当決定部105は、ソケット番号がlであるソケットに取り付けられたCPUに割り当てるライセンス数をKに設定する(ステップS49)。具体的には、割当決定部105は、第1管理データ格納部104に格納された、ソケット番号lに対応するライセンス数をKに設定する。
The
割当決定部105は、lを1インクリメントし(ステップS51)、countをcount=count−Kと設定する(ステップS53)。そしてステップS47の処理に戻る。
The
一方,count−K≧0が成立しない場合(ステップS47:Noルート)、割当決定部105は、ソケット番号がlであるソケットに取り付けられたCPUに割り当てるライセンスの数をcountに設定する(ステップS55)。具体的には、割当決定部105は、第1管理データ格納部104に格納された、ソケット番号lに対応するライセンス数をcountに設定する。そして元の処理に戻る。
On the other hand, if count-K ≧ 0 is not satisfied (step S47: No route), the
以上のような処理を実行すれば、動作するコアが特定のCPUに集められるような配置を実現できるようになる。例えばK=12であり且つcountの初期値が20である場合、第1管理データ格納部104には、図18に示すようなデータが格納される。
By executing the processing as described above, it is possible to realize an arrangement in which operating cores are collected by a specific CPU. For example, when K = 12, and the initial value of count is 20, the first management
図15の説明に戻り、電源モードが「省電力」ではない場合(ステップS21:Noルート)、割当決定部105は、第1分散割当処理を実行する(ステップS25)。第1分散割当処理については、図19及び図20を用いて説明する。
Returning to the description of FIG. 15, when the power mode is not “power saving” (step S21: No route), the
まず、割当決定部105は、第1管理データ格納部104に格納された、各CPUに割り当てるライセンス数を0に設定する(図19:ステップS61)。ステップS61の処理によって、第1管理データ格納部104には、例えば図17に示すようなデータが格納されるようになる。
First, the
割当決定部105は、未割り当てのライセンス数を表す変数countをcount=契約ライセンス数と設定する(ステップS63)。契約ライセンス数は、ライセンス管理部101から通知された契約ライセンス数である。
The
割当決定部105は、予め保存された、情報処理システム1のソケット数LをRAM112から読み出す(ステップS65)。
The
割当決定部105は、countをLで除した場合における商A及び剰余Bを算出する(ステップS67)。
The
割当決定部105は、第1管理データ格納部104に格納された、各CPUに割り当てるライセンス数をAに設定する(ステップS69)。
The
割当決定部105は、ソケット番号を表す変数lをl=1と設定する(ステップS71)。
The
割当決定部105は、B−1≧0が成立するか判定する(ステップS73)。B−1≧0が成立する場合(ステップS73:Yesルート)、割当決定部105は、ソケット番号がlであるソケットに取り付けられたCPUに割り当てるライセンス数を1インクリメントする(ステップS75)。具体的には、割当決定部105は、第1管理データ格納部104に格納された、ソケット番号lに対応するライセンス数を1インクリメントする。
The
割当決定部105は、BをB=B−1と設定し(ステップS77)且つlをl=l+1と設定する(ステップS79)。そしてステップS73の処理に戻る。
The
一方、B−1≧0が成立しない場合(ステップS73:Noルート)、呼び出しの元の処理に戻る。 On the other hand, if B-1 ≧ 0 is not satisfied (step S73: No route), the process returns to the original process of the call.
以上のような処理を実行すれば、動作するコアがCPU1p乃至4pに分散されるような配置を実現できるようになる。例えばL=4であり且つcountの初期値が20である場合、第1管理データ格納部104には、図20に示すようなデータが格納される。
By executing the processing as described above, it is possible to realize an arrangement in which operating cores are distributed among the
図15の説明に戻り、割当決定部105は、第1管理データ格納部104から、各ソケットに取り付けられたCPUに割り当てるライセンスの数を読み出す(ステップS27)。
Returning to the description of FIG. 15, the
割当決定部105は、電源モードが「性能」であるか判定する(ステップS29)。電源モードが「性能」ではない場合(ステップS29:Noルート)、割当決定部105は、第2集中割当処理を実行する(ステップS31)。第2集中割当処理については、図21乃至図23を用いて説明する。
The
まず、割当決定部105は、情報処理システム1内におけるCPUのうち未処理のCPUを1つ特定し、ソケット番号lをそのCPUが取り付けられたソケットのソケット番号に設定する(図21:ステップS81)。以下では、ステップS81において特定されたCPUを「処理対象CPU」と呼ぶ。
First, the
割当決定部105は、処理対象CPUに割り当てるライセンス数numを第1管理データ格納部104から読み出す(ステップS83)。
The
割当決定部105は、コア位置データ格納部106に格納された、処理対象CPUの各コアのライセンス割当フラグを「OFF」に設定する(ステップS85)。
The
割当決定部105は、LCU番号mをm=1と設定し且つコア番号nをn=1と設定する(ステップS87)。
The
割当決定部105は、num>0が成立するか判定する(ステップS89)。num>0が成立する場合(ステップS89:Yesルート)、割当決定部105は、コア位置データ格納部106に格納された、物理位置が(l,m,n)であるコアのライセンス割当フラグを「ON」に設定する(ステップS91)。
The
割当決定部105は、numをnum=num−1と設定する(ステップS93)。
The
割当決定部105は、n<LCU当たりのコア数Nが成立するか判定する(ステップS95)。n<LCU当たりのコア数Nが成立する場合(ステップS95:Yesルート)、割当決定部105は、nをn=n+1と設定し(ステップS97)、ステップS89の処理に戻る。
The
一方、n<LCU当たりのコア数Nが成立しない場合(ステップS95:Noルート)、割当決定部105は、nをn=1と設定する(ステップS99)。
On the other hand, when n <the number of cores N per LCU does not hold (step S95: No route), the
割当決定部105は、mをm=m+1と設定する(ステップS101)。そしてステップS89の処理に戻る。
The
一方,num>0が成立しない場合(ステップS89:Noルート)、割当決定部105は、情報処理システム1内に未処理のCPUが有るか判定する(ステップS103)。未処理のCPUが有る場合(ステップS103:Yesルート)、ステップS81の処理に戻る。未処理のCPUが無い場合(ステップS103:Noルート)、呼び出し元の処理に戻る。
On the other hand, when num> 0 is not satisfied (step S89: No route), the
以上のような処理を実行すれば、動作するコアが特定のLCUに集められるような配置を実現できるようになる。例えば初期的に図22に示すようなデータがコア位置データ格納部106に格納されている場合、第2集中割当処理を実行すると、例えば図23に示すようなデータがコア位置データ格納部106に格納される。
By executing the processing as described above, it is possible to realize an arrangement in which operating cores are collected in a specific LCU. For example, when data as shown in FIG. 22 is initially stored in the core position
図15の説明に戻り、電源モードが「性能」である場合(ステップS29:Yesルート)、割当決定部105は、第2分散割当処理を実行する(ステップS33)。第2分散割当処理については、図24を用いて説明する。
Returning to the description of FIG. 15, when the power mode is “performance” (step S29: Yes route), the
まず、割当決定部105は、情報処理システム1内におけるCPUのうち未処理のCPUを1つ特定し、ソケット番号lをそのCPUが取り付けられたソケットのソケット番号に設定する(図24:ステップS111)。以下では、ステップS111において特定されたCPUを「処理対象CPU」と呼ぶ。
First, the
割当決定部105は、処理対象CPUに割り当てるライセンス数numを第1管理データ格納部104から読み出す(ステップS113)。
The
割当決定部105は、コア位置データ格納部106に格納された、処理対象CPUの各コアのライセンス割当フラグを「OFF」に設定する(ステップS115)。
The
割当決定部105は、LCU番号mをm=1と設定し且つコア番号nをn=1と設定する(ステップS117)。
The
割当決定部105は、num>0が成立するか判定する(ステップS119)。num>0が成立する場合(ステップS119:Yesルート)、割当決定部105は、コア位置データ格納部106に格納された、物理位置が(l,m,n)であるコアのライセンス割当フラグを「ON」に設定する(ステップS121)。
The
割当決定部105は、numをnum=num−1と設定する(ステップS123)。
The
割当決定部105は、m<ソケット当たりのLCU数Mが成立するか判定する(ステップS125)。m<ソケット当たりのLCU数Mが成立する場合(ステップS125:Yesルート)、割当決定部105は、mをm=m+1と設定し(ステップS127)、ステップS119の処理に戻る。
The
一方、m<ソケット当たりのLCU数Mが成立しない場合(ステップS125:Noルート)、割当決定部105は、mをm=1と設定する(ステップS129)。
On the other hand, if m <the number M of LCUs per socket does not hold (step S125: No route), the
割当決定部105は、nをn=n+1と設定する(ステップS131)。そしてステップS119の処理に戻る。
The
一方,num>0が成立しない場合(ステップS119:Noルート)、割当決定部105は、情報処理システム1内に未処理のCPUが有るか判定する(ステップS133)。未処理のCPUが有る場合(ステップS133:Yesルート)、ステップS111の処理に戻る。未処理のCPUが無い場合(ステップS133:Noルート)、呼び出し元の処理に戻る。
On the other hand, when num> 0 is not satisfied (step S119: No route), the
以上のような処理を実行すれば、動作するコアが多数のLCUに分散されるような配置を実現できるようになる。 By executing the processing as described above, it is possible to realize an arrangement in which operating cores are distributed over a large number of LCUs.
図15の説明に戻り、割当決定部105は、コア位置データ格納部106に格納されたライセンス割当フラグが「ON」であるコアのC−IDをライセンス管理部101に通知する。そして、ライセンス管理部101は、割当決定部105から通知されたC−IDで、第2管理データ格納部102に格納されたC−IDを更新する(ステップS35)。そして呼び出し元の処理に戻る。
Returning to the description of FIG. 15, the
図14の説明に戻り、監視装置100は情報処理システム1の管理者による電源投入指示を受け付け(ステップS7)、監視装置100は電源制御プログラムを起動する(ステップS9)。電源制御プログラムの起動によって電源制御部109が動作を開始する。
Returning to the description of FIG. 14, the
電源制御部109は、電源投入処理を実行する(ステップS11)。そして処理は終了する。電源投入処理については、図25乃至図27を用いて説明する。
The
まず、電源投入管理部107は、LCU位置データ格納部108に格納された、各LCUの電源投入フラグを「OFF」に設定する(図25:ステップS141)。ステップS141の処理によって、LCU位置データ格納部108には、例えば図26に示すようなデータが格納される。
First, the power-on
電源投入管理部107は、処理されたコアの数を表す変数p_idをp_id=1と設定する(ステップS143)。
The power-on
電源投入管理部107は、コア位置データ格納部106から、C−IDがc_(p_id)であるコアのライセンス割当フラグを特定する(ステップS145)。
The power-on
電源投入管理部107は、ステップS145において特定されたライセンス割当フラグが「ON」であるか判定する(ステップS147)。ライセンス割当フラグが「ON」ではない場合(ステップS147:Noルート)、ステップS153の処理に移行する。
The power-on
一方、ライセンス割当フラグが「ON」である場合(ステップS147:Yesルート)、電源投入管理部107は、コア位置データ格納部106から、C−IDがc_(p_id)であるコアのソケット番号l及びLCU番号mを特定する(ステップS149)。
On the other hand, when the license assignment flag is “ON” (step S147: Yes route), the power-on
電源投入管理部107は、ソケット番号がlであり且つLCU番号がmであるLCUの電源投入フラグを「ON」に設定する(ステップS151)。ステップS151の処理によって、例えば図27に示すように、電源が投入されるLCUの電源投入フラグのみが「ON」に設定される。
The power-on
電源投入管理部107は、p_idをp_id=p_id+1と設定する(ステップS153)。
The power-on
電源投入管理部107は、p_id≦L*M*Nが成立するか判定する(ステップS155)。p_id≦L*M*Nが成立する場合(ステップS155:Yesルート)、ステップS145の処理に戻る。
The power-on
一方、p_id≦L*M*Nが成立しない場合(ステップS155:Noルート)、電源制御部109は、LCU位置データ格納部108における電源投入フラグが「ON」であるLCUを特定し、特定したLCUに電源を投入する(ステップS157)。そして呼び出し元の処理に戻る。
On the other hand, when p_id ≦ L * M * N is not satisfied (step S155: No route), the power
以上のような処理を実行すれば、電源を投入すべきLCUに対してのみ電源を投入できるようになる。図28に、電源モードと性能及び省電力化との関係を示す。電源モードが「性能」である場合、性能は高いが省電力化の効果は小さい。電源モードが「省電力」である場合、性能は低いが省電力化の効果は大きい。電源モード「バランス」である場合、性能及び省電力化の効果は中程度である。 If the processing as described above is executed, the power can be turned on only to the LCU that should be turned on. FIG. 28 shows the relationship between the power supply mode, performance, and power saving. When the power mode is “performance”, the performance is high, but the effect of power saving is small. When the power mode is “power saving”, the performance is low but the power saving effect is great. When the power supply mode is “balance”, the performance and power saving effects are moderate.
[実施の形態2]
次に、第2の実施の形態について説明する。第2の実施の形態によれば、動作させるコアの切り替えによって、マルチプロセッサシステム内の温度ムラを解消することができるようになる。なお、第2乃至第4の実施の形態においては、筐体間において動作させるコアの物理的配置を温度ムラの観点から最適化する機能を提供する例が示されており、仮想的なマッピングデータ処理を併用することで仮想環境に適用される。
[Embodiment 2]
Next, a second embodiment will be described. According to the second embodiment, temperature unevenness in the multiprocessor system can be eliminated by switching the operating core. In the second to fourth embodiments, there is shown an example of providing a function for optimizing the physical arrangement of cores operated between cases from the viewpoint of temperature unevenness, and virtual mapping data is shown. It is applied to the virtual environment by using processing together.
図29に、第2の実施の形態の情報処理システム2の概要を示す。情報処理システム2は、連結された複数の筐体を含むハードウエア23を有し、1台のサーバとして動作することができる。すなわち、情報処理システム2はビルディングブロック方式によって構築されるシステムである。ハードウエア23上では仮想化ソフトウエア22が動作し、仮想化ソフトウエア22上ではOS21が動作する。複数の筐体の各々は、例えばサービスプロセッサである監視装置を有し、各監視装置上で制御部が実行される。また、複数の監視装置のうち1の監視装置はマスタの監視装置(本実施の形態においては、監視装置0m)であり、マスタの監視装置上ではさらにシステム制御部200が実行される。図29の例では、筐体0bは制御部0fを実行し、筐体1bは制御部1fを実行し、筐体2bは制御部2fを実行する。
FIG. 29 shows an overview of the
図30に、ハードウエア23のより具体的な構成を示す。筐体0bは、CPU00p乃至02pと、冷却ファンによって筐体0b内に取り込まれた空気の温度(以下、吸気温度と呼ぶ)を計測する吸気温度センサ50sと、監視装置0mとを有する。CPU00pはCPU00pの温度を計測するCPU温度センサ00sを有し、CPU01pはCPU01pの温度を計測するCPU温度センサ01sを有し、CPU02pはCPU02pの温度を計測するCPU温度センサ02sを有する。各CPUは(p+1)個(pは自然数)のコアを有するマルチコアプロセッサである。但し、各CPUが有するコアの数が異なっていてもよい。筐体1b及び筐体2bの構成は筐体0bの構成と基本的に同じであるので、ここでは説明を省略する。
FIG. 30 shows a more specific configuration of the
各CPUは、専用の高速インタフェースによって他のCPUと通信を行うことができる。また、各監視装置は、専用のインタフェースによって他の監視装置と通信を行うことができる。 Each CPU can communicate with another CPU through a dedicated high-speed interface. Each monitoring device can communicate with other monitoring devices through a dedicated interface.
図31を用いて、制御部0fの機能ブロック及びシステム制御部200の機能ブロックを示す。制御部0fは、温度異常処理部301と、電源制御部302と、切替部303と、温度監視部304と、ファン制御部305とを含む。制御部1f及び2fが実行する処理は制御部0fが実行する処理と基本的に同じであるため、ここでは説明を省略する。また、システム制御部200は、OSインタフェース部201と、CPU選択部202と、管理データ格納部203と、温度データ処理部204とを含む。
FIG. 31 shows functional blocks of the control unit 0f and functional blocks of the
温度監視部304は、筐体0bにおける各CPUのCPU温度センサから取得した温度データ及び筐体0bにおける吸気温度センサ50sから取得した温度データを、温度データ処理部204に通知する。また、温度監視部304は、筐体0bにおける各CPUのCPU温度に応じて、温度異常処理部301、切替部303及びファン制御部305に通知を行う。温度異常処理部301は、温度監視部304からの通知に応じて、温度異常が発生したCPUの電源の制御(例えば切断)を電源制御部302に指示し、また、OS21の制御(例えばシャットダウン)をOSインタフェース部201に指示する。切替部303は、温度監視部304からの通知に応じて、コアの切替要求をCPU選択部202に出力する。ファン制御部305は、温度監視部304からの通知に応じて、筐体0bにおける冷却ファンの回転速度を制御する。CPU選択部202は、切替部303から受け取った切替要求に応じて、管理データ格納部203に格納されたデータに基づき処理を実行し、処理結果に基づき生成されたコア切替指示を仮想化ソフトウエア22に出力する。温度データ処理部204は、温度監視部304から受け取った温度データに基づき、管理データ格納部203に格納されているデータを更新する。
The
図32に、マスタである監視装置0mのハードウエア構成図を示す。監視装置0mは、CPU251と、RAM252と、ROM253と、バス255とを有する。CPU251、RAM252及びROM253は、バス255を介して接続される。ROM253は、システム制御ファームウエア2541及び制御ファームウエア2542を格納する。システム制御ファームウエア2541及び制御ファームウエア2542は、CPU251によってRAM252に読み出され、CPU251によって実行される。図31に示したOSインタフェース部201、CPU選択部202及び温度データ処理部204は、CPU251がシステム制御ファームウエア2541を実行することによって実現される。管理データ格納部203は、例えばRAM252に設けられる。図31に示した温度異常処理部301、電源制御部302、切替部303、温度監視部304及びファン制御部305は、CPU251が制御ファームウエア2542を実行することによって実現される。
FIG. 32 shows a hardware configuration diagram of the monitoring device 0m as a master. The monitoring device 0m includes a
図33に、マスタではない監視装置のハードウエア構成図を示す。マスタではない監視装置1m及び2mは、CPU261と、RAM262と、ROM263と、バス265とを有する。CPU261、RAM262及びROM263は、バス265を介して接続される。ROM263は、制御ファームウエア264を格納する。制御ファームウエア264は、CPU261によってRAM262に読み出され、CPU261によって実行される。マスタではない監視装置の温度異常処理部301、電源制御部302、切替部303、温度監視部304及びファン制御部305は、CPU261が制御ファームウエア264を実行することによって実現される。
FIG. 33 shows a hardware configuration diagram of a monitoring device that is not the master. The
図34に、仮想化ソフトウエア22の機能ブロック図を示す。仮想化ソフトウエア22は、CPU管理部401と、マッピングデータ格納部402とを含む。CPU管理部401は、CPU選択部202から受け取ったコア切替指示に基づき、マッピングデータ格納部402に格納されたデータを更新する。
FIG. 34 shows a functional block diagram of the
図35に、管理データ格納部203に格納される第1管理データの一例を示す。図35の例では、筐体の識別情報と、CPUの識別情報と、CPU温度及びその順位と、吸気温度及びその順位と、使用されていないコアの数及びコアの総数並びにその順位と、筐体間の距離及びその順位と、順位の合計を表す数値と、順位の合計を表す数値に基づき決定される総合順位とが格納される。筐体間の距離は、処理対象のCPUが含まれる筐体とその他の各筐体との距離である。CPU温度及び吸気温度が低いほど温度ムラの解消に有効であるため、順位が上になる。使用されていないコアの数が多いほど温度の局所的な上昇を発生させにくいため、順位は上になる。筐体間の距離が長いほど温度ムラの解消に有効であるため、順位は上になる。
FIG. 35 shows an example of first management data stored in the management
図36に、管理データ格納部203に格納される第2管理データの一例を示す。図36の例では、CPUの識別情報と、コアを識別するための番号と、コアが動作中であるか(すなわち、コアに電源が投入され且つプログラムの実行に使用されている(すなわちライセンスが割り当て済みである)か)否かを表す動作フラグとが格納される。第2管理データは、コアの切替時にCPU選択部202によって更新される。
FIG. 36 shows an example of second management data stored in the management
次に、図37乃至図44を用いて、情報処理システム2において行われる処理について説明する。まず、図37乃至図39を用いて、制御部(ここでは、制御部0fとする)が実行する処理を説明する。但し、制御部1f及び2fが実行する処理は制御部0fが実行する処理と同じである。
Next, processing performed in the
まず、温度監視部304は、吸気温度センサ50sから吸気温度を読み出し、読み出した吸気温度を温度データ処理部204に通知する(図37:ステップS161)。
First, the
温度監視部304は、筐体0bにおけるCPUのうち未処理のCPUを1つ特定する(ステップS163)。以下では、ステップS163において特定されたCPUを処理対象CPUと呼ぶ。
The
温度監視部304は、処理対象CPUのCPU温度を処理対象CPUのCPU温度センサから読み出し、読み出したCPU温度を温度データ処理部204に通知する(ステップS165)。
The
温度監視部304は、処理対象CPUのCPU温度がT3以上であるか判定する(ステップS167)。
The
処理対象CPUのCPU温度がT3以上である場合(ステップS167:Yesルート)、温度監視部304は、CPU温度がT3以上であることを温度異常処理部301に通知する。これに応じ、温度異常処理部301は、OS21のシャットダウン要求をシステム制御部200におけるOSインタフェース部201に出力する(ステップS169)。これに応じ、OSインタフェース部201は、OS21のシャットダウンを実行する。また、温度異常処理部301は、処理対象CPUの電源の制御(例えば切断)を電源制御部302に指示し、電源制御部302に処理対象CPUの電源切断を実行させてもよい。そして処理は端子Aを介して図39のステップS183に移行する。
When the CPU temperature of the processing target CPU is equal to or higher than T3 (step S167: Yes route), the
一方、処理対象CPUの温度がT3以上ではない場合(ステップS167:Noルート)、温度監視部304は、処理対象CPUのCPU温度がT2以上であるか判定する(ステップS171)。
On the other hand, when the temperature of the processing target CPU is not equal to or higher than T3 (step S167: No route), the
処理対象CPUのCPU温度がT2以上である場合(ステップS171:Yesルート)、温度監視部304は、コアの切替要求をシステム制御部200におけるCPU選択部202に出力する(ステップS173)。コアの切替要求は、処理対象CPUの識別情報を含む。システム制御部200が実行する処理については、後で説明する。そして処理は端子Aを介して図39のステップS183に移行する。
When the CPU temperature of the processing target CPU is equal to or higher than T2 (step S171: Yes route), the
一方、処理対象CPUのCPU温度がT2以上ではない場合(ステップS171:Noルート)、温度監視部304は、処理対象CPUのCPU温度がT1以上であるか判定する(ステップS175)。
On the other hand, when the CPU temperature of the processing target CPU is not equal to or higher than T2 (step S171: No route), the
処理対象CPUのCPU温度がT1以上である場合(ステップS175:Yesルート)、温度監視部304は、処理対象CPUのCPU温度がT1以上であることをファン制御部305に通知する。これに応じ、ファン制御部305は、筐体0bに搭載された冷却ファンの回転速度を高速化する(ステップS177)。例えば、CPU温度がT1以上である場合に設定すべき回転速度として予め指定された回転速度が設定される。そして処理は端子Aを介して図39のステップS183の処理に移行する。
When the CPU temperature of the processing target CPU is equal to or higher than T1 (step S175: Yes route), the
一方、処理対象CPUのCPU温度がT1以上ではない場合(ステップS175:Noルート)、温度監視部304は、処理対象CPUのCPU温度がT0以下であるか判定する(ステップS179)。
On the other hand, when the CPU temperature of the processing target CPU is not equal to or higher than T1 (step S175: No route), the
処理対象CPUのCPU温度がT0以下である場合(ステップS179:Yesルート)、温度監視部304は、処理対象CPUのCPU温度がT0以下であることをファン制御部305に通知する。これに応じ、ファン制御部305は、筐体0bに搭載された冷却ファンの回転速度の高速化を解除する(ステップS181)。なお、冷却ファンの回転速度が高速化されていない場合には、現状の回転速度が維持される。そして処理は端子Aを介して図39のステップS183の処理に移行する。
When the CPU temperature of the processing target CPU is equal to or lower than T0 (step S179: Yes route), the
一方、処理対象CPUのCPU温度がT0以下ではない場合(ステップS179:Noルート)、処理は端子Aを介して図39のステップS183の処理に移行する。 On the other hand, when the CPU temperature of the processing target CPU is not equal to or lower than T0 (step S179: No route), the process proceeds to the process of step S183 in FIG.
図38を用いて、T0乃至T3の関係を説明する。第2の実施の形態においては、T0<T1<T2<T3という関係が成立する。このようなT0乃至T3によって、温度上昇に対する対策を段階的に実施することが可能になっている。 The relationship between T0 to T3 will be described with reference to FIG. In the second embodiment, the relationship T0 <T1 <T2 <T3 is established. By such T0 to T3, it is possible to implement measures against temperature rise step by step.
図39の説明に移行し、温度監視部304は、情報処理システム2内のCPUのうち未処理のCPUが有るか判定する(ステップS183)。未処理のCPUが有る場合(ステップS183:Yesルート)、処理は端子Bを介して図37のステップS163の処理に戻る。
39, the
一方、未処理のCPUが無い場合(ステップS183:Noルート)、処理の終了指示を情報処理システム2の管理者から受け付けたか判定する(ステップS185)。処理の終了指示を受け付けていない場合(ステップS185:Noルート)、処理は端子Cを介して図37のステップS161の処理に戻る。処理の終了指示を受け付けた場合(ステップS185:Yesルート)、処理は終了する。 On the other hand, if there is no unprocessed CPU (step S183: No route), it is determined whether a processing end instruction has been received from the administrator of the information processing system 2 (step S185). When the process termination instruction has not been received (step S185: No route), the process returns to the process of step S161 in FIG. When the process end instruction is accepted (step S185: Yes route), the process ends.
以上のような処理を実行すれば、CPU温度の高さに応じて適切な対応を機動的に実施することができるようになる。 By executing the processing as described above, an appropriate response can be flexibly implemented according to the CPU temperature.
次に、図40乃至図44を用いて、システム制御部200が実行する処理を説明する。なお、本実施の形態においても、予め決められた契約ライセンス数のコアを情報処理システム2において動作させるものとする。
Next, processing executed by the
まず、システム制御部200における温度データ処理部204は、温度データの通知を制御部0f乃至2fにおける温度監視部304から受け取り、管理データ格納部203に格納された第1管理データを更新する(図40:ステップS191)。なお、ステップS191において、第2管理データに基づき各CPUの未使用コア数を算出し、第1管理データをも更新してもよい。
First, the temperature
CPU選択部202は、コアの切替要求を制御部0f乃至2fにおける切替部303から受け取ったか判定する(ステップS193)。コアの切替要求を切替部303から受け取っていない場合(ステップS193:Noルート)、ステップS203の処理に移行する。一方、コアの切替要求を切替部303から受け取った場合(ステップS193:Yesルート)、CPU選択部202は、決定処理を実行する(ステップS195)。決定処理については、図41及び42を用いて説明する。
The
まず、CPU選択部202は、第1管理データにおける「CPU温度」を順位付けし(図41:ステップS211)、第1管理データを更新する。ステップS211においては、CPU温度が低いほど順位が高くなるように順位付けされる。
First, the
CPU選択部202は、第1管理データにおける「吸気温度」を順位付けし(ステップS213)、第1管理データを更新する。ステップS213においては、吸気温度が低いほど順位が高くなるように順位付けされる。
The
CPU選択部202は、第1管理データにおける「未使用コア数」を順位付けし(ステップS215)、第1管理データを更新する。ステップS215においては、未使用コア数が多いほど順位が高くなるように順位付けされる。
The
CPU選択部202は、コアの切替要求に含まれるCPUの識別情報によって特定されるCPUを含む筐体と、その他の各筐体との筐体間距離を算出する。そして、CPU選択部202は、第1管理データにおける「筐体間距離」を順位付けし(ステップS217)、第1管理データを更新する。ステップS217においては、筐体間距離が長くなるほど順位が高くなるように順位付けされる。
The
CPU選択部202は、CPU温度の順位、吸気温度の順位、未使用コア数の順位及び筐体間距離の順位の総和を算出し(ステップS219)、第1管理データを更新する。
The
CPU選択部202は、ステップS219において算出された総和に従って総合順位を決定し(ステップS221)、第1管理データを更新する。
The
CPU選択部202は、順位を表す変数aをa=1と設定し(ステップS223)、総合順位がa位であるCPUを特定する(ステップS225)。
The
CPU選択部202は、ステップS225において特定されたCPUは未使用コアを有するか判定する(ステップS227)。未使用コアを有するか否かは、第1管理データにおける未使用コア数の欄に格納された情報によって判定される。ステップS225において特定されたCPUは未使用コアを有しない場合(ステップS227:Noルート)、CPU選択部202は、aをa=a+1と設定し(ステップS229)、ステップS225の処理に戻る。これにより、例えば図42の例であれば、まず総合順位が1であるCPU31pが特定され、次に総合順位が2であるCPU20p、CPU21p及びCPU30pが特定され・・・、というように、高順位のCPUから特定されるようになる。
The
一方、ステップS225において特定されたCPUは未使用コアを有する場合(ステップS227:Yesルート)、CPU選択部202は、ステップS225において特定されたCPUの未使用コアの中から1つ未使用コアを特定する。そして、特定された未使用コアが新たに動作させるコアであることを示す情報を生成し(ステップS231)、RAM252に格納する。そして呼び出し元の処理に戻る。
On the other hand, when the CPU identified in step S225 has an unused core (step S227: Yes route), the
図40の説明に戻り、CPU選択部202は、CPU温度がT2に達したCPU(すなわち、コアの切替要求に含まれる識別情報によって特定されるCPU)におけるコアを1つ無効に設定する(ステップS197)。具体的には、CPU選択部202は、管理データ格納部203に格納された第2管理データにおいて、無効に設定される1つのコアの動作フラグをOFFに設定する。
Returning to the description of FIG. 40, the
CPU選択部202は、新たに動作させる1つのコア(すなわち、ステップS231において生成された情報によって特定されるコア)を有効に設定する(ステップS199)。具体的には、CPU選択部202は、管理データ格納部203に格納された第2管理データにおいて、有効に設定される1つのコアの動作フラグをONに設定する。
The
図43を用いて、コアの切替について説明する。図43の例においては、鉛直方向において最も高い位置に設置された筐体0bの吸気温度が最も高くなっており、鉛直方向において最も低い位置に設置された筐体3bの吸気温度が最も低くなっている。太線のコアは有効なコア(すなわち、動作中のコア)である。
The core switching will be described with reference to FIG. In the example of FIG. 43, the intake temperature of the casing 0b installed at the highest position in the vertical direction is the highest, and the intake temperature of the
そして、本例においては、CPU00pの温度がT2以上になったと仮定する。このような場合には、上で述べたような処理に基づき、CPU00p内の1つのコアが動作を停止し、別のCPU内のコアを1つ動作させる。図43の例では、吸気温度が最も低い筐体3bにおけるCPU31pの1つのコアが新たに動作を開始する。これにより、契約ライセンス数のCPUが動作することを担保しつつ、情報処理システム2の温度耐性を強化することが可能になる。
In this example, it is assumed that the temperature of the
CPU選択部202は、仮想化ソフトウエア22におけるCPU管理部401に、マッピングデータの更新を指示する。これに応じ、CPU管理部401は、マッピングデータ格納部402に格納されたマッピングデータを更新する(ステップS201)。
The
図44を用いて、マッピングデータの更新について説明する。マッピングデータの更新においては、仮想CPU番号と物理CPU番号との対応付けが変更される。通常、OS21上で実行される仮想マシンは仮想CPU番号によってコアを利用するが、実際には仮想化ソフトウエア22において仮想CPU番号が物理CPU番号に変換され、物理CPU番号によってコアが利用される。ステップS201においては、コアの切替によって新たに7番のコアが利用されるようになっており、これに従い、CPU管理部401によって、マッピングデータにおける物理番号「#3」は「#7」に書き換えられる。このように、仮想CPU番号を変更することなく動作コアの配置変更が可能である。すなわち、OS21の改変は不要である。
The update of mapping data is demonstrated using FIG. In updating the mapping data, the association between the virtual CPU number and the physical CPU number is changed. Normally, a virtual machine executed on the
CPU選択部202は、情報処理システム2の管理者による処理の終了指示を受け付けたか判定する(ステップS203)。処理の終了指示を受け付けていない場合(ステップS203:Noルート)、ステップS191の処理に戻る。処理の終了指示を受け付けた場合(ステップS203:Yesルート)、処理は終了する。
The
以上のような処理を実行すれば、温度が局所的に高温になることを未然に防げるので、温度ムラの発生を抑制し、システムの安定動作を維持できるようになる。また、動作するCPUの配置の変更によって温度耐性を強化することができれば、冷却ファンの回転速度を高速化せずに済む場合があるので、消費電力の削減にもつながる。 By executing the processing as described above, it is possible to prevent the temperature from becoming locally high, so that the occurrence of temperature unevenness can be suppressed and the stable operation of the system can be maintained. Further, if the temperature tolerance can be enhanced by changing the arrangement of the operating CPUs, it may not be necessary to increase the rotation speed of the cooling fan, which leads to a reduction in power consumption.
なお、上記のような処理によれば、冷却に有利な位置にあるコアの使用数が増え、冷却に不利な位置にあるコアの使用数が次第に減っていくことになると考えられる。 In addition, according to the above processing, it is considered that the number of cores that are in an advantageous position for cooling increases and the number of cores that are in an unfavorable position for cooling gradually decreases.
[実施の形態3]
次に、第3の実施の形態について説明する。
[Embodiment 3]
Next, a third embodiment will be described.
第3の実施の形態の決定処理は、少なくともCPU温度と算出された筐体間距離とを順位付けする点で第2の実施の形態の決定処理と異なっており、その他の点については第3の実施の形態と第2の実施の形態は同じである。以下では、第3の実施の形態の決定処理について説明する。 The determination process of the third embodiment is different from the determination process of the second embodiment in that at least the CPU temperature and the calculated inter-chassis distance are ranked, and the other points are the third. The second embodiment and the second embodiment are the same. Below, the determination process of 3rd Embodiment is demonstrated.
まず、CPU選択部202は、第1管理データにおける「CPU温度」を順位付けし(図45:ステップS241)、第1管理データを更新する。ステップS241においては、CPU温度が低いほど順位が高くなるように順位付けされる。
First, the
CPU選択部202は、コアの切替要求に含まれるCPUの識別情報によって特定されるCPUを含む筐体と、その他の各筐体との筐体間距離を算出する。そして、CPU選択部202は、第1管理データにおける「筐体間距離」を順位付けし(ステップS243)、第1管理データを更新する。ステップS243においては、筐体間距離が長くなるほど順位が高くなるように順位付けされる。
The
CPU選択部202は、CPU温度の順位及び筐体間距離の順位の和を算出し(ステップS245)、第1管理データを更新する。
The
CPU選択部202は、ステップS245において算出された和に従って総合順位を決定し(ステップS247)、第1管理データを更新する。
The
CPU選択部202は、順位を表す変数aをa=1と設定し(ステップS249)、総合順位がa位であるCPUを特定する(ステップS251)。
The
CPU選択部202は、ステップS251において特定されたCPUは未使用コアを有するか判定する(ステップS253)。未使用コアを有するか否かは、第1管理データにおける未使用コア数の欄に格納された情報によって判定される。ステップS251において特定されたCPUは未使用コアを有しない場合(ステップS253:Noルート)、CPU選択部202は、aをa=a+1と設定し(ステップS255)、ステップS251の処理に戻る。
The
一方、ステップS251において特定されたCPUは未使用コアを有する場合(ステップS253:Yesルート)、CPU選択部202は、ステップS251において特定されたCPUの未使用コアの中から1つ未使用コアを特定する。そして、特定された未使用コアが新たに動作させるコアであることを示す情報を生成し(ステップS257)、RAM252に格納する。そして呼び出し元の処理に戻る。
On the other hand, when the CPU identified in step S251 has an unused core (step S253: Yes route), the
以上のような処理を実行すれば、温度が局所的に高温になることを未然に防げるので、温度ムラの発生を抑制し、システムの安定動作を維持できるようになる。また、動作するCPUの配置の変更によって温度耐性を強化することができれば、冷却ファンの回転速度を高速化せずに済む場合があるので、消費電力の削減にもつながる。例えば、筐体間の吸気温度にほとんど差が無い場合、或いは、CPU内のコアの使用数がCPU温度の上昇に及ぼす影響が僅かであるような場合に対して、第3の実施の形態は有効である。 By executing the processing as described above, it is possible to prevent the temperature from becoming locally high, so that the occurrence of temperature unevenness can be suppressed and the stable operation of the system can be maintained. Further, if the temperature tolerance can be enhanced by changing the arrangement of the operating CPUs, it may not be necessary to increase the rotation speed of the cooling fan, which leads to a reduction in power consumption. For example, in the case where there is almost no difference in the intake air temperature between the cases, or the case where the number of cores used in the CPU has a small effect on the rise in the CPU temperature, the third embodiment is It is valid.
[実施の形態4]
次に、第4の実施の形態について説明する。
[Embodiment 4]
Next, a fourth embodiment will be described.
第4の実施の形態の決定処理は、少なくとも吸気温度と未使用コア数とを順位付けする点で第2及び第3の実施の形態の決定処理と異なっており、その他の点については第4の実施の形態と第2及び第3の実施の形態は同じである。以下では、第4の実施の形態の決定処理について説明する。 The determination process of the fourth embodiment is different from the determination process of the second and third embodiments in that at least the intake air temperature and the number of unused cores are ranked, and the other points are the fourth. The second embodiment and the third and third embodiments are the same. Hereinafter, a determination process according to the fourth embodiment will be described.
CPU選択部202は、第1管理データにおける「吸気温度」を順位付けし(図46:ステップS261)、第1管理データを更新する。ステップS261においては、吸気温度が低いほど順位が高くなるように順位付けされる。
The
CPU選択部202は、第1管理データにおける「未使用コア数」を順位付けし(ステップS263)、第1管理データを更新する。ステップS263においては、未使用コア数が多いほど順位が高くなるように順位付けされる。
The
CPU選択部202は、吸気温度の順位及び未使用コア数の順位の和を算出し(ステップS265)、第1管理データを更新する。
The
CPU選択部202は、ステップS265において算出された和に従って総合順位を決定し(ステップS267)、第1管理データを更新する。
The
CPU選択部202は、順位を表す変数aをa=1と設定し(ステップS269)、総合順位がa位であるCPUを特定する(ステップS271)。
The
CPU選択部202は、ステップS271において特定されたCPUは未使用コアを有し、且つ、ステップS271において特定されたCPUを含む筐体とコアの切替要求に含まれる識別情報によって特定されるCPUを含む筐体との筐体間距離が0より大きいという条件が満たされるか判定する(ステップS273)。
The
条件が満たされない場合(ステップS273:Noルート)、CPU選択部202は、aをa=a+1と設定し(ステップS275)、ステップS271の処理に戻る。
When the condition is not satisfied (step S273: No route), the
一方、条件が満たされる場合(ステップS273:Yesルート)、CPU選択部202は、ステップS271において特定されたCPUの未使用コアの中から1つ未使用コアを特定する。そして、特定された未使用コアが新たに動作させるコアであることを示す情報を生成し(ステップS277)、RAM252に格納する。そして呼び出し元の処理に戻る。
On the other hand, when the condition is satisfied (step S273: Yes route), the
以上のような処理を実行すれば、温度が局所的に高温になることを未然に防げるので、温度ムラの発生を抑制し、システムの安定動作を維持できるようになる。また、動作するCPUの配置の変更によって温度耐性を強化することができれば、冷却ファンの回転速度を高速化せずに済む場合があるので、消費電力の削減にもつながる。例えば、特に吸気温度及びCPU内のコアの使用数がCPU温度に大きな影響を及ぼすような場合に対して、第4の実施の形態は有効である。 By executing the processing as described above, it is possible to prevent the temperature from becoming locally high, so that the occurrence of temperature unevenness can be suppressed and the stable operation of the system can be maintained. Further, if the temperature tolerance can be enhanced by changing the arrangement of the operating CPUs, it may not be necessary to increase the rotation speed of the cooling fan, which leads to a reduction in power consumption. For example, the fourth embodiment is effective particularly when the intake air temperature and the number of cores used in the CPU have a large effect on the CPU temperature.
以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、上で説明した監視装置100、制御部0f乃至2f、システム制御部200、及び仮想化ソフトウエア22の機能ブロック構成は実際のプログラムモジュール構成に一致しない場合もある。
Although one embodiment of the present invention has been described above, the present invention is not limited to this. For example, the functional block configurations of the
また、上で説明した各データ格納部の構成は一例であって、上記のような構成でなければならないわけではない。さらに、処理フローにおいても、処理結果が変わらなければ処理の順番を入れ替えることも可能である。さらに、並列に実行させるようにしても良い。 In addition, the configuration of each data storage unit described above is an example, and the above configuration is not necessarily required. Further, in the processing flow, the processing order can be changed if the processing result does not change. Further, it may be executed in parallel.
また、ステップS219、S247及びS267においては、順位に重み付けをしたうえで順位の和を求めるようにしてもよい。これにより、優先すべき項目の順位が総合順位に反映されやすくなる。 Further, in steps S219, S247, and S267, the sum of the ranks may be obtained after weighting the ranks. As a result, the order of items to be prioritized is easily reflected in the overall order.
以上述べた本発明の実施の形態をまとめると、以下のようになる。 The embodiment of the present invention described above is summarized as follows.
本実施の形態の第1の態様に係る制御装置(監視装置とも呼ぶ)は、(A)情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部と、(B)記憶部に記憶された、複数の処理装置の各々の物理位置の情報に基づき、複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、決定の結果に従い、記憶部に記憶された管理情報の更新と、1又は複数の第1処理装置を動作させるための処理とを実行する制御部とを有する。 The control device (also referred to as a monitoring device) according to the first aspect of the present embodiment includes (A) information on the physical position of each of the plurality of processing devices in the information processing system and whether or not the processing device is operating. And (B) one or a plurality of processing devices to be operated from among the plurality of processing devices based on the information on the physical positions of the plurality of processing devices stored in the storage unit. And a control unit that executes updating of management information stored in the storage unit and processing for operating one or a plurality of first processing devices according to the determination result.
これにより、マルチプロセッサシステムにおいて適切なプロセッサを動作させることが可能になる。 This makes it possible to operate an appropriate processor in the multiprocessor system.
また、情報処理システムは、複数の中央処理装置を有し、複数の中央処理装置の各々は、同一の1次キャッシュを使用する1又は複数の処理装置を各々が有する1又は複数のグループを有し、同一の中央処理装置に含まれる1又は複数のグループに属する処理装置は、同一の2次キャッシュを使用し、情報処理システムの電源は、グループ単位で制御され、物理位置の情報は、処理装置を含む中央処理装置の位置の情報と、処理装置が属するグループの位置の情報とを含んでもよい。同一のグループにおいて多数の処理装置が動作しないようにすれば、1次キャッシュについて競合が発生することを抑制できるので、性能が低下することを防げる。また、同一の中央処理装置において多数の処理装置が動作しないようにすれば、2次キャッシュについて競合が発生することを抑制できるので、性能が低下することを防げる。一方、同一のグループにおいて多数の処理装置が動作するようにすれば、電源が投入されるグループの数を減らせるので、電力消費を抑制できるようになる。従って、上で述べたような処理を実行すれば、動作させる処理装置の物理位置によって電力消費及び性能を適切に制御することができるようになる。 The information processing system has a plurality of central processing units, and each of the plurality of central processing units has one or a plurality of groups each having one or a plurality of processing units using the same primary cache. However, the processing devices belonging to one or more groups included in the same central processing unit use the same secondary cache, the power supply of the information processing system is controlled in units of groups, and the physical position information is processed Information on the position of the central processing unit including the device and information on the position of the group to which the processing device belongs may be included. If a large number of processing devices do not operate in the same group, it is possible to suppress the occurrence of contention for the primary cache, thereby preventing a decrease in performance. Further, if a large number of processing devices are not operated in the same central processing unit, it is possible to suppress the occurrence of contention for the secondary cache, thereby preventing a decrease in performance. On the other hand, if a large number of processing devices operate in the same group, the number of groups to be powered on can be reduced, so that power consumption can be suppressed. Therefore, if the process as described above is executed, the power consumption and the performance can be appropriately controlled according to the physical position of the processing apparatus to be operated.
また、上で述べた制御部は、(b1)1又は複数の第1処理装置が複数の中央処理装置に分散され且つ1又は複数の処理装置が複数のグループに分散されるように、1又は複数の第1処理装置を決定してもよい。これにより、2次キャッシュについて競合が発生することを抑止するとともに、1次キャッシュについて競合が発生することも抑止できるようになる。すなわち、性能を重視して情報処理システムを運用することが可能になる。 In addition, the control unit described above includes (b1) one or more first processing devices so that one or more first processing devices are distributed to a plurality of central processing devices and one or more processing devices are distributed to a plurality of groups. A plurality of first processing devices may be determined. As a result, it is possible to suppress the occurrence of contention for the secondary cache and to suppress the occurrence of contention for the primary cache. That is, the information processing system can be operated with emphasis on performance.
また、上で述べた制御部は、(b2)1又は複数の第1処理装置が複数の中央処理装置に分散され且つ1又は複数の処理装置が特定のグループに集められるように、1又は複数の第1処理装置を決定してもよい。これにより、2次キャッシュについて競合が発生することを抑止するとともに、電力消費を抑制できるようになる。すなわち、性能及び省電力のバランスを重視して情報処理システムを運用することが可能になる。 In addition, the control unit described above includes (b2) one or a plurality of first processing devices so that one or a plurality of first processing devices are distributed to a plurality of central processing devices and one or a plurality of processing devices are collected in a specific group. The first processing apparatus may be determined. As a result, it is possible to suppress the occurrence of contention for the secondary cache and to suppress power consumption. That is, the information processing system can be operated with an emphasis on the balance between performance and power saving.
また、上で述べた制御部は、(b3)1又は複数の第1処理装置が特定の中央処理装置に集められ且つ1又は複数の処理装置が特定のグループに集められるように、1又は複数の第1処理装置を決定してもよい。これにより、省電力を重視して情報処理システムを運用することができるようになる。 In addition, the control unit described above may include (b3) one or a plurality of first processing devices so that one or more first processing devices are collected in a specific central processing device and one or more processing devices are collected in a specific group. The first processing apparatus may be determined. As a result, the information processing system can be operated with emphasis on power saving.
また、上で述べた1又は複数の第1処理装置を動作させるための処理は、1又は複数の第1処理装置に電源を投入する処理を含んでもよい。例えば、情報処理システムの起動時から最適な物理位置で運用をすることができるようになる。 Moreover, the process for operating the 1 or several 1st processing apparatus mentioned above may also include the process which powers on a 1 or several 1st processing apparatus. For example, it becomes possible to operate at an optimum physical position from the time of starting the information processing system.
また、情報処理システムは、複数の中央処理装置を有し、複数の処理装置の各々は、複数の中央処理装置のいずれかに含まれてもよい。そして、上で述べた制御部は、(b4)動作している処理装置のうち特定の処理装置の温度が閾値を超えたことを検出し、各処理装置と特定の処理装置との距離と、各処理装置を含む中央処理装置の温度とに基づき、複数の処理装置の中から1の第1処理装置を決定してもよい。局所的に高温の場所が生じることを防ぎ且つ情報処理システム全体として温度を低下させるという意味では、特定の処理装置から離れた処理装置及び温度が低い中央処理装置に含まれる処理装置が動作することが好ましい。よって、上で述べたようにすれば、温度ムラの発生及び情報処理システムの高温化を抑制できるようになる。 The information processing system may include a plurality of central processing units, and each of the plurality of processing units may be included in any of the plurality of central processing units. And the control part mentioned above detects that the temperature of the specific processing apparatus exceeded the threshold among (b4) operating processing apparatuses, and the distance between each processing apparatus and the specific processing apparatus, Based on the temperature of the central processing unit including each processing unit, one first processing unit may be determined from among the plurality of processing units. In order to prevent the occurrence of a locally hot place and to lower the temperature of the information processing system as a whole, a processing device that is distant from a specific processing device and a processing device included in a central processing device having a low temperature operate. Is preferred. Thus, as described above, it is possible to suppress the occurrence of temperature unevenness and the high temperature of the information processing system.
また、情報処理システムは、複数の中央処理装置を有し、複数の処理装置の各々は、複数の中央処理装置のいずれかに含まれてもよい。そして、上で述べた制御部は、(b5)動作している処理装置のうち特定の処理装置の温度が閾値を超えたことを検出し、各処理装置と特定の処理装置との距離と、各処理装置を含む空間の吸気温度と、各処理装置を含む中央処理装置において動作していない処理装置の数とに基づき、複数の処理装置の中から1の第1処理装置を決定してもよい。局所的に高温の場所が生じることを防ぎ且つ情報処理システム全体として温度を低下させるという意味では、特定の処理装置から離れた処理装置、低温の空間に含まれる処理装置、及び動作していない処理装置が多い中央処理装置に含まれる処理装置が動作することが好ましい。よって、上で述べたようにすれば、温度ムラの発生及び情報処理システムの高温化を抑制できるようになる。 The information processing system may include a plurality of central processing units, and each of the plurality of processing units may be included in any of the plurality of central processing units. And the control part mentioned above detects that the temperature of the specific processing apparatus exceeded the threshold among (b5) operating processing apparatuses, and the distance between each processing apparatus and the specific processing apparatus, Even if one first processing device is determined from a plurality of processing devices based on the intake air temperature of the space including each processing device and the number of processing devices not operating in the central processing device including each processing device. Good. In the sense of preventing the occurrence of a locally hot place and reducing the temperature of the information processing system as a whole, a processing device away from a specific processing device, a processing device included in a low-temperature space, and a non-operating process It is preferable that the processing apparatus included in the central processing apparatus having many apparatuses operates. Thus, as described above, it is possible to suppress the occurrence of temperature unevenness and the high temperature of the information processing system.
また、上で述べた制御部は、(b6)各処理装置を含む中央処理装置の温度にさらに基づき、複数の処理装置の中から1の第1処理装置を決定してもよい。これにより、温度制御をより柔軟に行えるようになる。 Further, the control unit described above may determine (b6) one first processing device from among the plurality of processing devices based on the temperature of the central processing device including each processing device. Thereby, temperature control can be performed more flexibly.
また、1又は複数の第1処理装置を動作させるための処理は、処理装置の仮想的な識別情報と処理装置の物理的な識別情報とを対応付けて格納するデータ格納部に格納されている、特定の処理装置の物理的な識別情報を、1の第1処理装置の識別情報に書き換える処理を含んでもよい。例えば情報処理システムの運用中において、動作させるプロセッサを状況に応じて適切に切り替えることが可能になる。 In addition, the process for operating one or more first processing devices is stored in a data storage unit that stores virtual identification information of the processing device and physical identification information of the processing device in association with each other. A process of rewriting physical identification information of a specific processing apparatus with identification information of one first processing apparatus may be included. For example, during operation of the information processing system, the processor to be operated can be appropriately switched depending on the situation.
本実施の形態の第2の態様に係る制御方法は、(C)情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部に記憶された、複数の処理装置の各々の物理位置の情報に基づき、複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、(D)決定の結果に従い、記憶部に記憶された管理情報の更新と、1又は複数の第1処理装置を動作させるための処理とを実行する処理を含む。 The control method according to the second aspect of the present embodiment includes (C) information on each physical position of a plurality of processing devices in the information processing system, and management information indicating whether or not the processing devices are operating. Determining one or a plurality of first processing devices to be operated from among the plurality of processing devices based on the information on the physical positions of the plurality of processing devices stored in the storage unit storing (D) In accordance with the result, the management information stored in the storage unit is updated, and processing for operating one or more first processing devices is included.
なお、上記方法による処理をプロセッサに行わせるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブルディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等のコンピュータ読み取り可能な記憶媒体又は記憶装置に格納される。尚、中間的な処理結果はメインメモリ等の記憶装置に一時保管される。 A program for causing the processor to perform the processing according to the above method can be created, and the program can be a computer-readable storage medium such as a flexible disk, a CD-ROM, a magneto-optical disk, a semiconductor memory, a hard disk, or the like. It is stored in a storage device. The intermediate processing result is temporarily stored in a storage device such as a main memory.
以上の実施例を含む実施形態に関し、さらに以下の付記を開示する。 The following supplementary notes are further disclosed with respect to the embodiments including the above examples.
(付記1)
情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部と、
前記記憶部に記憶された、前記複数の処理装置の各々の物理位置の情報に基づき、前記複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、決定の結果に従い、前記記憶部に記憶された前記管理情報の更新と、前記1又は複数の第1処理装置を動作させるための処理とを実行する制御部と、
を有する制御装置。
(Appendix 1)
A storage unit that stores information on the physical position of each of the plurality of processing devices in the information processing system and management information indicating whether the processing device is operating;
Based on the information on the physical position of each of the plurality of processing devices stored in the storage unit, one or more first processing devices to be operated are determined from the plurality of processing devices, and according to the determination result A control unit that executes updating of the management information stored in the storage unit and processing for operating the one or more first processing devices;
Control device.
(付記2)
前記情報処理システムは、複数の中央処理装置を有し、
前記複数の中央処理装置の各々は、同一の1次キャッシュを使用する1又は複数の処理装置を各々が有する1又は複数のグループを有し、
同一の中央処理装置に含まれる1又は複数のグループに属する処理装置は、同一の2次キャッシュを使用し、
前記情報処理システムの電源は、グループ単位で制御され、
前記物理位置の情報は、前記処理装置を含む中央処理装置の位置の情報と、前記処理装置が属するグループの位置の情報とを含む、
付記1記載の制御装置。
(Appendix 2)
The information processing system has a plurality of central processing units,
Each of the plurality of central processing units has one or more groups each having one or more processing units using the same primary cache;
Processing devices belonging to one or more groups included in the same central processing unit use the same secondary cache,
The power source of the information processing system is controlled in groups,
The information on the physical position includes information on a position of a central processing unit including the processing device and information on a position of a group to which the processing device belongs.
The control device according to
(付記3)
前記制御部は、
前記1又は複数の第1処理装置が前記複数の中央処理装置に分散され且つ前記1又は複数の処理装置が前記複数のグループに分散されるように、前記1又は複数の第1処理装置を決定する、
付記2記載の制御装置。
(Appendix 3)
The controller is
The one or more first processing devices are determined such that the one or more first processing devices are distributed to the plurality of central processing devices and the one or more processing devices are distributed to the plurality of groups. To
The control device according to
(付記4)
前記制御部は、
前記1又は複数の第1処理装置が前記複数の中央処理装置に分散され且つ前記1又は複数の処理装置が特定のグループに集められるように、前記1又は複数の第1処理装置を決定する、
付記2記載の制御装置。
(Appendix 4)
The controller is
Determining the one or more first processing devices such that the one or more first processing devices are distributed to the plurality of central processing devices and the one or more processing devices are collected in a particular group;
The control device according to
(付記5)
前記制御部は、
前記1又は複数の第1処理装置が特定の中央処理装置に集められ且つ前記1又は複数の処理装置が特定のグループに集められるように、前記1又は複数の第1処理装置を決定する、
付記2記載の制御装置。
(Appendix 5)
The controller is
Determining the one or more first processing devices such that the one or more first processing devices are collected in a specific central processing device and the one or more processing devices are collected in a specific group;
The control device according to
(付記6)
前記1又は複数の第1処理装置を動作させるための処理は、
前記1又は複数の第1処理装置に電源を投入する処理を含む、
付記1乃至5のいずれか1つ記載の制御装置。
(Appendix 6)
The processing for operating the one or more first processing devices includes:
Including a process of turning on power to the one or more first processing devices,
The control device according to any one of
(付記7)
前記情報処理システムは、複数の中央処理装置を有し、
前記複数の処理装置の各々は、前記複数の中央処理装置のいずれかに含まれ、
前記制御部は、
動作している前記処理装置のうち特定の処理装置の温度が閾値を超えたことを検出し、各処理装置と前記特定の処理装置との距離と、各処理装置を含む中央処理装置の温度とに基づき、前記複数の処理装置の中から1の第1処理装置を決定する、
付記1記載の制御装置。
(Appendix 7)
The information processing system has a plurality of central processing units,
Each of the plurality of processing devices is included in any of the plurality of central processing devices,
The controller is
It is detected that the temperature of a specific processing device has exceeded a threshold value among the operating processing devices, the distance between each processing device and the specific processing device, the temperature of the central processing device including each processing device, And determining one first processing device from among the plurality of processing devices,
The control device according to
(付記8)
前記情報処理システムは、複数の中央処理装置を有し、
前記複数の処理装置の各々は、前記複数の中央処理装置のいずれかに含まれ、
前記制御部は、
動作している前記処理装置のうち特定の処理装置の温度が閾値を超えたことを検出し、各処理装置と前記特定の処理装置との距離と、各処理装置を含む空間の吸気温度と、各処理装置を含む中央処理装置において動作していない処理装置の数とに基づき、前記複数の処理装置の中から1の第1処理装置を決定する、
付記1記載の制御装置。
(Appendix 8)
The information processing system has a plurality of central processing units,
Each of the plurality of processing devices is included in any of the plurality of central processing devices,
The controller is
It is detected that the temperature of a specific processing device out of the operating processing devices exceeds a threshold, the distance between each processing device and the specific processing device, the intake air temperature of the space including each processing device, Determining one first processing device from the plurality of processing devices based on the number of processing devices not operating in the central processing unit including each processing device;
The control device according to
(付記9)
前記制御部は、
各処理装置を含む中央処理装置の温度にさらに基づき、前記複数の処理装置の中から前記1の第1処理装置を決定する、
付記8記載の制御装置。
(Appendix 9)
The controller is
Further determining the first first processing device from the plurality of processing devices based on a temperature of a central processing device including each processing device;
The control device according to
(付記10)
前記1又は複数の第1処理装置を動作させるための処理は、
処理装置の仮想的な識別情報と処理装置の物理的な識別情報とを対応付けて格納するデータ格納部に格納されている、前記特定の処理装置の物理的な識別情報を、前記1の第1処理装置の識別情報に書き換える処理を含む、
付記7乃至9のいずれか1つ記載の制御装置。
(Appendix 10)
The processing for operating the one or more first processing devices includes:
The physical identification information of the specific processing device stored in the data storage unit that stores the virtual identification information of the processing device and the physical identification information of the processing device in association with each other is the first first information. Including processing to rewrite the identification information of one processing device,
The control device according to any one of
(付記11)
プロセッサが、
情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部に記憶された、前記複数の処理装置の各々の物理位置の情報に基づき、前記複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、
決定の結果に従い、前記記憶部に記憶された前記管理情報の更新と、前記1又は複数の第1処理装置を動作させるための処理とを実行する、
処理を実行する制御方法。
(Appendix 11)
Processor
Each of the plurality of processing devices stored in a storage unit that stores information on the physical position of each of the plurality of processing devices in the information processing system and management information indicating whether or not the processing device is operating. Determining one or a plurality of first processing devices to be operated from among the plurality of processing devices based on the physical position information;
According to the result of the determination, the management information stored in the storage unit is updated, and the process for operating the one or more first processing devices is executed.
A control method for executing processing.
(付記12)
プロセッサに、
情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部に記憶された、前記複数の処理装置の各々の物理位置の情報に基づき、前記複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、
決定の結果に従い、前記記憶部に記憶された前記管理情報の更新と、前記1又は複数の第1処理装置を動作させるための処理とを実行する、
処理を実行させる制御プログラム。
(Appendix 12)
To the processor,
Each of the plurality of processing devices stored in a storage unit that stores information on the physical position of each of the plurality of processing devices in the information processing system and management information indicating whether or not the processing device is operating. Determining one or a plurality of first processing devices to be operated from among the plurality of processing devices based on the physical position information;
According to the result of the determination, the management information stored in the storage unit is updated, and the process for operating the one or more first processing devices is executed.
A control program that executes processing.
1 情報処理システム 10 OS
11 仮想化ソフトウエア 12 ハードウエア
13 マザーボード 14 メモリ
1p,2p,3p,4p CPU 100 監視装置
11l,12l,13l,14l,21l,22l,23l,24l,31l,32l,33l,34l,41l,42l,43l,44l LCU
1c L2キャッシュ 1mc メモリアクセスコントローラ
101 ライセンス管理部 102 第2管理データ格納部
103 電源モード管理部 104 第1管理データ格納部
105 割当決定部 106 コア位置データ格納部
107 電源投入管理部 108 LCU位置データ格納部
109 電源制御部 111 CPU
112 RAM 113 ROM
114 システム制御ファームウエア 115 バス
2 情報処理システム 21 OS
22 仮想化ソフトウエア 23 ハードウエア
0b,1b,2b 筐体 0f,1f,2f 制御部
200 システム制御部 0m,1m,2m 監視装置
00s,01s,02s,10s,11s,12s,20s,21s,22s CPU温度センサ
50s,51s,52s 吸気温度センサ 251,261 CPU
252,262 RAM 253,263 ROM
2541 システム制御ファームウエア 2542,264 制御ファームウエア
255,265 バス 201 OSインタフェース部
202 CPU選択部 203 管理データ格納部
204 温度データ処理部 301 温度異常処理部
302 電源制御部 303 切替部
304 温度監視部 305 ファン制御部
401 CPU管理部 402 マッピングデータ格納部
1
11
1c L2 cache 1mc
112
114
22
252,262 RAM 253,263 ROM
2541
Claims (12)
前記記憶部に記憶された、前記複数の処理装置の各々の物理位置の情報に基づき、前記複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、決定の結果に従い、前記記憶部に記憶された前記管理情報の更新と、前記1又は複数の第1処理装置を動作させるための処理とを実行する制御部と、
を有する制御装置。 A storage unit that stores information on the physical position of each of the plurality of processing devices in the information processing system and management information indicating whether the processing device is operating;
Based on the information on the physical position of each of the plurality of processing devices stored in the storage unit, one or more first processing devices to be operated are determined from the plurality of processing devices, and according to the determination result A control unit that executes updating of the management information stored in the storage unit and processing for operating the one or more first processing devices;
Control device.
前記複数の中央処理装置の各々は、同一の1次キャッシュを使用する1又は複数の処理装置を各々が有する1又は複数のグループを有し、
同一の中央処理装置に含まれる1又は複数のグループに属する処理装置は、同一の2次キャッシュを使用し、
前記情報処理システムの電源は、グループ単位で制御され、
前記物理位置の情報は、前記処理装置を含む中央処理装置の位置の情報と、前記処理装置が属するグループの位置の情報とを含む、
請求項1記載の制御装置。 The information processing system has a plurality of central processing units,
Each of the plurality of central processing units has one or more groups each having one or more processing units using the same primary cache;
Processing devices belonging to one or more groups included in the same central processing unit use the same secondary cache,
The power source of the information processing system is controlled in groups,
The information on the physical position includes information on a position of a central processing unit including the processing device and information on a position of a group to which the processing device belongs.
The control device according to claim 1.
前記1又は複数の第1処理装置が前記複数の中央処理装置に分散され且つ前記1又は複数の処理装置が前記複数のグループに分散されるように、前記1又は複数の第1処理装置を決定する、
請求項2記載の制御装置。 The controller is
The one or more first processing devices are determined such that the one or more first processing devices are distributed to the plurality of central processing devices and the one or more processing devices are distributed to the plurality of groups. To
The control device according to claim 2.
前記1又は複数の第1処理装置が前記複数の中央処理装置に分散され且つ前記1又は複数の処理装置が特定のグループに集められるように、前記1又は複数の第1処理装置を決定する、
請求項2記載の制御装置。 The controller is
Determining the one or more first processing devices such that the one or more first processing devices are distributed to the plurality of central processing devices and the one or more processing devices are collected in a particular group;
The control device according to claim 2.
前記1又は複数の第1処理装置が特定の中央処理装置に集められ且つ前記1又は複数の処理装置が特定のグループに集められるように、前記1又は複数の第1処理装置を決定する、
請求項2記載の制御装置。 The controller is
Determining the one or more first processing devices such that the one or more first processing devices are collected in a specific central processing device and the one or more processing devices are collected in a specific group;
The control device according to claim 2.
前記1又は複数の第1処理装置に電源を投入する処理を含む、
請求項1乃至5のいずれか1つ記載の制御装置。 The processing for operating the one or more first processing devices includes:
Including a process of turning on power to the one or more first processing devices,
The control device according to any one of claims 1 to 5.
前記複数の処理装置の各々は、前記複数の中央処理装置のいずれかに含まれ、
前記制御部は、
動作している前記処理装置のうち特定の処理装置の温度が閾値を超えたことを検出し、各処理装置と前記特定の処理装置との距離と、各処理装置を含む中央処理装置の温度とに基づき、前記複数の処理装置の中から1の第1処理装置を決定する、
請求項1記載の制御装置。 The information processing system has a plurality of central processing units,
Each of the plurality of processing devices is included in any of the plurality of central processing devices,
The controller is
It is detected that the temperature of a specific processing device has exceeded a threshold value among the operating processing devices, the distance between each processing device and the specific processing device, the temperature of the central processing device including each processing device, And determining one first processing device from among the plurality of processing devices,
The control device according to claim 1.
前記複数の処理装置の各々は、前記複数の中央処理装置のいずれかに含まれ、
前記制御部は、
動作している前記処理装置のうち特定の処理装置の温度が閾値を超えたことを検出し、各処理装置と前記特定の処理装置との距離と、各処理装置を含む空間の吸気温度と、各処理装置を含む中央処理装置において動作していない処理装置の数とに基づき、前記複数の処理装置の中から1の第1処理装置を決定する、
請求項1記載の制御装置。 The information processing system has a plurality of central processing units,
Each of the plurality of processing devices is included in any of the plurality of central processing devices,
The controller is
It is detected that the temperature of a specific processing device out of the operating processing devices exceeds a threshold, the distance between each processing device and the specific processing device, the intake air temperature of the space including each processing device, Determining one first processing device from the plurality of processing devices based on the number of processing devices not operating in the central processing unit including each processing device;
The control device according to claim 1.
各処理装置を含む中央処理装置の温度にさらに基づき、前記複数の処理装置の中から前記1の第1処理装置を決定する、
請求項8記載の制御装置。 The controller is
Further determining the first first processing device from the plurality of processing devices based on a temperature of a central processing device including each processing device;
The control device according to claim 8.
処理装置の仮想的な識別情報と処理装置の物理的な識別情報とを対応付けて格納するデータ格納部に格納されている、前記特定の処理装置の物理的な識別情報を、前記1の第1処理装置の識別情報に書き換える処理を含む、
請求項7乃至9のいずれか1つ記載の制御装置。 The processing for operating the one or more first processing devices includes:
The physical identification information of the specific processing device stored in the data storage unit that stores the virtual identification information of the processing device and the physical identification information of the processing device in association with each other is the first first information. Including processing to rewrite the identification information of one processing device,
The control device according to any one of claims 7 to 9.
情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部に記憶された、前記複数の処理装置の各々の物理位置の情報に基づき、前記複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、
決定の結果に従い、前記記憶部に記憶された前記管理情報の更新と、前記1又は複数の第1処理装置を動作させるための処理とを実行する、
処理を実行する制御方法。 Processor
Each of the plurality of processing devices stored in a storage unit that stores information on the physical position of each of the plurality of processing devices in the information processing system and management information indicating whether or not the processing device is operating. Determining one or a plurality of first processing devices to be operated from among the plurality of processing devices based on the physical position information;
According to the result of the determination, the management information stored in the storage unit is updated, and the process for operating the one or more first processing devices is executed.
A control method for executing processing.
情報処理システムにおける複数の処理装置の各々の物理位置の情報と、当該処理装置が動作しているか否かを示す管理情報とを記憶する記憶部に記憶された、前記複数の処理装置の各々の物理位置の情報に基づき、前記複数の処理装置の中から動作すべき1又は複数の第1処理装置を決定し、
決定の結果に従い、前記記憶部に記憶された前記管理情報の更新と、前記1又は複数の第1処理装置を動作させるための処理とを実行する、
処理を実行させる制御プログラム。 To the processor,
Each of the plurality of processing devices stored in a storage unit that stores information on the physical position of each of the plurality of processing devices in the information processing system and management information indicating whether or not the processing device is operating. Determining one or a plurality of first processing devices to be operated from among the plurality of processing devices based on the physical position information;
According to the result of the determination, the management information stored in the storage unit is updated, and the process for operating the one or more first processing devices is executed.
A control program that executes processing.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015212562A JP2017084148A (en) | 2015-10-29 | 2015-10-29 | Control apparatus, control method, and control program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015212562A JP2017084148A (en) | 2015-10-29 | 2015-10-29 | Control apparatus, control method, and control program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017084148A true JP2017084148A (en) | 2017-05-18 |
Family
ID=58711173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015212562A Pending JP2017084148A (en) | 2015-10-29 | 2015-10-29 | Control apparatus, control method, and control program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2017084148A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7372385B1 (en) | 2022-04-22 | 2023-10-31 | レノボ・シンガポール・プライベート・リミテッド | Information processing device and control method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008152594A (en) * | 2006-12-19 | 2008-07-03 | Hitachi Ltd | Method for enhancing reliability of multi-core processor computer |
JP2012038347A (en) * | 2005-09-28 | 2012-02-23 | Intel Corp | Power deliverly and power management of many-core processor |
JP2012133682A (en) * | 2010-12-22 | 2012-07-12 | Nec Corp | Computer, core allocation method and program |
-
2015
- 2015-10-29 JP JP2015212562A patent/JP2017084148A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012038347A (en) * | 2005-09-28 | 2012-02-23 | Intel Corp | Power deliverly and power management of many-core processor |
JP2008152594A (en) * | 2006-12-19 | 2008-07-03 | Hitachi Ltd | Method for enhancing reliability of multi-core processor computer |
JP2012133682A (en) * | 2010-12-22 | 2012-07-12 | Nec Corp | Computer, core allocation method and program |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7372385B1 (en) | 2022-04-22 | 2023-10-31 | レノボ・シンガポール・プライベート・リミテッド | Information processing device and control method |
JP2023162468A (en) * | 2022-04-22 | 2023-11-09 | レノボ・シンガポール・プライベート・リミテッド | Information processing apparatus and control method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112242923A (en) | System and method for realizing unified data management network function based on mimicry defense | |
JP4320247B2 (en) | Configuration information setting method and apparatus | |
US10528119B2 (en) | Dynamic power routing to hardware accelerators | |
EP3287898A1 (en) | Method, system and apparatus for creating virtual machine | |
JP5259725B2 (en) | Computer system | |
KR20180105874A (en) | Method, apparatus and system for selectively providing virtual machine through actual measurement of power usage | |
JP2009181167A (en) | Computer system, remote copy method, and first computer | |
CN112866314B (en) | Method for switching slave nodes in distributed master-slave system, master node device and storage medium | |
WO2019012627A1 (en) | Network control system, method and program | |
KR20140044596A (en) | Computing system including multi core processor and load balancing method thereof | |
US9300530B2 (en) | Management device, management method, and medium | |
CN104185821A (en) | Workload migration determination at multiple compute hierarchy levels | |
CN113032102A (en) | Resource rescheduling method, device, equipment and medium | |
JP2017084148A (en) | Control apparatus, control method, and control program | |
JP6374841B2 (en) | Virtual machine placement apparatus and virtual machine placement method | |
CN104460938B (en) | System-wide power conservation method and system using memory cache | |
CN105208111A (en) | Information processing method and physical machine | |
JP2016048542A (en) | Risk mitigation in data center network using virtual machine sharing | |
CN110297692B (en) | Distributed software task dynamic management method and system | |
CN113094149B (en) | Data center virtual machine placement method, system, medium and equipment | |
EP3910472B1 (en) | Processing allocation in data center fleets | |
CN115202810A (en) | Kubernetes working node distribution method and system | |
JP4485428B2 (en) | Network system, management computer, cluster management method, and computer program | |
JP6172735B2 (en) | Blade server, power supply control method, and power supply control program | |
CN114816025B (en) | Power management method and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180706 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190319 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190924 |