JP5696891B2 - Job scheduling method by IO configuration - Google Patents
Job scheduling method by IO configuration Download PDFInfo
- Publication number
- JP5696891B2 JP5696891B2 JP2011078989A JP2011078989A JP5696891B2 JP 5696891 B2 JP5696891 B2 JP 5696891B2 JP 2011078989 A JP2011078989 A JP 2011078989A JP 2011078989 A JP2011078989 A JP 2011078989A JP 5696891 B2 JP5696891 B2 JP 5696891B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- job
- file
- disk device
- switch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
本発明は、大規模なデータの高速処理に関する。 The present invention relates to high-speed processing of large-scale data.
従来、CPUの高速化やメモリの大容量化などにより、IOデータ量は大規模化してきている。特に、HPC(High Performance Computing)の分野では、大規模な環境下でのファイル共有が一般化するなど、IOの重要性が増してきており、ジョブ管理の観点においても、IOを考慮することが求められる。しかし、従来のジョブスケジューラは、管理の対象として、CPU数やメモリ量などを主に対象としており、IO構成を考慮していないため、システムのIO性能を効果的に引きだせていない。なお、特許文献1は、ジョブスケジューリング方法の一例である。 Conventionally, the amount of IO data has been increased due to the increase in CPU speed and memory capacity. In particular, in the field of HPC (High Performance Computing), the importance of IO has increased as file sharing in a large-scale environment has become common, and it is also necessary to consider IO from the viewpoint of job management. Desired. However, the conventional job scheduler mainly targets the number of CPUs, the amount of memory, and the like as management targets, and does not take into account the IO configuration, and therefore cannot effectively extract the IO performance of the system. Patent Document 1 is an example of a job scheduling method.
計算機システムは、各ノードの規模よりもノードの数を増加させることにより性能を向上させることが一般化している。このような計算機システムの構成として、ノードとディスク装置が接続されたスイッチが多数存在し、かつ、各ノードはそれらのスイッチを経由してそれぞれのディスク装置にアクセスする構成が考えられる。なお、スイッチはお互い、あるいはより上位のスイッチによって接続されている。このような計算機システムの構成において、IO性能に着目した場合、ジョブの入力ファイルは、ユーザのホーム領域など特定の領域に置かれることが多く、ファイル格納ディスク装置と同じスイッチに接続されているノードをジョブに割り当てることが望ましい。 Computer systems are generally improved in performance by increasing the number of nodes rather than the size of each node. As a configuration of such a computer system, there can be considered a configuration in which there are a large number of switches in which nodes and disk devices are connected, and each node accesses each disk device via these switches. Note that the switches are connected to each other or by a higher-order switch. In such a computer system configuration, when focusing on IO performance, job input files are often placed in a specific area such as the user's home area, and are connected to the same switch as the file storage disk device. Should be assigned to the job.
しかし、従来の計算機システムにおいては、ジョブに空きノードを割り当てる際に、IO構成を反映させる手段がなく、IO性能に効果的なノードの割り当てができない。このため、特にIO量の多いジョブの実行時間が延びるという問題が指摘されている。また、同じジョブを実行する場合であっても、ジョブが動作するノードにより実行時間にばらつくことがある。 However, in the conventional computer system, when an empty node is assigned to a job, there is no means for reflecting the IO configuration, and it is impossible to assign a node effective for IO performance. For this reason, a problem that the execution time of a job having a large amount of IO is particularly long has been pointed out. Even when the same job is executed, the execution time may vary depending on the node on which the job operates.
本発明は、かかる実情に鑑み、HPC(High Performance Computing)のような大規模なデータを高速に処理しなければならない分野において、IO量が多く、特に大規模なファイル共有を行うような場合に利用可能なジョブスケジューリングを提供しようとするものである。 In view of such a situation, the present invention has a large amount of IO in a field where large-scale data such as HPC (High Performance Computing) must be processed at high speed, and particularly when large-scale file sharing is performed. It is intended to provide available job scheduling.
本発明による計算機システムの一つは、多数のノードがネットワーク回線で接続された計算機システムにおいて、この計算機システムで実行されるジョブのスケジューリングに際し、システムのIO構成を考慮し、ジョブで使用するデータファイル(ジョブの入力ファイル)が格納されているディスク装置(以下「ファイル格納ディスク装置」という。)とIO経路の距離的に近いノードをジョブに割り当て、IO性能を確保することを特徴とする。また、距離の遠いノードしか確保できない場合には、ジョブの入力ファイルを、確保したノードに近いディスク装置に複写することでIO性能を確保する機能を有することを特徴とする。 One of the computer systems according to the present invention is a data file used in a job in consideration of the IO configuration of the system when scheduling a job executed in the computer system in a computer system in which a large number of nodes are connected by a network line. A node in which the IO path is close to a disk device (hereinafter referred to as a “file storage disk device”) in which (job input file) is stored is assigned to the job to ensure IO performance. In addition, when only a node with a long distance can be secured, the job input file is copied to a disk device close to the secured node, thereby having a function of securing IO performance.
本発明のジョブスケジューリングによれば、第1に、ジョブの実行時間を短縮できるという効果を奏し得る。これは、ディスク装置に近い距離のノードからファイルアクセスを行うことでIO時間が短縮されるためである。 According to the job scheduling of the present invention, firstly, the effect that the execution time of the job can be shortened can be obtained. This is because the IO time is shortened by performing file access from a node close to the disk device.
第2に、ジョブの実行時間のばらつきが小さくなるという効果を奏し得る。従来、ジョブの実行時に割り当たるノードはIO構成とは無関係であり、割り当たったノードとファイル格納ディスク装置の距離により、同じジョブを実行しても実行時間にばらつきがあった。IO構成に合わせたノードの割り当てによりこれが改善できる。特に、本発明では、距離が遠い場合には、より近いディスクにファイルをコピーするため、距離が最も遠いノードを割り当てるケースにおいて、従来方式にくらべ大きな効果がみられる。 Second, it is possible to achieve an effect that variation in job execution time is reduced. Conventionally, the nodes assigned at the time of job execution are irrelevant to the IO configuration, and even if the same job is executed, the execution time varies depending on the distance between the assigned node and the file storage disk device. This can be improved by assigning nodes according to the IO configuration. In particular, in the present invention, when the distance is long, a file is copied to a closer disk, and therefore, in the case of assigning the node with the longest distance, a great effect is seen compared to the conventional method.
以下、本発明の実施の形態について図面を参照しつつ詳細に説明する。なお、同一の要素には同一の符号を付し、重複する説明を省略する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In addition, the same code | symbol is attached | subjected to the same element and the overlapping description is abbreviate | omitted.
図1は、本発明の一実施形態に係る計算機システムの概略構成を示すブロック図である。同図に示すように、本実施例では、ジョブサーバ1と、ファイルサーバ4と、第1の同一スイッチ接続装置31と、第2の同一スイッチ接続装置32とがネットワーク回線2により相互に接続されている。第1の同一スイッチ接続装置31と第2の同一スイッチ接続装置32はそれぞれ、スイッチ311,321に接続されている装置群であり、それぞれ、ノードとディスク装置およびディスク装置上に作成されたファイルシステムを含む。ファイルシステムはすべてのノードで共有されており、ファイルサーバ4がその管理を行う。ファイルシステムは同じスイッチに接続されている複数のディスク装置で構成することができるが、異なるスイッチに接続されているディスク装置で構成されることはない。 FIG. 1 is a block diagram showing a schematic configuration of a computer system according to an embodiment of the present invention. As shown in the figure, in this embodiment, the job server 1, the file server 4, the first identical switch connection device 31, and the second identical switch connection device 32 are connected to each other via the network line 2. ing. The first same switch connection device 31 and the second same switch connection device 32 are device groups connected to the switches 311 and 321, respectively, and a node, a disk device, and a file system created on the disk device, respectively. including. The file system is shared by all nodes, and the file server 4 manages the file system. A file system can be composed of a plurality of disk devices connected to the same switch, but is not composed of disk devices connected to different switches.
本実施例は、同一スイッチ接続装置がネットワーク回線2により多数接続されている構成を前提としている。各ノードは、自身が含まれる同一スイッチ接続装置内のディスク装置だけでなく、他の同一スイッチ接続装置内のディスク装置へもネットワーク回線2を通してアクセス可能であり、ファイルサーバ4を経由せずにIOデータにアクセスする。ジョブサーバ1と各ノードは同一のファイルに対しては同じパス名でアクセスすることが可能である。また、オペレーティングシステムはUNIX(登録商標)やLinuxなどを前提とする。 This embodiment is based on the premise that a large number of the same switch connection devices are connected by the network line 2. Each node can access not only the disk device in the same switch connection device including itself but also the disk device in the other same switch connection device through the network line 2, and does not pass through the file server 4. Access data. The job server 1 and each node can access the same file with the same path name. The operating system is premised on UNIX (registered trademark), Linux, and the like.
図2は、本実施例におけるジョブサーバ1の概略構成を示すブロック図である。同図に示すとおり、ユーザが投入したジョブの制御を行うジョブスケジューラ11は、ジョブサーバ1で動作する。ジョブスケジューラ11は、システム構成情報ファイル101と、システム構成情報登録手段102と、ノード確保/解放手段103と、ファイルパス情報取得手段104と、ファイルシステム特定手段105と、スイッチ特定手段106と、ファイルシステム/スイッチ対応表107と、ネットワーク構成情報108と、空きノード選定手段109と、スイッチ配下ノード情報110と、ノード情報変更手段111と、ファイル操作手段112と、ジョブスケジューラ標準機能113を含んで構成される。 FIG. 2 is a block diagram illustrating a schematic configuration of the job server 1 in the present embodiment. As shown in FIG. 1, a job scheduler 11 that controls a job submitted by a user operates on the job server 1. The job scheduler 11 includes a system configuration information file 101, a system configuration information registration unit 102, a node reservation / release unit 103, a file path information acquisition unit 104, a file system identification unit 105, a switch identification unit 106, a file System / switch correspondence table 107, network configuration information 108, free node selection means 109, switch subordinate node information 110, node information change means 111, file operation means 112, and job scheduler standard function 113 Is done.
システム構成情報ファイル101は、ファイル格納ディスク装置とノード間の距離の閾値と、スイッチ毎にそのスイッチに接続されているノードおよび配下のファイルシステムの一覧と、ネットワークの構成といったシステム構成にかかわる情報を記述したファイルである。ジョブサーバ1に置かれ、システム管理者によって作成、変更される。 The system configuration information file 101 contains information related to the system configuration such as a threshold of the distance between the file storage disk device and the node, a list of nodes and subordinate file systems connected to the switch for each switch, and a network configuration. It is a described file. It is placed on the job server 1 and created and changed by the system administrator.
システム構成情報登録手段102は、ジョブスケジューラ11起動時に、システム構成情報ファイル101を読み込んで、ファイル格納ディスク装置とノード間の距離の閾値の取り込みと、ファイルシステム/スイッチ対応表107、スイッチ配下ノード情報110、ネットワーク構成情報108の作成を行う。 The system configuration information registration unit 102 reads the system configuration information file 101 when the job scheduler 11 is started up, captures a threshold value of the distance between the file storage disk device and the node, a file system / switch correspondence table 107, node information under the switch 110. The network configuration information 108 is created.
ノード確保/解放手段103は、ジョブへのノードの割り当ておよび解放に関する処理の全体的な制御を行う。ファイルパス情報取得手段104は、ユーザによって指定されるジョブの入力ファイルのパス名を取得する。ファイルシステム特定手段105は、ファイルのパス名からそのファイルが存在するファイルシステムを特定する。 The node securing / releasing unit 103 performs overall control of processing related to allocation and release of nodes to jobs. The file path information acquisition unit 104 acquires the path name of the input file of the job specified by the user. The file system specifying unit 105 specifies the file system in which the file exists from the path name of the file.
スイッチ特定手段106は、ファイルシステム/スイッチ対応表107を参照して、ファイル格納ディスク装置が接続されているスイッチを特定する。ファイルシステムは複数のスイッチに接続されているディスク装置から構成されることはないため、ファイルシステムとスイッチの対応がわかれば、ファイル格納ディスク装置が接続されているスイッチが特定できる。 The switch specifying means 106 refers to the file system / switch correspondence table 107 and specifies the switch to which the file storage disk device is connected. Since the file system is not composed of disk devices connected to a plurality of switches, if the correspondence between the file system and the switch is known, the switch to which the file storage disk device is connected can be specified.
ファイルシステム/スイッチ対応表107は、ディスク装置とスイッチの対応を表したもので、ファイル格納ディスク装置がどのスイッチに接続されているかの特定に使用する。ネットワーク構成情報108は、スイッチ同士の接続構成の情報であり、この情報を参照することにより、スイッチ間の距離がわかる。 The file system / switch correspondence table 107 shows the correspondence between the disk device and the switch, and is used to specify which switch the file storage disk device is connected to. The network configuration information 108 is information on the connection configuration between the switches, and the distance between the switches can be known by referring to this information.
空きノード選定手段109は、ノード確保/解放手段103から呼び出され、ファイル格納ディスク装置に、より近い距離の空きノードの情報(空きノード、空きノードが接続されているスイッチ、距離)を返却する。ノード確保/解放手段103は、この距離によってファイルのコピーを行うかを判断する。 The empty node selecting unit 109 is called from the node securing / releasing unit 103 and returns information on empty nodes at a closer distance (an empty node, a switch to which the empty node is connected, a distance) to the file storage disk device. The node securing / releasing means 103 determines whether to copy the file based on this distance.
スイッチ配下ノード情報110は、各スイッチに接続されているノードの一覧とそのノードの状態(空き、使用中、故障中など)を含む情報である。ノード情報変更手段111は、ノードの確保/解放時にスイッチ配下ノード情報110に含まれるノードの状態を更新するために使用する。 The switch subordinate node information 110 is information including a list of nodes connected to each switch and the state of the node (free, in use, in failure, etc.). The node information changing unit 111 is used to update the state of the node included in the switch subordinate node information 110 when a node is secured / released.
ファイル操作手段112は、確保したノードとファイル格納ディスク装置の距離が閾値以上の場合に、ノード確保/解放手段103から呼び出され、ジョブの入力ファイルを、確保したノードが接続されているスイッチ配下のディスク装置にコピーする。これにより、ジョブが動作するノードと距離の近いファイルIOが可能となる。また、ノード解放時にはコピーしたファイルの削除を行う。ジョブスケジューラ標準機能113は、ユーザが投入したジョブのキューイングやジョブが要求した資源に基づく順序制御、ジョブの起動/終了、状態監視などといった、スケジューラが通常持っている一般的な機能を指すものである。 The file operation unit 112 is called from the node securing / release unit 103 when the distance between the secured node and the file storage disk device is equal to or greater than the threshold, and the job input file is transferred to the switch under the switch to which the secured node is connected. Copy to a disk unit. As a result, a file IO having a short distance from the node on which the job operates can be obtained. When the node is released, the copied file is deleted. The job scheduler standard function 113 indicates general functions that the scheduler normally has such as queuing of jobs submitted by the user, sequence control based on the resources requested by the job, job start / end, status monitoring, etc. It is.
次に、本実施例において、ジョブにノードを割り当てるときの動作について説明する。 Next, an operation when assigning a node to a job in this embodiment will be described.
図4は、本実施例において、ノードを確保する処理の流れを示すフローチャートである。ノード確保/解放手段103は、ジョブスケジューラ標準機能113からのノード確保の要求を受け、ファイルパス情報取得手段104により、ユーザより指定されるジョブの入力ファイルのパス名を取得する(S41)。ファイルのパス名が与えられれば、オペレーティングシステムの一般的な機能を使用して、そのファイルが存在するファイルシステムを得ることができる。ノード確保/解放手段103は、ファイルシステム特定手段105を使用してファイルのパス名から、そのファイルが存在するファイルシステムを特定する(S42)。続いて、スイッチ特定手段106を使用して、ファイルシステム/スイッチ対応表107をもとに、ファイルシステムがあるスイッチを特定し(S43)、空きノード選定手段109により、スイッチから一番近い距離のノードの確保を行う(S44)。次に、ステップS44で確保したノードと、ファイル格納ディスク装置との距離があらかじめ設定された閾値以上であるかチェックを行い(S45)、閾値以上の場合は、ファイル操作手段112により、確保したノードと同じスイッチ配下のディスク装置にジョブの入力ファイルをコピーする(S46)。ジョブはこのコピー後のファイルをアクセスする。次に、確保したノードについて、ノード情報変更手段111を使用して、スイッチ配下ノード情報110にある、ノードの状態を“空き”から“使用中”に更新する(S47)。 FIG. 4 is a flowchart showing the flow of processing for securing a node in this embodiment. The node reservation / release unit 103 receives the node reservation request from the job scheduler standard function 113, and the file path information acquisition unit 104 acquires the path name of the input file of the job specified by the user (S41). Given the path name of a file, the general function of the operating system can be used to obtain the file system in which the file exists. The node securing / releasing means 103 uses the file system specifying means 105 to specify the file system in which the file exists from the file path name (S42). Subsequently, the switch identification unit 106 is used to identify the switch with the file system based on the file system / switch correspondence table 107 (S43), and the empty node selection unit 109 determines the closest distance from the switch. A node is secured (S44). Next, it is checked whether the distance between the node secured in step S44 and the file storage disk device is equal to or greater than a preset threshold value (S45). The job input file is copied to the disk device under the same switch (S46). The job accesses the copied file. Next, for the reserved node, the node information changing unit 111 is used to update the node state in the switch subordinate node information 110 from “free” to “in use” (S47).
図5は、本実施例において、スイッチから一番近い距離の空きノードを確保する処理の流れを示すフローチャートである。同図に示すように、まず、空きノード選定手段109は、最初に空きノードを探す対象とするスイッチおよびファイル格納ディスク装置との距離の初期設定を行う(S51)。対象とするスイッチは図4のステップS43で特定したスイッチであり、距離はそのスイッチに接続されているノードとの距離である1とする。次に、対象スイッチに空きノードがあるかをスイッチ配下ノード情報110でチェックし(S52)、空きがあれば空きノードを確保し(S54)、空きノードがなければネットワーク構成情報108をもとに次に近い距離のスイッチを対象に設定して、その分の距離を加算し(S53)、空きノードが確保できるまでステップS53以降の処理を繰り返す。なお、計算機システム上に空きノードがまったくない場合は、ジョブスケジューラ標準機能113からノードの確保要求が行われることはない。 FIG. 5 is a flowchart showing the flow of processing for securing an empty node at the closest distance from the switch in this embodiment. As shown in the figure, first, the free node selecting unit 109 initially sets the distance between the switch and the file storage disk device to be searched for a free node first (S51). The target switch is the switch specified in step S43 in FIG. 4, and the distance is 1 which is the distance to the node connected to the switch. Next, whether or not there is an empty node in the target switch is checked by the switch subordinate node information 110 (S52). If there is an empty node, an empty node is secured (S54), and if there is no empty node, the network configuration information 108 is used. The next closest switch is set as a target, and the distances are added (S53), and the processes in and after step S53 are repeated until an empty node can be secured. If there is no free node on the computer system, the job scheduler standard function 113 does not make a node reservation request.
図6は、本実施例において、ノードを解放する処理の流れを示すフローチャートである。同図に示すように、ジョブスケジューラ標準機能113からの要求を受け、ノード確保/解放手段103は、解放するノードについて、ノード情報変更手段111を使用して、スイッチ配下ノード情報110にあるノードの状態を“使用中”から“空き”に更新する(S61)。次に、ノード確保時に距離が閾値以上であったためにファイルをコピーしていた場合は、ファイル操作手段112により、コピーしたジョブの入力ファイルを削除する(ステップS62)。 FIG. 6 is a flowchart showing the flow of processing for releasing a node in this embodiment. As shown in the figure, in response to a request from the job scheduler standard function 113, the node securing / releasing unit 103 uses the node information changing unit 111 for the node to be released to determine the node in the node information 110 under the switch. The state is updated from “in use” to “free” (S61). Next, when the file is copied because the distance is equal to or greater than the threshold when the node is secured, the input file of the copied job is deleted by the file operation unit 112 (step S62).
図3は、本実施例による計算機システムの装置構成の一例とその効果を説明するための図である。ジョブスケジューラが空きノードを確保する処理において、ジョブの入力ファイルのパス名より、ファイル格納ディスク装置が接続されているスイッチを特定し、ファイル格納ディスク装置により近いノードを確保できるようにする。ディスク装置とノードの距離は、経由するスイッチの台数で判断する。例えば、図3のような構成において、ジョブの入力ファイルがディスク装置#1に格納されているとする。この場合、ディスク装置#1に最も近いのは、同じスイッチ#1に接続されているノード#1−1とノード#1−2であり、スイッチを1台経由することから距離を1と考える。同様にスイッチ#2に接続されているノード#2−1、ノード#2−2はスイッチを3台経由することから、ディスク装置#1からの距離は3となる。この距離の小さいノードを近いノードと判断する。 FIG. 3 is a diagram for explaining an example of the apparatus configuration of the computer system according to the present embodiment and its effect. In the process of securing a free node by the job scheduler, the switch to which the file storage disk device is connected is identified from the path name of the input file of the job so that a node closer to the file storage disk device can be secured. The distance between the disk device and the node is determined by the number of switches that pass through. For example, in the configuration shown in FIG. 3, it is assumed that a job input file is stored in the disk device # 1. In this case, the nodes closest to the disk device # 1 are the node # 1-1 and the node # 1-2 connected to the same switch # 1, and the distance is considered to be 1 because one switch is passed through. Similarly, since the node # 2-1 and the node # 2-2 connected to the switch # 2 pass through three switches, the distance from the disk device # 1 is 3. A node with this small distance is determined as a close node.
ジョブスケジューラは、ファイルシステムとスイッチの対応表から、ファイル格納ディスク装置が接続されているスイッチを特定し、そのスイッチに接続されている空きノードを割り当てる。スイッチに接続されているノードに空きがない場合は、ネットワーク構成の情報をもとに、次に距離の近いスイッチに接続されているノードに空きがあるかを確認する。これを空きノードが確保できるまで繰り返すことでより近いノードの割り当てを行う。 The job scheduler identifies the switch to which the file storage disk device is connected from the correspondence table between the file system and the switch, and allocates a free node connected to the switch. If there is no vacancy in the node connected to the switch, it is checked whether there is a vacancy in the node connected to the next closest switch based on the network configuration information. By repeating this until a free node can be secured, a closer node is assigned.
しかし、このようにして空きノードを割り当てた場合でも、ファイル格納ディスク装置に近いノードに空きがなければ、結果としてファイル格納ディスク装置との距離が遠いノードが割りあたる場合が発生し得る。このようなケースにおいては、ジョブのIO性能が低下したり、経由するスイッチが多くなることで、ジョブ以外の外的な要因の影響を受けやすくなってしまう。そこで、割り当てるノードとファイル格納ディスク装置の距離に閾値を設け、この閾値以上となる場合にはジョブの入力ファイルを割り当てノードと同じスイッチに接続されているディスク装置上にコピーし、そのコピーしたファイルを入力ファイルとすることで上記問題を解決する。 However, even when an empty node is assigned in this way, if there is no available node near the file storage disk device, a node far from the file storage disk device may be assigned as a result. In such a case, the IO performance of the job is reduced or the number of switches through which the job passes is increased, so that it is easily affected by external factors other than the job. Therefore, a threshold is set for the distance between the node to be allocated and the file storage disk device, and if this threshold is exceeded, the job input file is copied to the disk device connected to the same switch as the allocation node, and the copied file The above problem is solved by using as an input file.
なお、本発明は、上記した実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内において、他の様々な形で実施することができる。このため、上記実施形態はあらゆる点で単なる例示にすぎず、限定的に解釈されるものではない。例えば、上述の各処理ステップは処理内容に矛盾を生じない範囲で任意に順番を変更して又は並列に実行することができる。 The present invention is not limited to the above-described embodiment, and can be implemented in various other forms without departing from the gist of the present invention. For this reason, the said embodiment is only a mere illustration in all points, and is not interpreted limitedly. For example, the above-described processing steps can be executed in any order or in parallel as long as there is no contradiction in the processing contents.
上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限
られない。
A part or all of the above embodiments can be described as in the following supplementary notes, but is not limited thereto.
(付記1)複数のノードがネットワーク回線で接続された計算機システムにおいて、前記計算機システムは、ジョブにノードを割り当てるスケジューリングを行うためのジョブサーバを備え、前記ジョブサーバは、ジョブで使用するデータファイルが格納されているディスク装置とのIO経路の距離がより近いノードを割り当てることを特徴とする計算機システム。 (Supplementary note 1) In a computer system in which a plurality of nodes are connected by a network line, the computer system includes a job server for performing scheduling for assigning a node to a job, and the job server has a data file used in a job. A computer system, wherein a node having a closer IO path distance to a stored disk device is assigned.
(付記2)前記ジョブサーバは、割り当てノードと前記ジョブで使用するデータファイルが格納されているディスク装置のIO経路の距離が所定の閾値を越えている場合、前記データファイルをIO経路の距離がより近いディスク装置にコピーした後、ノードを割り当てることを特徴とする付記1に記載の計算機システム。 (Supplementary Note 2) If the distance between the allocation path and the IO path of the disk device storing the data file used in the job exceeds a predetermined threshold, the job server determines that the distance between the IO path The computer system according to appendix 1, wherein a node is assigned after copying to a closer disk device.
(付記3)複数のノードがネットワーク回線で接続された計算機システムにおいて、前記計算機システムに含まれるジョブサーバがジョブのスケジューリングを行う方法であって、前記ジョブサーバは、ジョブにノードを割り当てるスケジューリングを行う際、ジョブで使用するデータファイルが格納されているディスク装置とのIO経路の距離がより近いノードを割り当てることを特徴とする方法。 (Supplementary Note 3) In a computer system in which a plurality of nodes are connected by a network line, a job server included in the computer system performs job scheduling, and the job server performs scheduling for assigning nodes to jobs. A node having a closer IO path to a disk device storing a data file used in the job.
(付記4)前記ジョブサーバは、割り当てノードと前記ジョブで使用するデータファイルが格納されているディスク装置のIO経路の距離が、所定の閾値を越えている場合、前記データファイルをIO経路の距離がより近いディスク装置にコピーした後、ノードを割り当てることを特徴とする付記3に記載の方法。 (Additional remark 4) When the distance of IO path | route of the disk apparatus in which the data file used by the allocation node and the said job is stored exceeds the predetermined | prescribed threshold value, the said job server will distance the said data file to IO path | route. The method according to appendix 3, wherein a node is allocated after copying to a closer disk device.
1 ジョブサーバ、2 ネットワーク回線、31,32 同一スイッチ接続装置、311,321 スイッチ、4 ファイルサーバ、11 ジョブスケジューラ、101 システム構成情報ファイル、102 システム構成情報登録手段、103 ノード確保/解放手段、104 ファイルパス情報取得手段、105 ファイルシステム特定手段、106 スイッチ特定手段、107 ファイルシステム/スイッチ対応表、108 ネットワーク構成情報、109 空きノード選定手段、110 スイッチ配下ノード情報、111 ノード情報変更手段、112 ファイル操作手段、113 ジョブスケジューラ標準機能 DESCRIPTION OF SYMBOLS 1 Job server, 2 Network line, 31, 32 Same switch connection apparatus, 311, 321 switch, 4 File server, 11 Job scheduler, 101 System configuration information file, 102 System configuration information registration means, 103 Node reservation / release means, 104 File path information acquisition means, 105 file system identification means, 106 switch identification means, 107 file system / switch correspondence table, 108 network configuration information, 109 free node selection means, 110 switch subordinate node information, 111 node information change means, 112 file Operation means, 113 Job scheduler standard function
Claims (4)
前記計算機システムは、ジョブにノードを割り当てるスケジューリングを行うためのジョブサーバを備え、
前記ジョブサーバは、
ジョブで使用するデータファイルが格納されているディスク装置とのIO経路の距離がより近いノードを割り当てるジョブスケジューラであって、割り当てノードと前記ジョブで使用するデータファイルが格納されているディスク装置のIO経路の距離が所定の閾値を越えている場合、前記データファイルをIO経路の距離がより近いディスク装置にコピーした後、ノードを割り当てるジョブスケジューラを備え、
前記ジョブスケジューラは、ノードを解放するとき、当該ノードを割り当てる際にIO経路の距離が閾値を超えていたためにデータファイルをコピーしていた場合は、当該コピーしたデータファイルを削除することを特徴とする計算機システム。 In a computer system in which multiple nodes are connected by a network line,
The computer system includes a job server for performing scheduling for assigning nodes to jobs,
The job server
A job scheduler for allocating a node having a closer IO path distance to a disk device storing a data file used in a job, the IO of the disk device storing the data file used in the job A job scheduler for allocating nodes after copying the data file to a disk device having a closer IO path distance when the path distance exceeds a predetermined threshold;
The job scheduler , when releasing a node, deletes the copied data file if the data file is copied because the IO path distance exceeds the threshold when the node is allocated. Computer system to do.
前記ジョブサーバは、
ジョブにノードを割り当てるスケジューリングを行う際、ジョブで使用するデータファイルが格納されているディスク装置とのIO経路の距離がより近いノードを割り当てること、
割り当てノードと前記ジョブで使用するデータファイルが格納されているディスク装置のIO経路の距離が、所定の閾値を越えている場合、前記データファイルをIO経路の距離がより近いディスク装置にコピーした後、ノードを割り当てること、及び
ノードを解放するとき、当該ノードを割り当てる際にIO経路の距離が閾値を超えていたためにデータファイルをコピーしていた場合は、当該コピーしたデータファイルを削除することを特徴とする方法。 In a computer system in which a plurality of nodes are connected by a network line, a job server included in the computer system performs job scheduling,
The job server
When scheduling to assign a node to a job, assign a node with a closer IO path distance to the disk device that stores the data file used in the job,
If the IO path distance between the allocation node and the disk device storing the data file used in the job exceeds a predetermined threshold, after copying the data file to a disk device with a closer IO path distance When allocating a node and releasing a node, if the data file was copied because the IO path distance exceeded the threshold when allocating the node, delete the copied data file. Feature method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011078989A JP5696891B2 (en) | 2011-03-31 | 2011-03-31 | Job scheduling method by IO configuration |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011078989A JP5696891B2 (en) | 2011-03-31 | 2011-03-31 | Job scheduling method by IO configuration |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012215936A JP2012215936A (en) | 2012-11-08 |
JP5696891B2 true JP5696891B2 (en) | 2015-04-08 |
Family
ID=47268672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011078989A Expired - Fee Related JP5696891B2 (en) | 2011-03-31 | 2011-03-31 | Job scheduling method by IO configuration |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5696891B2 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4113352B2 (en) * | 2001-10-31 | 2008-07-09 | 株式会社日立製作所 | Storage resource operation management method in storage network |
JP2006277637A (en) * | 2005-03-30 | 2006-10-12 | Nec Corp | Multiprocessor computer system for allocating job by temperature monitoring, and computer program |
US8150904B2 (en) * | 2007-02-28 | 2012-04-03 | Sap Ag | Distribution of data and task instances in grid environments |
JP5210730B2 (en) * | 2007-11-28 | 2013-06-12 | 株式会社日立製作所 | Virtual machine monitor and multiprocessor system |
-
2011
- 2011-03-31 JP JP2011078989A patent/JP5696891B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012215936A (en) | 2012-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8117641B2 (en) | Control device and control method for information system | |
JP4464378B2 (en) | Computer system, storage system and control method for saving storage area by collecting the same data | |
JP2004280485A (en) | Computer system | |
CN103797462A (en) | Method, system, and device for creating virtual machine | |
JP2005338985A (en) | Method and system for managing storage area | |
KR20130048594A (en) | Distributed storage system, apparatus and method for managing a distributed storage in consideration of delay elements | |
WO2016092856A1 (en) | Information processing device, information processing system, task processing method, and storage medium for storing program | |
CN112540829B (en) | Container group eviction method, device, node equipment and storage medium | |
JP2018022345A (en) | Information processing system | |
US9934147B1 (en) | Content-aware storage tiering techniques within a job scheduling system | |
CN107528871B (en) | Data analysis in storage systems | |
JP5158576B2 (en) | I / O control system, I / O control method, and I / O control program | |
JP2020024636A (en) | Scheduling device, scheduling system, scheduling method and program | |
WO2018188959A1 (en) | Method and apparatus for managing events in a network that adopts event-driven programming framework | |
KR102063281B1 (en) | Methods and devices for accessing files, and storage systems | |
US10430233B1 (en) | Scheduling computational tasks among multiple classes of storage resources based on job classification | |
JP2008009865A (en) | Distributed computer system | |
CN116502225A (en) | Virus scanning method and device for self-adaptive packet redundancy arrangement and electronic equipment | |
JP5696891B2 (en) | Job scheduling method by IO configuration | |
JP6341030B2 (en) | Information processing system, information processing system control method, and control program | |
JP6046523B2 (en) | In-memory distributed database, data distribution method and program | |
US20140089611A1 (en) | Memory management control system, memory management control method, and storage medium storing memory management control program | |
JP6164125B2 (en) | Print control system | |
JP6364827B2 (en) | Information processing apparatus, resource access method thereof, and resource access program | |
CN108279982A (en) | Pbs resources and hadoop method for managing resource, system and equipment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140828 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141219 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150115 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5696891 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |