JP2006228093A - Selection of calculation node in pc cluster computer, start of selected calculation node, and method and apparatus for distribution scheduling processing of program - Google Patents

Selection of calculation node in pc cluster computer, start of selected calculation node, and method and apparatus for distribution scheduling processing of program Download PDF

Info

Publication number
JP2006228093A
JP2006228093A JP2005043581A JP2005043581A JP2006228093A JP 2006228093 A JP2006228093 A JP 2006228093A JP 2005043581 A JP2005043581 A JP 2005043581A JP 2005043581 A JP2005043581 A JP 2005043581A JP 2006228093 A JP2006228093 A JP 2006228093A
Authority
JP
Japan
Prior art keywords
computer
client
client computer
server computer
cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005043581A
Other languages
Japanese (ja)
Inventor
Norihiro Ikeda
憲宏 池田
Takumi Ichimura
匠 市村
Akira Hara
章 原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2005043581A priority Critical patent/JP2006228093A/en
Publication of JP2006228093A publication Critical patent/JP2006228093A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stored Programmes (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem that it is impossible to automatically detect a service providing apparatus and the suited state of an OS included in a client computer and to select a starting method in a conventional computer node selecting method in the case of constructing a PC cluster computer in an environment where a personal computer having a different OS, a personal computer having different performance and the service providing apparatus are mixed. <P>SOLUTION: A service providing apparatus can be detected by a detection function of the service providing apparatus and a client computer starting method can be selected by a determination function of an OS included in the client computer. Further a process can be performed within the shortest time by a grouping function and a program distribution schedule preparing function. <P>COPYRIGHT: (C)2006,JPO&NCIPI

Description

本発明は、PCクラスタ計算機の構成要素である計算ノードとして利用可能な複数のクライアントコンピュータにおいて、各々のクライアントコンピュータの状態に応じてPCクラスタ計算機の要素として利用するかどうかを選択する方式、計算ノードとして選択された各クライアントコンピュータの起動方法の選択方式及び、計算ノードのハードウェア性能、通信速度、プロセスの履行状態の履歴を基にしたグループ作成方式、PCクラスタ計算機として、全体の計算に必要な時間を最小限にするためのプログラム配布スケジュール作成方式に関係する。 The present invention relates to a method and a computing node for selecting whether or not to use as an element of a PC cluster computer according to the state of each client computer in a plurality of client computers that can be used as a computing node as a component of the PC cluster computer. Necessary for the overall calculation as a PC cluster computer, a method for selecting the startup method of each client computer selected as a group, a group creation method based on the hardware performance of the computing node, communication speed, and history of process execution status It relates to a program distribution schedule creation method for minimizing time.

PCクラスタ計算機とは、複数のクライアントコンピュータを計算ノードとしてネットワーク上で接続した分散メモリ型並列計算機の一種である。   The PC cluster computer is a type of distributed memory parallel computer in which a plurality of client computers are connected as calculation nodes on a network.

PCクラスタ計算機の計算ノードとして、使用していないクライアントコンピュータを使用することで、計算処理能力の向上だけではなく、眠っているCPU資源の有効活用ができる。このとき、計算ノードとして使用するクライアントコンピュータとして、計算時に異常終了をしてしまうようなクライアントコンピュータや、ユーザがログイン状態にあるPC(以下ログイン状態のPCと呼ぶ)、他のクライアントコンピュータとネットワークを介して通信を行いサービスを提供するクライアントコンピュータ(以下サービス提供機と呼ぶ)が含まれていてはならない。   By using an unused client computer as a calculation node of the PC cluster computer, not only the calculation processing capacity can be improved but also the sleeping CPU resources can be effectively used. At this time, as a client computer used as a calculation node, a client computer that ends abnormally at the time of calculation, a PC in which a user is in a login state (hereinafter referred to as a PC in a login state), another client computer, and a network are used. It must not include a client computer (hereinafter referred to as a service provider) that communicates and provides services.

その中でも特に計算時に異常終了してしまうようなクライアントコンピュータを事前に検出し計算ノードから除外するための、計算ノードの選択方法としては、マウントが正常に行われているかという点、メモリの空き容量が十分にあるかという点、CPU負荷率の点から計算ノードを選択する特許文献1の方法がある。 Among them, the computer node selection method for detecting client computers that will end abnormally during calculation and excluding them from the calculation nodes in particular is whether or not the mount is performed normally, and there is free memory. There is a method of Patent Document 1 in which a calculation node is selected in terms of whether there is a sufficient amount of CPU and a CPU load factor.

計算ノードとしてのクライアントコンピュータの起動方法としては、サーバコンピュータからOSのイメージを転送し、起動する方法(以下ディスクレスブートと呼ぶ)と、クライアントコンピュータのハードディスク上のOSのイメージで起動する方法(以下ローカルブートと呼ぶ)がある。   As a method for starting a client computer as a computing node, a method of transferring and starting an OS image from a server computer (hereinafter referred to as diskless boot) and a method of starting with an OS image on a hard disk of a client computer (hereinafter referred to as local). Called boot).

ディスクレスブートで起動すると、サーバコンピュータからOSのイメージを転送するため、計算ノードとなるクライアントコンピュータのOSが計算ノードとして使用できるOS(以下計算ノード適合OSと呼ぶ)でなくても計算ノードとして起動することが可能であるが、NFS (Network File System)を利用するため、通信によりネットワークに負荷がかかり、ローカルブートで起動したときよりも、計算処理性能が劣ってしまう。   When booted by diskless boot, the image of the OS is transferred from the server computer. Therefore, even if the OS of the client computer serving as the computing node is not an OS that can be used as a computing node (hereinafter referred to as a computing node compatible OS) However, since the network file system (NFS) is used, a load is imposed on the network due to communication, and the calculation processing performance is inferior to that when starting by local boot.

これに対して、ローカルブートで起動する場合は、NFSを使用しないので、ネットワークに負荷がかかることによる計算処理性能の低下はないが、クライアントコンピュータのOSが計算ノード適合OSでない場合は、計算ノードとして利用することができない。   On the other hand, when starting by local boot, since NFS is not used, there is no deterioration in calculation processing performance due to load on the network. However, if the OS of the client computer is not a calculation node compatible OS, the calculation node Can not be used as.

上記の2点から、計算ノード適合OSであるクライアントコンピュータはローカルブート、計算ノード不適合であるOSをもつクライアントコンピュータは、ディスクレスブートで起動することで、可能な限り最適に近い計算処理性能を得ることができる。   From the above two points, a client computer that is a compute node compatible OS can obtain a computation performance as close to optimum as possible by booting a client computer having an OS that is not suitable for a compute node by diskless boot. Can do.

特開2003−203061号JP 2003-203061 A

計算ノード適合OSであるクライアントコンピュータはローカルブート、計算ノード不適合であるOSをもつクライアントコンピュータはディスクレスブートで起動するためには、ネットワーク上のそれぞれのクライアントコンピュータについて計算ノード適合OSであるか、それとも計算ノード不適合OSなのかを把握できている必要がある。しかし、PCをユーザが自由にカスタマイズできる環境では、PCクラスタ計算機の管理者が、これをすべて把握しておくことは困難である。 In order to start a client computer having a computation node compatible OS by a local boot and a client computer having an OS incompatible with a computation node by a diskless boot, each client computer on the network is a computation node compatible OS or a computation. It is necessary to know whether the OS is incompatible with the node. However, in an environment where the user can freely customize the PC, it is difficult for the administrator of the PC cluster computer to grasp all of this.

従来の方法では、計算途中で異常終了を起こすような状況にある計算ノードを事前に除外することはできるが、ログイン状態のクライアントコンピュータ、サービス提供機の除外はできない。 In the conventional method, it is possible to exclude a computing node in a situation where abnormal termination occurs during the calculation in advance, but it is not possible to exclude a client computer and a service provider in a login state.

また、クライアントコンピュータを計算ノードとして起動するとき、同時に起動できる台数には制限がある。このため、起動台数に比例し、全てのクライアントコンピュータが起動を完了するまでの時間も長くなるので、プログラムの配布を全てのクライアントコンピュータが起動を完了するまで待つと、計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスが終了するまでの時間も長くなってしまう。   In addition, when a client computer is activated as a computation node, there is a limit to the number that can be activated simultaneously. For this reason, the time until all client computers complete their startup increases in proportion to the number of startups, so when waiting for all client computers to complete startup, the client computers are started as calculation nodes. However, it takes longer to complete the process between sending the program, executing the calculation, and receiving the result.

本発明の目的は、ネットワーク上のクライアントコンピュータに対して、各クライアントコンピュータが持つOSの計算ノードとしての適合状態を自動検知し起動方法を選択する機能、ハードウェアの性能や通信速度やプロセスの履行状態に基づくグループ化機能、プログラム配布スケジュールの作成機能及びその実施機能を提供するものである。   An object of the present invention is to implement a function of automatically detecting a conformity state as an OS computing node of each client computer and selecting a starting method, hardware performance, communication speed, and process for client computers on a network It provides a grouping function based on a state, a function for creating a program distribution schedule, and a function for implementing the function.

ネットワークに接続されている複数のパーソナルコンピュータを用いてPCクラスタ計算機を構築するために、計算ノードとしての複数のクライアントコンピュータとクライアントコンピュータを管理するサーバコンピュータにおいて、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴に応じて、クライアントコンピュータをグループごとに分類する手段と、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴にもとづいて、クライアントコンピュータを自動でグループに追加またはグループから削除する手段と、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴にもとづいて、グループごとにコンピュータのネットワーク起動する手段と、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴にもとづいて、グループを構成するクライアントコンピュータに対し、サーバコンピュータからPCクラスタ計算機を構成する計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスを最短時間で履行するクライアントコンピュータのグループを履行前に予測し、PCクラスタ計算機として全体の計算に必要な時間を最小限にするためのプログラム配布スケジュールを作成し、そのスケジュールに基づいて全計算を履行する手段と、クライアントコンピュータにおいてPCクラスタ計算機を構築するOS(Operating System)としての適合状態を自動検知し、検知した結果または過去の起動履歴に応じて、サーバコンピュータから起動するためのOSをネットワークからダウンロードするディスクレスブート方式またはクライアントコンピュータの外部記憶装置に保存されているOSを用いて起動するローカルブート方式を自動で選択する機能を備えたPCクラスタ計算機装置を有する。   In order to construct a PC cluster computer using a plurality of personal computers connected to a network, a plurality of client computers as computing nodes and a server computer that manages the client computer, the performance of the central processing unit of the client computer, memory For classifying client computers into groups according to the occupancy rate of the network, NIC (Network Interface Card) hardware communication speed, communication speed with server computer, server computer and client computer process performance status and past history And the performance of the central processing unit of the client computer, the memory occupancy rate, and the NIC (Network Interface Card) hardware communication A means for automatically adding or removing a client computer to or from a group based on the communication speed with the server computer, the process performance status of the server computer and the client computer, and the past history, and the performance of the central processing unit of the client computer , Computer network activation for each group based on memory occupancy rate, NIC (Network Interface Card) hardware communication speed, server computer communication speed, server computer and client computer process performance status and past history Communication means, the performance of the central processing unit of the client computer, the memory occupancy rate, and the NIC (Network Interface Card) hardware communication Based on the speed, the communication speed with the server computer, the process execution status of the server computer and the client computer, and the past history, the client computer is configured as a computing node constituting the PC cluster computer from the server computer to the client computer constituting the group. Starts up, sends programs, executes calculations, and implements the process between receiving the results in the shortest possible time, predicting a group of client computers before implementation, minimizing the time required for the overall calculation as a PC cluster computer A program distribution schedule for creating a PC cluster computer on a client computer and a means for executing all calculations based on the schedule, and an OS (Operating System) for building a PC cluster computer on the client computer OS that is automatically detected as a conforming state, and that is stored in an external storage device of a client computer or a client computer that downloads an OS for starting from a server computer from a network in accordance with the detected result or past boot history A PC cluster computer device having a function of automatically selecting a local boot method to be activated using the.

計算ノードとしての複数のクライアントコンピュータとクライアントコンピュータを管理するサーバコンピュータにおいて、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態を、サーバコンピュータ内に動作するデータベースに保存する機能と、クライアントコンピュータをグループごとに分類する手段においてデータベースを参照する機能と、グループの構成をサーバコンピュータ内に動作するデータベースに保存する機能と、クライアントコンピュータを自動でグループに追加またはグループから削除する手段においてデータベースを参照する機能と、グループを構成するクライアントコンピュータに対し、サーバコンピュータからPCクラスタ計算機を構成する計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスを最短時間で履行するクライアントコンピュータのグループを履行前に予測し、PCクラスタ計算機として全体の計算に必要な時間を最小限にするためのプログラム配布スケジュールを作成し、そのスケジュールに基づいて全計算を履行する手段において、データベースを参照する機能を備えた請求項1記載のPCクラスタ計算機装置を有する。   In a server computer that manages a plurality of client computers as client nodes and a client computer, the performance of the central processing unit of the client computer, the memory occupancy, the communication speed of the NIC (Network Interface Card) hardware, and the communication with the server computer The function of storing the speed, the process execution status of the server computer and the client computer in a database operating in the server computer, the function of referring to the database in the means for classifying the client computers into groups, and the group configuration in the server computer Data storage function and the means to automatically add or remove client computers from the group. A function that refers to a database and a process between starting a client computer as a computing node constituting a PC cluster computer from a server computer, sending a program, executing a calculation, and receiving a result for a client computer constituting a group As a PC cluster computer, a program distribution schedule is created to minimize the time required for the entire calculation, and all calculations are performed based on that schedule. 2. The PC cluster computer apparatus according to claim 1, further comprising a function of referring to a database as means for executing.

クライアントコンピュータにおいてPCクラスタ計算機を構築するOSとしての適合状態を検知する手段において、クライアントコンピュータが停止している場合はネットワークを介してコンピュータを起動し、サーバコンピュータからクライアントコンピュータに信号を送信し、信号を受信したクライアントコンピュータが適合状態を返信する際、クライアントコンピュータの外部記憶装置に保存されているOSを用いて起動可能であることを通知する手段と、クライアントコンピュータの外部装置に保存されているOSを用いて起動が不可能であることを通知する手段と、クライアントコンピュータから通知された信号をサーバコンピュータのデータベースに保存する機能と、データベースに保存された信号にもとづいてサーバコンピュータから起動するためのOSをネットワークからダウンロードするディスクレスブート方式またはクライアントコンピュータの外部記憶装置に保存されているOSを用いて起動するローカルブート方式を自動で選択する機能を備えた請求項1記載のPCクラスタ計算機装置を有する。   In the means for detecting a conformity state as an OS for constructing a PC cluster computer in a client computer, when the client computer is stopped, the computer is started via a network, and a signal is transmitted from the server computer to the client computer. Means for notifying that the client computer can start using the OS stored in the external storage device of the client computer, and the OS stored in the external device of the client computer A server computer based on the signal stored in the database, a means for notifying that the activation is impossible using the server, a function for storing the signal notified from the client computer in the database of the server computer, and the server computer. 2. A function of automatically selecting a diskless boot method for downloading an OS for booting from a network from a network or a local boot method for booting using an OS stored in an external storage device of a client computer. It has a PC cluster computer device.

サーバコンピュータからPCクラスタ計算機を構成する計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスを最短時間で履行するクライアントコンピュータのグループを履行前に予測する手段、およびPCクラスタ計算機として全体の計算に必要な時間を最小限にするためのプログラム配布スケジュールを作成し、そのスケジュールに基づいて全計算を履行する手段において、すでに起動しているサーバコンピュータおよびクライアントコンピュータにおいて、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態を一定の時間で計測し、計測値の平均値をサーバコンピュータに通知する機能と、サーバコンピュータで受信した平均値の変化の状態にもとづいてプロセスを最短時間で履行するクライアントコンピュータのグループを予測する機能と、PCクラスタ計算機としてプログラム配布スケジュールを作成する機能を備えた請求項1記載のPCクラスタ計算機装置を有する。   A client computer is started as a computing node constituting a PC cluster computer from a server computer, a program is transmitted, a calculation is executed, and a group of client computers that perform a process in a shortest time is received before implementation. Server computer and client that have already been started in a means for creating a program distribution schedule for minimizing the time required for the entire calculation as a PC cluster computer, and for performing all calculations based on the schedule In the computer, the performance of the central processing unit of the client computer, the memory occupancy, the communication speed of the NIC (Network Interface Card) hardware, the communication speed with the server computer, the server computer The process execution status of the computer and client computer is measured in a certain amount of time, the average value of the measured values is notified to the server computer, and the process is executed in the shortest time based on the change state of the average value received by the server computer. The PC cluster computer apparatus according to claim 1, further comprising a function of predicting a group of client computers to be executed and a function of creating a program distribution schedule as a PC cluster computer.

ネットワーク上にサービス提供機、ログイン状態のクライアントコンピュータが含まれる場合においても、それらのクライアントコンピュータを事前に検出することで、計算ノードとして使用することが可能なクライアントコンピュータのみを計算ノードとして選択することが可能となる。   Even when service provider machines and logged-in client computers are included on the network, only client computers that can be used as calculation nodes are selected as calculation nodes by detecting those client computers in advance. Is possible.

クライアントコンピュータのOSを計算ノード適合OSであるか、不適合OSであるかを判定し、計算ノードとして起動するクライアントコンピュータをディスクレスブートかローカルブートのどちらを用いて起動するのかを決定することで、可能な限り最適に近い計算処理性能を得ることが可能となる。   It is possible by determining whether the OS of the client computer is a computation node compatible OS or a non-conforming OS, and determining whether to start the client computer to be started as a calculation node using diskless boot or local boot It is possible to obtain calculation processing performance as close to optimum as possible.

性能の近いクライアントコンピュータをグループ化することで、OSイメージの効率的なマルチキャスト配信ができ、またプログラムの配布スケジュールの作成を容易にすることができる。   By grouping client computers having similar performance, it is possible to efficiently distribute an OS image by multicast and to easily create a program distribution schedule.

計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスを最短で終了させるようなプログラムの配布スケジュールを作成し、実施することができる。   It is possible to create and execute a program distribution schedule that starts a client computer as a calculation node, sends a program, executes a calculation, and finishes the process while receiving the result in the shortest time.

図1は、本発明の1実施例の構成図である。同図に示すようにサーバコンピュータは、ネットワークに接続されているクライアントコンピュータの管理情報を格納するためのデータベース(DB1)、パケット解析機能(F1)とポートスキャン機能(F2)を持つサービス提供機検出機能(F3)、クライアントコンピュータのOS判定機能(F4)、OSイメージ配信機能(F5)、グループ化機能(F6)、プログラム配布スケジュール作成および実施機能(F7)で構成される。   FIG. 1 is a block diagram of an embodiment of the present invention. As shown in the figure, the server computer detects a service provider having a database (DB1) for storing management information of client computers connected to the network, a packet analysis function (F1), and a port scan function (F2). The function (F3), the client computer OS determination function (F4), the OS image distribution function (F5), the grouping function (F6), and the program distribution schedule creation and execution function (F7).

パケット解析機能(F1)は、ネットワーク上に流れるパケットを監視し、サービスを提供する内容のパケットを発見したとき、そのパケットの送信元のクライアントコンピュータがサービス提供機であるとみなす。ポートスキャン機能(F2)は、パケット解析で検出されたサービス提供機以外のクライアントコンピュータに対して、ポートスキャンを行い開いているポート確認する。このとき、サービスを提供するためのポートが開いていた場合、そのクライアントコンピュータはサービス提供機であるとみなす。これらの機能を用いてサービス提供機の検出を行うのがサービス提供機検出機能(F3)である。また、検出したサービス提供機の情報は管理情報データベース(DB1)に格納する。   The packet analysis function (F1) monitors a packet flowing on the network, and when a packet having a content providing a service is found, the client computer that has transmitted the packet is regarded as a service provider. The port scan function (F2) performs port scan on client computers other than the service provider detected by packet analysis and confirms the open port. At this time, if a port for providing a service is open, the client computer is regarded as a service providing machine. The service provider detection function (F3) detects a service provider using these functions. Further, the detected information on the service provider is stored in the management information database (DB1).

クライアントコンピュータのOS判定機能(F4)は、クライアントコンピュータのOSの適合状態を検知し、起動方法の選択を行う機能である。また、選択した起動方法を、管理情報データベース(DB1)に格納する。   The client computer OS determination function (F4) is a function for detecting the conformity state of the client computer OS and selecting a startup method. The selected activation method is stored in the management information database (DB1).

OSイメージ配信機能(F5)は、ディスクレスブートで起動する計算ノードに対して、計算ノード適合OSのイメージを配信する機能である。ここでは、OSイメージの配信にはマルチキャストによる配信を用いる。   The OS image distribution function (F5) is a function for distributing an image of a computation node compatible OS to a computation node that is activated by a diskless boot. Here, multicast distribution is used for distributing the OS image.

グループ化機能(F6)は、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態にもとづいてグループを構成する。また、グループの構成を管理情報データベース(DB1)に格納する。 The grouping function (F6) includes the performance of the central processing unit of the client computer, the memory occupancy rate, the communication speed of the NIC (Network Interface Card) hardware, the communication speed with the server computer, and the process execution of the server computer and the client computer. Configure groups based on status. The group configuration is stored in the management information database (DB1).

プログラム配布スケジュール作成機能(F7)は、グループ化機能(F6)によって構成されたグループに対する評価値を求め、その評価値の小さいグループから起動されるようなスケジュールを作成する機能である。   The program distribution schedule creation function (F7) is a function for obtaining an evaluation value for the group configured by the grouping function (F6) and creating a schedule that is activated from a group with a small evaluation value.

管理情報データベース(DB1)は、ネットワーク上のPCの起動方法とその履歴、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴、グループの構成を格納している。これらの情報はサービス提供機検出機能やクライアントコンピュータのOS判定機能やグループ化機能により定期的に更新される。   The management information database (DB1) is a network PC startup method and its history, the performance of the central processing unit of the client computer, the memory occupancy rate, the NIC (Network Interface Card) hardware communication speed, and the server computer Stores the communication speed, the process execution status of the server computer and the client computer, the past history, and the group configuration. These pieces of information are periodically updated by the service provider detection function, the OS determination function of the client computer, and the grouping function.

図2を用いてPCクラスタ計算機の起動準備に移るまでのサーバコンピュータの処理について説明をする。サーバコンピュータは、クライアントコンピュータのOSが計算ホスト適合OSであるかどうかを判定し、管理情報データベース(DB1)に格納する情報を取得しグループ化を行うプログラム、サービス提供機の検出を行うプログラムを起動(Step21)、(Step22)し、PCクラスタ計算機の起動要求があるまで待機(Step23)する。その後PCクラスタ計算機の起動要求を受けると、(Step21)、(Step22)で起動したプログラムを終了させ(Step24)、起動スケジュールを作成するプログラムを起動(Step25)した後、PCクラスタ計算機の起動処理の制御を行うプログラムを起動(Step26)する。その後、PCクラスタ計算機の終了を確認(Step27)すると(Step21)に戻る。   The processing of the server computer up to the start of PC cluster computer startup will be described with reference to FIG. The server computer determines whether the OS of the client computer is a computing host compatible OS, starts the program for acquiring information stored in the management information database (DB1), grouping, and detecting the service provider (Step 21) and (Step 22), and wait until there is a PC cluster computer activation request (Step 23). When a PC cluster computer startup request is received thereafter, the program started at (Step 21) and (Step 22) is terminated (Step 24), the program for creating the startup schedule is started (Step 25), and the startup processing of the PC cluster computer is executed. The program for controlling is started (Step 26). Thereafter, when the completion of the PC cluster computer is confirmed (Step 27), the process returns to (Step 21).

図3を用いてクライアントコンピュータのOSの判定、管理情報データベース(DB1)に格納する情報を取得、グループ化を行うプログラムの説明を行う。まず、電源の入っていないクライアントコンピュータをディスクレスブートで起動する(Step31)。次にクライアントコンピュータから中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、プロセス履行状態の情報を取得し、管理情報データベース(DB1)に格納(Step32)する。その情報と過去の記録をもとに同一の性能を持つクライアントコンピュータからなるグループを作成する(Step33)。このとき、サーバコンピュータとの通信速度、メモリの占有率が過去の記録と異なるものについては現在のグループから削除し、適切なグループに追加する。   A program for determining the OS of a client computer, obtaining information stored in the management information database (DB1), and grouping will be described with reference to FIG. First, a client computer that is not turned on is activated by diskless boot (Step 31). Next, information on the performance of the central processing unit, the occupation ratio of the memory, the communication speed of the NIC (Network Interface Card) hardware, the communication speed with the server computer, and the process execution status is acquired from the client computer, and the management information database (DB1) ) (Step 32). Based on the information and past records, a group of client computers having the same performance is created (Step 33). At this time, if the communication speed with the server computer and the memory occupancy are different from the past record, they are deleted from the current group and added to an appropriate group.

グループ化は同程度の性能を持つクライアントコンピュータを集めて1つのグループとする。また、サービス提供機は、起動不可のグループに追加される。クライアントコンピュータをグループ化するのは、同時に起動しているクライアントコンピュータの起動完了までの時間のばらつきをなくすためである。   In grouping, client computers having similar performance are collected into one group. In addition, the service provider is added to a group that cannot be activated. The reason why the client computers are grouped is to eliminate variations in the time required to complete startup of client computers that are simultaneously started.

サーバコンピュータとの通信速度は、サーバコンピュータとクライアントコンピュータ間で一定のサイズのファイルの転送を行うことで得られる転送速度とする。   The communication speed with the server computer is a transfer speed obtained by transferring a file of a certain size between the server computer and the client computer.

次に、クライアントコンピュータのOSの情報を確認する(Step34)。その情報から、計算ノード適合OSではないと判断されたときは、そのクライアントコンピュータの起動方法をディスクレスブートとする(Step37)。計算ノード適合OSであると判断された場合は、そのクライアントコンピュータの起動方法をローカルブートとする(Step36)。次に決定した起動方法をデータベースに保存する(Step37)。次に起動したクライアントコンピュータをシャットダウン(Step39)し、起動する時間まで待機 (Step310)した後、(Step31)に戻る。 Next, the OS information of the client computer is confirmed (Step 34). If it is determined from the information that the OS is not a computation node compatible OS, the client computer is activated by a diskless boot (Step 37). If it is determined that the OS is a computation node compatible OS, the client computer is activated by a local boot (Step 36). Next, the determined activation method is stored in the database (Step 37). Next, the started client computer is shut down (Step 39), waits until the start time (Step 310), and then returns to (Step 31).

クライアントコンピュータのOSの判定、管理情報データベース(DB1)に格納するための情報を取得、グループ化を行うプログラムは、サーバコンピュータからプログラム終了の指示を受け取った場合、現在実行しているステップを実行し終わったら後、すぐに終了する。このプログラムで得た起動方法に関する情報は図1の管理情報データベース(DB1)に格納される。 The program for determining the OS of the client computer, acquiring information for storing in the management information database (DB1), and grouping the program executes the currently executing step when receiving an instruction to terminate the program from the server computer. After it finishes, it ends immediately. Information regarding the startup method obtained by this program is stored in the management information database (DB1) of FIG.

図4を用いてサービス提供機検出プログラムの説明をする。まず、ネットワーク上のパケットを取得(Step41)し、取得したパケットの解析を行う(Step42)、その解析結果からサービス提供機を検出した場合は、検出したサービス提供機を図1の管理情報データベース(DB1)に格納する(Step44)。次にサーバコンピュータからプログラム終了の指示がなければ、次回の起動時間まで待機(Step46)する。終了の指示があれば、管理情報DBに含まれているサービス提供機以外のPCに対してポートスキャンを行い(Step47)サービス提供機を検出した場合には、検出したサービス提供機を管理情報データベース(DB1)に格納(Step49)し終了する。   The service provider detection program will be described with reference to FIG. First, a packet on the network is acquired (Step 41), and the acquired packet is analyzed (Step 42). When a service provider is detected from the analysis result, the detected service provider is identified by the management information database (FIG. 1). DB1) (Step 44). Next, if there is no instruction to end the program from the server computer, it waits until the next activation time (Step 46). If there is an instruction for termination, port scanning is performed on a PC other than the service provider included in the management information DB (Step 47). If a service provider is detected, the detected service provider is managed in the management information database. Store in (DB1) (Step 49) and end.

パケット解析を行ったうえでポートスキャンを行うのは、パケット解析で検出することができなかったサービス提供機をポートスキャンで発見するためである。このように、2段階でサービス提供機検出を行うことで精度を高めることができる。   The reason why the port scan is performed after the packet analysis is performed is to find a service provider that could not be detected by the packet analysis by the port scan. Thus, accuracy can be increased by performing service provider detection in two stages.

図5を用いてプログラム配布スケジュールを作成するプログラムの説明をする。まず、実行しようとするプログラムの大きさを求める(Step51)。次にデータベースから、グループに関する情報を取得する(Step52)。次にグループごとの評価値を求める(Step53)。次に評価値の小さいグループから起動するようなスケジュールを作成する(Step54)。   A program for creating a program distribution schedule will be described with reference to FIG. First, the size of the program to be executed is obtained (Step 51). Next, information about the group is acquired from the database (Step 52). Next, an evaluation value for each group is obtained (Step 53). Next, a schedule for starting from a group having a small evaluation value is created (Step 54).

グループの評価値は「数式1」によって求める。

Figure 2006228093
ここで、Vkはグループkの評価値、tkはグループkが起動開始から起動完了までにかかった時間、wはプログラムの大きさ、Nkはグループkに含まれるクライアントコンピュータの台数である。Pk,iは中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度から得られるグループkに含まれるクライアントコンピュータiの性能とする。αはパラメータである。 The evaluation value of the group is obtained by “Formula 1”.
Figure 2006228093
Here, Vk is an evaluation value of group k, tk is the time taken from the start of activation of group k to the completion of activation, w is the size of the program, and Nk is the number of client computers included in group k. Pk, i is the performance of the central processing unit, the memory occupancy rate, the NIC (Network Interface Card) hardware communication speed, and the performance of the client computer i included in the group k obtained from the communication speed with the server computer. α is a parameter.

PCクラスタ計算機を起動する際に、クライアントコンピュータを計算ノードとして起動する
処理を制御するプログラムを、図6を用いて説明する。この起動処理を制御するプログラムでは、起動の終了したグループを格納するリスト、未起動のクライアントコンピュータを格納するリスト、起動済みのクライアントコンピュータを格納するリストの3つを利用する。これらのリストをここでは、リスト1、リスト2、リスト3と呼ぶ。まず、リスト3を初期化する(Step61)。次にリスト1,2を初期化する(Step62)。次に起動グループを決定し、そのグループに含まれるクライアントコンピュータをリスト1に追加する(Step62)。次にあらかじめ定められた同時起動可能台数を越えないように、リスト1に含まれるクライアントコンピュータに対して、起動処理を行うプログラムと起動の管理を行うプログラムを起動する(Step64)。起動を管理するプログラムから起動完了の通知を受け取った場合には、起動完了したクライアントコンピュータについてリスト1からの削除及びリスト2への追加を行い、また、起動完了までにかかった時間を管理情報データベース(DB1)に記録する(Step66)。起動処理を行うプログラムから起動不可の通知を受け取った場合には、起動が不可であると判断されたクライアントコンピュータをリスト2に追加(Step68)し、起動の管理をするプログラムを終了させる(Step610)。次に、リスト2に起動グループ内のクライアントコンピュータが全て含まれる場合は、リスト3に起動が終了したグループを追加する(Step611)。そうでない場合は、(Step64)に戻る。次に、プログラムがすでに配布されているかを調べ、プログラムがすでに配布されていて、まだ終了していないときは、起動完了したグループを、PCクラスタ計算機を構成する計算ノードとして追加する(Step615)。プログラムの実行がすでに終了していればクライアントコンピュータの起動を制御するプログラムを終了する。プログラムがまだ配布されていなければ、起動が完了したグループにプログラムを配布する(Step613)。次にリスト3に全てのグループが含まれる場合は、計算ノードの起動処理を制御するプログラムを終了する。全てのグループが含まれてはいない場合は、(Step62)へ戻る。
A program for controlling processing for starting a client computer as a calculation node when starting a PC cluster computer will be described with reference to FIG. The program for controlling the activation process uses three lists: a list for storing activated groups, a list for storing unactivated client computers, and a list for storing activated client computers. These lists are referred to herein as list 1, list 2, and list 3. First, list 3 is initialized (Step 61). Next, the lists 1 and 2 are initialized (Step 62). Next, an activation group is determined, and client computers included in the group are added to list 1 (Step 62). Next, a program for starting processing and a program for managing startup are started on the client computers included in list 1 so as not to exceed the predetermined number of simultaneously startable devices (Step 64). When a startup completion notification is received from a startup management program, the startup completion client computer is deleted from list 1 and added to list 2, and the time taken to complete startup is also shown in the management information database. It records in (DB1) (Step 66). When a notification indicating that the activation is not possible is received from the program that performs the activation process, the client computer that is determined to be unable to activate is added to the list 2 (Step 68), and the program that manages the activation is terminated (Step 610). . Next, when the list 2 includes all the client computers in the activation group, the group whose activation has been completed is added to the list 3 (Step 611). Otherwise, return to (Step 64). Next, it is checked whether the program has already been distributed. If the program has already been distributed and has not been finished yet, the activated group is added as a calculation node constituting the PC cluster computer (Step 615). If the execution of the program has already ended, the program that controls the start of the client computer is ended. If the program has not been distributed yet, the program is distributed to the group that has been activated (Step 613). Next, when all the groups are included in list 3, the program for controlling the computation node activation processing is terminated. If all the groups are not included, the process returns to (Step 62).

図7を用いて、計算ノードとしてクライアントコンピュータを起動するプログラムを説明する。まず、クライアント計算機がすでに電源が投入済みであり、なおかつログイン状態にある場合には、起動処理を制御するプログラムに起動不可の通知を送り(Step74) プログラムを終了する。電源が投入されていない場合には、計算ホストの起動方法を決定し(Step73)、それが、ディスクレスブートであればWake On Lanで電源を投入しディスクレスブートで起動し(Step78) プログラムを終了する。起動方法がローカルブートであれば、Wake On Lanで電源を投入しローカルブートで起動し(Step79)プログラムを終了する。電源が投入済みであり、ユーザがログインしていない場合には、現在起動しているOSが計算ノード適合OSであればプログラムを終了し、そうでなければ起動方法を決定し(Step77))、決定した起動方法が、ディスクレスブートであればクライアントコンピュータをリブートし、ディスクレスブートで起動しプログラムを終了する。ローカルブートであれば、クライアントコンピュータをリブートし、ローカルブートで計算ノード適合OSを起動させプログラムを終了する。   A program for starting a client computer as a computation node will be described with reference to FIG. First, when the client computer has already been turned on and is in a login state, a notification indicating that the client computer cannot be started is sent to the program that controls the startup process (Step 74), and the program is terminated. If the power is not turned on, the computer host activation method is determined (Step 73). If it is a diskless boot, the power is turned on with Wake On Lan and the diskless boot is started (Step 78). . If the activation method is local boot, the power is turned on with Wake On Lan, and the program is terminated with local boot (Step 79). If the power is already turned on and the user is not logged in, the program is terminated if the currently activated OS is a computation node compatible OS, otherwise the activation method is determined (Step 77)). If the determined activation method is diskless boot, the client computer is rebooted, activated by diskless boot, and the program is terminated. If it is a local boot, the client computer is rebooted, the computation node compatible OS is started by the local boot, and the program is terminated.

図8を用いてクライアントコンピュータの起動管理プログラムを説明する。まず、管理しているクライアントコンピュータのレスポンスがあれば、起動中のOSが計算ノード適合OSであるかを確認し、計算ノード適合OSであれば起動処理を制御するプログラムに起動完了の通知を行い(Step84)終了する。レスポンスがなければレスポンスがあるまで待機(Step83)する。   The startup management program for the client computer will be described with reference to FIG. First, if there is a response from the managed client computer, it confirms whether the OS being started is a computation node compatible OS, and if it is a computation node compatible OS, notifies the program that controls the startup process of completion of startup. (Step 84) The process ends. If there is no response, it waits until there is a response (Step 83).

上記のクライアントコンピュータの起動に係わるプログラムは、起動グループの決定や起動方法を決定する際には、図1の管理情報データベース(DB1)に格納されている情報を参考にする。また、計算ノードの起動処理を行うプログラムは、管理情報データベース(DB1)内に起動方法に関する情報を持たない計算ノードは、ディスクレスブートで起動するものとする。   The above-described program related to the activation of the client computer refers to the information stored in the management information database (DB1) of FIG. 1 when determining the activation group and activation method. In addition, it is assumed that a computation node activation process program that does not have information on the activation method in the management information database (DB1) is activated by a diskless boot.

上記のクライアントコンピュータの起動に係わるプログラムの概観を、図9を基に説明する。サーバコンピュータによって起動されたクライアントコンピュータの起動処理を制御するプログラムは、クライアントコンピュータ一台につき起動処理プログラム、起動管理プログラムを1つずつ起動する。起動管理プログラムは起動処理プログラムが起動処理を行っているクライアントコンピュータを管理し、起動の完了を確認すると、起動完了の通知を、起動処理を制御するプログラムに送る。また、起動処理プログラムはユーザがログインしていて起動処理が行えないクライアントコンピュータを確認すると起動不可の通知を、起動処理を制御するプログラムに通知する。また、図9に示すように、それぞれのプログラムが独立に動作することで、計算ノードの異常や起動時間の違いなどによって影響を受けることを防ぐことができるようになる。   An overview of the program related to the startup of the client computer will be described with reference to FIG. The program for controlling the startup process of the client computer started by the server computer starts one startup process program and one startup management program for each client computer. The activation management program manages the client computer that is being activated by the activation processing program. When the activation management program confirms the completion of activation, the activation management program sends a notification of activation completion to the program that controls the activation processing. Further, when the client computer logs in and confirms a client computer that cannot perform the startup process, the startup process program notifies the program that controls the startup process of a notification that startup is not possible. Also, as shown in FIG. 9, since each program operates independently, it can be prevented from being affected by an abnormality in a computation node, a difference in activation time, and the like.

なお、本実施の形態では、計算ノード不適合OSを持つクライアントコンピュータ、性能が異なるクライアントコンピュータ、サービス提供機が混在する環境において、PCクラスタ計算機の構築を容易にするとともに、計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスの終了までの時間を最短にすることができる。   In this embodiment, it is easy to construct a PC cluster computer and start a client computer as a computation node in an environment where a client computer having a computing node incompatible OS, a client computer with different performance, and a service provider are mixed. Then, it is possible to minimize the time until the end of the process while sending the program, executing the calculation, and receiving the result.

異種OSを持つパーソナルコンピュータ、性能が異なるパーソナルコンピュータ、サービス提供機が混在する情報処理センターや研究室などの施設において、容易にPCクラスタ計算機の構築及びPCクラスタ計算機の利用が可能となる。   It is possible to easily construct a PC cluster computer and use a PC cluster computer in a facility such as a personal computer having a different OS, a personal computer having different performance, and an information processing center or laboratory where service providing machines are mixed.

本発明の一実施例の構成図Configuration diagram of one embodiment of the present invention PCクラスタ計算機の起動準備に移るまでのサーバコンピュータの処理に関するプログラムのフローチャートFlowchart of a program relating to server computer processing up to the start of PC cluster computer startup preparation クライアントコンピュータのOSの判定、管理情報データベース(DB1)に格納する情報を取得、グループ化を行うプログラムのフローチャートFlowchart of a program for determining the OS of a client computer, obtaining information stored in the management information database (DB1), and grouping サービス提供機を検出するプログラムのフローチャートFlow chart of program for detecting service provider プログラム配布スケジュールを作成するプログラムのフローチャートProgram flowchart for creating a program distribution schedule PCクラスタ計算機を起動する際に、クライアントコンピュータを計算ノードとして起動する処理を制御するプログラムのフローチャートFlow chart of a program for controlling processing for starting a client computer as a calculation node when starting a PC cluster computer クライアントコンピュータを計算ノードとして起動する処理を行うプログラムのフローチャートFlowchart of a program that performs processing for starting a client computer as a computation node クライアントコンピュータの起動管理を行うプログラムのフローチャートFlow chart of a program for managing start of a client computer クライアントコンピュータの起動に係わるプログラムの概観図Overview of programs related to client computer startup

符号の説明Explanation of symbols

F1 パケット解析機能
F2 ポートスキャン機能
F3 サービス機検出機能
F4 クライアントコンピュータのOS判定機能
F5 OSイメージ配信機能
F6 グループ化機能
F7 プログラム起動スケジュール作成機能
DB1 管理情報データベース
F1 packet analysis function F2 port scan function F3 service machine detection function F4 client computer OS determination function F5 OS image distribution function F6 grouping function F7 program start schedule creation function DB1 management information database

Claims (4)

ネットワークに接続されている複数のパーソナルコンピュータを用いてPCクラスタ計算機を構築するために、計算ノードとしての複数のクライアントコンピュータとクライアントコンピュータを管理するサーバコンピュータにおいて、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴に応じて、クライアントコンピュータをグループごとに分類する手段と、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴にもとづいて、クライアントコンピュータを自動でグループに追加またはグループから削除する手段と、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴にもとづいて、グループごとにコンピュータをネットワーク起動する手段と、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態および過去の履歴にもとづいて、グループを構成するクライアントコンピュータに対し、サーバコンピュータからPCクラスタ計算機を構成する計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスを最短時間で履行するクライアントコンピュータのグループを履行前に予測し、PCクラスタ計算機として全体の計算に必要な時間を最小限にするためのプログラム配布スケジュールを作成し、そのスケジュールに基づいて全計算を履行する手段と、クライアントコンピュータにおいてPCクラスタ計算機を構築するOS(Operating System)としての適合状態を自動検知し、検知した結果または過去の起動履歴に応じて、サーバコンピュータから起動するためのOSをネットワークからダウンロードするディスクレスブート方式またはクライアントコンピュータの外部記憶装置に保存されているOSを用いて起動するローカルブート方式を自動で選択する機能を備えたPCクラスタ計算機装置。   In order to construct a PC cluster computer using a plurality of personal computers connected to a network, a plurality of client computers as computing nodes and a server computer that manages the client computer, the performance of the central processing unit of the client computer, memory For classifying client computers into groups according to the occupancy rate of the network, NIC (Network Interface Card) hardware communication speed, communication speed with server computer, server computer and client computer process performance status and past history And the performance of the central processing unit of the client computer, the memory occupancy rate, and the NIC (Network Interface Card) hardware communication A means for automatically adding or removing a client computer to or from a group based on the communication speed with the server computer, the process performance status of the server computer and the client computer, and the past history, and the performance of the central processing unit of the client computer Network startup for each group based on memory occupancy, NIC (Network Interface Card) hardware communication speed, server computer communication speed, server computer and client computer process performance status, and past history Communication means, the performance of the central processing unit of the client computer, the memory occupancy rate, and the NIC (Network Interface Card) hardware communication Based on the speed, the communication speed with the server computer, the process execution status of the server computer and the client computer, and the past history, the client computer is configured as a computing node constituting the PC cluster computer from the server computer to the client computer constituting the group. Starts up, sends programs, executes calculations, and implements the process between receiving the results in the shortest possible time, predicting a group of client computers before implementation, minimizing the time required for the overall calculation as a PC cluster computer A program distribution schedule for creating a PC cluster computer on a client computer and a means for executing all calculations based on the schedule, and an OS (Operating System) for building a PC cluster computer on the client computer OS that is automatically detected as a conforming state, and that is stored in an external storage device of a client computer or a client computer that downloads an OS for starting from a server computer from a network in accordance with the detected result or past boot history A PC cluster computer device having a function of automatically selecting a local boot method to be started using a computer. 計算ノードとしての複数のクライアントコンピュータとクライアントコンピュータを管理するサーバコンピュータにおいて、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態を、サーバコンピュータ内に動作するデータベースに保存する機能と、クライアントコンピュータをグループごとに分類する手段においてデータベースを参照する機能と、クライアントコンピュータを自動でグループに追加またはグループから削除する手段においてデータベースを参照する機能と、グループの構成をサーバコンピュータ内に動作するデータベースに保存する機能と、グループを構成するクライアントコンピュータに対し、サーバコンピュータからPCクラスタ計算機を構成する計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスを最短時間で履行するクライアントコンピュータのグループを履行前に予測し、PCクラスタ計算機として全体の計算に必要な時間を最小限にするためのプログラム配布スケジュールを作成し、そのスケジュールに基づいて全計算を履行する手段において、データベースを参照する機能を備えた請求項1記載のPCクラスタ計算機装置。   In a server computer that manages a plurality of client computers as client nodes and a client computer, the performance of the central processing unit of the client computer, the memory occupancy, the communication speed of the NIC (Network Interface Card) hardware, and the communication with the server computer A function for storing the speed, process execution status of the server computer and the client computer in a database operating in the server computer, a function for referring to the database in a means for classifying the client computers into groups, and automatically grouping the client computers into groups A function for referring to the database in the means for addition or deletion from the group, and data for operating the group configuration in the server computer. The function of saving data in the database and the process between starting the client computer as a computing node constituting the PC cluster computer from the server computer, sending the program, executing the calculation, and receiving the result for the client computer constituting the group As a PC cluster computer, a program distribution schedule is created to minimize the time required for the entire calculation, and all calculations are performed based on that schedule. 2. The PC cluster computer device according to claim 1, further comprising a function of referring to a database in the means for executing. クライアントコンピュータにおいてPCクラスタ計算機を構築するOSとしての適合状態を検知する手段において、クライアントコンピュータが停止している場合はネットワークを介してコンピュータを起動し、サーバコンピュータからクライアントコンピュータに信号を送信し、信号を受信したクライアントコンピュータが適合状態を返信する際、クライアントコンピュータの外部記憶装置に保存されているOSを用いて起動可能であることを通知する手段と、クライアントコンピュータの外部装置に保存されているOSを用いて起動が不可能であることを通知する手段と、クライアントコンピュータから通知された信号をサーバコンピュータのデータベースに保存する機能と、データベースに保存された信号にもとづいてサーバコンピュータから起動するためのOSをネットワークからダウンロードするディスクレスブート方式またはクライアントコンピュータの外部記憶装置に保存されているOSを用いて起動するローカルブート方式を自動で選択する機能を備えた請求項1記載のPCクラスタ計算機装置。   In the means for detecting a conformity state as an OS for constructing a PC cluster computer in a client computer, when the client computer is stopped, the computer is started via a network, and a signal is transmitted from the server computer to the client computer. Means for notifying that the client computer can start using the OS stored in the external storage device of the client computer, and the OS stored in the external device of the client computer A server computer based on the signal stored in the database, a means for notifying that the activation is impossible using the server, a function for storing the signal notified from the client computer in the database of the server computer, and the server computer. 2. A function of automatically selecting a diskless boot method for downloading an OS for booting from a network from a network or a local boot method for booting using an OS stored in an external storage device of a client computer. PC cluster computer device. サーバコンピュータからPCクラスタ計算機を構成する計算ノードとしてクライアントコンピュータを起動し、プログラムを送信し、計算を実行し、結果を受け取る間のプロセスを最短時間で履行するクライアントコンピュータのグループを履行前に予測する手段、およびPCクラスタ計算機として全体の計算に必要な時間を最小限にするためのプログラム配布スケジュールを作成し、そのスケジュールに基づいて全計算を履行する手段において、すでに起動しているサーバコンピュータおよびクライアントコンピュータにおいて、クライアントコンピュータの中央処理装置の性能、メモリの占有率、NIC(Network Interface Card)のハードウェアの通信速度、サーバコンピュータとの通信速度、サーバコンピュータ及びクライアントコンピュータのプロセス履行状態を一定の時間で計測し、計測値の平均値をサーバコンピュータに通知する機能と、サーバコンピュータで受信した平均値の変化の状態にもとづいてプロセスを最短時間で履行するクライアントコンピュータのグループを予測する機能と、PCクラスタ計算機としてプログラム配布スケジュールを作成する機能を備えた請求項1記載のPCクラスタ計算機装置。
A client computer is started as a computing node constituting a PC cluster computer from a server computer, a program is transmitted, a calculation is executed, and a group of client computers that perform a process in a shortest time is received before implementation. Server computer and client that have already been started in a means for creating a program distribution schedule for minimizing the time required for the entire calculation as a PC cluster computer, and for performing all calculations based on the schedule In the computer, the performance of the central processing unit of the client computer, the memory occupancy, the communication speed of the NIC (Network Interface Card) hardware, the communication speed with the server computer, the server computer In addition, the process execution state of the client computer is measured in a certain time, the average value of the measured value is notified to the server computer, and the process is executed in the shortest time based on the change state of the average value received by the server computer. 2. The PC cluster computer apparatus according to claim 1, further comprising a function of predicting a group of client computers and a function of creating a program distribution schedule as a PC cluster computer.
JP2005043581A 2005-02-21 2005-02-21 Selection of calculation node in pc cluster computer, start of selected calculation node, and method and apparatus for distribution scheduling processing of program Pending JP2006228093A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005043581A JP2006228093A (en) 2005-02-21 2005-02-21 Selection of calculation node in pc cluster computer, start of selected calculation node, and method and apparatus for distribution scheduling processing of program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005043581A JP2006228093A (en) 2005-02-21 2005-02-21 Selection of calculation node in pc cluster computer, start of selected calculation node, and method and apparatus for distribution scheduling processing of program

Publications (1)

Publication Number Publication Date
JP2006228093A true JP2006228093A (en) 2006-08-31

Family

ID=36989403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005043581A Pending JP2006228093A (en) 2005-02-21 2005-02-21 Selection of calculation node in pc cluster computer, start of selected calculation node, and method and apparatus for distribution scheduling processing of program

Country Status (1)

Country Link
JP (1) JP2006228093A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111448A1 (en) * 2007-03-09 2008-09-18 Nec Corporation Server function switching device, method and program, and thin client system and server device
JP2012514791A (en) * 2009-01-07 2012-06-28 ソニー株式会社 Parallel task application framework
JP2012170154A (en) * 2012-06-11 2012-09-06 Nakayo Telecommun Inc Telephone terminal capable of selecting server function
JP2017091318A (en) * 2015-11-12 2017-05-25 富士通株式会社 Processing dispersion control device, processing dispersion control method, and processing dispersion control program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111448A1 (en) * 2007-03-09 2008-09-18 Nec Corporation Server function switching device, method and program, and thin client system and server device
JPWO2008111448A1 (en) * 2007-03-09 2010-06-24 日本電気株式会社 Server function switching device, method and program, thin client system and server device
JP5201366B2 (en) * 2007-03-09 2013-06-05 日本電気株式会社 Server function switching device, method and program, thin client system and server device
US9703571B2 (en) 2007-03-09 2017-07-11 Nec Corporation Server function switching device, method and program, and thin client system and server device
JP2012514791A (en) * 2009-01-07 2012-06-28 ソニー株式会社 Parallel task application framework
JP2012170154A (en) * 2012-06-11 2012-09-06 Nakayo Telecommun Inc Telephone terminal capable of selecting server function
JP2017091318A (en) * 2015-11-12 2017-05-25 富士通株式会社 Processing dispersion control device, processing dispersion control method, and processing dispersion control program

Similar Documents

Publication Publication Date Title
US9729488B2 (en) On-demand mailbox synchronization and migration system
JP6005706B2 (en) Virtual machine morphing for heterogeneous mobile environments
US9288147B2 (en) Dynamically balancing resources in a server farm
US10289441B1 (en) Intelligent scale-out federated restore
WO2020253079A1 (en) Jmeter-based distributed performance test method and apparatus, device, and storage medium
JP4738144B2 (en) Information monitoring method, system and program
JP2005056391A (en) Method and system for balancing workload of computing environment
US9596189B1 (en) Virtual machine management
CN110149409B (en) Cloud host metadata service management method, system, equipment and storage medium
US9979780B1 (en) Method and apparatus for selection between multiple candidate clouds for job processing
JP2012088808A (en) Virtual machine control device, virtual machine control program and virtual machine control method
US20180176289A1 (en) Information processing device, information processing system, computer-readable recording medium, and information processing method
CN111176803A (en) Service processing method, device, server and storage medium
JP2006228093A (en) Selection of calculation node in pc cluster computer, start of selected calculation node, and method and apparatus for distribution scheduling processing of program
CN111506388B (en) Container performance detection method, container management platform and computer storage medium
TWI507889B (en) Management node , method , machine 一accessible medium and system for reservation and execution image writing of native computing devices
JP6279816B2 (en) Storage monitoring system and monitoring method thereof
JP7030412B2 (en) Information processing system and control method
US10635997B1 (en) Finite life instances
JP5632403B2 (en) Task management system, task management server, task management method, and task management program
JP2013134658A (en) Computer network system, configuration management method, configuration management program and storage medium
US9270530B1 (en) Managing imaging of multiple computing devices
US10860347B1 (en) Virtual machine with multiple content processes
JP4208494B2 (en) Load test system for network server
CN113973049B (en) Method for managing and deploying bit stream of FPGA (field programmable Gate array) cluster