JP2007148531A - Pc cluster system, server, address assignment method and program - Google Patents

Pc cluster system, server, address assignment method and program Download PDF

Info

Publication number
JP2007148531A
JP2007148531A JP2005338780A JP2005338780A JP2007148531A JP 2007148531 A JP2007148531 A JP 2007148531A JP 2005338780 A JP2005338780 A JP 2005338780A JP 2005338780 A JP2005338780 A JP 2005338780A JP 2007148531 A JP2007148531 A JP 2007148531A
Authority
JP
Japan
Prior art keywords
address
logical address
physical
physical address
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005338780A
Other languages
Japanese (ja)
Other versions
JP4304310B2 (en
Inventor
Koji Matsuoka
浩司 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2005338780A priority Critical patent/JP4304310B2/en
Publication of JP2007148531A publication Critical patent/JP2007148531A/en
Application granted granted Critical
Publication of JP4304310B2 publication Critical patent/JP4304310B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Multi Processors (AREA)
  • Small-Scale Networks (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To avoid deterioration of performance caused by execution of parallel jobs on a PC extending between switches while reducing manual cost by permitting connection of an individual PC constituting a PC cluster to an optional switch independently from its physical position and saving the labor hour in establishment of the PC cluster. <P>SOLUTION: The system constitutes a sub-network containing only one switch to which PCs are connected, and forms a partial physical address/logic address list registering all PCs connected to the switch. Partial physical address/logic address lists for all switches are formed while changing the structure of the sub-network. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は並列計算を行うPCクラスタの構築の技術に関し、特に、任意の階層の1つのスイッチに収容されたPC(Personal Computer)の物理アドレスと論理アドレスとが対応付けられたリストと、必要に応じて、任意の階層の1つのスイッチに収容されたPC論理アドレスとホスト名とが対応付けられたリストとを自動的に生成し、それらを統合することによって、PCに付与された論理アドレスあるいはホスト名から該PCが収容された1つのスイッチを一意に識別することを可能とするPCクラスタの構築技術に関する。   The present invention relates to a technology for constructing a PC cluster that performs parallel computation, and in particular, a list in which physical addresses and logical addresses of PCs (Personal Computers) accommodated in one switch in an arbitrary hierarchy are associated with each other, as necessary. In response, a list in which a PC logical address and a host name accommodated in one switch of an arbitrary hierarchy are automatically associated and integrated to obtain a logical address assigned to the PC or The present invention relates to a PC cluster construction technique that makes it possible to uniquely identify one switch in which a PC is accommodated from a host name.

近年、計算機性能の向上に伴い、計算機シミュレーションが自動車の設計などに実用されるようになってきた。このような計算機需要対応して、大規模なPCクラスタが数多く構築され、もはや、大規模なPCクラスタの構築は一般的なものとなってきた。大規模なPCクラスタの構築・運用では、構築時には規模に応じた人手が、障害対応には運用期間に応じた人手が必要となり、その人的なコストの削減が大きな課題となっている。   In recent years, with the improvement of computer performance, computer simulation has come into practical use for automobile design and the like. In response to such demand for computers, many large-scale PC clusters have been constructed, and construction of large-scale PC clusters has become common. In the construction and operation of a large-scale PC cluster, manpower according to the scale is required at the time of construction, and manpower according to the operation period is necessary for dealing with failures, and the reduction of the human cost is a major issue.

特定のPCで障害が発生した場合、どのPCの動作がおかしいかは論理的なアドレスあるいはホスト名で識別することが可能である。例えば、ホスト名を指定した通信がある特定のPCで正常に機能しない時、そのPCで障害が発生したことを識別できる。   When a failure occurs on a specific PC, it is possible to identify which PC is operating strangely by a logical address or host name. For example, when communication with a specified host name does not function properly on a particular PC, it can be identified that a failure has occurred on that PC.

したがって、PCクラスタの維持管理では、一般に、論理的なアドレスあるいはホスト名が物理的にどのPCに対応するかを知ることが1つの課題になる。これは障害が発生したノードを物理的に交換するなどの対策が必要であることを考えれば自明である。   Therefore, in the maintenance management of a PC cluster, it is generally one problem to know which PC a logical address or host name physically corresponds to. This is self-evident when considering the need to take measures such as physically replacing the failed node.

最も単純には、PCの物理的な並びを物理アドレスに見立て、物理アドレスに対応して論理アドレスとホスト名とを付与する。これによって、障害が発生した場合、障害が発生した論理アドレスあるいはホスト名に対応して、物理アドレスが一意に決まり、PCの物理的な並びの上で先頭から何番目のPCで障害が発生したという形で、障害の発生したPCを物理的に特定することができる。このPCクラスタの構成方式では、障害が発生したPCの識別が簡単になる反面、物理的な並びに応じた論理アドレス、ホスト名の設定が必要で、構築の際に少なくない人手が必要となる。特に、大規模なシステムの構築では非常にコストが高い。   Most simply, the physical arrangement of PCs is regarded as physical addresses, and logical addresses and host names are assigned corresponding to the physical addresses. As a result, when a failure occurs, the physical address is uniquely determined according to the logical address or host name where the failure occurred, and the failure occurs in the first PC in the physical array of the PC. In this way, the faulty PC can be physically identified. This PC cluster configuration method makes it easy to identify the PC where the failure occurred, but it requires the setting of logical addresses and host names according to the physical sequence, and requires a lot of manpower for the construction. In particular, the construction of a large-scale system is very expensive.

一方、特殊な装置を用いて、論理的なアドレスあるいはホスト名に対応した物理アドレスを指定して指示を送り、装置のLEDを点灯させるような手段も公知の技術として知られている。維持管理を行う者は、点灯されたLEDを目当てに、障害が発生しているPCを物理的に識別し、そのPCの交換などを行うことができる。このような装置を用いたPCクラスタの構成方式では、PCの物理的な並びを考慮する必要がないので、前者の方式で問題となった、構築時のコストの削減が可能である。   On the other hand, means for sending a command by specifying a logical address or a physical address corresponding to a host name using a special device and lighting the LED of the device is also known as a known technique. A person who performs maintenance management can physically identify the PC in which the failure has occurred and use it to replace the PC. In the configuration method of the PC cluster using such a device, it is not necessary to consider the physical arrangement of the PCs. Therefore, it is possible to reduce the construction cost, which is a problem in the former method.

PCクラスタ上で扱われるアプリケーション・データはある有限の並列性を持ち、一定の台数以上のPCを用いて並列に計算しようとしても、PC数に応じた計算時間の短縮が困難であることが知られている。このため、大規模なPCクラスタを複数の部分的なPCクラスタに分割し、それぞれで、異なるデータを用いた計算(ジョブ)を同時に実行することが一般的に行われている。このような運用を行えば、1つ1つの部分的なPCクラスタで行われている並列計算をあまり効率の低下しない状態で実行できるため、同時に実行する複数のジョブを1つ1つ逐次的にすべてのPCを使って並列に実行するよりも、合計すると短い時間で実行することが可能である。   Application data handled on a PC cluster has a certain finite parallelism, and it is known that it is difficult to shorten the calculation time according to the number of PCs even if trying to calculate in parallel using a certain number of PCs or more. It has been. For this reason, it is a common practice to divide a large-scale PC cluster into a plurality of partial PC clusters and simultaneously execute calculations (jobs) using different data for each. If such an operation is performed, parallel computations performed in each partial PC cluster can be executed in a state where the efficiency is not lowered so much, so a plurality of jobs to be executed simultaneously are sequentially and one by one. It is possible to execute in a short time in total, compared to using all PCs in parallel.

このような分割運用に対応するためは、適切なネットワークの階層構成を採ることが高い性能を発揮させる上で重要な課題となる。多くのPCを接続しようとすると物理的に1つのスイッチには収容できなくなるため、一定数のPCを1つのスイッチに収容し、それらのスイッチを上位側のスイッチで接続する階層的な構成をとる場合が多い。階層構成をとる場合、上位側のネットワークのスループットを下位側のネットワークのスループットより高くすることが一般的に行われているが、コスト面から、上位側のネットワークのスループットを下位側のネットワークのスループットの合計と同等にすることは難しい。   In order to cope with such a divided operation, it is an important issue to achieve high performance to adopt an appropriate network hierarchy. If you try to connect many PCs, it will not be physically accommodated in one switch, so a certain number of PCs will be accommodated in one switch, and these switches will be connected in a hierarchical configuration. There are many cases. In the case of a hierarchical structure, it is common to make the throughput of the upper network higher than the throughput of the lower network, but from the cost perspective, the upper network throughput is lower than the lower network throughput. It is difficult to make it equal to the sum of

このような場合、並列計算を行うPCが同一のスイッチに収容されている方が、それらのPCが2つ以上のスイッチにまたがって収容され上位側のネットワークによって接続される方よりも、高い性能を発揮できる。これは、後者では上位側のネットワークが隘路となって、通信に待ちが生じ、性能が低下する可能性があるためである。このような性能の低下は、並列計算を行うために個々のPCが交換するデータのスループットの1つのスイッチに収容されたPCの数だけの合計が上位側のネットワークのスループットを上回る場合顕著となる。   In such a case, the performance of PCs that perform parallel computation in the same switch is higher than those that are accommodated across two or more switches and connected by a higher-level network. Can be demonstrated. This is because in the latter case, the network on the upper side becomes a bottleneck, waiting for communication may occur and performance may be reduced. Such a decrease in performance becomes significant when the total number of PCs accommodated in one switch in the throughput of data exchanged by individual PCs for performing parallel computation exceeds the throughput of the upper network. .

このようなPCの割り当ての不都合による性能低下を回避するため、並列計算用のジョブスケジューラは個々のPCが収容されたスイッチを識別し、同じスイッチに収容されたPCが並列計算に必要な数だけそろった段階で、同一のスイッチに収容されたPCのみを使って該並列計算を実行するような機能を有する。該機能を有効に活用するためには、論理的なPCに対しどのスイッチに収容されているかという属性を与える必要があるが、どのスイッチに収容されているかということは物理的な属性なので、うまく対応させるためにはPCクラスタを構成する際に問題となったような手作業が必要となる。例えば、PCの物理的な並びを物理アドレスに見立て、物理アドレスに対応して論理アドレスとホスト名を付与する。このような設定を行えば、PCの物理的な並びの上で何番目から何番目のPCが同一のスイッチに収容されているかどうかを識別することができ、特定のPCに対しどのスイッチに収容されているかという属性を与えることができる。しかし、このような作業はPCクラスタの構築でも問題点として指摘したように、PCクラスタを構成するPCの数が多い場合、非常に煩雑で、手作業ゆえに設定を間違える可能性があるだけでなく、PCクラスタを構築するための時間が長くなってしまうという問題があった。   In order to avoid performance degradation due to such inconvenience of allocation of PCs, the job scheduler for parallel calculation identifies the switch in which each PC is accommodated, and only the number of PCs accommodated in the same switch is necessary for parallel computation At the same stage, it has a function to execute the parallel calculation using only PCs accommodated in the same switch. In order to make effective use of this function, it is necessary to give an attribute as to which switch is accommodated to a logical PC. In order to make it compatible, it is necessary to perform manual work that has become a problem when configuring a PC cluster. For example, the physical arrangement of PCs is regarded as physical addresses, and logical addresses and host names are assigned corresponding to the physical addresses. If such a setting is made, it is possible to identify what number to what number PC is accommodated in the same switch in the physical array of PCs, and which switch accommodates a specific PC. Attribute can be given. However, as pointed out as a problem in PC cluster construction, such work is very complicated when there are many PCs that make up the PC cluster, and not only can settings be mistaken because of manual work. There was a problem that it took a long time to build a PC cluster.

そこで、本発明が解決しようとする課題は、PCクラスタを構成する個々のPCをその物理的な位置によらず任意のスイッチに接続することを許容して、PCクラスタを構築する際の手間を省き人的なコストを削減しながら、スイッチ間をまたがるPC上で並列ジョブを実行することによる性能の低下を回避することができるPCクラスタの構築技術を提供することにある。   Therefore, the problem to be solved by the present invention is to allow the individual PCs constituting the PC cluster to be connected to an arbitrary switch regardless of its physical position, and to save time and labor when building the PC cluster. The object of the present invention is to provide a PC cluster construction technology capable of avoiding the performance degradation caused by executing parallel jobs on PCs across switches while reducing labor costs.

上記課題を解決するための第1の発明は、
複数の端末を有するPCクラスタシステムであって、
前記複数の端末を少なくとも1つ以上のグループにするグループ化手段と、
前記端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
を有することを特徴とする。
The first invention for solving the above-described problems is
A PC cluster system having a plurality of terminals,
Grouping means for grouping the plurality of terminals into at least one group;
Logical address providing means for collecting physical addresses of the terminals, and for each collected physical address, a logical address including identification information that can uniquely identify a group to which the terminal having the physical address belongs;
It has physical address / logical address list generation means for associating the physical address with a logical address assigned to the physical address to generate a physical address / logical address list.

上記課題を解決するための第2の発明は、上記第1の発明において、
論理アドレスとホスト名とを対応付けて論理アドレス・ホスト名リストを生成する論理アドレス・ホスト名リスト生成手段
を有することを特徴とする。
According to a second invention for solving the above-mentioned problem, in the first invention,
It has a logical address / host name list generating means for generating a logical address / host name list by associating a logical address with a host name.

上記課題を解決するための第3の発明は、上記第1又は第2の発明において、
前記グループ化手段は、グループ同士の通信を遮断するように構成されていることを特徴とする。
According to a third invention for solving the above-described problem, in the first or second invention,
The grouping means is configured to block communication between groups.

上記課題を解決するための第4の発明は、
サーバであって、
PCクラスタを構成している端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
を有することを特徴とする。
A fourth invention for solving the above-described problem is
A server,
A logical address that collects the physical addresses of the terminals that make up the PC cluster and gives each collected physical address a logical address that includes identification information that can uniquely identify the group to which the terminal having the physical address belongs. Granting means;
It has physical address / logical address list generation means for associating the physical address with a logical address assigned to the physical address to generate a physical address / logical address list.

上記課題を解決するための第5の発明は、
アドレス付与方法であって、
複数の端末を少なくとも1つ以上のグループにするグループ化ステップと、
前記グループのうち、1つのグループに属する端末とサーバとのみとを通信させるように設定する設定ステップと、
前記設定に基づいて、通信できる端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与ステップと、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを前記グループ毎に生成する物理アドレス・論理アドレスリスト生成ステップと、
前記グループ毎に生成された物理アドレス・論理アドレスリストを1つに統合する統合ステップと
を有することを特徴とする。
A fifth invention for solving the above-described problem is
An address assignment method,
A step of grouping a plurality of terminals into at least one group;
A setting step for setting only terminals and servers belonging to one group to communicate with each other among the groups;
A logic that collects physical addresses of terminals that can communicate based on the setting, and assigns a logical address including identification information that can uniquely identify a group to which the terminal having the physical address belongs to each of the collected physical addresses. An address assignment step;
A physical address / logical address list generating step for generating a physical address / logical address list for each group by associating the physical address with a logical address given to the physical address;
An integration step of integrating the physical address / logical address list generated for each group into one.

上記課題を解決するための第6の発明は、上記第5の発明において、
論理アドレスとホスト名とを対応付けて論理アドレス・ホスト名リストを生成する論理アドレス・ホスト名リスト生成ステップ
を有することを特徴とする。
A sixth invention for solving the above-described problem is the above-mentioned fifth invention,
It has a logical address / host name list generation step for generating a logical address / host name list by associating a logical address with a host name.

上記課題を解決するための第7の発明は、上記第5又は第6の発明において、
前記グループ化ステップは、グループ同士の通信を遮断する遮断ステップを有することを特徴とする。
A seventh invention for solving the above-mentioned problems is the fifth or sixth invention,
The grouping step includes a blocking step for blocking communication between groups.

上記課題を解決するための第8の発明は、
複数の端末を有するPCクラスタシステムのプログラムであって、前記プログラムは前記PCクラスタシステムを、
前記複数の端末を少なくとも1つ以上のグループにするグループ化手段と、
前記端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
して機能させることを特徴とする。
An eighth invention for solving the above-mentioned problems is
A PC cluster system program having a plurality of terminals, wherein the program
Grouping means for grouping the plurality of terminals into at least one group;
Logical address providing means for collecting physical addresses of the terminals, and for each collected physical address, a logical address including identification information that can uniquely identify a group to which the terminal having the physical address belongs;
The physical address and the logical address assigned to the physical address are associated with each other to function as a physical address / logical address list generating unit that generates a physical address / logical address list.

上記課題を解決するための第9の発明は、
サーバのプログラムであって、前記プログラムは前記サーバを、
PCクラスタを構成している端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
して機能させることを特徴とする。
The ninth invention for solving the above-mentioned problems is
A server program, said program comprising:
A logical address that collects the physical addresses of the terminals that make up the PC cluster and gives each collected physical address a logical address that includes identification information that can uniquely identify the group to which the terminal having the physical address belongs. Granting means;
The physical address and the logical address assigned to the physical address are associated with each other to function as a physical address / logical address list generating unit that generates a physical address / logical address list.

本発明のPCクラスタシステムでは、PC(端末)をその物理的な位置にとらわれずに、任意にスイッチに収容(接続)する。   In the PC cluster system of the present invention, a PC (terminal) is arbitrarily accommodated (connected) in a switch without being constrained by its physical location.

サブネットワーク構成部1によって、サーバがある階層の1つのスイッチに収容されているPCに対してのみ通信できるようにネットワークを分割する。   The subnetwork configuration unit 1 divides the network so that the server can communicate only with a PC accommodated in one switch in a certain hierarchy.

物理アドレス収集部11は、そのスイッチに収容された個々のPCの物理アドレスを収集する。   The physical address collection unit 11 collects physical addresses of individual PCs accommodated in the switch.

サーバは、物理アドレス収集部11が収集した物理アドレスに対して該物理アドレスに対応するPCが収容されているスイッチを一意に識別できる論理アドレスを割り当てる。   The server assigns to the physical address collected by the physical address collection unit 11 a logical address that can uniquely identify the switch in which the PC corresponding to the physical address is accommodated.

部分物理アドレス・論理アドレスリスト生成部2は、該スイッチに収容されたすべてのPCの物理アドレスと論理アドレスとの組が登録された部分物理アドレス・論理アドレスリスト21を生成する。   The partial physical address / logical address list generation unit 2 generates a partial physical address / logical address list 21 in which pairs of physical addresses and logical addresses of all PCs accommodated in the switch are registered.

サーバは、必要に応じて、該スイッチに収容されているPCの論理アドレスに対してホスト名を割り当てる。   The server assigns a host name to the logical address of the PC accommodated in the switch as necessary.

部分論理アドレス・ホスト名リスト生成部3は、該スイッチに収容されたすべてのPCの論理アドレスとホスト名との組が登録された部分論理アドレス・ホスト名リスト31を生成する。一般的に、OS(Operating
System)上でPCはホスト名で識別されるので、ホスト名から該ホスト名が割り当てられたPCが収容されたスイッチが一意に識別できることが好ましい。これらの作業を分割されたすべてのサブネットワークに対し、同時、あるいは逐次に行う。
The partial logical address / host name list generation unit 3 generates a partial logical address / host name list 31 in which pairs of logical addresses and host names of all PCs accommodated in the switch are registered. Generally, OS (Operating
Since the PC is identified by the host name on the (System), it is preferable that the switch accommodating the PC to which the host name is assigned can be uniquely identified from the host name. These operations are performed simultaneously or sequentially on all divided sub-networks.

物理アドレス・論理アドレスリスト統合部4と論理アドレス・ホスト名リスト統合部5とは、それぞれ、すべてのサブネットワークの部分物理アドレス・論理アドレスリスト21と部分論理アドレス・ホスト名リスト31とをそれぞれ統合し、PCクラスタを構成するすべてのPCが登録された物理アドレス・論理アドレスリスト41と論理アドレス・ホスト名リスト51とを生成する。   The physical address / logical address list integration unit 4 and the logical address / host name list integration unit 5 integrate the partial physical address / logical address list 21 and the partial logical address / host name list 31 of all the sub-networks, respectively. Then, a physical address / logical address list 41 and a logical address / host name list 51 in which all PCs constituting the PC cluster are registered are generated.

PCクラスタを起動すると、個々のPCは物理アドレスを指定してサーバに論理アドレスの付与を要求する。一旦論理アドレスを得たら、サーバは、該論理アドレスを記録し、次回以降論理アドレスの付与を要求しないように設定を行っても良い。サーバは物理アドレス・論理アドレスリスト41を参照し、個々のPCに論理アドレスを付与する。   When a PC cluster is activated, each PC specifies a physical address and requests the server to assign a logical address. Once the logical address is obtained, the server may record the logical address and perform setting so as not to request the provision of the logical address from the next time. The server refers to the physical address / logical address list 41 and assigns a logical address to each PC.

この論理アドレスの付与及びPCへの論理アドレスの設定を手作業で行ってもなんら問題はない。また、サーバは論理アドレスとホスト名との変換を行っていて、個々のPCはホスト名を指定して論理アドレスを検索する、また、論理アドレスを指定してホスト名を検索することができる。   There is no problem even if this logical address is assigned and the logical address is set to the PC manually. Further, the server performs conversion between the logical address and the host name, and each PC can search the logical address by designating the host name, and can retrieve the host name by designating the logical address.

サーバは、論理アドレス・ホスト名リスト51を参照し、個々のPCから要求された検索を行う。なお、論理アドレス・ホスト名のリストを個々のPCに送り、PC側で検索を行ってもなんら問題はない。例えば、運用管理システム上でPCの属性を設定する場合、その内容から該論理アドレスを割り当てられたPCがどのスイッチに収容されているかを一意に識別可能な論理アドレスが付与されていて、また、その内容から該ホスト名を割り当てられたPCがどのスイッチに収容されているかを一意に識別可能なホスト名が付与されているので、該PCが収容されているスイッチに関する物理的な属性を容易に設定することができる。該設定された属性から、前記運用管理システムは並列計算に使用するべきPCを判断することができる。   The server refers to the logical address / host name list 51 and performs a search requested by each PC. There is no problem even if a list of logical addresses and host names is sent to each PC and a search is performed on the PC side. For example, when setting an attribute of a PC on the operation management system, a logical address that can uniquely identify which switch contains the PC to which the logical address is assigned is given. Since the host name that can uniquely identify which switch contains the PC to which the host name is assigned is assigned based on the contents, physical attributes relating to the switch in which the PC is accommodated can be easily set. Can be set. From the set attribute, the operation management system can determine a PC to be used for parallel computation.

本発明よると、PCクラスタを構成する個々のPCをその物理的な位置によらず、任意のスイッチに接続することを許容してPCクラスタを構築する際の手間を省き、人的なコストを削減する。   According to the present invention, it is possible to connect the individual PCs constituting the PC cluster to an arbitrary switch regardless of the physical position, thereby saving the labor for building the PC cluster and reducing the human cost. Reduce.

更に、PCクラスタを構成する個々のPCに、該PCが接続されたスイッチが識別できるIPアドレスとホスト名とを付与することができる。   Furthermore, an IP address and a host name that can be identified by the switch to which the PC is connected can be assigned to each PC constituting the PC cluster.

また、運用管理システム上で、PCの属性情報として、PCが収容されたスイッチに関する属性を付与することによって、スイッチ間をまたがるような形で並列ジョブが実行されないようにすることができ、スイッチ間をまたがるPC上で並列ジョブを実行することによる性能の低下を回避することができる。   In addition, by assigning attributes related to switches that contain PCs as attribute information of PCs on the operation management system, it is possible to prevent parallel jobs from being executed across switches. It is possible to avoid performance degradation caused by executing parallel jobs on PCs that straddle.

本発明の実施の形態について図面を参照して詳細に説明する。   Embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本実施の形態のPCクラスタシステムの概要図である。   FIG. 1 is a schematic diagram of a PC cluster system according to the present embodiment.

本実施の形態のシステムは、サーバとスイッチと複数の端末(PC:Personal Computer)とを有する。   The system according to the present embodiment includes a server, a switch, and a plurality of terminals (PC: Personal Computer).

サーバは、PC対して各種命令やデータを提供するものである。   The server provides various commands and data to the PC.

PCは、スイッチに任意に接続され、PCクラスタを構成している。   The PC is arbitrarily connected to the switch to form a PC cluster.

図2は、本実施の形態におけるPCクラスタシステムのブロック図である。   FIG. 2 is a block diagram of the PC cluster system in the present embodiment.

スイッチは、サブネットワーク構成部1を有する。   The switch includes a subnetwork configuration unit 1.

サブネットワーク構成部1は、PCをグループ化し、グループ毎に1つのスイッチを構成するようにパーティショニングを行う。これにより、1つのスイッチにグループ化されたPCを収容(接続)することによって、ネットワークを構成している複数の端末を複数のサブネットワークにする。尚、本発明において、サブネットワーク毎に構成されているスイッチのことを下位スイッチとし、下位スイッチをまとめるスイッチを上位スイッチとする。   The subnetwork configuration unit 1 groups PCs and performs partitioning so as to configure one switch for each group. Accordingly, by accommodating (connecting) the grouped PCs in one switch, a plurality of terminals constituting the network are converted into a plurality of sub-networks. In the present invention, a switch configured for each sub-network is a lower switch, and a switch for grouping the lower switches is an upper switch.

サーバは、物理アドレス収集部11と、部分物理アドレス・論理アドレスリスト生成部2と、部分論理アドレス・ホスト名リスト生成部3と、部分物理アドレス・論理アドレスリスト統合部4と、部分論理アドレス・ホスト名リスト統合部5とを有する。サーバは、上記以外に、各種制御を行う制御部とDHCP(Dynamic Host Configuration Protocol)サーバとしての機能とを有する。   The server includes a physical address collection unit 11, a partial physical address / logical address list generation unit 2, a partial logical address / host name list generation unit 3, a partial physical address / logical address list integration unit 4, a partial logical address / And a host name list integration unit 5. In addition to the above, the server has a control unit that performs various controls and a function as a DHCP (Dynamic Host Configuration Protocol) server.

部分物理アドレス・論理アドレスリスト生成部2は、下位スイッチ毎に、その下位スイッチに収容されている全PCの物理アドレスと論理アドレスとが対応付けられて登録された部分物理アドレス・論理アドレスリスト21を生成する。更に、部分物理アドレス・論理アドレスリスト生成部2は、ネットワークを構成するすべての下位スイッチに対して同様な処理を繰り返すことによって、下位スイッチの数と同じ数の部分物理アドレス・論理アドレスリスト21を生成する。尚、本実施の形態では物理アドレスとしてPCのMACアドレス、論理アドレスとしてPCに割り振られるIPアドレスを用いて説明するがこの限りではない。   The partial physical address / logical address list generation unit 2 registers, for each lower switch, a partial physical address / logical address list 21 in which the physical addresses and logical addresses of all PCs accommodated in the lower switch are registered in association with each other. Is generated. Further, the partial physical address / logical address list generation unit 2 repeats the same processing for all the lower switches constituting the network, thereby creating the same number of partial physical addresses / logical address lists 21 as the number of lower switches. Generate. In this embodiment, the description will be made using the MAC address of the PC as the physical address and the IP address assigned to the PC as the logical address, but this is not restrictive.

部分論理アドレス・ホスト名リスト生成部3は、下位スイッチ毎に、その下位スイッチに収容されている全PCのホスト名を論理アドレスに対応付けて登録した部分論理アドレス・ホスト名リスト31を生成する。更に、ネットワークを構成するすべての下位スイッチに対し同様な処理を繰り返すことによって、下位スイッチの数と同じ数の部分論理アドレス・ホスト名リスト31を生成する。尚、部分論理アドレス・ホスト名リストは、必要に応じて生成される。   The partial logical address / host name list generation unit 3 generates, for each lower switch, a partial logical address / host name list 31 in which the host names of all PCs accommodated in the lower switch are registered in association with the logical addresses. . Further, by repeating the same processing for all the lower switches constituting the network, the same number of partial logical address / host name lists 31 as the number of lower switches are generated. The partial logical address / host name list is generated as necessary.

部分物理アドレス・論理アドレスリスト統合部4は、下位スイッチの数と同一の数だけ生成された部分物理アドレス・論理アドレスリスト21から、物理アドレス・論理アドレスリスト41を作成する。この物理アドレス・論理アドレスリスト41は、各物理アドレス・論理アドレスリスト21を統合したリストである。   The partial physical address / logical address list integration unit 4 creates a physical address / logical address list 41 from the partial physical addresses / logical address list 21 generated in the same number as the number of lower switches. The physical address / logical address list 41 is a list obtained by integrating the physical addresses / logical address list 21.

部分論理アドレス・ホスト名リスト統合部5は、下位スイッチの数と同一の数だけ生成された部分論理アドレス・ホスト名リスト31から論理アドレス・ホスト名リスト51を作成する。この論理アドレス・ホスト名リスト51は、各論理アドレス・ホスト名リスト31を統合したリストである。尚、論理アドレス・ホスト名リスト51は、必要に応じて生成される。   The partial logical address / host name list integration unit 5 creates a logical address / host name list 51 from the partial logical address / host name list 31 generated by the same number as the number of lower switches. The logical address / host name list 51 is a list obtained by integrating the logical address / host name lists 31. The logical address / host name list 51 is generated as necessary.

続いて、図2及び図3を参照して本実施の形態の動作について詳細に説明する。尚、本実施の形態では、IPMI(Intelligent Platform Management Initiative)インターフェースを用いて、電源の制御を利用する場合について説明する。IPMIインターフェースを用いた場合、個々のPCのIPMIインターフェースに付与したIPアドレスを指定することによって、任意のPCの電源を投入し、落とすことができる。また、電源が投入されて稼動状態にあるかどうかなどを確認できる。尚、IPMIインターフェースを用いたPCの電源の制御、状態の監視は周知の技術を用いて行われる。   Next, the operation of the present embodiment will be described in detail with reference to FIGS. In the present embodiment, a case will be described in which power control is used using an IPMI (Intelligent Platform Management Initiative) interface. When using the IPMI interface, you can turn on and off any PC by specifying the IP address assigned to the IPMI interface of each PC. In addition, it is possible to check whether the power is turned on and in an operating state. Note that control of the power supply of the PC and monitoring of the state using the IPMI interface are performed using a well-known technique.

まず、ネットワーク全体で通信ができるように接続する。この状態で、サーバは、例えばMagic Packet等を利用して、ネットワーク内のすべてのPCの電源を起動し、全PCの仮設定用のOS(Operating
System)を立ち上げる(ステップS401)。仮設定用のOSは、仮IPアドレスの振り分けをサーバに要求し、この要求に対するサーバからの応答をIPMIインターフェース用の仮IPアドレスとして設定した後(ステップS402)、自らシャットダウンする(ステップS403)。
First, it connects so that it can communicate in the whole network. In this state, the server starts up the power of all PCs in the network using, for example, Magic Packet, etc.
System) is started (step S401). The temporary setting OS requests the server to allocate a temporary IP address, sets a response from the server to this request as a temporary IP address for the IPMI interface (step S402), and then shuts down itself (step S403).

サーバは、自信が発行したIPMIインターフェース用の仮IPアドレスを持つすべてのPCの電源が落ちていることを確認する(ステップS404)。   The server confirms that all PCs having temporary IP addresses for the IPMI interface issued by the self have been turned off (step S404).

サーバがすべてのPCの電源が落ちていることを確認した後、サブネットワーク構成部1はサブネットワークを生成し(ステップS405)、更にある1つの下位スイッチに収容されているPCとサーバとの間でのみ通信ができるサブネットワークを構成する(ステップS406)。更に、PCが収容される下位スイッチ同士の通信を上位スイッチにおいて遮断する。   After the server confirms that all the PCs are powered off, the sub-network configuration unit 1 generates a sub-network (step S405), and further, between the PC and the server accommodated in one lower switch. A sub-network that can communicate only with is configured (step S406). Further, communication between lower switches in which PCs are accommodated is blocked at the upper switches.

この状態で、サーバは、IPMIインターフェースを用いて、全PCの仮IPアドレスを指定してPCの電源を投入するようにする(ステップS407)。この時、ある1つの下位スイッチに収容されているPCとサーバとの間でのみ通信が出来るサブネットワークしか構成されていないので、この下位スイッチに収容されているPCのみの電源が投入される。他の下位スイッチに収容されていて、通信できないPCに対する電源投入の指示は無視される。   In this state, the server uses the IPMI interface to specify the temporary IP addresses of all PCs and turn on the PCs (step S407). At this time, since only the sub-network that can communicate only between the PC accommodated in a certain lower switch and the server is configured, the power of only the PC accommodated in this lower switch is turned on. Power-on instructions for PCs that are housed in other lower switches and cannot communicate are ignored.

PCの電源が起動されると、PCは自身のMACアドレスを指定してIPアドレスの取得要求をサーバに要求する。サーバはDHCP(Dynamic Host Configuration Protocol)サーバとしての機能を有するので、PCからのIPアドレスの取得要求に対してIPアドレスを付与し(ステップS408)、このことをログに記録していく。サーバは、IPアドレスから、特定のスイッチに収容されているかどうかを認識できるようにするために、例えば、システムのネットワークとして192.168.0.0、ネットマスク255.255.0.0のネットワークを設定し、スイッチ毎に異なるIPアドレス、例えば、192.168.n.0(ここでnはスイッチを一意に識別する識別情報)を付与する。   When the PC is powered on, the PC specifies its own MAC address and requests the server to obtain an IP address. Since the server functions as a DHCP (Dynamic Host Configuration Protocol) server, an IP address is assigned to an IP address acquisition request from the PC (step S408), and this is recorded in a log. In order to be able to recognize whether the server is accommodated in a specific switch from the IP address, for example, a network with 192.168.0.0 and a net mask of 255.255.0.0 is set as the system network, and the server is different for each switch. An IP address, for example, 192.168.n.0 (where n is identification information that uniquely identifies the switch) is assigned.

部分物理アドレス・論理アドレス生成部2は、サーバのDHCPのログから、PCのMACアドレスと、このMACアドレスに対して付与したIPアドレスとを対応付けて、部分物理アドレス・論理アドレスリスト21を作成する(ステップS409)。本実施の形態ではサーバのDHCP機能部が物理アドレスであるMACアドレスを採取する物理アドレス収集部11として機能している。   The partial physical address / logical address generation unit 2 creates a partial physical address / logical address list 21 by associating the MAC address of the PC with the IP address assigned to the MAC address from the DHCP log of the server. (Step S409). In this embodiment, the DHCP function unit of the server functions as a physical address collection unit 11 that collects a MAC address that is a physical address.

一般的に、OS上ではPCはホスト名によって識別される。OS上でIPアドレスとホスト名との対応のデータベースが必要になる場合、必要に応じて部分論理アドレス・ホスト名生成部3によってPCのIPアドレスとそれに対応するホスト名との組のリストである部分論理アドレス・ホスト名リスト31を作成する(ステップS410)。サーバは、ホスト名を命名する際、ホスト名から特定のスイッチに収容されているかどうかを確認するために、ホスト名をシステムを識別する名前とスイッチを一意に識別する情報Nとスイッチ内で何番目のPCであるかを示す番号との組み合わせというような規則でホスト名を命名する。   Generally, a PC is identified by a host name on the OS. When a database for correspondence between IP addresses and host names is required on the OS, the partial logical address / host name generation unit 3 makes a list of combinations of PC IP addresses and corresponding host names as necessary. The partial logical address / host name list 31 is created (step S410). When naming a host name, the server uses the host name to identify the system, the information that uniquely identifies the switch, and the information in the switch to check whether the host name is contained in a specific switch. The host name is named according to a rule such as a combination with a number indicating whether it is the second PC.

1つの下位スイッチに対する部分物理アドレス・論理アドレスリスト21と、必要に応じて作成される部分論理アドレス・ホスト名リスト31との作成が完了した段階で、サーバはIPMIインターフェースを用いて該スイッチに接続されたすべてのPCの電源を落とす(ステップS411)。   When the creation of the partial physical address / logical address list 21 for one lower switch and the partial logical address / host name list 31 created as necessary is completed, the server connects to the switch using the IPMI interface. All the PCs that have been turned off are turned off (step S411).

サーバはIPMIインターフェースにより、該スイッチに収容されたすべてのPCの電源が落ちたことを確認した後、上述したように、サブネットワーク構成部1によって次の下位スイッチのサブネットワークを構成し、次のスイッチに対して同様な処理を行う。該スイッチに対する部分物理アドレス・論理アドレスリスト21と必要に応じて部分論理アドレス・ホスト名リスト31とを作成する。このような処理を、システムを構成する下位スイッチの数だけ繰り返す(ステップS412)。   After confirming that the power of all the PCs accommodated in the switch has been turned off by the IPMI interface, the server configures the subnetwork of the next lower switch by the subnetwork configuration unit 1 as described above. Similar processing is performed on the switch. A partial physical address / logical address list 21 for the switch and a partial logical address / host name list 31 are created as necessary. Such processing is repeated by the number of lower switches constituting the system (step S412).

すべての下位スイッチに対する部分物理アドレス・論理アドレスリスト21と部分論理アドレス・ホスト名リスト31との作成が完了した時点で、部分物理アドレス・論理アドレスリスト統合部4は部分物理アドレス・論理アドレスリスト21からPCクラスタを構成するすべてのPCが登録された物理アドレス・論理アドレスリスト41を生成する(ステップS413)。更に、部分論理アドレス・ホスト名リスト統合部5は部分論理アドレス・ホスト名リスト31から、PCクラスタを構成するすべてのPCが登録された論理アドレス・ホスト名リスト51を作成する(ステップS414)。   When the creation of the partial physical address / logical address list 21 and the partial logical address / host name list 31 for all the lower switches is completed, the partial physical address / logical address list integration unit 4 performs the partial physical address / logical address list 21. To generate a physical address / logical address list 41 in which all PCs constituting the PC cluster are registered (step S413). Further, the partial logical address / host name list integration unit 5 creates a logical address / host name list 51 in which all PCs constituting the PC cluster are registered from the partial logical address / host name list 31 (step S414).

本実施例のように各スイッチに対応した処理を逐次的に行う場合、作成する部分物理アドレス・論理アドレスリスト21と必要に応じて作成する部分論理アドレス・ホスト名リスト31とを、それぞれ、物理アドレス・論理アドレスリスト41と論理アドレス・ホスト名リスト42として、内容を追加していけば、すべてのスイッチに対する処理が完了した時点で必要とするリストの作成が完了する。したがって、本実施例では、部分物理アドレス・論理アドレスリスト統合部4と部分論理アドレス・ホスト名リスト統合部5との機能は、それぞれ、部分物理アドレス・論理アドレスリスト生成部2と部分論理アドレス・ホスト名リスト生成部3とに集約されている。   When processing corresponding to each switch is sequentially performed as in this embodiment, a partial physical address / logical address list 21 to be created and a partial logical address / host name list 31 to be created as needed are physically If the contents are added as the address / logical address list 41 and the logical address / host name list 42, creation of the necessary lists is completed when the processing for all the switches is completed. Therefore, in this embodiment, the functions of the partial physical address / logical address list integration unit 4 and the partial logical address / host name list integration unit 5 are respectively the partial physical address / logical address list generation unit 2 and the partial logical address / The host name list generation unit 3 collects them.

運用管理システムは、物理アドレス・論理アドレスリスト41の内容からDHCP用の設定ファイルを作成する。必要に応じて、論理アドレス・ホスト名リスト51の内容をNIS(Network Information Service)のデータベースに登録し、ホスト名に基づいてPCの指定ができるようにする。   The operation management system creates a DHCP configuration file from the contents of the physical address / logical address list 41. If necessary, the contents of the logical address / host name list 51 are registered in an NIS (Network Information Service) database so that a PC can be designated based on the host name.

さらに運用管理システムのPCの属性情報として、IPアドレスあるいはホスト名から該PCが収容されたスイッチを識別し、該スイッチに収容されていることを示す属性を設定する。例えば、大規模なPCクラスタシステムの運用管理システムとしてよく利用されているLSF(Load Sharing Facility)では、プロセッサの属性として色属性を定義することできる。   Further, as the PC attribute information of the operation management system, the switch in which the PC is accommodated is identified from the IP address or the host name, and an attribute indicating that the PC is accommodated is set. For example, in an LSF (Load Sharing Facility) often used as an operation management system for a large-scale PC cluster system, a color attribute can be defined as a processor attribute.

この場合、スイッチに特定の色を付与して、同じスイッチに収容されたPCには同じ色の属性を与える。このような設定を行うことにより、LSFは複数のPCを必要とする並列ジョブを実行する場合、同じ色の属性をもつPCが必要数だけ集まった時点で該並列ジョブの実行を開始するようにすることができる。   In this case, a specific color is assigned to the switch, and the same color attribute is given to PCs accommodated in the same switch. With this setting, when executing a parallel job that requires multiple PCs, the LSF will start executing the parallel job when the required number of PCs with the same color attribute have gathered. can do.

このような管理を行えば、並列に実行するジョブを同一のスイッチに収容されたPCの上で実行することができ、上記課題で述べたように、スイッチ間をまたがるPC上で実行した場合の性能の低下を回避できる。   With this kind of management, jobs that are executed in parallel can be executed on PCs that are accommodated in the same switch, and as described in the above problem, when executed on PCs that span between switches. Performance degradation can be avoided.

なお、個々のPCがIPアドレスあるいはホスト名からどのスイッチに収容されているかを識別することは可能だか、物理的なPCの位置は不定である。PCの物理的な位置によらず任意のスイッチに接続することを許容して、クラスタを構築する際の手間を削減し、人的なコストを削減することが目的であるので、これは自明なことである。   Note that it is possible to identify which switch contains each PC from the IP address or host name, and the location of the physical PC is undefined. This is self-evident because the purpose is to allow connection to any switch regardless of the physical location of the PC, reduce the time and effort required to build a cluster, and reduce human costs. That is.

上記の設定が完了後、PCで最初にOSを起動した際に、自らに与えられたIPアドレスに対応して一意に定まるIPアドレスをIPMIインターフェース用のIPアドレスとして再設定する。例えば、192.168.1.1のPCのIPMIポートには192.168.101.1のIPアドレスを付与する。これによって、運用時に障害が生じた場合は、もし装置にLEDの表示機能があれば、障害が発生したと想定されるPCのIPアドレスに対応する該PCのIPMIインターフェース用のIPアドレスを指定してLEDを点灯させることができる。運用保守を行うものは該LEDの表示によって障害が生じたPCを物理的に特定し、交換などの作業を行うことができる。   After the above settings are completed, when the OS is first started on the PC, the IP address uniquely determined corresponding to the IP address assigned to itself is reset as the IP address for the IPMI interface. For example, the IP address of 192.168.101.1 is assigned to the IPMI port of the PC with 192.168.1.1. As a result, if a failure occurs during operation, if the device has an LED display function, specify the IP address for the IPMI interface of the PC that corresponds to the IP address of the PC that is assumed to have failed. LED can be turned on. Those who perform operation and maintenance can physically identify the PC on which the failure has occurred by the display of the LED, and can perform operations such as replacement.

尚、上記実施の形態では、IPMIを用いた場合について説明した。しかし、電源の遮断はOSから可能であるし、電源の投入もWOL(Wakeup on LAN)使うあるいは電源スイッチを逐次操作すればよいので、IPMIインターフェースがなくても問題はない。ただし、電源を逐次操作する場合、選択的な電源の投入ができないので、この場合はスイッチの数だけのサーバを用意し、上記実施の形態ではスイッチ毎逐次に行う部分物理アドレス・論理アドレスリスト21の作成を同時に行えるようにすれば良い。このためには安価なノートPCなどをサーバとして用意すればよく、手作業をなくして人的コストを削減できる効果と比べると、特に問題とはならない。   In the above embodiment, the case where IPMI is used has been described. However, power can be shut down from the OS, and power can be turned on using WOL (Wakeup on LAN) or operating the power switch sequentially, so there is no problem even if there is no IPMI interface. However, when the power supply is sequentially operated, the selective power supply cannot be turned on. In this case, as many servers as the number of switches are prepared. In the above embodiment, the partial physical address / logical address list 21 sequentially executed for each switch. Can be created at the same time. For this purpose, an inexpensive notebook PC or the like may be prepared as a server, which is not a problem as compared with the effect of reducing human costs by eliminating manual work.

次に、本実施の形態の効果について説明する。   Next, the effect of this embodiment will be described.

本実施の形態では、IPMIインターフェースによってPCの電源を制御しながら、サブネットワーク構成部1によってサブネットワークの構成を変更して、下位側のスイッチに収容されたPCに対する部分物理アドレス・論理アドレスリスト21と必要に応じて部分論理アドレス・ホスト名リスト31を逐次作成する。   In this embodiment, while controlling the power supply of the PC by the IPMI interface, the subnetwork configuration unit 1 changes the configuration of the subnetwork, and the partial physical address / logical address list 21 for the PC accommodated in the lower switch is provided. The partial logical address / host name list 31 is sequentially created as necessary.

そして、最終的には物理アドレス・論理アドレスリスト41からDHCPサーバ用の設定ファイルと論理アドレス・ホスト名リスト51からNISサーバに登録するホスト名情報を作成する。   Finally, the DHCP server setting file is created from the physical address / logical address list 41 and the host name information to be registered in the NIS server is created from the logical address / host name list 51.

論理アドレス、ホスト名はともに該論理アドレス、ホスト名が付与されたPCがどのスイッチに収容されているかを位置に識別できるような命名規則に基づき決められていて、LSFなどの運用管理システムで設定されるPC固有の属性情報として、該PCがどのスイッチに接続されているかの属性を与えることができる。   Both the logical address and host name are determined based on a naming rule that can identify the switch where the PC with the logical address and host name is stored, and is set by an operation management system such as LSF. As the PC-specific attribute information, an attribute indicating which switch the PC is connected to can be given.

これによって、PCの物理的な位置によらず任意のスイッチに接続することを許容して、クラスタを構築する際の手間を省き人的なコストを削減する。更に、スイッチ間をまたがるPC上で並列ジョブを実行することによる性能の低下を回避できる。   This allows connection to an arbitrary switch regardless of the physical location of the PC, saving labor when building a cluster and reducing human costs. Furthermore, it is possible to avoid performance degradation caused by executing parallel jobs on PCs that span switches.

また、運用管理システム上でPCの属性を設定する場合、その内容から該論理アドレスを割り当てられたPCがどのスイッチに収容されているかを一意に識別可能な論理アドレスが付与されていて、また、その内容から該ホスト名を割り当てられたPCがどのスイッチに収容されているかを一意に識別可能なホスト名が付与されているので、該PCが収容されているスイッチに関する物理的な属性を容易に設定することができる。該設定された属性から、前記運用管理システムは並列計算に使用するべきPCを判断することができる。   In addition, when setting the attributes of the PC on the operation management system, a logical address that can uniquely identify which switch contains the PC to which the logical address is assigned is given, and Since the host name that can uniquely identify which switch contains the PC to which the host name is assigned is assigned based on the contents, physical attributes relating to the switch in which the PC is accommodated can be easily set. Can be set. From the set attribute, the operation management system can determine a PC to be used for parallel computation.

図1は、本発明の実施の形態のPCクラスタシステムの概要図である。FIG. 1 is a schematic diagram of a PC cluster system according to the embodiment of this invention. 図2は、本発明の実施の形態のPCクラスタシステムのブロック図である。FIG. 2 is a block diagram of the PC cluster system according to the embodiment of this invention. 図3は、本発明の実施の形態のPCクラスタシステムの概念図である。FIG. 3 is a conceptual diagram of the PC cluster system according to the embodiment of this invention. 図4は、本発明の実施の形態の動作を示す図である。FIG. 4 is a diagram showing the operation of the embodiment of the present invention.

符号の説明Explanation of symbols

1 サブネットワーク構成部
2 部分物理アドレス・論理アドレスリスト生成部
3 部分論理アドレス・ホスト名リスト生成部
4 部分物理アドレス・論理アドレスリスト統合部
5 部分論理アドレス・ホスト名リスト統合部
11 物理アドレス収集部
21 部分物理アドレス・論理アドレスリスト
31 部分論理アドレス・ホスト名リスト
41 物理アドレス・論理アドレスリスト
51 論理アドレス・ホスト名リスト
DESCRIPTION OF SYMBOLS 1 Subnetwork structure part 2 Partial physical address / logical address list generation part 3 Partial logical address / host name list generation part 4 Partial physical address / logical address list integration part 5 Partial logical address / host name list integration part 11 Physical address collection part 21 Partial Physical Address / Logical Address List 31 Partial Logical Address / Host Name List 41 Physical Address / Logical Address List 51 Logical Address / Host Name List

Claims (9)

複数の端末を有するPCクラスタシステムであって、
前記複数の端末を少なくとも1つ以上のグループにするグループ化手段と、
前記端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
を有することを特徴とするPCクラスタシステム。
A PC cluster system having a plurality of terminals,
Grouping means for grouping the plurality of terminals into at least one group;
Logical address providing means for collecting physical addresses of the terminals, and for each collected physical address, a logical address including identification information that can uniquely identify a group to which the terminal having the physical address belongs;
A PC cluster system comprising physical address / logical address list generation means for generating a physical address / logical address list by associating the physical address with a logical address assigned to the physical address.
論理アドレスとホスト名とを対応付けて論理アドレス・ホスト名リストを生成する論理アドレス・ホスト名リスト生成手段
を有することを特徴とする請求項1に記載のPCクラスタシステム。
2. The PC cluster system according to claim 1, further comprising logical address / host name list generation means for generating a logical address / host name list by associating a logical address with a host name.
前記グループ化手段は、グループ同士の通信を遮断するように構成されていることを特徴とする請求項1又は請求項2に記載のPCクラスタシステム。   The PC cluster system according to claim 1, wherein the grouping unit is configured to block communication between groups. サーバであって、
PCクラスタを構成している端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
を有することを特徴とするサーバ。
A server,
A logical address that collects the physical addresses of the terminals that make up the PC cluster and gives each collected physical address a logical address that includes identification information that can uniquely identify the group to which the terminal having the physical address belongs. Granting means;
A server comprising: a physical address / logical address list generating means for generating a physical address / logical address list by associating the physical address with a logical address assigned to the physical address.
アドレス付与方法であって、
複数の端末を少なくとも1つ以上のグループにするグループ化ステップと、
前記グループのうち、1つのグループに属する端末とサーバとのみとを通信させるように設定する設定ステップと、
前記設定に基づいて、通信できる端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与ステップと、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを前記グループ毎に生成する物理アドレス・論理アドレスリスト生成ステップと、
前記グループ毎に生成された物理アドレス・論理アドレスリストを1つに統合する統合ステップと
を有することを特徴とするアドレス付与方法。
An address assignment method,
A step of grouping a plurality of terminals into at least one group;
A setting step for setting only terminals and servers belonging to one group to communicate with each other among the groups;
A logic that collects physical addresses of terminals that can communicate based on the setting, and assigns a logical address including identification information that can uniquely identify a group to which the terminal having the physical address belongs to each of the collected physical addresses. An address assignment step;
A physical address / logical address list generating step for generating a physical address / logical address list for each group by associating the physical address with a logical address given to the physical address;
And an integrating step of integrating the physical address / logical address list generated for each group into one.
論理アドレスとホスト名とを対応付けて論理アドレス・ホスト名リストを生成する論理アドレス・ホスト名リスト生成ステップ
を有することを特徴とする請求項5に記載のアドレス付与方法。
6. The address assigning method according to claim 5, further comprising a logical address / host name list generation step for generating a logical address / host name list by associating a logical address with a host name.
前記グループ化ステップは、グループ同士の通信を遮断する遮断ステップを有することを特徴とする請求項5又は請求項6に記載のアドレス付与方法。   7. The address assigning method according to claim 5, wherein the grouping step includes a blocking step for blocking communication between groups. 複数の端末を有するPCクラスタシステムのプログラムであって、前記プログラムは前記PCクラスタシステムを、
前記複数の端末を少なくとも1つ以上のグループにするグループ化手段と、
前記端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
して機能させることを特徴とするプログラム。
A PC cluster system program having a plurality of terminals, wherein the program
Grouping means for grouping the plurality of terminals into at least one group;
Logical address providing means for collecting physical addresses of the terminals, and for each collected physical address, a logical address including identification information that can uniquely identify a group to which the terminal having the physical address belongs;
A program that functions as a physical address / logical address list generation unit that generates a physical address / logical address list by associating the physical address with a logical address assigned to the physical address.
サーバのプログラムであって、前記プログラムは前記サーバを、
PCクラスタを構成している端末の物理アドレスを収集し、この収集した各物理アドレスに対して、その物理アドレスを有する端末が属するグループを一意に識別できる識別情報を含む論理アドレスを付与する論理アドレス付与手段と、
前記物理アドレスと、その物理アドレスに付与された論理アドレスとを対応付けて物理アドレス・論理アドレスリストを生成する物理アドレス・論理アドレスリスト生成手段と
して機能させることを特徴とするプログラム。
A server program, said program comprising:
A logical address that collects the physical addresses of the terminals that make up the PC cluster and gives each collected physical address a logical address that includes identification information that can uniquely identify the group to which the terminal having the physical address belongs. Granting means;
A program that functions as a physical address / logical address list generation unit that generates a physical address / logical address list by associating the physical address with a logical address assigned to the physical address.
JP2005338780A 2005-11-24 2005-11-24 PC cluster system, server, address assigning method, and program thereof Expired - Fee Related JP4304310B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005338780A JP4304310B2 (en) 2005-11-24 2005-11-24 PC cluster system, server, address assigning method, and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005338780A JP4304310B2 (en) 2005-11-24 2005-11-24 PC cluster system, server, address assigning method, and program thereof

Publications (2)

Publication Number Publication Date
JP2007148531A true JP2007148531A (en) 2007-06-14
JP4304310B2 JP4304310B2 (en) 2009-07-29

Family

ID=38209913

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005338780A Expired - Fee Related JP4304310B2 (en) 2005-11-24 2005-11-24 PC cluster system, server, address assigning method, and program thereof

Country Status (1)

Country Link
JP (1) JP4304310B2 (en)

Also Published As

Publication number Publication date
JP4304310B2 (en) 2009-07-29

Similar Documents

Publication Publication Date Title
WO2015176262A1 (en) Node interconnection apparatus, resource control node and server system
JP5132735B2 (en) Server system and server arrangement method
US20070110077A1 (en) Virtual network management method, virtual network management program, virtual network management system, and virtual network means
US20140129819A1 (en) Cloud cluster system and boot deployment method for the same
US20170317945A1 (en) System and method for distributed resource management
JP5720324B2 (en) Thin client environment providing system, server, thin client environment management method, and thin client environment management program
KR20070006906A (en) System and method for topology-aware job scheduling and backfilling in an hpc environment
JP2010239597A (en) Ip address assignment control program, ip address assignment control apparatus, and ip address assignment control method
CN111538561B (en) OpenStack large-scale cluster deployment test method and system based on KVM virtualization technology
US11573917B2 (en) Low latency computing architecture
CN104360878A (en) Method and device for deploying application software
JP2012256148A (en) Operational management device and method
US20050044220A1 (en) Method and system of managing computing resources
CN113382077B (en) Micro-service scheduling method, micro-service scheduling device, computer equipment and storage medium
US8819200B2 (en) Automated cluster node configuration
CN116569137A (en) Preserving and restoring pre-provisioned virtual machine state
CN114385126B (en) K8 s-based multi-tenant deep learning model research and development system and method
CN112433823A (en) Apparatus and method for dynamically virtualizing physical card
US7877471B2 (en) Detecting system reconfiguration and maintaining persistent I/O configuration data in a clustered computer system
CN113127144B (en) Processing method, processing device and storage medium
JP4304310B2 (en) PC cluster system, server, address assigning method, and program thereof
JP2011081579A (en) System operation management method and system for virtual resource in it system virtualization
WO2015067051A1 (en) Test agent method and device thereof
Xie et al. ARPIM: IP address resource pooling and intelligent management system for broadband IP networks
US20220075694A1 (en) Automatic reclamation of reserved resources in a cluster with failures

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080206

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090325

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090407

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130515

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140515

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees