JP2000040065A - Parallel computer system - Google Patents

Parallel computer system

Info

Publication number
JP2000040065A
JP2000040065A JP10209585A JP20958598A JP2000040065A JP 2000040065 A JP2000040065 A JP 2000040065A JP 10209585 A JP10209585 A JP 10209585A JP 20958598 A JP20958598 A JP 20958598A JP 2000040065 A JP2000040065 A JP 2000040065A
Authority
JP
Japan
Prior art keywords
computer system
parallel computer
console
computers
parallel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10209585A
Other languages
Japanese (ja)
Inventor
Hiroshi Fukuoka
博 福岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP10209585A priority Critical patent/JP2000040065A/en
Publication of JP2000040065A publication Critical patent/JP2000040065A/en
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

PROBLEM TO BE SOLVED: To operate a parallel computer system even without having a dedicated console device, to utilize an existent personal computer(PC) or a work station(WS) as a console and to connect any number of computers usable as consoles at the same time. SOLUTION: A parallel computer system 101 is provided with plural computers 1-2 to 1-4 mutually connected through a network 1-5 and a hardware managing mechanism 1-6 for performing the operation and monitoring of a hardware such as the control of power sources of these computers or the management of the console. Inside the computers 1-2 to 1-4, a system managing program 1-10 is provided for monitoring the messages of all the computers in the parallel computer system 1-1 and managing the monitoring of computer performance such as a CPU using rate or a memory using rate. The computer 1-2 and the hardware managing mechanism 1-6 are connected through a network 1-11 such as Ethernet(R) connectable with a distant place to computers 1-12 to 1-14 such as PC or WS to be used as the console.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、並列計算機システ
ムに係り、特に、特に、複数の計算機がネットワークに
接続されて構成される並列計算機システムを管理するた
めのクライアント型のコンソールを備えた並列計算機シ
ステムに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel computer system and, more particularly, to a parallel computer having a client-type console for managing a parallel computer system in which a plurality of computers are connected to a network. About the system.

【0002】[0002]

【従来の技術】複数のコンソールから管理される並列計
算機システムに関する従来技術として、例えば、特開平
10−11115号公報等に記載された技術が知られて
いる。この従来技術は、管理の対象となる並列計算機シ
ステムの管理機構を複数のコンソールのそれぞれに備え
るものである。
2. Description of the Related Art As a conventional technique relating to a parallel computer system managed from a plurality of consoles, for example, a technique described in Japanese Patent Application Laid-Open No. H10-11115 is known. In this conventional technique, a management mechanism of a parallel computer system to be managed is provided in each of a plurality of consoles.

【0003】図4は複数のコンソールから管理される従
来技術による並列計算機システムの構成例を示すブロッ
ク図であり、以下、図4を参照して従来技術について説
明する。図4において、4−1は並列計算機システム、
4−2〜4−4は計算機、4−5はネットワーク、4−
6〜4−8、4−12〜4−14はシリアル回線、4−
9、4−15は専用コンソール、4−10、4−16は
端末入出力プログラム、4−11、4−17はシステム
管理プログラム、4−18、4−19はハードウェア管
理機構である。
FIG. 4 is a block diagram showing an example of the configuration of a conventional parallel computer system managed from a plurality of consoles. The prior art will be described below with reference to FIG. In FIG. 4, 4-1 is a parallel computer system,
4-2 to 4-4 are computers, 4-5 is a network, 4-
6-4-8, 4-12-4-14 are serial lines, 4-
Reference numerals 9 and 4-15 are dedicated consoles, 4-10 and 4-16 are terminal input / output programs, 4-11 and 4-17 are system management programs, and 4-18 and 4-19 are hardware management mechanisms.

【0004】図4に示す従来技術による並列計算機シス
テムは、ネットワーク4−5により複数の計算機4−2
〜4−4が相互に接続されて構成された並列計算機シス
テム4−1と、この並列計算機システムの各計算機を管
理するためにシリアル回線4−6〜4−8により各計算
機に接続されたコンソール4−9と、シリアル回線4−
12〜4−14により各計算機に接続されたコンソール
4−15とを備えて構成される。コンソール4−9は、
並列計算機システム4−1を管理するための専用のコン
ソール装置であり、ハードウェア管理機構4−18を備
え、端末入出力プログラム4−10と、システム管理プ
ログラム4−11とがインストールされている。
[0004] A parallel computer system according to the prior art shown in FIG. 4 comprises a plurality of computers 4-2 via a network 4-5.
To a computer connected to each other through a serial line 4-6 to 4-8 for managing each computer of the parallel computer system. 4-9 and serial line 4-
And a console 4-15 connected to each computer by 12 to 4-14. Console 4-9
This is a dedicated console device for managing the parallel computer system 4-1. The console device has a hardware management mechanism 4-18, and has a terminal input / output program 4-10 and a system management program 4-11 installed.

【0005】前述において、万一、このコンソール4−
9が何等かの障害によって使用できなくなった場合、コ
ンソール4−15を代替コンソールとして使用可能であ
る。このコンソール4−15は、コンソール4−9と同
様に、ハードウェア管理機構4−19を備え、端末入出
力プログラム4−16と、システム管理プログラム4−
17とがインストールされている。
[0005] In the above, the console 4-
If 9 becomes unusable due to some failure, the console 4-15 can be used as an alternative console. Like the console 4-9, the console 4-15 includes a hardware management mechanism 4-19, and includes a terminal input / output program 4-16 and a system management program 4-19.
17 are installed.

【0006】前述したような従来技術による並列計算機
システムは、コンソールのハードウェア管理機構とシス
テム管理プログラムとが、コンソールと計算機とを接続
するシリアル回線を使用して並列計算機システムを管理
している。
In the above-described parallel computer system according to the prior art, the hardware management mechanism of the console and the system management program manage the parallel computer system using a serial line connecting the console and the computer.

【0007】[0007]

【発明が解決しようとする課題】前述したような従来技
術は、並列計算機システムと並列計算機システムの管理
機構とが分離されているため、並列計算機システムを管
理するためのコンソールとして、専用のコンソール装置
が最低でも1台必要であった。
In the prior art as described above, since the parallel computer system and the management mechanism of the parallel computer system are separated, a dedicated console device is used as a console for managing the parallel computer system. However, at least one was required.

【0008】そして、前述の従来技術は、コンソールに
ソフトウェアを管理するシステム管理プログラムだけで
はなく、ハードウェアを管理するハードウェア管理機構
も装備していたため、コンソールと並列計算機システム
とを接続する回線として、Ethernet等の遠隔地
から利用できる回線を使用することができず、ハードウ
ェアの管理が可能な接続距離の短いシリアル回線等を使
用せざるを得ないという問題点を有している。
In the above-described prior art, a console is provided with not only a system management program for managing software but also a hardware management mechanism for managing hardware, so that a line connecting the console and the parallel computer system is provided. In addition, there is a problem that a line that can be used from a remote place such as Ethernet or the like cannot be used, and a serial line or the like having a short connection distance and capable of managing hardware must be used.

【0009】また、前述の従来技術は、コンソールと並
列計算機システムとの間をシリアル回線等の1対1で通
信を行うような回線によって接続しており、コンソール
を増設する場合、回線を接続するためのハードウェアを
並列計算機システムにも増設する必要があるため、同時
に接続できるコンソールの台数が制限されるという問題
点を有している。
In the above-mentioned prior art, the console and the parallel computer system are connected by a line such as a serial line for performing one-to-one communication. When the console is added, the line is connected. Therefore, there is a problem that the number of consoles that can be connected at the same time is limited because it is necessary to add additional hardware to the parallel computer system.

【0010】本発明の目的は、前述した従来技術の問題
点を解決し、並列計算機システムの管理機構を並列計算
機システム自身に備えることにより、専用のコンソール
装置がなくても並列計算機システムを動作可能とし、シ
リアル回線等による接続を不要として、既存のPC(パ
ーソナルコンピュータ)、WS(ワークステーション)
等をコンソールとして利用可能とし、また、同時に利用
可能なコンソールを何台でも接続可能とした並列計算機
システムを提供することにある。
[0010] An object of the present invention is to solve the above-mentioned problems of the prior art, and to provide a parallel computer system management mechanism in the parallel computer system itself so that the parallel computer system can operate without a dedicated console device. No connection by serial line etc. is required, existing PC (personal computer), WS (workstation)
It is another object of the present invention to provide a parallel computer system which can be used as a console and can connect any number of consoles which can be used simultaneously.

【0011】[0011]

【課題を解決するための手段】本発明によれば前記目的
は、ネットワークで接続された複数の計算機により構成
される並列計算機システムにおいて、前記並列計算機シ
ステムを構成する計算機の少なくとも1つに、前記並列
計算機システムを構成する計算機のハードウェアの制御
を行うハードウェア管理機構を備え、前記ハードウェア
管理機構を備える計算機は、ネットワークを介して並列
計算機システムの外部に設けられ、並列計算機システム
に対する監視、制御を行うコンソールとして使用する少
なくとも1つの計算機に接続され、前記コンソールとし
て使用される計算機からのハードウェア制御の指示によ
り前記並列計算機システムを構成する計算機のハードウ
ェアの制御を行うことにより達成される。
According to the present invention, an object of the present invention is to provide a parallel computer system comprising a plurality of computers connected via a network, wherein at least one of the computers constituting the parallel computer system includes A computer having a hardware management mechanism for controlling hardware of a computer constituting the parallel computer system is provided.The computer provided with the hardware management mechanism is provided outside the parallel computer system via a network, and monitors the parallel computer system. This is achieved by being connected to at least one computer used as a console for controlling and controlling hardware of the computers constituting the parallel computer system according to a hardware control instruction from the computer used as the console. .

【0012】また、前記目的は、前記ハードウェア管理
機構を備える計算機が、並列計算機システムを構成する
他の計算機のそれぞれと、並列計算機システムを構築す
るネットワーク以外の回線により接続されていることに
より、また、前記ハードウェア管理機構を備える計算機
のハードウエア管理機構を、並列計算機システムを構成
する計算機とは独立に並列計算機システム内に備え、前
記ハードウェア管理機構が、ネットワークを介して前記
少なくとも1つのコンソールとして使用する計算機に接
続されたことにより達成される。
[0012] Further, the object is that the computer provided with the hardware management mechanism is connected to each of the other computers constituting the parallel computer system by a line other than the network constituting the parallel computer system. Further, a hardware management mechanism of a computer having the hardware management mechanism is provided in the parallel computer system independently of a computer constituting the parallel computer system, and the hardware management mechanism is configured to control the at least one of the computers via a network. This is achieved by being connected to a computer used as a console.

【0013】さらに、前記目的は、前記並列計算機シス
テムを構成する計算機の少なくとも1つが、あるいは、
前記並列計算機システムを構成する計算機とは独立に設
けられたハードウェア管理機構が、並列計算機システム
を構成する全計算機でのオペレーティングシステムのコ
マンド操作、メッセージのモニタリング等のソフトウェ
ア制御行うシステム管理プログラムを有することにより
達成される。
Further, the object is that at least one of the computers constituting the parallel computer system includes:
A hardware management mechanism provided independently of the computers constituting the parallel computer system has a system management program for performing software control such as command operation of an operating system and message monitoring on all the computers constituting the parallel computer system. This is achieved by:

【0014】[0014]

【発明の実施の形態】以下、本発明による並列計算機シ
ステムの一実施形態を図面により詳細に説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an embodiment of a parallel computer system according to the present invention will be described in detail with reference to the drawings.

【0015】図1は本発明の一実施形態による並列計算
機システムの構成例を示すブロック図、図2は本発明の
実施形態による並列計算機システムを構成する計算機の
電源ONを行う処理を説明するシーケンス図、図3はコ
ンソールとして動作する計算機へのメッセージ出力の処
理を説明するシーケンス図である。図1において、1−
1は並列計算機システム、1−2〜1−4は計算機、1
−5はネットワーク、1−6はハードウェア管理機構、
1−7〜1−9はシリアル回線、1−10はシステム管
理プログラム、1−11はEthernet等のネット
ワーク、1−12〜1−14はコンソールとしての計算
機、1−15〜1−17は端末入出力プログラムであ
る。
FIG. 1 is a block diagram showing an example of the configuration of a parallel computer system according to an embodiment of the present invention. FIG. 2 is a sequence diagram illustrating a process for turning on a computer constituting the parallel computer system according to an embodiment of the present invention. FIG. 3 and FIG. 3 are sequence diagrams illustrating a process of outputting a message to a computer operating as a console. In FIG. 1, 1-
1 is a parallel computer system, 1-2 to 1-4 are computers, 1
-5 is a network, 1-6 is a hardware management mechanism,
1-7 to 1-9 are serial lines, 1-10 is a system management program, 1-11 is a network such as Ethernet, 1-12 to 1-14 are computers as consoles, 1-15 to 1-17 are terminals It is an input / output program.

【0016】並列計算機システム1−1は、ネットワー
ク1−5により相互に接続された複数の計算機1−2〜
1−4と、これらの計算機の電源の制御等のハードウェ
アの操作、監視やコンソールの管理を行うハードウェア
管理機構1−6とを備えて構成されている。ハードウェ
ア管理機構1−6は、並列計算機システムにとって重要
な要素であるため複数用意されており、障害発生時に自
動的に切り替えられる。ハードウェア管理機構1−6と
全ての計算機1−2〜1−4とは、シリアル回線1−7
〜1−9により接続されている。
The parallel computer system 1-1 includes a plurality of computers 1-2 connected to each other by a network 1-5.
1-4, and a hardware management mechanism 1-6 for performing hardware operations such as power control of these computers, monitoring and console management. Since the hardware management mechanism 1-6 is an important element for the parallel computer system, a plurality of hardware management mechanisms are prepared, and are automatically switched when a failure occurs. The hardware management mechanism 1-6 and all the computers 1-2 to 1-4 are connected to a serial line 1-7.
1-9.

【0017】計算機1−2内には、並列計算機システム
1−1内の全ての計算機1−2、1−3、1−4のメッ
セージの監視、CPU使用率、メモリ使用率等の計算機
のパフォーマンスの監視等の管理を行うシステム管理プ
ログラム1−10が備えられている。システム管理プロ
グラム1−10は、ハードウェア管理機構1−6と同様
に並列計算機システム1−1として重要な要素であるた
め、他の計算機内にも設けられており、複数の計算機内
のシステム管理プログラム1−10を並列に起動してお
き、万一の障害には自動的に切l替えることが可能とさ
れている。
In the computer 1-2, monitoring of messages of all the computers 1-2, 1-3, and 1-4 in the parallel computer system 1-1, performance of the computer such as CPU utilization, memory utilization, etc. A system management program 1-10 for managing the monitoring and the like is provided. Since the system management program 1-10 is an important element as the parallel computer system 1-1 like the hardware management mechanism 1-6, the system management program 1-10 is provided in another computer, and the system management program in a plurality of computers is provided. The program 1-10 can be started in parallel and automatically switched in case of a failure.

【0018】計算機1−2及びハードウェア管理機構1
−6は、Ethernet等の遠隔地と接続可能なネッ
トワーク1−11と接続されており、このネットワーク
1−11に並列計算機システムの外部に設けられる1台
以上のコンソールとして使用する計算機1−12〜1−
14が接続されている。並列計算機システムの外部に設
けられる計算機1−12〜1−14には、それぞれ、オ
ペーレータへのメッセージ出力、システムの操作を実行
する端末入出力プログラム1−15〜1−17がインス
トールされている。そして、並列計算機システムの外部
に設けられる計算機1−12〜1−14は、既存のP
C、WS等を使用することができ、それぞれがコンソー
ルとして利用可能であり、計算機1−12〜1−14の
どの計算機からでも並列計算機システム101を操作す
ることができる。
Computer 1-2 and hardware management mechanism 1
-6 is connected to a network 1-11, which can be connected to a remote place such as Ethernet, and computers 1-12-used as one or more consoles provided outside the parallel computer system on this network 1-11. 1-
14 are connected. Computers 1-12 to 1-14 provided outside the parallel computer system are installed with terminal input / output programs 1-15 to 1-17 for outputting messages to operators and executing system operations, respectively. Then, the computers 1-12 to 1-14 provided outside the parallel computer system correspond to the existing P
C, WS, and the like can be used, each of which can be used as a console, and the parallel computer system 101 can be operated from any of the computers 1-12-1-14.

【0019】次に、コンソールとして使用する計算機か
らの並列計算機システムに対する操作の例として、計算
機の電源をONにする場合の動作を図2に示すシーケン
スを参照して説明する。
Next, as an example of an operation on a parallel computer system from a computer used as a console, an operation when the power of the computer is turned on will be described with reference to a sequence shown in FIG.

【0020】並列計算機システムが外部からアクセスで
きるようなネットワークに接続されていない場合は不要
であるが、外部からアクセスできるようなネットワーク
に並列計算機システムが接続されている場合、セキュリ
ティの管理をする必要がある。セキュリティの管理方式
としては様々なものが知られているが、ここでは、基本
的なセキュリティの管理方式であるIDとパスワードと
による認証を例にとり説明する。また、並列計算機シス
テムは、複数の計算機により構成されており、電源ON
の操作の単位としては、並列計算機システム全体、複数
の計算機、1つの計算機等があるが、ここでは、並列計
算機システム内の複数の計算機をグループに纏め、その
グループの計算機に対して電源がOFFの状態から電源
をONにする動作について説明する。
This is unnecessary when the parallel computer system is not connected to a network accessible from the outside. However, when the parallel computer system is connected to a network accessible from the outside, it is necessary to manage security. There is. Various security management methods are known. Here, an explanation will be given using an example of authentication using an ID and a password, which are basic security management methods. The parallel computer system is composed of a plurality of computers, and the power is turned on.
Is a unit of the whole parallel computer system, a plurality of computers, a single computer, and the like. Here, a plurality of computers in the parallel computer system are grouped, and the power of the computers in the group is turned off. The operation of turning on the power from the state described above will be described.

【0021】以下に説明する例では、計算機1−2に
“nodeA”という計算機名称を、計算機1−3に
“nodeB”という計算機名称を、計算機1−4に
“nodeC”という計算機名称を付けていると仮定す
る。さらに、端末入出力プログラムの表示方法について
も様々な種類があるが、ここではボタンを使った簡単な
表示形式を例にとって説明する。
In the following example, the computer 1-2 is given a computer name "nodeA", the computer 1-3 is given a computer name "nodeB", and the computer 1-4 is given a computer name "nodeC". Assume that Furthermore, there are various types of display methods of the terminal input / output program. Here, a simple display format using buttons will be described as an example.

【0022】(1)いま、オペレータが並列計算機シス
テムの外部に設けられる計算機1−12をコンソールと
して使用し、端末入出力プログラム1−15を使って並
列計算機システムへアクセスするために、まず、計算機
1−12の認証画面2−12の認証IDの入力フィール
ドに“admin1”を、パスワードの入力フィールド
に“abcd”を入力したとする。端末入出力プログラ
ム1−15は、ネットワーク1−11を介してハードウ
ェア管理機構1−6へ認証IDとパスワードとを送信す
る(ステップ2−1)。
(1) Now, in order for the operator to use the computer 1-12 provided outside the parallel computer system as a console and access the parallel computer system using the terminal input / output program 1-15, first, the computer It is assumed that "admin1" is entered in the authentication ID input field and "abcd" is entered in the password input field of the authentication screen 2-12 of 1-12. The terminal input / output program 1-15 transmits the authentication ID and the password to the hardware management mechanism 1-6 via the network 1-11 (Step 2-1).

【0023】(2)ハードウェア管理機構1−6には、
認証IDの登録簿2−10が記憶されており、その内容
が予め登録されている。ハードウェア管理機構1−6
は、この認証IDの登録簿2−10をチェックし、端末
入出力プログラム1−15に対してアクセスを許可する
(ステップ2−2)。
(2) The hardware management mechanism 1-6 includes:
An authentication ID registry 2-10 is stored, and its contents are registered in advance. Hardware management mechanism 1-6
Checks the authentication ID register 2-10 and permits access to the terminal input / output program 1-15 (step 2-2).

【0024】(3)これにより、アクセスが許可された
端末入出力プログラム1−15は、次に、ハードウェア
管理機構1−6へ並列計算機システム内の全ての計算機
の情報を要求する(ステップ2−3)。
(3) Accordingly, the terminal input / output program 1-15 permitted to access next requests information of all computers in the parallel computer system from the hardware management mechanism 1-6 (step 2). -3).

【0025】(4)ハードウェア管理機構1−6は、並
列計算機システム内の全ての計算機の情報2−11を端
末入出力プログラム1−15へ送信する。計算機の情報
は、複数あるが、図示例では、電源状態の情報とグルー
プ名の情報とを送信している(ステップ2−4)。
(4) The hardware management mechanism 1-6 transmits information 2-11 of all computers in the parallel computer system to the terminal input / output program 1-15. Although there are a plurality of computer information, in the illustrated example, information on the power supply state and information on the group name are transmitted (step 2-4).

【0026】(5)計算機の情報を受けた端末入出力プ
ログラム1−15は、電源操作用の画面2−13を表示
する。図示例では、グループ単位の電源操作用のアイコ
ンによる電源の状況を示す電源操作ボタンを表示した表
示画面となっており、オペレータは、この画面を参照し
て現在の計算機の状態を知ることができる(ステップ2
−5)。
(5) The terminal input / output program 1-15 having received the information of the computer displays a power operation screen 2-13. In the illustrated example, the display screen displays a power operation button indicating a power state by a power operation icon for each group, and the operator can know the current state of the computer by referring to this screen. (Step 2
-5).

【0027】(6)次に、オペレータは、この電源操作
用の画面2−13を操作して端末入出力プログラムに対
し“Group1”の計算機の電源のONを要求する。
Group1は、計算機1−2の計算機名称“node
A”と計算機1−3の計算機名称“nodeB”とを1
つのグループとしてまとめたものである(ステップ2−
6)。
(6) Next, the operator operates the power operation screen 2-13 to request the terminal input / output program to turn on the power of the computer of “Group 1”.
Group 1 is a computer name “node” of the computer 1-2.
A ”and the computer name“ nodeB ”of the computer 1-3 are set to 1
(Step 2-
6).

【0028】(7)このオペレータの操作後の電源操作
用の画面は、画面2−14のようになる。端末入出力プ
ログラム1−15は、“Group1”の電源のONを
ハードウェア管理機構に要求する(ステップ2−7)。
(7) The screen for power supply operation after the operator's operation is as shown in Screen 2-14. The terminal input / output program 1-15 requests the hardware management mechanism to turn on the power of “Group1” (step 2-7).

【0029】(8)ハードウェア管理機構1−6は、計
算機の情報2−11を元に“nodeA”と“node
B”とに属する計算機の電源をONにする(ステップ2
−8、2−9)。
(8) The hardware management mechanism 1-6 determines "nodeA" and "node" based on the computer information 2-11.
B ”is turned on (step 2).
-8, 2-9).

【0030】本発明の実施形態は、前述したように、並
列計算機システムの外部に設けられた計算機1−12を
コンソールとして使用して並列計算機システム101を
構成する計算機の電源をONとすることができる。この
操作は、並列計算機システム外の計算機1−13、1−
14をコンソールとして使用しても同様に行うことがで
きる。
In the embodiment of the present invention, as described above, it is possible to use the computer 1-12 provided outside the parallel computer system as a console to turn on the power of the computers constituting the parallel computer system 101. it can. This operation is performed on computers 1-13 and 1- 1 outside the parallel computer system.
The same can be done by using the console 14 as a console.

【0031】次に、並列計算機システムからコンソール
として使用する計算機への情報送信の例として、並列計
算機システム内の各計算機で出力されたメッセージを収
集して出力する動作を図3に示すシーケンスを参照して
説明する。
Next, as an example of information transmission from a parallel computer system to a computer used as a console, an operation of collecting and outputting messages output by each computer in the parallel computer system is described with reference to a sequence shown in FIG. I will explain.

【0032】従来のコンソールをサーバとして扱うシス
テムは、システムから出力されたメッセージを収集して
逐一コンソールへ送信していた。また、従来、複数のコ
ンソールが接続されている場合、どのコンソールへ送信
すればいいのかを判断するため、コンソールを管理する
必要があった。前述のように構成される本発明の実施形
態による並列計算機システムは、コンソールとしての計
算機をクライアントとして扱うため、コンソール取り扱
いしての計算機からの要求に対してサーバとなる並列計
算機システムがコンソールとしての計算機の要求毎にコ
ンソールとしての計算機へメッセージを送信するという
方式により、並列計算機システム内の各計算機で出力さ
れたメッセージをコンソールとしての計算機に送信する
ことができる。
A conventional system that treats a console as a server collects messages output from the system and sends them to the console one by one. Conventionally, when a plurality of consoles are connected, it has been necessary to manage the consoles in order to determine which console should be transmitted. In the parallel computer system according to the embodiment of the present invention configured as described above, since the computer as the console is treated as a client, the parallel computer system serving as a server in response to a request from the computer handling the console serves as a console. The message output from each computer in the parallel computer system can be transmitted to the computer as a console by transmitting a message to the computer as a console for each request from the computer.

【0033】(1)並列計算機システム1−1を構成す
る計算機1−2内のシステム管理プログラム1−10
は、ネットワーク1−5を介して全ての計算機1−2〜
1−4の出力メッセージを常時収集すると同時にコンソ
ールとして使用される計算機からの要求を待っている。
コンソールとして使用される並列計算機システムの外部
に設けられた計算機1−12の端末入出力プログラム1
−15は、ある一定間隔でシステム管理プログラム1−
10に対してメッセージを要求する(ステップ3−
1)。
(1) System management program 1-10 in computer 1-2 constituting parallel computer system 1-1
Are all computers 1-2 through the network 1-5.
The output messages of 1-4 are constantly collected and at the same time a request from a computer used as a console is awaited.
Terminal I / O program 1 of computer 1-12 provided outside parallel computer system used as console
-15 indicates that the system management program 1-
10 (step 3).
1).

【0034】(2)要求を受けたシステム管理プログラ
ム1−10は、現在出力されているメッセージをコンソ
ールとしての計算機1−12へ送信する(ステップ3−
2)。
(2) Upon receiving the request, the system management program 1-10 transmits the currently output message to the computer 1-12 as a console (step 3).
2).

【0035】(3)コンソールとしての計算機1−12
内の端末入出力プログラム1−15は、受取ったメッセ
ージを画面に表示する(ステップ3−3)。
(3) Computer 1-12 as Console
The terminal input / output program 1-15 displays the received message on the screen (step 3-3).

【0036】前述したように、本発明の実施形態によれ
ば、並列計算機システムのハードウェア管理機構を並列
計算機システム自身に備えることにより、専用のコンソ
ール装置がなくても並列計算機システムを動作させるこ
とが可能であるので、コンソールとしての計算機の障害
が並列計算機システムに影響することがない。
As described above, according to the embodiment of the present invention, by providing the hardware management mechanism of the parallel computer system in the parallel computer system itself, the parallel computer system can be operated without a dedicated console device. Therefore, the failure of the computer as the console does not affect the parallel computer system.

【0037】また、本発明の実施形態によれば、既存の
PC、WS等をコンソールとして利用することができる
ため、専用のコンソールを設置するスペースとコストと
を削減することができる。さらに、本発明の実施形態に
よれば、同時に利用可能なコンソールとしての計算機を
何台でも接続可能なため、1つのコンソール取り扱いし
ての計算機に障害が発生しても他のコンソールとしての
計算機から並列計算機システムを管理することができ
る。
Further, according to the embodiment of the present invention, since an existing PC, WS or the like can be used as a console, the space and cost for installing a dedicated console can be reduced. Furthermore, according to the embodiment of the present invention, any number of computers as consoles that can be used simultaneously can be connected. Therefore, even if a computer that handles one console fails, the computer as another console can be used. A parallel computer system can be managed.

【0038】前述した本発明の実施形態は、並列計算機
システム内に、ハードウェア管理機構を、並列計算機シ
ステムを構成する計算機とは独立に設けているが、本発
明は、並列計算機システムを構成する計算機内にハード
ウェア管理機構を備えるようにしてもよい。また、前述
した本発明の実施形態は、並列計算機システムを構成す
る計算機の1または複数にシステム管理プログラムを備
えるとしているが、本発明は、システム管理プログラム
を並列計算機システムを構成する計算機とは独立に設け
たハードウェア管理機構内に備えるようにしてもよい。
In the embodiment of the present invention described above, the hardware management mechanism is provided in the parallel computer system independently of the computers constituting the parallel computer system, but the present invention constitutes the parallel computer system. A hardware management mechanism may be provided in the computer. Further, in the above-described embodiment of the present invention, one or more of the computers constituting the parallel computer system are provided with the system management program. However, the present invention provides that the system management program is independent of the computers constituting the parallel computer system. May be provided in the hardware management mechanism provided in the server.

【0039】[0039]

【発明の効果】以上説明したように本発明によれば、専
用のコンソール装置がなくても並列計算機システムを動
作可能とし、シリアル回線等の接続を不要として、既存
のPC、WS等をコンソールとして利用可能とし、ま
た、同時に利用可能なコンソールとしての計算機を何台
でも接続して並列計算機システムを管理することができ
る。
As described above, according to the present invention, a parallel computer system can be operated without a dedicated console device, connection of a serial line or the like is unnecessary, and an existing PC, WS or the like can be used as a console. A parallel computer system can be managed by connecting any number of computers as consoles that can be used simultaneously and that can be used at the same time.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施形態による並列計算機システム
の構成例を示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration example of a parallel computer system according to an embodiment of the present invention.

【図2】本発明の実施形態による並列計算機システムを
構成する計算機の電源ONを行う処理を説明するシーケ
ンス図である。
FIG. 2 is a sequence diagram illustrating a process for turning on a power supply of a computer constituting the parallel computer system according to the embodiment of the present invention;

【図3】コンソールとして動作する計算機へのメッセー
ジ出力の処理を説明するシーケンス図である。
FIG. 3 is a sequence diagram illustrating a process of outputting a message to a computer that operates as a console.

【図4】複数のコンソールから管理される従来技術によ
る並列計算機システムの構成例を示すブロック図であ
る。
FIG. 4 is a block diagram showing a configuration example of a parallel computer system according to a conventional technique managed from a plurality of consoles.

【符号の説明】[Explanation of symbols]

1−1、4−1 並列計算機システム 1−2〜1−4、4−2〜4−4 計算機 1−5、4−5 ネットワーク 1−6、4−18、4−19 ハードウェア管理機構 1−7〜1−9、4−6〜4−8、4−12〜4−14
シリアル回線 1−10、4−11、4−17 システム管理プログラ
ム 1−11 Ethernet等のネットワーク 1−12〜1−14 コンソールとしての計算機 1−15〜1−17、4−10、4−16 端末入出力
プログラム 4−9、4−15 コンソール専用端末
1-1, 4-1 Parallel computer system 1-2, 1-4, 4-2, 4-4 Computer 1-5, 4-5 Network 1-6, 4-18, 4-19 Hardware management mechanism 1 -7 to 1-9, 4-6 to 4-8, 4-12 to 4-14
Serial line 1-10, 4-11, 4-17 System management program 1-11 Network such as Ethernet 1-12 to 1-14 Computer as console 1-15 to 1-17, 4-10, 4-16 Terminal Input / output program 4-9, 4-15 Console dedicated terminal

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 ネットワークで接続された複数の計算機
により構成される並列計算機システムにおいて、前記並
列計算機システムを構成する計算機の少なくとも1つ
に、前記並列計算機システムを構成する計算機のハード
ウェアの制御を行うハードウェア管理機構を備え、前記
ハードウェア管理機構を備える計算機は、ネットワーク
を介して並列計算機システムの外部に設けられ、並列計
算機システムに対する監視、制御を行うコンソールとし
て使用する少なくとも1つの計算機に接続され、前記コ
ンソールとして使用される計算機からのハードウェア制
御の指示により前記並列計算機システムを構成する計算
機のハードウェアの制御を行うことを特徴とする並列計
算機システム。
1. A parallel computer system comprising a plurality of computers connected via a network, wherein at least one of the computers constituting the parallel computer system controls hardware of the computers constituting the parallel computer system. A computer provided with a hardware management mechanism for performing the operation, the computer having the hardware management mechanism is provided outside the parallel computer system via a network, and is connected to at least one computer used as a console for monitoring and controlling the parallel computer system. A parallel computer system for controlling hardware of computers constituting the parallel computer system according to a hardware control instruction from a computer used as the console.
【請求項2】 前記ハードウェア管理機構を備える計算
機は、並列計算機システムを構成する他の計算機のそれ
ぞれと、並列計算機システムを構築するネットワーク以
外の回線により接続されていることを特徴とする請求項
1記載の並列計算機システム。
2. The computer provided with the hardware management mechanism is connected to each of the other computers constituting the parallel computer system by a line other than a network for constructing the parallel computer system. 2. The parallel computer system according to 1.
【請求項3】 前記ハードウェア管理機構を備える計算
機のハードウエア管理機構を、並列計算機システムを構
成する計算機とは独立に並列計算機システム内に備え、
前記ハードウェア管理機構は、ネットワークを介して前
記コンソールとして使用する少なくとも1つの計算機に
接続されたことを特徴とする請求項1または2記載の並
列計算機システム。
3. A parallel computer system comprising a hardware management mechanism of a computer having the hardware management mechanism, independently of a computer constituting the parallel computer system.
3. The parallel computer system according to claim 1, wherein the hardware management mechanism is connected to at least one computer used as the console via a network.
【請求項4】 前記並列計算機システムを構成する計算
機の少なくとも1つは、並列計算機システムを構成する
全計算機でのオペレーティングシステムのコマンド操
作、メッセージのモニタリング等のソフトウェア制御行
うシステム管理プログラムを有することを特徴とする請
求項1、2または3記載の並列計算機システム。
4. At least one of the computers constituting the parallel computer system has a system management program which performs software control such as command operation of an operating system and message monitoring on all the computers constituting the parallel computer system. 4. The parallel computer system according to claim 1, 2 or 3.
【請求項5】 前記並列計算機システムを構成する計算
機とは独立に設けられたハードウェア管理機構内に、並
列計算機システムを構成する全計算機でのオペレーティ
ングシステムのコマンド操作、メッセージのモニタリン
グ等のソフトウェア制御行うシステム管理プログラムを
有することを特徴とする請求項3記載の並列計算機シス
テム。
5. Software control such as operating system command operations and message monitoring in all the computers constituting the parallel computer system, in a hardware management mechanism provided independently of the computers constituting the parallel computer system. 4. The parallel computer system according to claim 3, further comprising a system management program for executing the program.
JP10209585A 1998-07-24 1998-07-24 Parallel computer system Pending JP2000040065A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10209585A JP2000040065A (en) 1998-07-24 1998-07-24 Parallel computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10209585A JP2000040065A (en) 1998-07-24 1998-07-24 Parallel computer system

Publications (1)

Publication Number Publication Date
JP2000040065A true JP2000040065A (en) 2000-02-08

Family

ID=16575281

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10209585A Pending JP2000040065A (en) 1998-07-24 1998-07-24 Parallel computer system

Country Status (1)

Country Link
JP (1) JP2000040065A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148584A (en) * 2005-11-24 2007-06-14 Samsung Electronics Co Ltd System and method for providing information on use of memory of computer
JP2012198925A (en) * 2012-06-13 2012-10-18 Samsung Electronics Co Ltd System and method of providing information on computer memory use

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007148584A (en) * 2005-11-24 2007-06-14 Samsung Electronics Co Ltd System and method for providing information on use of memory of computer
JP2012198925A (en) * 2012-06-13 2012-10-18 Samsung Electronics Co Ltd System and method of providing information on computer memory use

Similar Documents

Publication Publication Date Title
EP1306959B1 (en) Uninterrupted power supply managing system and managing method, and electric device managing system and program
JPH10313329A (en) Fault permission communication method/system
JP4343282B2 (en) Composite communication terminal device management system and composite communication terminal device
JP2004306200A (en) Robot control system
JP2000040065A (en) Parallel computer system
CN109901954B (en) Storage device and resource management method
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
Cisco Configuring IBM Channel Attach
JP2914362B2 (en) Server automatic operation device with power control function in client / server system
JP2003345478A (en) Intelligent type device capable of sharing identical user input/output interface by al intelligent type modules
JP3790173B2 (en) Network management method and network management system used therefor
JP2803711B2 (en) How to power off a computer system
JP3082704B2 (en) Communication device management method
KR0121970B1 (en) Common-bus managing method in an exchanger
JP2000148431A (en) Device and method for network device management and unit and method for network device control