JP2002366535A - Maintenance system of parallel computers - Google Patents

Maintenance system of parallel computers

Info

Publication number
JP2002366535A
JP2002366535A JP2001177909A JP2001177909A JP2002366535A JP 2002366535 A JP2002366535 A JP 2002366535A JP 2001177909 A JP2001177909 A JP 2001177909A JP 2001177909 A JP2001177909 A JP 2001177909A JP 2002366535 A JP2002366535 A JP 2002366535A
Authority
JP
Japan
Prior art keywords
logical package
software
package
network
logical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001177909A
Other languages
Japanese (ja)
Inventor
Teruyuki Harada
輝之 原田
勝男 ▲吉▼田
Katsuo Yoshida
Akihiro Ueda
明弘 上田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Information Technology Co Ltd
Hitachi Solutions Technology Ltd
Original Assignee
Hitachi Ltd
Hitachi ULSI Systems Co Ltd
Hitachi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi ULSI Systems Co Ltd, Hitachi Information Technology Co Ltd filed Critical Hitachi Ltd
Priority to JP2001177909A priority Critical patent/JP2002366535A/en
Publication of JP2002366535A publication Critical patent/JP2002366535A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

PROBLEM TO BE SOLVED: To dissolve temporal restriction of performance of a replacing work by performing incorporation of a logical package in a network by decision of software itself. SOLUTION: This maintenance system of parallel computers is provided with a means 100 to set completion of replacement of a faulty logical package, a CPU interface control part 101 to report the completion of replacement of the faulty logical package to the software 200 and a structure control part 103 to set connecting relation between the logical package and the network in the network according to an instruction from the software.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、並列計算機システ
ムにおいて、ソフトウェアの動作状況をソフトウェア自
身が判断し、論理パッケージのネットワークへの組み込
みを実行可能とするものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a parallel computer system in which the operation status of software is determined by the software itself, and a logic package can be incorporated into a network.

【0002】[0002]

【従来の技術】従来の方式は、故障した論理パッケージ
を交換した場合、ソフトウェアの動作状況をコンソール
等で照合し、論理パッケージのネットワークへの組み込
みが実行可能であることを確認し、キーボード等の入力
装置にて論理パッケージのネットワークへの組み込み処
理を実行させている。
2. Description of the Related Art In the conventional method, when a failed logical package is replaced, the operation status of software is collated on a console or the like, and it is confirmed that the logical package can be incorporated into a network. The input device executes the process of incorporating the logical package into the network.

【0003】[0003]

【発明が解決しようとする課題】上記従来技術では、故
障論理パッケージの交換と交換した論理パッケージのネ
ットワークへの組み込み動作が一連で行われるため、交
換作業実施の時間的制約が大きい。
In the above-mentioned prior art, the replacement of the faulty logic package and the operation of incorporating the replaced logic package into the network are performed in a series, so that the time for performing the replacement work is greatly restricted.

【0004】本発明の目的は、論理パッケージのネット
ワークへの組み込みをソフトウェア自身の判断により行
うことにより、交換作業実施の時間的制約を解消するこ
とにある。
[0004] It is an object of the present invention to eliminate the time constraint of the exchange work by incorporating a logical package into a network at the discretion of the software itself.

【0005】[0005]

【課題を解決するための手段】図1は、本発明を示すブ
ロック図である。
FIG. 1 is a block diagram showing the present invention.

【0006】故障した論理パッケージの交換完了を設定
する手段100と、故障した論理パッケージの交換終了を
ソフトウェア200に報告するCPUインタフェース制御部10
1と、ソフトウェアからの指示に従い論理パッケージと
ネットワークの接続関係をネットワークに設定する構成
制御部102と、論理パッケージの故障状態を保持する手
段201と論理パッケージとネットワークの接続状態を保
持する手段103を有する。
Means 100 for setting completion of replacement of a failed logical package, and CPU interface controller 10 for reporting completion of replacement of a failed logical package to software 200
1, a configuration control unit 102 for setting a connection relationship between a logical package and a network to a network according to an instruction from software, a unit 201 for holding a failure state of a logical package, and a unit 103 for holding a connection state of a logical package and a network. Have.

【0007】[0007]

【発明の実施の形態】故障した論理パッケージの交換が
終了したことを論理パッケージ交換作業制御部100にて
設定する。交換が完了した障害論理パッケージ番号をCP
Uインタフェース制御部101を通じて、ソフトウェア200
に報告する。ソフトウェアは、交換完了論理パッケージ
番号を故障部位情報201に保持する。ソフトウェアはネ
ットワークの構成を変更しても良いと判断した時点で、
故障部位情報201に保持している交換完了論理パッケー
ジの組み込みを、構成制御部102に対して指示する。構
成制御部は、ネットワーク構成情報103を再構成し、交
換完了論理パッケージの接続を接続情報310〜313に設定
する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The completion of replacement of a failed logical package is set by the logical package replacement work control unit 100. Replaced failed logical package number with CP
Software 200 through U interface control unit 101
Report to The software stores the replacement completion logical package number in the failure part information 201. When the software determines that the network configuration can be changed,
The configuration control unit 102 is instructed to incorporate the replacement completion logical package held in the failure site information 201. The configuration control unit reconfigures the network configuration information 103 and sets the connection of the exchange completion logical package to the connection information 310 to 313.

【0008】本発明の実施例を図4に従い説明する。An embodiment of the present invention will be described with reference to FIG.

【0009】例えば、論理パッケージ210が故障したと
する。故障した論理パッケージ210の交換を終了する
と、論理パッケージ交換作業制御部100に、交換した論
理パッケージ210の番号を入力する(ステップS1)。
For example, assume that the logic package 210 has failed. When the replacement of the failed logical package 210 is completed, the number of the replaced logical package 210 is input to the logical package replacement work control unit 100 (step S1).

【0010】入力された論理パッケージ番号210は、CPU
インタフェース制御部101に報告され、CPUインタフェー
ス制御部101からソフトウェア200に報告される(ステッ
プS2)。
The input logical package number 210 is
The information is reported to the interface control unit 101, and is reported to the software 200 from the CPU interface control unit 101 (step S2).

【0011】ソフトウェア200は、故障部位情報201内に
ある論理パッケージ210の故障状態を「交換完了」に変
更する(ステップS12)。
The software 200 changes the failure status of the logical package 210 in the failure site information 201 to “replacement completed” (step S12).

【0012】ソフトウェア200は、実行中のジョブが終
了した時点で計算機システムの構成変更を実行しても良
いかを判定する(ステップS13)。
The software 200 determines whether the configuration change of the computer system may be executed when the job being executed is completed (step S13).

【0013】構成を変更しても良いと判断した場合に、
故障部位情報201内にある論理パッケージの故障状態を
照合し、「交換完了」状態の論理パッケージがあると、故
障部位情報201内にある論理パッケージの接続状態を
「接続」に変更し(ステップS14)、CPUインタフェース
制御部101を経由し、構成制御部102に対して、システム
の組み込みを指示する(ステップS15)。
When it is determined that the configuration can be changed,
The failure state of the logical package in the failure part information 201 is checked, and if there is a logical package in the “replacement completed” state, the connection state of the logical package in the failure part information 201 is changed to “connected” (step S14). ), And instructs the configuration control unit 102 to incorporate the system via the CPU interface control unit 101 (step S15).

【0014】構成制御部102は、論理パッケージ210を組
み込んだ状態のネットワーク構成情報103を再構成し
(ステップS4)、ネットワーク300内の論理パッケージ2
10の接続情報310を「切り離し」から「接続」に変更する
(ステップS5)。
The configuration control unit 102 reconfigures the network configuration information 103 in which the logical package 210 is incorporated (step S4), and the logical package 2 in the network 300
The ten connection information 310 is changed from "disconnection" to "connection" (step S5).

【0015】[0015]

【発明の効果】以上、説明した様に本発明では、計算機
システムを制御するソフトウェアの動作状態に関わり無
く、故障論理パッケージの交換作業を完了することがで
きる。また、ソフトウェアの制御上、都合の良い動作状
態になった時点で、交換した論理パッケージのネットワ
ークへの組み込みができる。
As described above, according to the present invention, the replacement operation of the faulty logic package can be completed irrespective of the operating state of the software for controlling the computer system. Further, at the time when the operation state becomes convenient for software control, the replaced logical package can be incorporated into the network.

【0016】これらの仕組みにより、時間的制約の少な
い故障論理パッケージの並行保守を可能とする。
[0016] These mechanisms enable parallel maintenance of a faulty logic package with less time constraints.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の全体を示す構成図である。FIG. 1 is a configuration diagram showing the whole of the present invention.

【図2】ネットワークと論理パッケージの接続状態を保
持する情報の構成図である。
FIG. 2 is a configuration diagram of information holding a connection state between a network and a logical package.

【図3】論理パッケージの故障状態を保持する情報の構
成図である。
FIG. 3 is a configuration diagram of information holding a failure state of a logical package.

【図4】本発明を実行するためのフロー図である。FIG. 4 is a flowchart for implementing the present invention.

【符号の説明】[Explanation of symbols]

100…論理パッケージ交換作業制御部、101…CPUインタ
フェース制御部、102…構成制御部、103…ネットワーク
構成情報、200…ソフトウェア、201…故障部位情報、21
0〜213…論理パッケージ、300…ネットワーク、310〜31
3…ネットワークと論理パッケージの接続情報、500,600
…論理パッケージ番号、501,601…論理パッケージ番号5
00の接続状態、602…論理パッケージ番号500の故障状
態、S1,S2…手順(ステップ)の番号。
100: Logical package exchange work control unit, 101: CPU interface control unit, 102: Configuration control unit, 103: Network configuration information, 200: Software, 201: Fault location information, 21
0-213 ... Logical package, 300 ... Network, 310-31
3… Network and logical package connection information, 500,600
… Logical package number, 501,601… Logical package number 5
00: connection state, 602: failure state of logical package number 500, S1, S2: number of procedure (step).

───────────────────────────────────────────────────── フロントページの続き (72)発明者 原田 輝之 神奈川県秦野市堀山下1番地 株式会社日 立インフォメーションテクノロジー内 (72)発明者 ▲吉▼田 勝男 神奈川県秦野市堀山下1番地 株式会社日 立製作所エンタープライズサーバ事業部内 (72)発明者 上田 明弘 東京都小平市上水本町五丁目22番1号 株 式会社日立超エル・エス・アイ・システム ズ内 Fターム(参考) 5B045 GG11 JJ42  ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Teruyuki Harada 1st Horiyamashita, Hadano-shi, Kanagawa Prefecture Inside Nichi Information Technology Co., Ltd. (72) Inventor Akihiro Ueda 5-22-1, Kamizuhoncho, Kodaira-shi, Tokyo F-term (reference) 5B045 GG11 JJ42 in Hitachi Super LSI Systems Co., Ltd.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 ネットワークにより接続された複数の論
理パッケージが実装される並列計算機システムにおい
て、 計算機システムを制御するソフトウェアと、論理
パッケージの故障情報を保持する手段と、故障した論理
パッケージの交換が完了したことを設定する手段と、故
障した論理パッケージの交換が完了したことをソフトウ
ェアに通知する手段と、ネットワークと論理パッケージ
の接続状態を保持する手段と、ネットワークにある論理
パッケージとの接続情報を制御する手段とを有し、ソフ
トウェアの動作状況に応じ、ソフトウェアが任意に交換
完了した論理パッケージのネットワークへの組込みを可
能とする並列計算機システムの保守方式。
In a parallel computer system in which a plurality of logical packages connected by a network are mounted, software for controlling the computer system, means for retaining failure information of the logical package, and replacement of the failed logical package are completed. Means for setting the connection of the logical package, means for notifying the software that the replacement of the failed logical package has been completed, means for maintaining the connection state between the network and the logical package, and control of the connection information between the logical packages on the network. A maintenance method for a parallel computer system, which has a means for performing the above operation, and enables the incorporation of a logical package, whose software has been arbitrarily exchanged, into a network according to the operation state of the software.
JP2001177909A 2001-06-13 2001-06-13 Maintenance system of parallel computers Withdrawn JP2002366535A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001177909A JP2002366535A (en) 2001-06-13 2001-06-13 Maintenance system of parallel computers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001177909A JP2002366535A (en) 2001-06-13 2001-06-13 Maintenance system of parallel computers

Publications (1)

Publication Number Publication Date
JP2002366535A true JP2002366535A (en) 2002-12-20

Family

ID=19018685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001177909A Withdrawn JP2002366535A (en) 2001-06-13 2001-06-13 Maintenance system of parallel computers

Country Status (1)

Country Link
JP (1) JP2002366535A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870424B2 (en) 2006-11-14 2011-01-11 Honda Motor Co., Ltd. Parallel computer system
CN109980779A (en) * 2019-03-08 2019-07-05 南京国电南自电网自动化有限公司 A kind of intelligent substation multi-compartment cluster measure and control device and its dispositions method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7870424B2 (en) 2006-11-14 2011-01-11 Honda Motor Co., Ltd. Parallel computer system
CN109980779A (en) * 2019-03-08 2019-07-05 南京国电南自电网自动化有限公司 A kind of intelligent substation multi-compartment cluster measure and control device and its dispositions method
CN109980779B (en) * 2019-03-08 2021-10-22 南京国电南自电网自动化有限公司 Intelligent substation multi-interval cluster measurement and control device and deployment method thereof

Similar Documents

Publication Publication Date Title
KR100557399B1 (en) A method of improving the availability of a computer clustering system through the use of a network medium link state function
JP4353005B2 (en) System switching method for clustered computer systems
JP4529767B2 (en) Cluster configuration computer system and system reset method thereof
US20100057966A1 (en) Notifying Asynchronous Events To A Host Of A Data Storage System And Apparatus For The Same
JPH08328880A (en) Computer operation management system for operating system capable of simultaneous executing of plural application programs
JPH07221739A (en) System and method for data processing for enhancement of availability
JP4315016B2 (en) System switching method for computer system
US7076607B2 (en) System, method, and apparatus for storing segmented data and corresponding parity data
JP2002366535A (en) Maintenance system of parallel computers
JPH06348664A (en) Controller for computer system constituted of plural cpus provided with different instruction characteristics
JP2001331330A (en) Process abnormality detection and restoration system
JPH05314075A (en) On-line computer system
JPH10116261A (en) Check point restarting method for parallel computer system
JP2002116920A (en) Cluster system, monitoring method in cluster system, and computer program
JP2005050298A (en) Computer system, computer, data communication method, and program
CN111258823A (en) Method and system for switching master server and slave server
KR101883251B1 (en) Apparatus and method for determining failover in virtual system
JP2000148525A (en) Method for reducing load of active system in service processor duplex system
JPS592152A (en) Resetting system in case of fault
JPH0271336A (en) Monitor system for fault state of processor
JP2000357151A (en) Information processor
JP2003029998A (en) Information processor provided with console displaying operation state of redundant or duplexed logic part
JP2016224490A (en) Redundant system
JP2704137B2 (en) Current / spare switching method
JP3299315B2 (en) Multiprocessor system

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060512

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060512

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070216

A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902