JP5447626B1 - Cluster system and cluster system update method - Google Patents

Cluster system and cluster system update method Download PDF

Info

Publication number
JP5447626B1
JP5447626B1 JP2012211112A JP2012211112A JP5447626B1 JP 5447626 B1 JP5447626 B1 JP 5447626B1 JP 2012211112 A JP2012211112 A JP 2012211112A JP 2012211112 A JP2012211112 A JP 2012211112A JP 5447626 B1 JP5447626 B1 JP 5447626B1
Authority
JP
Japan
Prior art keywords
control unit
host
software
update
cluster system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012211112A
Other languages
Japanese (ja)
Other versions
JP2014067162A (en
Inventor
聖子 松村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012211112A priority Critical patent/JP5447626B1/en
Application granted granted Critical
Publication of JP5447626B1 publication Critical patent/JP5447626B1/en
Publication of JP2014067162A publication Critical patent/JP2014067162A/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】ホストコンピュータ(ホスト)と制御装置との間のインタフェース(IF)仕様の変更を伴うホストのソフトウェア(SW)および制御装置のSWのアップデートを行う場合において、システム全体を停止することなく双方のアップデートを行うことができるクラスタシステムなどを提供する。
【解決手段】クラスタシステム1は、複数のホストと、各ホストにより共有される第1の制御部及び第2の制御部からなる制御装置とによって構成されるクラスタシステムにおいて、ホストは、第1の制御部及び第2の制御部とのIFを制御するSWを備え、第1の制御部及び第2の制御部は、ホストとのIFを制御するSWを備え、ホストは、第1の制御部のSWのアップデートが完了するのに応じて、自コンピュータのSWを1台ずつアップデートし、第2の制御部は、ホストの全てのSWのアップデートが完了するのに応じて、第2の制御部のSWをアップデートする。
【選択図】図1
When updating host software (SW) and control device SW accompanying changes in interface (IF) specifications between a host computer (host) and a control device, both without stopping the entire system A cluster system that can update the system is provided.
A cluster system includes a plurality of hosts and a control device including a first control unit and a second control unit shared by the hosts. SW for controlling IF with the control unit and the second control unit is provided, the first control unit and the second control unit are provided with SW for controlling IF with the host, and the host is the first control unit. The SW of the own computer is updated one by one in accordance with the completion of the update of the SW, and the second control unit updates the second control unit in accordance with the completion of the update of all the SWs of the host. Update the SW.
[Selection] Figure 1

Description

本発明は、クラスタシステムにおけるソフトウェアをアップデートする技術に関する。   The present invention relates to a technique for updating software in a cluster system.

クラスタシステムにおいて、障害が発生した場合またはソフトウェアのアップデートを行う場合においても、システムを停止させることなく処理を続行する技術が知られている。   In a cluster system, even when a failure occurs or when software is updated, a technique for continuing processing without stopping the system is known.

例えば、特許文献1には、システムバスに通信可能に接続される、複数のプロセッサボードが故障した場合に、システムを停止することなくプロセッサボードを交換する技術が開示されている。   For example, Patent Document 1 discloses a technique for replacing a processor board without stopping the system when a plurality of processor boards that are communicably connected to the system bus have failed.

特許文献2には、複数のプロセッサを有するシステムにおけるプロセッサのソフトウェアのアップデート方式に関する技術が開示されている。具体的に、特許文献2には、稼動系と待機系とのプロセッサにおいて、同等の処理を行うことにより、稼動系の制御状態を待機系に反映させ、両プロセッサ間においてデータを一致させる技術が開示されている。   Patent Document 2 discloses a technique related to a software update method for a processor in a system having a plurality of processors. Specifically, Patent Document 2 discloses a technique for reflecting the control state of the active system in the standby system by performing equivalent processing in the active and standby processors, and matching the data between the processors. It is disclosed.

特許文献3には、ホストコンピュータとMSCP装置(Multi-System Control Processor:排他制御装置)とを有する疎結合のコンピュータシステムに関する技術が開示されている。   Patent Document 3 discloses a technique related to a loosely coupled computer system having a host computer and an MSCP device (Multi-System Control Processor: exclusive control device).

特開2003−157151JP 2003-157151 A 特開2002−49502JP2002-49502 特開2011−216059JP2011-216059

しかしながら、特許文献1には、障害が発生した場合の技術、すなわち故障時にシステムを停止させることなく部品交換を行う技術が開示されている。特許文献2には、プロセッサのソフトウェアのアップデートに関する技術について記載されている。   However, Patent Document 1 discloses a technique when a failure occurs, that is, a technique for replacing parts without stopping the system when a failure occurs. Japanese Patent Application Laid-Open No. 2004-228561 describes a technique related to updating of processor software.

特許文献3に開示されたコンピュータシステムにおいて、ホストコンピュータとMSCP装置の間のインタフェース仕様の変更を伴うアップデートを行う場合、上述した特許文献1及び特許文献2に開示された技術を適用すると、システムを停止しなければならない。その理由は、インタフェース仕様の変更を伴うアップデートを行う場合、ホストコンピュータ側のソフトウェアとMSCP装置側のソフトウェアの双方を同時にアップデートする必要があるからである。   In the computer system disclosed in Patent Document 3, in the case of performing an update accompanied by a change in the interface specification between the host computer and the MSCP device, if the technology disclosed in Patent Document 1 and Patent Document 2 described above is applied, the system is Must stop. The reason for this is that, when performing an update with a change in interface specifications, it is necessary to update both the software on the host computer side and the software on the MSCP device side at the same time.

本発明は、上記課題を鑑み、ホストコンピュータと制御装置との間のインタフェース仕様の変更を伴うホストコンピュータのソフトウェアおよび制御装置のソフトウェアのアップデートを行う場合において、システム全体を停止することなく双方のアップデートを行うことができるクラスタシステムなどを提供することを1つの目的とする。   In view of the above-described problems, the present invention provides an update for both the host computer software and the control device software that is accompanied by a change in the interface specifications between the host computer and the control device without stopping the entire system. It is an object to provide a cluster system or the like that can perform the above.

上記目的を達成するために、本発明に係るクラスタシステムは、複数のホストコンピュータと、前記各ホストコンピュータにより共有される第1の制御部及び第2の制御部からなる制御装置とによって構成されるクラスタシステムにおいて、前記ホストコンピュータは、前記第1の制御部及び前記第2の制御部とのインタフェースを制御するソフトウェアを備え、前記第1の制御部及び前記第2の制御部は、前記ホストコンピュータとのインタフェースを制御するソフトウェアを備え、前記ホストコンピュータは、前記第1の制御部のソフトウェアのアップデートが完了するのに応じて、自コンピュータのソフトウェアを1台ずつアップデートし、前記第2の制御部は、前記ホストコンピュータの全てのソフトウェアのアップデートが完了するのに応じて、前記第2の制御部のソフトウェアをアップデートすることを特徴とする。   In order to achieve the above object, a cluster system according to the present invention includes a plurality of host computers and a control device including a first control unit and a second control unit shared by the host computers. In the cluster system, the host computer includes software for controlling an interface with the first control unit and the second control unit, and the first control unit and the second control unit are configured as the host computer. The host computer updates the software of its own computer one by one in response to completion of the software update of the first control unit, and the second control unit Update all software on the host computer. In response to, characterized by updating the software of the second control unit.

上記目的を達成するために、本発明に係るクラスタシステムのアップデート方法は、複数のホストコンピュータと、前記各ホストコンピュータにより共有される第1の制御部及び第2の制御部からなる制御装置とによって構成されるクラスタシステムにおいて、前記ホストコンピュータは、前記第1の制御部及び前記第2の制御部とのインタフェースを制御するソフトウェアを備え、前記第1の制御部及び前記第2の制御部は、前記ホストコンピュータとのインタフェースを制御するソフトウェアを備え、前記第1の制御部のソフトウェアのアップデートが完了するのに応じて、前記ホストコンピュータのソフトウェアを1台ずつアップデートし、前記ホストコンピュータの全てのソフトウェアのアップデートが完了するのに応じて、前記第2の制御部のソフトウェアをアップデートする。   In order to achieve the above object, a cluster system update method according to the present invention includes a plurality of host computers and a control device including a first control unit and a second control unit shared by the host computers. In the cluster system configured, the host computer includes software that controls an interface with the first control unit and the second control unit, and the first control unit and the second control unit include: Software for controlling an interface with the host computer, and updating the software of the host computer one by one in response to completion of the software update of the first control unit. As the update of To update the software of the control unit of.

本発明に係るクラスタシステムは、ホストコンピュータと制御装置との間のインタフェース仕様の変更を伴うホストコンピュータのソフトウェアおよび制御装置のソフトウェアのアップデートを行う場合において、システム全体を停止することなく双方のアップデートを行うことができる。   In the cluster system according to the present invention, when updating the software of the host computer and the software of the control device accompanied by the change of the interface specification between the host computer and the control device, both updates are performed without stopping the entire system. It can be carried out.

本発明の第1の実施形態に係るクラスタシステム1の構成を示す図である。It is a figure which shows the structure of the cluster system 1 which concerns on the 1st Embodiment of this invention. 第1の実施形態に係るクラスタシステム1の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the cluster system 1 which concerns on 1st Embodiment. 第1の実施形態に係るクラスタシステム1のステップS104の詳細を示すフローチャートである。It is a flowchart which shows the detail of step S104 of the cluster system 1 which concerns on 1st Embodiment. 第1の実施形態に係るクラスタシステム1のステップS108の詳細を示すフローチャートである。It is a flowchart which shows the detail of step S108 of the cluster system 1 which concerns on 1st Embodiment. 第1の実施形態に係るクラスタシステム1のステップS114の詳細を示すフローチャートである。It is a flowchart which shows the detail of step S114 of the cluster system 1 which concerns on 1st Embodiment. 第1の実施形態に係るクラスタシステム1のアップデート途中における、各ホスト10A〜10nと制御装置20との接続状況を表す図である。It is a figure showing the connection condition of each host 10A-10n and the control apparatus 20 in the middle of the update of the cluster system 1 which concerns on 1st Embodiment.

以下、本発明を、図面を参照して詳細に説明する。   Hereinafter, the present invention will be described in detail with reference to the drawings.

<第1の実施形態>
はじめに、本発明の第1の実施形態に係るクラスタシステムについて説明する。
<First Embodiment>
First, the cluster system according to the first embodiment of the present invention will be described.

図1は、本発明の第1の実施形態に係るクラスタシステム1の構成を示す図である。図1に示すように、クラスタシステム1は、プログラム制御により動作する複数のホストコンピュータ(以下、「ホスト」と称する)10と、第1の制御部22及び第2の制御部24を有する制御装置20とによって構成される。   FIG. 1 is a diagram showing a configuration of a cluster system 1 according to the first embodiment of the present invention. As shown in FIG. 1, the cluster system 1 includes a plurality of host computers (hereinafter referred to as “hosts”) 10 that operate by program control, and a first control unit 22 and a second control unit 24. 20.

複数のホスト10は、各々独立したコンピュータである。各ホスト10は、第1の制御部22及び第2の制御部24とそれぞれ通信可能に接続されている(以下、本願においては、「接続」と略称する)。ホスト10の一例として、サーバー等が挙げられる。また、複数のホスト10は、それぞれ第1の制御部22及び第2の制御部24との通信インタフェース(以下、本願においては、「インタフェース」と略称する)14を制御するソフトウェア(以下、「SW」と略称する)12を備える。ホスト10は、SW12をアップデートする際に、第1の制御部22及び第2の制御部24との接続を切断する。ホスト10は、SW12のアップデートが完了した際に、第1の制御部22及び第2の制御部24との接続を試行する。   The plurality of hosts 10 are independent computers. Each host 10 is communicably connected to the first control unit 22 and the second control unit 24 (hereinafter, abbreviated as “connection” in the present application). An example of the host 10 is a server. Each of the plurality of hosts 10 includes software (hereinafter referred to as “SW”) that controls a communication interface (hereinafter referred to as “interface”) 14 with each of the first control unit 22 and the second control unit 24. ”). When the host 10 updates the SW 12, the host 10 disconnects from the first control unit 22 and the second control unit 24. The host 10 tries to connect to the first control unit 22 and the second control unit 24 when the update of the SW 12 is completed.

ホスト10は、第1の制御部22及び第2の制御部24の両方と接続が確立している場合、第1の制御部22及び第2の制御部24の両方の負荷がほぼ均等になるよう分散して処理を行う(負荷分散)。一方、ホスト10は、第1の制御部22及び第2の制御部24のどちらか一方とのみ接続が確立している場合、接続が確立している制御部とだけ処理を行う。   When the host 10 is connected to both the first control unit 22 and the second control unit 24, the loads on both the first control unit 22 and the second control unit 24 are almost equal. Distribute processing in such a way (load distribution). On the other hand, when the connection is established with only one of the first control unit 22 and the second control unit 24, the host 10 performs processing only with the control unit with which the connection is established.

制御装置20は、第1の制御部22と第2の制御部24とを有し、クラスタシステムにおいて、共有される装置である。第1の制御部22及び第2の制御部24は、互いに接続されている。   The control device 20 includes a first control unit 22 and a second control unit 24, and is a device shared in the cluster system. The first control unit 22 and the second control unit 24 are connected to each other.

制御装置20の一例として、排他制御装置が挙げられる。排他制御装置は、複数のプロセスが利用する共有資源に対して、それらのプロセスからの同時アクセスにより競合が発生する場合に、あるプロセスに資源を独占的に利用させている間は、他のプロセスが利用できないようにすることで整合性を保つ。   An example of the control device 20 is an exclusive control device. When a conflict occurs due to simultaneous access from multiple processes to a shared resource used by multiple processes, the exclusive control device allows other processes to exclusively use the resources. Consistency is maintained by making it unavailable.

第1の制御部22と第2の制御部24は、例えば、同様の構成である。第1の制御部22及び第2の制御部24は、それぞれが独立して排他制御処理を実行し処理結果を互いにバックアップする。第1の制御部22及び第2の制御部24は、処理結果を互いへバックアップすることにより、片方の装置が障害で停止した場合、残った装置によってシステムの運用を継続できるよう構成されている。   The 1st control part 22 and the 2nd control part 24 are the same structures, for example. Each of the first control unit 22 and the second control unit 24 independently executes an exclusive control process and backs up the processing results. The first control unit 22 and the second control unit 24 are configured to back up processing results to each other so that when one device stops due to a failure, the operation of the system can be continued by the remaining device. .

第1の制御部22及び第2の制御部24は、ホスト10とのインタフェース28及びインタフェース32を制御するSW26及びSW30を備える。第1の制御部22及び第2の制御部24は、SW26及びSW30をアップデートする際に、各ホスト10との接続を切断する。第1の制御部22及び第2の制御部24は、SW26及びSW30のアップデートが完了した場合、各ホスト10との接続を試行する。第1の制御部22及び第2の制御部24は、各ホスト10のSW12のリビジョン(バージョン)を読み出し、アップデートされたSW26及びSW30が備える互換性のあるリビジョンの範囲情報と比較する。第1の制御部22及び第2の制御部24は、ホスト10のリビジョンが範囲内の場合はそのホスト10との接続を確立し、ホスト10のリビジョンが範囲外の場合はそのホスト10との接続を保留する
次に、クラスタシステム1の動作を説明する。
The first control unit 22 and the second control unit 24 include SW 26 and SW 30 that control the interface 28 and the interface 32 with the host 10. The first control unit 22 and the second control unit 24 disconnect the connection with each host 10 when updating the SW 26 and SW 30. The first control unit 22 and the second control unit 24 try to connect to each host 10 when the update of the SW 26 and the SW 30 is completed. The first control unit 22 and the second control unit 24 read the revision (version) of the SW 12 of each host 10 and compare it with the compatible revision range information included in the updated SW 26 and SW 30. The first control unit 22 and the second control unit 24 establish a connection with the host 10 when the revision of the host 10 is within the range, and with the host 10 when the revision of the host 10 is out of the range. Next, the operation of the cluster system 1 will be described.

図2は、本発明の第1の実施形態に係るクラスタシステム1の動作を示すフローチャートである。   FIG. 2 is a flowchart showing the operation of the cluster system 1 according to the first embodiment of the present invention.

図2に示すように、ステップS102において、第1の制御部22は、SW26をアップデートする。   As shown in FIG. 2, in step S102, the first control unit 22 updates the SW 26.

ステップS104において、第1の制御部22は、SW26のアップデートが完了すると、各ホスト10との接続を試行する。ステップS104についての詳細は、後述する。   In step S <b> 104, the first control unit 22 tries to connect to each host 10 when the update of the SW 26 is completed. Details of step S104 will be described later.

ステップS106において、各ホスト10は、SW12をアップデートする。   In step S106, each host 10 updates SW12.

ステップS108において、SW12をアップデートしたホスト10は、第1の制御部22及び第2の制御部24との接続を試行する。ステップS108についての詳細は、後述する。   In step S <b> 108, the host 10 that has updated the SW 12 tries to connect to the first control unit 22 and the second control unit 24. Details of step S108 will be described later.

ステップS110において、全てのホスト10のSW12のアップデートが完了した場合、ステップS112に進む。全てのホスト10のSW12のアップデートが完了していない場合、ステップS106に進む。   In step S110, when the update of SW 12 of all the hosts 10 is completed, the process proceeds to step S112. If updating of the SWs 12 of all the hosts 10 has not been completed, the process proceeds to step S106.

ステップS112において、第2の制御部24は、SW30をアップデートする。   In step S112, the second control unit 24 updates the SW 30.

ステップS114において、第2の制御部24は、SW30のアップデートが完了すると、各ホスト10との接続を試みる。ステップS114についての詳細は、後述する。   In step S114, the second control unit 24 tries to connect to each host 10 when the update of the SW 30 is completed. Details of step S114 will be described later.

図3は、本発明の第1の実施形態に係るクラスタシステム1のステップS104の詳細を示すフローチャートである。   FIG. 3 is a flowchart showing details of step S104 of the cluster system 1 according to the first embodiment of the present invention.

図3に示すように、ステップS202において、SW26のアップデートが完了した第1の制御部22は、ホスト10との接続を試行する。   As shown in FIG. 3, in step S <b> 202, the first control unit 22 that has completed the update of the SW 26 tries to connect to the host 10.

ステップS204において、第1の制御部22は、ホスト10のSW12のリビジョンを読み出し、アップデートされたSW26が備える互換性のあるリビジョンの範囲情報と比較する。   In step S204, the first control unit 22 reads the revision of the SW 12 of the host 10 and compares it with the compatible revision range information included in the updated SW 26.

ステップS206において、第1の制御部22は、アップデートされたSW26が備える互換性のあるリビジョンの範囲内にホスト10のリビジョンが含まれる場合、処理をS208に進める。一方、第1の制御部22は、アップデートされたSW26が備える互換性のあるリビジョンの範囲内にホスト10のリビジョンが含まれない場合、処理をS210に進める。   In step S206, if the revision of the host 10 is included in the compatible revision range included in the updated SW 26, the first control unit 22 advances the process to step S208. On the other hand, if the revision of the host 10 is not included in the compatible revision range included in the updated SW 26, the first control unit 22 advances the process to S210.

ステップS208において、第1の制御部22は、互換性のあるSW12を備えるホスト10との接続を確立する(接続を完了する)。   In step S208, the first control unit 22 establishes a connection with the host 10 including the compatible SW 12 (completes the connection).

ステップS210において、第1の制御部22は、互換性のないSW12を備えるホスト10との接続を保留する。   In step S210, the first control unit 22 suspends the connection with the host 10 including the incompatible SW12.

ステップS212において、第1の制御部22は、全てのホスト10に対して、上記S202〜S210を行った場合、処理をS106に進める。一方、第1の制御部22は、全てのホスト10に対して、上記S202〜S210の動作を行っていない場合、処理をS202に戻す。   In step S212, when the first control unit 22 performs the above-described steps S202 to S210 for all the hosts 10, the process proceeds to step S106. On the other hand, the first control unit 22 returns the process to S202 when the operations of S202 to S210 are not performed on all the hosts 10.

図4は、本発明の第1の実施形態に係るクラスタシステム1のステップS108の詳細を示すフローチャートである。   FIG. 4 is a flowchart showing details of step S108 of the cluster system 1 according to the first embodiment of the present invention.

図4に示すように、ステップS302において、SW12のアップデートが完了したホスト10は、第1の制御部22と接続を試行する。   As shown in FIG. 4, in step S <b> 302, the host 10 that has completed the update of the SW 12 tries to connect to the first control unit 22.

ステップS304において、第1の制御部22は、SW12のアップデートが完了したホスト10からの接続を認識することにより、そのホスト10のSW12のリビジョンを読み出し、SW26が備える互換性のあるリビジョンの範囲情報と比較する。   In step S304, the first control unit 22 recognizes the connection from the host 10 in which the update of the SW 12 is completed, thereby reading the revision of the SW 12 of the host 10, and the compatible revision range information included in the SW 26. Compare with

ステップS306において、第1の制御部22は、SW26が備える互換性のあるリビジョンの範囲内にそのホスト10のリビジョンが含まれる場合、処理をS308に進める。一方、第1の制御部22は、SW26が備える互換性のあるリビジョンの範囲内にそのホスト10のリビジョンが含まれない場合、処理をS310に進める。   In step S306, if the revision of the host 10 is included in the compatible revision range included in the SW 26, the first control unit 22 advances the process to S308. On the other hand, if the revision of the host 10 is not included in the compatible revision range of the SW 26, the first control unit 22 advances the process to S310.

ステップS308において、第1の制御部22は、互換性のあるSW12を備えるホスト10との接続を確立する(接続を完了する)。   In step S308, the first control unit 22 establishes a connection with the host 10 including the compatible SW 12 (completes the connection).

ステップS310において、第1の制御部22は、互換性のないSW12を備えるホスト10との接続を保留する。   In step S310, the first control unit 22 suspends the connection with the host 10 including the incompatible SW12.

ステップS312において、SW12のアップデートが完了したホスト10は、第2の制御部24と接続を試行する。   In step S312, the host 10 that has completed the update of the SW 12 tries to connect with the second control unit 24.

ステップS314において、第2の制御部24は、SW12のアップデートが完了したホスト10からの接続を認識することにより、そのホスト10のSW12のリビジョンを読み出し、SW30が備える互換性のあるリビジョンの範囲情報と比較する。   In step S314, the second control unit 24 recognizes the connection from the host 10 in which the update of the SW 12 is completed, thereby reading the revision of the SW 12 of the host 10, and the compatible revision range information included in the SW 30. Compare with

ステップS316において、第2の制御部24は、SW30が備える互換性のあるリビジョンの範囲内にそのホスト10のリビジョンが含まれる場合、処理をS318に進める。一方、第2の制御部24は、SW30が備える互換性のあるリビジョンの範囲内にそのホスト10のリビジョンが含まれない場合、処理をS320に進める。   In step S316, if the revision of the host 10 is included in the compatible revision range included in the SW 30, the second control unit 24 advances the process to step S318. On the other hand, if the revision of the host 10 is not included in the compatible revision range of the SW 30, the second control unit 24 advances the process to S320.

ステップS318において、第2の制御部24は、互換性のあるSW12を備えるホスト10との接続を確立する(接続を完了する)。   In step S318, the second control unit 24 establishes a connection with the host 10 including the compatible SW 12 (completes the connection).

ステップS320において、第2の制御部24は、互換性のないSW12を備えるホスト10との接続を保留する。   In step S320, the second control unit 24 suspends the connection with the host 10 including the incompatible SW 12.

図5は、本発明の第1の実施形態に係るクラスタシステム1のステップS114の詳細を示すフローチャートである。   FIG. 5 is a flowchart showing details of step S114 of the cluster system 1 according to the first embodiment of the present invention.

図5に示すように、ステップS402において、SW30のアップデートが完了した第2の制御部24は、ホスト10との接続を試行する。   As illustrated in FIG. 5, in step S <b> 402, the second control unit 24 that has completed the update of the SW 30 tries to connect to the host 10.

ステップS404において、第2の制御部24は、ホスト10のSW12のリビジョンを読み出し、アップデートされたSW30が備える互換性のあるリビジョンの範囲情報と比較する。   In step S404, the second control unit 24 reads the revision of the SW 12 of the host 10 and compares it with the compatible revision range information included in the updated SW 30.

ステップS406において、第2の制御部24は、アップデートされたSW30が備える互換性のあるリビジョンの範囲内にホスト10のリビジョンが含まれる場合、処理をS408に進める。一方、第2の制御部24は、アップデートされたSW30が備える互換性のあるリビジョンの範囲内にホスト10のリビジョンが含まれない場合、処理をS410に進める。   In step S406, if the revision of the host 10 is included in the compatible revision range included in the updated SW 30, the second control unit 24 advances the process to step S408. On the other hand, if the revision of the host 10 is not included in the compatible revision range of the updated SW 30, the second control unit 24 advances the process to S410.

ステップS408において、第2の制御部24は、互換性のあるSW12を備えるホスト10との接続を確立する(接続を完了する)。   In step S408, the second control unit 24 establishes a connection with the host 10 including the compatible SW 12 (completes the connection).

ステップS410において、第2の制御部24は、互換性のないSW12を備えるホスト10との接続を保留する。   In step S410, the second control unit 24 suspends the connection with the host 10 including the incompatible SW12.

ステップS412において、第2の制御部24は、全てのホスト10に対して、上記S402〜S410を行った場合、処理を終了する。一方、第2の制御部24は、全てのホスト10に対して、上記S402〜S410の動作を行っていない場合、処理をS402に戻す。   In step S412, the second control unit 24 ends the process when the above-described steps S402 to S410 are performed on all the hosts 10. On the other hand, the second control unit 24 returns the process to S402 when the operations of S402 to S410 are not performed for all the hosts 10.

ここで、制御装置20を介して、異なるホスト10の間における情報交換を行う場合について説明する。図1に示すように、各ホスト10と制御装置20の備える第1の制御部22及び第2の制御部24との接続が確立されている場合には、異なるホスト間における情報交換は、第1の制御部22及び第2の制御部24のいずれか一方を介して行う。   Here, a case where information is exchanged between different hosts 10 via the control device 20 will be described. As shown in FIG. 1, when the connection between each host 10 and the first control unit 22 and the second control unit 24 included in the control device 20 is established, information exchange between different hosts is performed as follows. This is performed via one of the first control unit 22 and the second control unit 24.

一方、図6は、クラスタシステムのアップデート途中における、各ホスト10A〜10nと制御装置20との接続状況を表す図である。図6に示すように、第1の制御部22のSW26及び複数のホスト10A〜10nのうちの1つのホスト10AのSW12Aのアップデートが完了した場合を考える。このとき、第1の制御部22とホスト10Aとの接続は確立していることとする。また、第2の接続部24とその他のホスト10B〜10nとの接続は確立していることとする。   On the other hand, FIG. 6 is a diagram showing the connection status between the hosts 10A to 10n and the control device 20 during the update of the cluster system. As shown in FIG. 6, consider a case where the update of the SW 26 of the first control unit 22 and the SW 12A of one host 10A among the plurality of hosts 10A to 10n is completed. At this time, it is assumed that the connection between the first control unit 22 and the host 10A is established. In addition, it is assumed that the connection between the second connection unit 24 and the other hosts 10B to 10n has been established.

ここで、ホスト10Bが、ホスト10Aと情報交換を行う場合を考える。ホスト10Bは、第2の制御部24に、ホスト10Aと情報交換を行う指示を出す。しかし、第2の制御部24は、ホスト10Aとの接続がないことを認識し、第1の制御部22にホスト10Bからの指示を転送する。指示を転送された第1の制御部22は、ホストAとの接続が確立していることを認識し、ホスト10Aに指示を転送する。上記のように、ホストBは、第1の制御部22及び第2の制御部24を介して、ホストAと情報交換を行う。   Here, consider a case where the host 10B exchanges information with the host 10A. The host 10B instructs the second control unit 24 to exchange information with the host 10A. However, the second control unit 24 recognizes that there is no connection with the host 10A, and transfers the instruction from the host 10B to the first control unit 22. The first control unit 22 to which the instruction has been transferred recognizes that the connection with the host A has been established, and transfers the instruction to the host 10A. As described above, the host B exchanges information with the host A via the first control unit 22 and the second control unit 24.

したがって、第1の実施形態に係るクラスタシステム1は、ホストコンピュータと制御装置との間のインタフェース仕様の変更を伴う機能強化を行うホストコンピュータのSWおよび制御装置のSWのアップデートを行う場合において、システム全体を停止することなく双方のアップデートを行うことができる。その理由は、第1の制御部22、各ホスト10、第2の制御部24の順にアップデートを行うからである。また、第1の制御部22及び第2の制御部24は、アップデートを行った際に、各ホスト10との接続を試行し、互換性のあるSW12を有するホスト10と接続するからである。また、各ホスト10は、アップデートを行った際に、第1の制御部22及び第2の制御部24との接続を試行することにより、第1の制御部22及び第2の制御部が、互換性のあるSW12を有するホスト10と接続するからである。   Therefore, when the cluster system 1 according to the first embodiment updates the SW of the host computer and the SW of the control device that perform functional enhancement accompanied by the change of the interface specification between the host computer and the control device, the system Both updates can be performed without stopping the whole. This is because the update is performed in the order of the first control unit 22, each host 10, and the second control unit 24. In addition, when the update is performed, the first control unit 22 and the second control unit 24 try to connect to each host 10 and connect to the host 10 having the compatible SW 12. Each host 10 tries to connect to the first control unit 22 and the second control unit 24 when updating, so that the first control unit 22 and the second control unit This is because the host 10 having the compatible SW 12 is connected.

1 クラスタシステム
10 ホストコンピュータ(ホスト)
12、26、30 ソフトウェア(SW)
14、28、32 通信インタフェース(インタフェース)
20 制御装置
22 第1の制御部
24 第2の制御部
1 Cluster system 10 Host computer (host)
12, 26, 30 Software (SW)
14, 28, 32 Communication interface (interface)
20 control device 22 first control unit 24 second control unit

Claims (4)

複数のホストコンピュータと、前記各ホストコンピュータにより共有される第1の制御部及び第2の制御部からなる制御装置とによって構成されるクラスタシステムにおいて、
前記ホストコンピュータは、前記第1の制御部及び前記第2の制御部とのインタフェースを制御するソフトウェアを備え、
前記第1の制御部及び前記第2の制御部は、前記ホストコンピュータとのインタフェースを制御するソフトウェアを備え、
前記ホストコンピュータは、前記第1の制御部のソフトウェアのアップデートが完了するのに応じて、自コンピュータのソフトウェアをップデートし、
前記第2の制御部は、前記複数のホストコンピュータソフトウェアのアップデートが完了するのに応じて、前記第2の制御部のソフトウェアをアップデートすることを特徴とするクラスタシステム。
In a cluster system constituted by a plurality of host computers and a control device including a first control unit and a second control unit shared by the host computers,
Each of the host computers includes software for controlling an interface with the first control unit and the second control unit,
The first control unit and the second control unit include software for controlling an interface with each host computer,
Wherein each host computer in response to software update of the first control unit is completed, the software of the host computer and A Ppudeto,
The second control unit updates the software of the second control unit in response to completion of the software update of the plurality of host computers.
前記第1の制御部及び前記第2の制御部のソフトウェアは、前記複数のホストコンピュータにおけるホストコンピュータとの接続処理を試行する場合に、前記ホストコンピュータのリビジョンを読み出し、そのソフトウェアが備える互換性のあるリビジョンの範囲情報と比較し、前記ホストコンピュータのリビジョンが範囲内の場合はそのホストコンピュータとの前記接続処理完了し、前記ホストコンピュータのリビジョンが範囲外の場合はそのホストコンピュータとの前記接続処理を保留する、請求項1に記載のクラスタシステム。 The software of the first control unit and the second control unit reads the revision of the host computer when trying to connect to the host computer in the plurality of host computers, and is compatible with the software. compared to a revision of the range information, the case revision of the host computer is in a range to complete the connection process with the host computer, if the revision of the host computer is out of range the connection with the host computer The cluster system according to claim 1, wherein the processing is suspended. 前記ホストコンピュータは、自コンピュータのソフトウェアをアップデートする際、前記第1の制御部及び前記第2の制御部との通信接続を切断し、自コンピュータのソフトウェアのアップデートが完了すると、アップデートを完了した自コンピュータが個別に前記接続処理を試行する、請求項1または請求項2のいずれかに記載のクラスタシステム。 When each host computer updates the software of its own computer , the host computer disconnects the communication connection with the first control unit and the second control unit, and when the update of the software of its own computer is completed , the update is completed. The cluster system according to claim 1 , wherein the own computer individually tries the connection process . 複数のホストコンピュータと、前記各ホストコンピュータにより共有される第1の制御部及び第2の制御部からなる制御装置とによって構成されるクラスタシステムにおいて、
前記ホストコンピュータは、前記第1の制御部及び前記第2の制御部とのインタフェースを制御するソフトウェアを備え、
前記第1の制御部及び前記第2の制御部は、前記ホストコンピュータとのインタフェースを制御するソフトウェアを備える場合に、
前記クラスタシステムによって、
前記第1の制御部のソフトウェアのアップデートが完了するのに応じて、前記ホストコンピュータのソフトウェアをップデートし、
前記複数のホストコンピュータソフトウェアのアップデートが完了するのに応じて、前記第2の制御部のソフトウェアをアップデートすることを特徴とするクラスタシステムのアップデート方法。
In a cluster system constituted by a plurality of host computers and a control device including a first control unit and a second control unit shared by the host computers,
Each of the host computers includes software for controlling an interface with the first control unit and the second control unit,
When the first control unit and the second control unit include software for controlling an interface with each host computer,
By the cluster system,
In response to the software update of the first control unit is completed, the software of the respective host computer A Ppudeto,
A cluster system update method, comprising: updating software of the second control unit in response to completion of software update of the plurality of host computers.
JP2012211112A 2012-09-25 2012-09-25 Cluster system and cluster system update method Expired - Fee Related JP5447626B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012211112A JP5447626B1 (en) 2012-09-25 2012-09-25 Cluster system and cluster system update method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012211112A JP5447626B1 (en) 2012-09-25 2012-09-25 Cluster system and cluster system update method

Publications (2)

Publication Number Publication Date
JP5447626B1 true JP5447626B1 (en) 2014-03-19
JP2014067162A JP2014067162A (en) 2014-04-17

Family

ID=50614413

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012211112A Expired - Fee Related JP5447626B1 (en) 2012-09-25 2012-09-25 Cluster system and cluster system update method

Country Status (1)

Country Link
JP (1) JP5447626B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579139A (en) * 2020-12-09 2021-03-30 北京红山信息科技研究院有限公司 Multi-cluster patch updating method, system, server and storage medium

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016125294A1 (en) * 2015-02-06 2016-08-11 株式会社日立製作所 Computer system, management device, and method
CN108681461A (en) * 2018-05-07 2018-10-19 广东电网有限责任公司 A kind of clustered software system does not shut down newer method, system and relevant apparatus

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06309117A (en) * 1993-04-22 1994-11-04 Hitachi Ltd Uninterruptible maintenance method for disk controller and disk controller
JP3385407B2 (en) * 2000-07-14 2003-03-10 株式会社日立製作所 Non-stop program change method for multiprocessor system and multiprocessor system
JP4497953B2 (en) * 2004-02-25 2010-07-07 株式会社日立製作所 Information processing system and information processing method
JP2009265939A (en) * 2008-04-24 2009-11-12 Panasonic Electric Works Co Ltd Equipment management system
JP5530893B2 (en) * 2010-10-08 2014-06-25 株式会社野村総合研究所 Function expansion method of service providing system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112579139A (en) * 2020-12-09 2021-03-30 北京红山信息科技研究院有限公司 Multi-cluster patch updating method, system, server and storage medium

Also Published As

Publication number Publication date
JP2014067162A (en) 2014-04-17

Similar Documents

Publication Publication Date Title
US11200079B2 (en) System and method for virtual machine live migration
US11392417B2 (en) Ultraconverged systems having multiple availability zones
US20130111075A1 (en) Switching control device and switching control method
US9652427B2 (en) Processor module, micro-server, and method of using processor module
WO2017179537A1 (en) Software update control device, software update control system, software update control method, and recording medium having software update control program stored thereon
JP6431197B2 (en) Snapshot processing methods and associated devices
JP5447626B1 (en) Cluster system and cluster system update method
CN107870662B (en) CPU reset method in multi-CPU system and PCIe interface card
US20190056970A1 (en) Method for computer-aided coupling a processing module into a modular technical system and modular technical system
WO2014180207A1 (en) Metadata server migration processing method and device
CN103345407A (en) Control circuit, connectivity controller, connectivity control method and main board
CN110187923A (en) A kind of CPU starting method and apparatus applied to multi -CPU board
JP2007304845A (en) Virtual computer system and software update method
WO2009145098A1 (en) I/o connection system, method and program
CN109117289B (en) Server system and method for managing dual-substrate management controller
CN105446654B (en) Server control method and rack controller
US11966350B2 (en) Configurable storage server with multiple sockets
CN104901836A (en) Cross-regional connection method and device for SDN controllers and forwarding equipment
JP5470884B2 (en) Multi-node system, abnormality processing method, switch, node, and program
CN106155573B (en) method and device for expanding storage device and expanded storage device
CN109901954B (en) Storage device and resource management method
US10303568B2 (en) Systems and methods for high availability of management controllers
JP6841876B2 (en) Flexible connection of processor modules
JP6958110B2 (en) Information processing equipment and programs
JP5672225B2 (en) HARDWARE MANAGEMENT DEVICE, INFORMATION PROCESSING DEVICE, HARDWARE MANAGEMENT METHOD, AND COMPUTER PROGRAM

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131216

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5447626

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees