JP2007094609A - Computer system facilitating io card maintenance - Google Patents

Computer system facilitating io card maintenance Download PDF

Info

Publication number
JP2007094609A
JP2007094609A JP2005281080A JP2005281080A JP2007094609A JP 2007094609 A JP2007094609 A JP 2007094609A JP 2005281080 A JP2005281080 A JP 2005281080A JP 2005281080 A JP2005281080 A JP 2005281080A JP 2007094609 A JP2007094609 A JP 2007094609A
Authority
JP
Japan
Prior art keywords
card
slot
board
bus
spare
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005281080A
Other languages
Japanese (ja)
Inventor
Hidenori Ito
英則 伊藤
Noriaki Shimizu
徳明 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005281080A priority Critical patent/JP2007094609A/en
Publication of JP2007094609A publication Critical patent/JP2007094609A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a computer system capable of restoring and operating a system in the same way as a conventional way without physically replacing a board or changing setting to software in switching to a substitute board when an IO card of a computer fails. <P>SOLUTION: When the IO card in operation fails, the card is separated from a bus, and the bus is connected to another card mounted beforehand into a spare slot. At this time, a bus signal line uniquely assigned to the slot is taken over by switching mechanism hardware. In software, the card is thereby handled in the same way as the card being replaced in a conventional operation slot. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、コンピュータのIOカード保守時に、IOカードを故障発生時に取り替え作業の発生しない、また、専用のスタンバイ用ソフトウェアを必要としない、保守性に優れたコンピュータシステムの構成に関する。   The present invention relates to a configuration of a computer system excellent in maintainability, in which an IO card is not replaced when a failure occurs and a dedicated standby software is not required during maintenance of a computer IO card.

コンピュータのIOカードの故障時に、全体システムを停止することなくIOカードを交換する方式として、PCIホットプラグ方式が存在する。PCIホットプラグ方式においては、ボードの交換作業において、交換前のボードが搭載されていたスロットに、新ボードを取り付けることにより、オペレーティングシステムは、従来使用していたソフトウェアリソースを新ボードに割り付け、新ボードを従来ボードと同様に扱い、システム全体として、従来と変わらぬ機能を提供できる。   There is a PCI hot plug method as a method for replacing an IO card without stopping the entire system when a computer IO card fails. In the PCI hot-plug method, the operating system allocates the previously used software resources to the new board by installing the new board in the slot in which the board was installed before replacing the board. The board is handled in the same way as a conventional board, and the system as a whole can provide the same functions as before.

特開平5−274167号公報JP-A-5-274167

しかし、PCIホットプラグでのボードの交換作業は、稼動中の電源が入った装置に対して、実施するため、交換時に他のデバイスに触るなどの作業ミスが、システムダウンを引き起こす可能性があり、作業上、安全で確実な保守方法とは言い難く、実際に使用されているケースは多くない。   However, because the board replacement work using the PCI hot plug is performed for a device that is powered on during operation, an error such as touching another device during replacement may cause the system to go down. It is difficult to say that it is a safe and reliable maintenance method in terms of work, and there are not many cases where it is actually used.

代替案として、予め、装置内に予備のIOカードを装着しておき、専用ソフトウェアの管理下において、専用ソフトウェアのボード異常検知時に、使用するカードを予備カードに切り替えるという方式も存在する。この場合、予備カードは予め装置に実装されているため、現象発生時にカード交換作業は不要である。また、迅速な移行処理が可能である。   As an alternative, there is a method in which a spare IO card is installed in the apparatus in advance, and the card to be used is switched to a spare card when the board error of the dedicated software is detected under the management of the dedicated software. In this case, since the spare card is mounted in the apparatus in advance, the card exchange work is not necessary when the phenomenon occurs. In addition, quick migration processing is possible.

しかし、この方式では、専用ソフトウェアが必要で、かつ、同ソフトウェアに変更のポリシー設定が必要など、大掛かりな仕掛けが必要である。また、オペレーティングシステムにおいても予備ボード上リソースの割り当てや管理も必要になる。また、従来とは異なる環境でシステムが動作することになり、その差異から何らかの問題を引き起こす可能性が存在する。   However, this method requires a large-scale mechanism such as requiring dedicated software and setting a policy for changing the software. In addition, the operating system also requires allocation and management of resources on the spare board. In addition, the system operates in an environment different from the conventional environment, and there is a possibility that some problem may be caused by the difference.

対象コンピュータの予備スロットのバス信号線にたいして、交換対象スロットの識別信号やリソース信号の接続を動的に割り当て可能な機構を設ける。   A mechanism capable of dynamically assigning the identification signal and resource signal connection of the replacement target slot to the bus signal line of the spare slot of the target computer is provided.

IOカードの故障発生時、ホットプラグ対応のOSとホットプラグコントローラの機能により、故障したカードをシステムのバスから切り離した後、予備カードをシステムバスに接続し、同カードをOSに認識させるという手順を踏むことにより、ハードウェアの取りはずしや再取り付け作業なく、また、専用の二重系のプログラムなく、予備カードへの移行が可能となる。   When an IO card failure occurs, the hot-plug OS and hot-plug controller function disconnect the failed card from the system bus, connect the spare card to the system bus, and let the OS recognize the card. By stepping on, it becomes possible to migrate to a spare card without removing or re-installing hardware, or without a dedicated dual system program.

図1に本発明を実現するコンピュータの内部構成を示す。   FIG. 1 shows the internal configuration of a computer that implements the present invention.

コンピュータのCPU1は、チップセット2を経由しIOバスを介して、IOカードスロット(SL1,SL2,SL3,SL4)にアクセスを行う。ここで、各IOカードスロットは、スイッチ4により、IOバスとの接続、切断が可能である。   The CPU 1 of the computer accesses the IO card slots (SL1, SL2, SL3, SL4) via the chip set 2 and the IO bus. Here, each IO card slot can be connected to and disconnected from the IO bus by the switch 4.

スイッチ4の制御は、ホットプラグコントローラ3により行われる。ホットプラグコントローラは、保守作業者が操作できるスイッチSW1および、オペレーティングシステム6の制御を受け動作する。   The switch 4 is controlled by the hot plug controller 3. The hot plug controller operates under the control of the switch SW1 that can be operated by the maintenance worker and the operating system 6.

IOバスは、各スロット共通のバス信号B0とスロット毎に異なる信号(B1,B2,B3)から成る。   The IO bus is composed of a bus signal B0 common to each slot and signals (B1, B2, B3) that differ for each slot.

切り替え機構5は、予備スロット用のスイッチSW2の制御により、交換対象のスロット専用のバス(B1,B2,B3)のいずれかを選択して、予備スロットの専用バスB4に接続する機能をもつ。   The switching mechanism 5 has a function of selecting one of the buses (B1, B2, B3) dedicated to the slot to be replaced and connecting it to the dedicated bus B4 of the spare slot under the control of the switch SW2 for the spare slot.

次に、図1の構成下で、本発明で実現できる機能について説明する。   Next, functions that can be realized by the present invention under the configuration of FIG. 1 will be described.

この例では、各スロット(SL1,SL2,SL3、SL4)には同一種類のカードが実装されて、通常時は、予備スロットSL4以外のスロットのカードでシステム運用がなされているとする。   In this example, it is assumed that the same type of card is mounted in each slot (SL1, SL2, SL3, SL4), and that the system is operated with a card in a slot other than the spare slot SL4 in normal times.

カードスロットA(SL1)に接続されたカードが故障したとする。オペレータは、同カードの異常を検知し、オペレーティングシステム6に、スロット1の取り外し要求を行う。オペレーティングシステム6は、ホットプラグコントローラ3に対して、スイッチ4の制御を要求することにより、スロットA(SL1)が、IOバスから切り離される。   Assume that a card connected to the card slot A (SL1) has failed. The operator detects an abnormality of the card and requests the operating system 6 to remove the slot 1. The operating system 6 requests the hot plug controller 3 to control the switch 4, whereby the slot A (SL1) is disconnected from the IO bus.

次に、オペレータは、切り替え機構のスイッチSW2を操作することにより、IOスロットA(SL1)の専用バス信号B1を予備スロットの専用バス信号B4に接続する。その後、ホットプラグコントローラ用スイッチSW1の操作により、予備スロットSL4をIOバスに接続する。   Next, the operator operates the switch SW2 of the switching mechanism to connect the dedicated bus signal B1 of the IO slot A (SL1) to the dedicated bus signal B4 of the spare slot. Thereafter, the spare slot SL4 is connected to the IO bus by operating the hot plug controller switch SW1.

ホットプラグコントローラ3からの割り込みにより、オペレーティングシステム6は、バスに接続されているIOカードを再スキャンし、予備スロットSL4に接続されているカードを検出し、リソースの割り当てを行う。   In response to an interrupt from the hot plug controller 3, the operating system 6 rescans the IO card connected to the bus, detects the card connected to the spare slot SL4, and allocates resources.

このオペレーティングシステムのリソース割り当てにおいて、予備スロットに接続されているスロット専用信号B4は、IOカードスロットA(SL1)に接続されているため、論理的には、スロットA(SL1)のカードが交換されたのと等価になる。   In this operating system resource allocation, since the slot dedicated signal B4 connected to the spare slot is connected to the IO card slot A (SL1), the card in the slot A (SL1) is logically replaced. Is equivalent to

この場合、ソフトウェアからみた場合は、全く従来と互換なハード構成となるため、オペレーティングシステムは、新規に検出したカードに対して、従来カードに使用していたリソースと同一のリソースを割り当てることとなり、以降一切の設定を行わなくても継続してシステム運用が可能になる。   In this case, from the viewpoint of software, the hardware configuration is completely compatible with the conventional one. Therefore, the operating system allocates the same resource as that used for the conventional card to the newly detected card. Thereafter, the system can be operated continuously without any setting.

以上により、運用中のIOカードの故障時に、システム全体を停止することなく、また、ハードウェアの物理的な交換作業することなく、さらに、特別なソフトウェアを用いたり、特別な設定変更も必要無く、予備ボードへの切り替え運用が可能になる。   As described above, when the IO card in operation fails, the entire system is not stopped, the hardware is not physically replaced, and no special software or special setting change is required. Switching to a spare board becomes possible.

本実施形態においては、IOカード故障時に代替ボードに切り替える際に、
(1)IOカード交換時に、システムを停止する必要があること。
(2)IOカード交換時に、システム動作中に交換して、作業ミスによりシステムダウンを発生させる可能性。
(3)待機系を実現するために、予めボードをOSに認識させせ、2重化プログラムなどの仕掛けを必要とすること。
(4)交換後従来の運用環境とは別構成で、運用が行われることに関するリスク。
を回避することができる。
In this embodiment, when switching to an alternative board at the time of IO card failure,
(1) The system must be stopped when replacing the IO card.
(2) When replacing an IO card, it may be replaced while the system is operating, causing a system failure due to a work mistake.
(3) In order to realize a standby system, make the OS recognize the board in advance and require a device such as a duplex program.
(4) Risks related to operation after the replacement in a configuration different from the conventional operating environment.
Can be avoided.

また、予め予備スロットに予備カードを実装しておき、予備カード使用時、従来の信号割付けを継続使用することにより、IOカードの交換時に発生する以下の2つのリスクを排除することができる。
(a)IOカードを物理的に挿抜する際に発生しうる、作業ミス。
(b)予備スロットのIOカードをソフト的に別のスロットのカードに見せてしまった場合に、同カードをオペレーティングシステムが従来とは別のカードと扱うことによるシステム的な非互換から生じる問題。
In addition, by preliminarily mounting a spare card in the spare slot and using the conventional signal assignment continuously when the spare card is used, the following two risks that occur when replacing the IO card can be eliminated.
(A) An operation error that may occur when an IO card is physically inserted or removed.
(B) When the IO card in the spare slot is shown as a card in another slot in terms of software, a problem arises from system incompatibility due to the operating system handling the card as a card different from the conventional one.

本発明を実現するコンピュータの内部構成図FIG. 3 is an internal configuration diagram of a computer that implements the present invention

符号の説明Explanation of symbols

1:CPU、2:チップセット、3:ホットプラグコントローラ、4:スイッチ、5:切り替え機構、6:オペレーティングシステム、SL1,SL2,SL3,SL4:IOカードスロット、B0:IOバス(共通信号)、B1、B2,B3、B4:IOバス(スロット毎専用信号)、SW1:ホットプラグコントローラ制御スイッチ、SW2:切り替え機構制御スイッチ
1: CPU, 2: chipset, 3: hot plug controller, 4: switch, 5: switching mechanism, 6: operating system, SL1, SL2, SL3, SL4: IO card slot, B0: IO bus (common signal), B1, B2, B3, B4: IO bus (dedicated signal for each slot), SW1: hot plug controller control switch, SW2: switching mechanism control switch

Claims (1)

コンピュータのIOカードスロットに対して、カードスロット毎に異なる信号を接続することにより、オペレーティングシステムが、複数カードの識別管理や、リソース割り当てを行っているコンピュータシステムにおいて、
IOボードの故障時、予備スロットのIOカードの信号接続に従来の故障したボードが使用していた信号接続を引き継がせることにより、オペレーティングシステムに、従来ボードと同一の処理を継続させ、迅速で確実な予備カードへの切替を行うコンピュータシステム。
In the computer system in which the operating system performs identification management of multiple cards and resource allocation by connecting different signals for each card slot to the IO card slot of the computer,
In the event of an IO board failure, the operating system can continue the same processing as the conventional board by taking over the signal connection used by the previous failed board for the IO slot signal connection in the spare slot. Computer system that switches to a new spare card.
JP2005281080A 2005-09-28 2005-09-28 Computer system facilitating io card maintenance Pending JP2007094609A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005281080A JP2007094609A (en) 2005-09-28 2005-09-28 Computer system facilitating io card maintenance

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005281080A JP2007094609A (en) 2005-09-28 2005-09-28 Computer system facilitating io card maintenance

Publications (1)

Publication Number Publication Date
JP2007094609A true JP2007094609A (en) 2007-04-12

Family

ID=37980280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005281080A Pending JP2007094609A (en) 2005-09-28 2005-09-28 Computer system facilitating io card maintenance

Country Status (1)

Country Link
JP (1) JP2007094609A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252609A (en) * 2013-06-28 2014-12-31 联想(北京)有限公司 Hot plug protecting method and hot plug protecting device
CN104598789A (en) * 2015-02-15 2015-05-06 联想(北京)有限公司 Protection method of hot-plugging functional module device and electronic device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104252609A (en) * 2013-06-28 2014-12-31 联想(北京)有限公司 Hot plug protecting method and hot plug protecting device
CN104252609B (en) * 2013-06-28 2017-09-29 联想(北京)有限公司 Hot plug guard method and device
CN104598789A (en) * 2015-02-15 2015-05-06 联想(北京)有限公司 Protection method of hot-plugging functional module device and electronic device

Similar Documents

Publication Publication Date Title
US9760455B2 (en) PCIe network system with fail-over capability and operation method thereof
JP5898790B2 (en) Storage apparatus to which PCI-Express connection solid state drive is applied
US9235484B2 (en) Cluster system
CN1300397A (en) Multiconfiguration backplane
CN1300393A (en) Method for switching between multiple system hosts
CN1300394A (en) Method for suitching between multiple system processors
JP2012203636A (en) Control method for virtual computer and computer
US10614022B2 (en) PCIe fabric connectivity expansion card
US9195553B2 (en) Redundant system control method
JP2012133405A (en) Storage device and data transfer control method thereof
CN1821973A (en) Fault tolerant computer system and interrupt control method for the same
JP2006072591A (en) Virtual computer control method
US9779047B2 (en) Universal intelligent platform management interface (IPMI) host to baseboard management controller (BMC) communication for non-x86 and legacy free systems
US10379931B2 (en) Computer system
US7000153B2 (en) Computer apparatus and method of diagnosing the computer apparatus and replacing, repairing or adding hardware during non-stop operation of the computer apparatus
JP2007094609A (en) Computer system facilitating io card maintenance
JP2003131897A (en) Storage with built-in port
JPH09146875A (en) Separation of adaptor card slot for hot plugging
JP6357879B2 (en) System and fault handling method
JP2021002144A (en) Information processing device, control method of information processing device, and control program of information processing device
US8738829B2 (en) Information system for replacing failed I/O board with standby I/O board
US6832331B1 (en) Fault tolerant mastership system and method
US20190266061A1 (en) Information processing apparatus, control method for information processing apparatus, and computer-readable recording medium having stored therein control program for information processing apparatus
US9639438B2 (en) Methods and systems of managing an interconnection
JP4432975B2 (en) Packet communication device, packet communication method, and packet communication program