JP2011081462A - 計算機装置、計算機システム、アダプタ承継方法 - Google Patents
計算機装置、計算機システム、アダプタ承継方法 Download PDFInfo
- Publication number
- JP2011081462A JP2011081462A JP2009231078A JP2009231078A JP2011081462A JP 2011081462 A JP2011081462 A JP 2011081462A JP 2009231078 A JP2009231078 A JP 2009231078A JP 2009231078 A JP2009231078 A JP 2009231078A JP 2011081462 A JP2011081462 A JP 2011081462A
- Authority
- JP
- Japan
- Prior art keywords
- switch
- identifier
- computer module
- computer
- adapter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2033—Failover techniques switching over of hardware resources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2023—Failover techniques
- G06F11/2025—Failover techniques using centralised failover control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/202—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
- G06F11/2038—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
Abstract
【解決手段】本発明に係る計算機は、計算機モジュールとI/Oアダプタの間の接続経路を論理的に識別する識別子を、現用系計算機から待機系計算機に引き継ぐ。
【選択図】図1
Description
図1は、本発明の実施の形態1に係る計算機システム1000の構成図である。計算機システム1000は、現用系計算機モジュール100a、100b、100cおよび100d、待機系計算機モジュール110eおよび110f、サービスプロセッサ150、管理コンソール180、I/Oアダプタ220a−1、220a−3、220a−5、220a−8、220b−2、220b−4、220b−5および220b−7、PCIeスイッチ300aおよび300b、PCIマネージャ400を備える。
本ステップにおいて、現用系計算機モジュール100aに障害が発生したものとする。ここで発生した障害は、現用系計算機モジュール100aの重要な機能、例えば一部のI/Oブリッジの破損などを想定する。
現用系計算機モジュール100aは、自己に障害が発生したことを検出し、管理ポート106aを介してサービスプロセッサ150にその旨を通知する。
サービスプロセッサ150は、現用系計算機モジュール100aに障害が発生した旨をPCIマネージャ400に報告する。障害の種類などを併せて報告してもよい。
PCIマネージャ400は、現用系計算機モジュール100aの電源を強制的にOFFするように、サービスプロセッサ150へ指示する。
サービスプロセッサ150は、電源を強制的にOFFするように、現用系計算機モジュール100aへ指示する。
現用系計算機モジュール100aは、サービスプロセッサ150からの指示にしたがって電源をOFFする。
サービスプロセッサ150は、現用系計算機モジュール100aの電源がOFFになったことを確認し、PCIマネージャ400にその旨を報告する。
PCIマネージャ400は、PCIeスイッチ300aおよび300bの仮想スイッチ管理テーブル330、仮想ブリッジ管理テーブル340、バス割当管理テーブル370を、図9で説明した状態に更新するよう、仮想スイッチ生成部310bへ指示する。仮想スイッチ生成部310bは、指示にしたがって各テーブルを更新する。仮想スイッチ生成部310aも管理ポート399を介して同様に更新指示を受信し、各テーブルを更新する。
PCIマネージャ400は、待機系計算機モジュール110eの電源をONするよう、サービスプロセッサ150に指示する。このとき、バス割当管理テーブル350が保持している、仮想ブリッジ360−10、360−11、360−12に対応するPCIバス番号を併せて通知する。
サービスプロセッサ150は、電源をONするように、待機系計算機モジュール110eへ指示する。また、PCIマネージャ400より通知を受けたPCIバス番号を、併せて通知する。
待機系計算機モジュール110eは、サービスプロセッサ150からの指示にしたがって電源をONする。また、サービスプロセッサ150より通知を受けたPCIバス番号を用いて、I/Oブリッジ104eからI/Oアダプタ220に至る接続経路を認識する。以後、待機系計算機モジュール110eは通常動作を実行する。
本発明の実施の形態2では、実施の形態1で説明した計算機システム1000を多重構成にした例を説明する。多重構成のシステムとすることにより、システムの可用性などの向上を図る。
通常のコールドスタンバイ方式による冗長化では、待機系ブレードのI/Oアダプタの構成は現用系ブレードサーバが使用するI/Oアダプタと同じ構成をとらなければならないが、本方式では現用系ブレードサーバで使用していたI/Oアダプタをそのまま待機系ブレードサーバで使用することができ、待機系ブレードサーバ用にI/Oアダプタを用意する必要がないため、本構成のようなI/Oアダプタが多いシステムでは、待機系のI/Oアダプタのコストを削減することができる。
Claims (8)
- 演算装置を備えた複数の計算機モジュールと、
I/Oアダプタと、
前記計算機モジュールを接続するアップストリームポート及び前記I/Oアダプタを接続するダウンストリームポートを有するスイッチと、
PCIマネージャと
を備え、
前記スイッチは、
前記アップストリームポートと前記ダウンストリームポートとを論理的に接続する仮想スイッチを有し、
稼動状態にある計算機モジュールと第1の仮想スイッチとの間の接続経路を論理的に識別する第1の識別子及び前記第1の仮想スイッチと前記I/Oアダプタとの接続経路を論理的に識別する第2の識別子を保持し、
稼動状態にある前記計算機モジュールが非稼動状態に移行すると、前記非稼動状態を検出した前記PCIマネージャは、前記スイッチに対して前記識別子の更新指示を出し、
前記識別子の更新指示を受けた前記スイッチは、
待機状態にある計算機モジュールと第2の仮想スイッチとの接続経路を論理的に識別する第3の識別子に、前記第1の識別子を引き継ぎ、
前記第2の仮想スイッチと前記I/Oアダプタとの接続経路を識別する第4の識別子に、前記第2の識別子を引き継ぎ、
前記待機状態にある計算機モジュールは、前記識別子の引き継ぎ後に稼動状態に移行する
ことを特徴とする計算機装置。 - 前記スイッチは、
前記アップストリームポートと前記ダウンストリームポートとを論理的に接続する仮想スイッチを生成する仮想スイッチ生成部を備え、
前記計算機モジュールと前記仮想スイッチとの間の接続経路を論理的に識別する識別子、及び前記仮想スイッチと前記I/Oアダプタとの接続経路を論理的に識別する識別子を、仮想ブリッジ管理情報として保持する、
ことを特徴とする請求項1記載の計算機装置。 - 前記スイッチは、
前記アップストリームポートと前記ダウンストリームポートとの間の論理的な接続経路を論理的に識別するスイッチ識別子を、仮想スイッチ管理情報として保持する
ことを特徴とする請求項2記載の計算機装置。 - 前記計算機モジュールの状態を管理する前記PCIマネージャは、
稼動状態にある前記計算機モジュールが非稼動状態に移行すると、
前記第1の識別子及び第2の識別子を、待機状態にある計算機モジュールから前記I/Oアダプタへの接続経路を論理的に識別する前記第3の識別子及び前記第4の識別子に引き継ぐように前記仮想ブリッジ管理情報及び前記仮想スイッチ管理情報の更新する更新指示を、前記スイッチに出力する
ことを特徴とする請求項1記載の計算機装置。 - 請求項1記載の1以上の計算機装置を備えることを特徴とする計算機システム。
- 更に、前記計算機モジュールが使用する通信装置を接続する1以上の第2スイッチを備え、
前記スイッチと前記第2スイッチを接続した
ことを特徴とする請求項5記載の計算機システム。 - 前記第2スイッチは、
前記スイッチを接続するアップストリームポートと、
前記計算機モジュールが使用する通信装置を接続するダウンストリームポートと、
を備え、
前記スイッチが備えるダウンストリームポートと前記第2スイッチが備えるアップストリームポートとを接続した
ことを特徴とする請求項6記載の計算機システム。 - 演算装置を備えた複数の計算機モジュールと、I/Oアダプタと、前記計算機モジュールを接続するアップストリームポート及び前記I/Oアダプタを接続するダウンストリームポートを有するスイッチと、PCIマネージャとを備える計算機装置におけるアダプタ承継方法であって、
前記スイッチは、
前記アップストリームポートと前記ダウンストリームポートとを論理的に接続し、
稼動状態にある計算機モジュールと第1の仮想スイッチとの間の接続経路を論理的に識別する第1の識別子及び前記第1の仮想スイッチと前記I/Oアダプタとの接続経路を論理的に識別する第2の識別子を保持し、
稼動状態にある前記計算機モジュールが非稼動状態に移行すると、
前記非稼動状態を検出した前記PCIマネージャは、前記スイッチに対して前記識別子の更新指示を出し、
前記識別子の更新指示を受けた前記スイッチは、
待機状態にある計算機モジュールと第2の仮想スイッチとの接続経路を論理的に識別する第3の識別子に、前記引き継いだ第1の識別子を引き継ぎ、
前記第2の仮想スイッチと前記I/Oアダプタとの接続経路を識別する第4の識別子に、前記第2の識別子を引き継ぎ
前記待機状態にある計算機モジュールは、前記識別子の引き継ぎ後に稼動状態に移行する
ことを特徴とするアダプタ承継方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009231078A JP5069732B2 (ja) | 2009-10-05 | 2009-10-05 | 計算機装置、計算機システム、アダプタ承継方法 |
US12/897,120 US8285911B2 (en) | 2009-10-05 | 2010-10-04 | Computer apparatus, computer system and adapter carry-over method |
US13/588,554 US8626978B2 (en) | 2009-10-05 | 2012-08-17 | Computer apparatus, computer system and adapter carry-over method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009231078A JP5069732B2 (ja) | 2009-10-05 | 2009-10-05 | 計算機装置、計算機システム、アダプタ承継方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011081462A true JP2011081462A (ja) | 2011-04-21 |
JP5069732B2 JP5069732B2 (ja) | 2012-11-07 |
Family
ID=44069704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009231078A Expired - Fee Related JP5069732B2 (ja) | 2009-10-05 | 2009-10-05 | 計算機装置、計算機システム、アダプタ承継方法 |
Country Status (2)
Country | Link |
---|---|
US (2) | US8285911B2 (ja) |
JP (1) | JP5069732B2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012157038A1 (ja) * | 2011-05-13 | 2012-11-22 | 株式会社日立製作所 | 接続経路管理方法、i/o仮想化装置及び接続経路管理プログラム |
WO2013030910A1 (ja) * | 2011-08-26 | 2013-03-07 | 株式会社日立製作所 | Mraスイッチ、それを用いた計算機システム、及びmraスイッチの設定変更方法 |
JP2014010731A (ja) * | 2012-07-02 | 2014-01-20 | Hitachi Ltd | 計算機、計算機システム、及びioデバイス構成の引継ぎ方法 |
JP2015501501A (ja) * | 2012-10-26 | 2015-01-15 | 華為技術有限公司Huawei Technologies Co.,Ltd. | Pcieスイッチベースのサーバ・システム、スイッチング方法、及びデバイス |
WO2015011895A1 (ja) * | 2013-07-23 | 2015-01-29 | 日本電気株式会社 | 情報処理装置、i/oシステム、及び、i/o制御方法 |
WO2016031035A1 (ja) * | 2014-08-29 | 2016-03-03 | 株式会社日立製作所 | 計算機システムの系切り替え方式 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5541021B2 (ja) * | 2010-09-09 | 2014-07-09 | 富士通株式会社 | スイッチ装置 |
US8843688B2 (en) * | 2012-09-11 | 2014-09-23 | International Business Machines Corporation | Concurrent repair of PCIE switch units in a tightly-coupled, multi-switch, multi-adapter, multi-host distributed system |
US20140258577A1 (en) | 2013-03-11 | 2014-09-11 | Futurewei Technologies, Inc. | Wire Level Virtualization Over PCI-Express |
US9455901B2 (en) * | 2013-10-04 | 2016-09-27 | Nicira, Inc. | Managing software and hardware forwarding elements to define virtual networks |
US9563591B2 (en) * | 2014-03-06 | 2017-02-07 | International Business Machines Corporation | Peripheral component interconnect express (PCIe) ping in a switch-based environment |
WO2015162774A1 (ja) * | 2014-04-25 | 2015-10-29 | 株式会社日立製作所 | 計算機、計算機のi/oスイッチの制御方法 |
WO2015162777A1 (ja) * | 2014-04-25 | 2015-10-29 | 株式会社日立製作所 | 計算機システム及び接続構成制御方法 |
JP6418043B2 (ja) * | 2015-04-08 | 2018-11-07 | 株式会社デンソー | スイッチングハブ及び通信ネットワーク |
US9967182B2 (en) | 2015-07-31 | 2018-05-08 | Nicira, Inc. | Enabling hardware switches to perform logical routing functionalities |
CN108023756B (zh) * | 2016-10-28 | 2021-09-28 | 阿里巴巴集团控股有限公司 | 一种虚拟交换机的升级方法和装置 |
US11316713B2 (en) * | 2019-11-25 | 2022-04-26 | International Business Machines Corporation | Virtual drawers in a server |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007195166A (ja) * | 2006-01-18 | 2007-08-02 | Internatl Business Mach Corp <Ibm> | 組み込みdidによるpciバス・アドレス・ベースのルーティング用ルーティング・テーブルを作成し、管理する方法、コンピュータ・プログラムおよび装置 |
JP2008171413A (ja) * | 2006-12-19 | 2008-07-24 | Internatl Business Mach Corp <Ibm> | データ処理システム内で第1のホスト・システムと第2のホスト・システムとの間で通信するための方法、プログラム、およびシステム(ソケット接続および共用メモリを使用するホスト・システム間の通信のためのシステムおよび方法) |
JP2008310489A (ja) * | 2007-06-13 | 2008-12-25 | Hitachi Ltd | I/oデバイス切り替え方法 |
JP2009181418A (ja) * | 2008-01-31 | 2009-08-13 | Hitachi Ltd | 情報処理システム、i/oスイッチ及びi/oパスの交替処理方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7058738B2 (en) * | 2004-04-28 | 2006-06-06 | Microsoft Corporation | Configurable PCI express switch which allows multiple CPUs to be connected to multiple I/O devices |
US7356636B2 (en) * | 2005-04-22 | 2008-04-08 | Sun Microsystems, Inc. | Virtualized PCI switch |
-
2009
- 2009-10-05 JP JP2009231078A patent/JP5069732B2/ja not_active Expired - Fee Related
-
2010
- 2010-10-04 US US12/897,120 patent/US8285911B2/en not_active Expired - Fee Related
-
2012
- 2012-08-17 US US13/588,554 patent/US8626978B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007195166A (ja) * | 2006-01-18 | 2007-08-02 | Internatl Business Mach Corp <Ibm> | 組み込みdidによるpciバス・アドレス・ベースのルーティング用ルーティング・テーブルを作成し、管理する方法、コンピュータ・プログラムおよび装置 |
JP2008171413A (ja) * | 2006-12-19 | 2008-07-24 | Internatl Business Mach Corp <Ibm> | データ処理システム内で第1のホスト・システムと第2のホスト・システムとの間で通信するための方法、プログラム、およびシステム(ソケット接続および共用メモリを使用するホスト・システム間の通信のためのシステムおよび方法) |
JP2008310489A (ja) * | 2007-06-13 | 2008-12-25 | Hitachi Ltd | I/oデバイス切り替え方法 |
JP2009181418A (ja) * | 2008-01-31 | 2009-08-13 | Hitachi Ltd | 情報処理システム、i/oスイッチ及びi/oパスの交替処理方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012157038A1 (ja) * | 2011-05-13 | 2012-11-22 | 株式会社日立製作所 | 接続経路管理方法、i/o仮想化装置及び接続経路管理プログラム |
WO2013030910A1 (ja) * | 2011-08-26 | 2013-03-07 | 株式会社日立製作所 | Mraスイッチ、それを用いた計算機システム、及びmraスイッチの設定変更方法 |
JP2014010731A (ja) * | 2012-07-02 | 2014-01-20 | Hitachi Ltd | 計算機、計算機システム、及びioデバイス構成の引継ぎ方法 |
JP2015501501A (ja) * | 2012-10-26 | 2015-01-15 | 華為技術有限公司Huawei Technologies Co.,Ltd. | Pcieスイッチベースのサーバ・システム、スイッチング方法、及びデバイス |
KR101570175B1 (ko) | 2012-10-26 | 2015-11-18 | 후아웨이 테크놀러지 컴퍼니 리미티드 | Pcie 스위치 기반의 서버 시스템, 스위칭 방법 및 장치 |
US9678842B2 (en) | 2012-10-26 | 2017-06-13 | Huawei Technologies Co., Ltd. | PCIE switch-based server system, switching method and device |
WO2015011895A1 (ja) * | 2013-07-23 | 2015-01-29 | 日本電気株式会社 | 情報処理装置、i/oシステム、及び、i/o制御方法 |
JPWO2015011895A1 (ja) * | 2013-07-23 | 2017-03-02 | 日本電気株式会社 | 情報処理装置、i/oシステム、及び、i/o制御方法 |
US9740641B2 (en) | 2013-07-23 | 2017-08-22 | Nec Corporation | Information processing device, I/O system, and I/O control method |
WO2016031035A1 (ja) * | 2014-08-29 | 2016-03-03 | 株式会社日立製作所 | 計算機システムの系切り替え方式 |
Also Published As
Publication number | Publication date |
---|---|
US8626978B2 (en) | 2014-01-07 |
US20110131361A1 (en) | 2011-06-02 |
US20120311226A1 (en) | 2012-12-06 |
US8285911B2 (en) | 2012-10-09 |
JP5069732B2 (ja) | 2012-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5069732B2 (ja) | 計算機装置、計算機システム、アダプタ承継方法 | |
US11314677B2 (en) | Peer-to-peer device arrangements in communication fabrics | |
JP4242420B2 (ja) | 多数のコンピューティングプラットフォームにおけるosにとらわれない資源共有 | |
US9760455B2 (en) | PCIe network system with fail-over capability and operation method thereof | |
CN103117866B (zh) | 交换结构管理方法和系统 | |
US7395367B2 (en) | Method using a master node to control I/O fabric configuration in a multi-host environment | |
CN101741831B (zh) | 动态物理和虚拟多路径输入/输出的方法、系统和装置 | |
US10331520B2 (en) | Raid hot spare disk drive using inter-storage controller communication | |
US11775464B2 (en) | Computer system and a computer device | |
CN104871493A (zh) | 高性能计算(hpc)网络中的通信信道故障切换 | |
WO2021105845A1 (en) | Virtual drawers in server | |
WO2021012169A1 (zh) | 一种提高存储系统可靠性的方法和相关装置 | |
JP6063576B2 (ja) | サーバシステム、計算機システム、サーバシステムの管理方法、及びコンピュータ読み取り可能な記憶媒体 | |
JP5217128B2 (ja) | エミュレーション装置及びエミュレーション方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120522 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120817 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150824 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5069732 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150824 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |