JPWO2013105433A1 - 情報処理システム - Google Patents

情報処理システム Download PDF

Info

Publication number
JPWO2013105433A1
JPWO2013105433A1 JP2013553242A JP2013553242A JPWO2013105433A1 JP WO2013105433 A1 JPWO2013105433 A1 JP WO2013105433A1 JP 2013553242 A JP2013553242 A JP 2013553242A JP 2013553242 A JP2013553242 A JP 2013553242A JP WO2013105433 A1 JPWO2013105433 A1 JP WO2013105433A1
Authority
JP
Japan
Prior art keywords
information processing
storage device
processing apparatus
controller
hdd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013553242A
Other languages
English (en)
Inventor
廣一郎 加藤
廣一郎 加藤
明宏 梅沢
明宏 梅沢
八木 伸夫
伸夫 八木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2013553242A priority Critical patent/JPWO2013105433A1/ja
Publication of JPWO2013105433A1 publication Critical patent/JPWO2013105433A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • G06F3/0658Controller construction arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • G06F3/0676Magnetic disk device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Abstract

CPU、メインメモリ、HDDなどから構成されるモジュール単位の情報処理装置が相互にSMP結合されたシステムにおいて、システム内に分散しているHDDを単一のDiskとして使用することができる手段を提供する。1つ以上のCPUと、メインメモリと、1つ以上の記憶装置と、前記記憶装置の制御を行う記憶装置コントローラとを備えた情報処理装置をSMP結合により相互に接続した情報処理システムにおいて、ある1つの情報処理装置内の記憶装置コントローラが自情報処理装置内の記憶装置及び他情報処理装置内の記憶装置を制御する。各情報処理装置は自情報処理装置内の記憶装置を自情報処理装置内の記憶装置コントローラ又は他情報処理装置内の記憶装置コントローラのいずれに接続するかを排他的に切り替える記憶装置切り替えスイッチを備える。

Description

2つ以上の情報処理装置が相互にSMP接続されたマルチプロセッサコンピュータシステムにおいて、複数の情報処理装置内に分散している記憶装置(HDDやSSDなど)を単一の記憶装置コントローラ(RAIDコントローラ)に接続することを可能とすることで、複数の情報処理装置に分散した複数の記憶装置を単一の記憶装置として利用可能とする制御方式に関する。
近年、企業の成長に伴い、ビジネスを拡張するたびにサーバ装置の処理能力の拡張を迫られる場面が多く見られる。従来のサーバ装置における演算処理能力の拡張手段として、「スケールアウト」、「スケールアップ」と呼ばれる大きく2つの方式に分類できる。
スケールアウト方式とは、ブレードサーバに代表されるように、CPU、メインメモリ、HDD、I/Oの組を一組のサーバモジュールとし、サーバモジュールを増設することでサーバ演算処理能力の拡張を行う拡張手段で、相互に関連の薄い処理が大量にある場合に有効であり、サーバモジュールを追加することで簡単に拡張が可能というメリットがある一方、ある大規模バッチ処理など、特に高い処理能力を要求される場合には適用出来ないといった問題がある。
スケールアップ方式とは、大規模SMP(Symmetric Multi Proseccing:対称型マルチプロセッシング)構成に代表されるようにプロセッサの高速化と増設、メモリの大容量化などによってサーバ処理単体の処理能力を向上させる拡張手段であり、大規模バッチ処理など特に高い処理能力を要求される場合に有効である一方、大規模SMPは一般的に高価であり、導入時のコストや、導入後のさらなるシステム拡張時のコストが膨大になるといった問題がある。
これらの問題に対し、特許文献1では、複数のブレードサーバモジュール間をSMP結合するための技術について述べており、従来のブレードサーバシステムのスケールアウト型の拡張性に加え、スケールアップ型の拡張性を併せ持つサーバ装置を提供している。この技術を用いることでCPU、メインメモリ、HDD、I/Oなどのサーバモジュール単位で必要な能力のみスケールアウト型/スケールアップ型のどちらか一方の方式を用いてシステムの増設が可能となる。
また、特許文献2では、バックプレーンを介するSMP結合の配線に換えて、ブレードサーバモジュールに装着する着脱可能なSMP結合装置(フロントプレーン)を提供し、サーバモジュール間SMPを実現している。
しかし、特許文献1及び、特許文献2の両方とも、異なるサーバモジュール間のCPU同士を接続するSMP結合の技術についてのみ言及している。そのため、特許文献1及び特許文献2の技術を用いてスケールアップ型のシステム増設が実施された場合、サーバモジュール単位でHDDが増設される結果、Operation System(OS)からは単一のDiskとして認識できない。そのため、サーバモジュール間を跨るHDDを組み合わせてRAIDを構成することが出来ず、システム内の複数のHDDを有効に活用するこが出来ないといった問題がある。
図6に従来技術を用いて構成されたシステム装置の例を示す。
情報処理装置600aは、CPU601a、メインメモリ602a、PCI Expressルートポート 603a、記憶装置コントローラ604a、BMC(Board Management Controller)605a、FPGA606a、HDD607aと、前記HDDのStatusを示すHDD Status LED 608aから構成される。
前記情報処理装置内の前記BMCは、伝送路617aより、バックプレーン620を経由してシステム装置制御モジュール618内のシステム制御コントローラ619と接続される。
前記情報処理装置内のHDD607aは伝送路609aを介して記憶装置コントローラ604aのHDD接続用のポート610aと接続される。
また、前記記憶装置コントローラは設定次第で様々な用途に利用可能な汎用入出力ピン(GPIO)などに代表される入出力端子を複数有している。例として、図6における記憶装置コントローラは、GPIO611aをLED制御用途に設定しており、サイドバンド信号612aを介して前記情報処理装置内のStatus LED 608aに接続することで、HDDの状態(Status)を示すLEDを制御している。
同様に、前記記憶装置コントローラは、GPIO613aをHDD Presence認識用途に設定しており、サイドバンド信号614aを介して前記HDD607aと接続することで、前記記憶装置コントローラはHDDの搭載/非搭載を認識している。
同様な情報処理装置がさらに1つ存在し(情報処理装置600b)、前記BMC605aと同様に、情報処理装置600b内のBMC605bも伝送路617bにより前記バックプレーンを経由して前記システム制御コントローラ 619と接続される。
前記2つの情報処理装置(600a,600b)内の各々のCPU(601a,601b)はフロントプレーン615を接続することで伝送路616により相互に接続され、CPU間でSMP結合が可能となり、複数の情報処理装置を単一のシステム装置として動作することが可能となる。
一方、情報処理装置600a内のHDD607aは、記憶装置コントローラ604aと接続される。同様に、情報処理装置600b内のHDD607bは、記憶装置コントローラ604bと接続されるため、OSはこれら複数のHDDを、単一のDiskとして認識できない。
図6の例では情報処理装置1台につき1つのHDDしか搭載されていない例を示しているが、仮に、情報処理装置1台につき、2つのHDDが搭載されている情報処理装置を2つ組み合わせてSMPが構成されているシステムにおいて、現状では情報処理装置単位でしかRAIDを構成できないため、システム内にHDDが計4つあるにも関わらず、情報処理装置単位でRAID0またはRAID1しか設定できないといった問題がある。
特開2010−9628 特開2010−79467
本発明の目的は、CPU、メインメモリ、HDD、I/Oなどから構成されるモジュール単位の情報処理装置が相互にSMP結合されたシステムにおいて、従来技術ではモジュール単位で制御されていた複数のHDDを、特定のモジュール内のHDDコントローラ(RAIDコントローラ)から制御する手段を提供することで、システム内に分散していたHDDを単一のDiskとして使用し、システム内のリソースを有効に活用することが出来る手段を提供する。
1つ以上のCPUと、メインメモリと、1つ以上の記憶装置と前記記憶装置の制御を行う記憶装置コントローラを備える情報処理装置をSMP結合により相互に接続した情報処理システムにおいて、ある1つの情報処理装置内の記憶装置コントローラが当該情報処理装置内の記憶装置及び他情報処理装置内の記憶装置を制御する。
従来では、仮に2つのHDDが搭載されている情報処理装置を2つ組み合わせてSMPが構成されているシステムにおいて、情報処理装置単位でしかRAIDを構成できないため、システム内にHDDが計4つあるにも関わらず、情報処理装置単位でRAID0またはRAID1しか設定できない。そのため、RAID0では信頼性が確保できず、RAID1の場合は使用できる領域が1/2となり、装置の資源を有効に活用できなかった。
しかし、本発明によれば、複数の情報処理装置間をSMP結合することにより、スケールアップ型の拡張性を有するサーバシステムにおいて、情報システム装置単位で制御されるHDDが、OSから単一のDiskとして認識されることが可能となる。
その結果、2つのHDDが搭載されている情報処理装置を2つ組み合わせてSMPが構成されているシステムにおいて、合計4つのHDD全てを単一のRAIDコントローラに接続することでRAID5やRAID6を構成することが可能となり、信頼性を確保し、なおかつ装置内の資源を有効に活用することが可能となる。
本発明における記憶装置共有機構を備えた情報処理システムの全体ハードウェア構成の一例を示す図である。 本発明における実施例1のBMCの役割(Primary or Non−Primary)別におけるHDD接続先を定義する設定テーブルの一例を示す図である。 本発明における実施例1のFPGAの実装の一例を示す図である。 本発明におけるシステム制御コントローラがBMCに対してPrimary/Non−Primaryの設定を行うフローを示す図である。 図1におけるシステム構成において、記憶装置切り替えスイッチを含まないドータカードを用いた場合における情報処理システムの全体ハードウェア構成の一例を示す図である。 従来技術を用いたスケールアップ型のSMP結合された情報処理システムの全体ハードウェア構成の一般例を示す図である。
図1に、本発明における記憶装置制御機構を用いたコンピュータシステム(ブレードサーバシステム)全体の構成の一例を示す。
情報処理装置(ブレードサーバモジュール)100aは、CPU101a、メインメモリ102a、PCI Expressルートポート 103a、記憶装置コントローラ104a、BMC105a、FPGA106a、HDD107a及び、記憶装置切り替えスイッチ108aを備えたドータカード125aから構成される。
前記情報処理装置内の前記BMCは、伝送路118aにより、バックプレーン115を経由してシステム装置制御モジュール116内のシステム制御コントローラ117と接続される。
同様な情報処理装置がさらに1つ存在し(情報処理装置100b)、前記BMC105aと同様に、情報処理装置100b内のBMC105bも伝送路118bによりバックプレーンを経由して前記システム制御コントローラ117と接続される。
前記2つの情報処理装置(100a,100b)内の各々のCPU(101a,101b)はフロントプレーン109を接続することで伝送路 110により相互に接続される。
伝送路113aは、前記フロントプレーンを接続することで、情報処理装置100a内前記ドータカード125a上の記憶装置切り替えスイッチ108aと、前記情報処理装置(100a)とは異なる情報処理装置100b内の記憶装置コントローラ104b内のHDD接続用ポート(ポート1 126b)と相互に接続される。
同様に、前記情報処理装置100bは、記憶装置切り替えスイッチ108bを備えたドータカード125bを有し、伝送路113bは、前記フロントプレーンを接続することで、情報処理装置100b内前記ドータカード125b上の記憶装置切り替えスイッチ108bと、前記情報処理装置(100b)とは異なる情報処理装置100a内の記憶装置コントローラ104a内のHDD接続用ポート(ポート1 126a)と相互に接続される。
システム制御コントローラ117は、BMCをPrimary及びNon−Primaryと定義する2つの状態の内、いずれか一方の状態に伝送路118a,118bを介して設定することが出来る。
通常は 情報処理装置100a,100b内の各々のBMC105a,105bは各々Primaryに設定されており、各々独立した情報処理装置として稼動しているが、フロントプレーンにより相互接続された情報処理装置100a,100b内のBMC105a,105bのいずれか一方をPrimaryに設定し、もう一方をNon−Primaryに設定することで、2つの情報処理装置100a,100bをSMP接続し、
前記2つの情報処理装置100a,100bを単一のシステムとして使用することが可能となる。
図4にシステム制御コントローラ404がBMCに対してPrimary/Non−Primaryの設定を行う例を示す。
情報処理装置401は、システム装置全体の制御を行うシステム装置制御モジュール402とバックプレーン400を介して相互に接続される。
前記システム制御コントローラ404は、前記情報処理装置内のBMC405と、伝送路403により相互に接続される。
前記システム制御コントローラ404は前記伝送路403を経由し、前記BMC405にアクセスすることで、前記情報処理装置401のハードウェア制御を行う。
前記BMCはBMCのPrimary/Non−Primaryの役割を保持するためのレジスタ(BMC Role Control Register 406)を有し、前記レジスタ406の値は、前記システム制御コントローラ404により設定される。
例として、複数の情報処理装置がSMP結合されたシステム装置において、前記BMCが属する情報処理装置がシステム装置の電源制御などの処理を行う主系情報処理装置(Primary)として動作する場合、前記システム制御コントローラは伝送路403を介して前記BMC内のBMC Role Control Registerに値0をセットする。
同様に、複数の情報処理装置がSMP結合されたシステム装置において、前記BMC405が属する情報処理装置がシステム装置の中で、自身では電源制御等は行わず、Primaryからの指示により動作を行う従属系情報処理装置(Non−Primary)として動作する場合、前記システム制御コントローラ404は伝送路403を介して前記BMC405内のBMC Role Control Registerに値1をセットする。
BMCはこのBMC Role Control Registerを参照することで自身が属する情報処理装置の、システム装置内での役割を認識する。
また、図1における前期記憶装置切り替えスイッチ108aは、2:1マルチプレクサの機能を有し、HDD107aに接続される信号111aの接続先を、
同一情報処理装置100a内の記憶装置コントローラ104a内のHDD接続用ポート(ポート0 125a)からの信号112aと、前記情報処理装置100aとは異なる情報処理装置100b内の規則装置コントローラ104b内のHDD接続用ポート(ポート1 126b)からの信号113aのいずれか一方の信号に、
情報処理装置100a内のFPGA106aからの制御信号114aを用いて切り替える機能を有する。
前記情報処理装置100a内のFPGA106aは、前記情報処理装置100a内のBMC105aと伝送路119aを介して接続されており、BMCの設定(Primary/Non−Primary)により前記FPGA106aからの制御信号 114aを用いて前記記憶装置切り替えスイッチを設定し、前記情報処理装置内のHDDの接続先を切り替える機能を有する。
図4にBMCの役割を示すBMC Role Control Registerの値による、記憶装置切り替えスイッチの振る舞いの例を示す。
情報処理装置401内のBMC405は、伝送路407により、前記情報処理装置401内のFPGA408と相互に接続される。
前記FPGAは、自身が属する前記情報処理装置401内のHDD409の制御モードを保持するためのレジスタ(HDD Control Register 410)有し、前記BMC405が、BMC Role Control Register 406の値を伝送路407を経由し、前記HDD Control Registerの値を設定する。
例として、BMCの役割がPrimary、すなわち、BMC Role Control Register 406の値が0に設定されている場合、BMCが伝送路407を経由し、FPGA内のHDD Control Register 410の値を0にセットする。
また、BMCの役割がNon−Primary、すなわち、BMC Role Control Register 406の値が1に設定されている場合、BMCが伝送路407を経由し、FPGA408内のHDD Control Register 410の値を1にセットする。
前記HDD Control Register 410は制御信号 411を介して、記憶装置切り替えスイッチ412と接続される。
記憶装置切り替えスイッチ412は、制御信号411の値が0である場合、HDD 409と記憶装置コントローラ413が接続される図4に示す構成に設定する。
一方、記憶装置切り替えスイッチ412は、制御信号411の値が1である場合、スイッチの接続先を切り替える。
この結果、システム制御コントローラ404が情報処理装置の役割(Primary/Non−Primary)の設定を行うことで、記憶装置切り替えスイッチの接続先を変更することが可能となる。
図2にBMCの役割(Primary or Non−Primary)別におけるHDD接続先の例を示す。
この例では図1における情報処理装置100a内のBMC105aの役割がPrimaryに設定されている場合、前記情報処理装置(100a)内のHDD107aの接続先を、前記情報処理装置内の記憶装置切り替えスイッチ108aに示される接続の通り、伝送路112aを介して、前記情報処理装置内の記憶装置コントローラ 104aに接続される。よって、前記記憶装置切り替えスイッチ(108a)における接続では、同一情報処理装置(100a)内のHDD(107a)と記憶装置コントローラ(104a)が接続される。
一方、情報処理装置100b内のBMC105bの役割がNon−Primaryに設定されている場合、前記情報処理装置(100b)内のHDD107bの接続先を、前記情報処理装置内の記憶装置切り替えスイッチ108bに示される接続の通り、フロントプレーン109を経由して接続される伝送路113bを介して、前記情報処理装置(100b)とは異なる情報処理装置100a内の記憶装置コントローラ104a内のHDD接続用ポート(ポート1 126a)に接続される。よって、前記記憶装置切り替えスイッチ(108b)における接続では、HDD107bを備える情報処理装置(100b)とは異なる情報処理装置(100a)内の記憶装置コントローラ(104a)が接続される。
前記情報処理装置(100a,100b)内のFPGA(106a,106b)には、HDDのプレゼンスを示すプレゼンスサイドバンド信号120a,120bが、前記ドータカード125a,125bを介して接続される。同様に、前記FPGA(106a,106b)には、HDDのStatusを示すLED122a,122bを制御するLED制御用サイドバンド信号121a,121bも前記ドータカード125a,125bを介して接続される。
前記FPGA(106a,106b)は記憶装置コントローラ(104a,104b)とSIOインタフェース123a,123bを介して相互に接続される。
また、情報処理装置100a内のFPGA106aは、フロントプレーン109を介して接続される情報処理装置100b内のFPGA106bと伝送路124を介して相互に接続される。
図3に本発明におけるFPGAの実装例を示す。
図3におけるFPGA301は情報処理装置300内に位置する。前記FPGAは、BMC302と伝送路310により相互に接続され、記憶装置コントローラ303と伝送路311により相互に接続される。前記FPGAはHDDのPresenceを示すサイドバンド信号314がHDD305から接続される。前記HDDのStatusを示すStatus LED 304とサイドバンド信号313により接続される。
前記FPGA301は前記情報処理装置内の記憶装置切り替えスイッチ306と、制御信号315により接続される。さらに、前記FPGA301は、図1の例のように、図1中のフロントプレーン109により複数の情報処理装置が接続されている場合において、異なる情報処理装置(以後、リモートと呼ぶ)内のFPGAと、前記情報処理装置(以後、ローカルと呼ぶ)内の前記FPGA間で、通信する際に用いるFPGA間通信用伝送路312が接続されており、前記フロントプレーン109を介してリモートのFPGAに接続される。
前記FPGA301はHDD制御モードを管理するためのレジスタ(HDD Control Register 324)を有し、前記BMC302と接続される前記伝送路310を介して前記BMCから制御される。
前記BMC302が属する情報処理装置(ローカル)がPrimaryとして動作し、ローカル内のHDDがローカル内の記憶装置コントローラにより制御される場合、前記BMC302は、前記HDD制御モードレジスタ324に値0をセットする。
一方、前記BMCが属する情報処理装置(ローカル)がNon−Primaryとして動作し、ローカル内のHDDが異なる情報処理装置(リモート)内の記憶装置コントローラにより制御される場合、前記BMCは、前記HDD制御モードレジスタ324に値1をセットする。
前記FPGA301と前記記憶装置コントローラ303を接続する伝送路311はSIO(Serial I/O)により接続されており、前記FPGA301内のSIO I/F CTL(パラレル<−>シリアル変換ブロック) 320と接続される。前記SIO I/F CTLは前記記憶装置コントローラ303からのシリアル制御信号をパラレル信号に変換し、FPGA内部のレジスタに接続される。
前記FPGA301は、ローカルのHDDのStatusを示すLEDを制御するためのLED Status Control Register(ローカル用) 321aを有し、本レジスタはSIO I/F CTL 320を介して信号325により前記記憶装置コントローラ303に接続される。また、本レジスタはセレクタ323を介して前記Status LED 304と接続される。前記セレクタ323は前記記憶装置切り替えスイッチ制御用の信号315により制御され、記憶装置切り替えスイッチ制御用の信号315の値が0の場合、前記LED Status Control Register(ローカル用) 321aと、前記Status LED 304が接続され、前記記憶装置コントローラ303により、ローカルの前記Status LED 304を制御可能となる。
前記FPGA301は、ローカルのHDDのプレゼンスを示すサイドバンド信号314と接続されるHDD Presence Monitor Register(ローカル用) 322aを有する。本レジスタは、信号326により前記SIO I/F CTL 320と接続され、前記記憶装置コントローラ303が、ローカルの前記HDD305のプレゼンスを認識することが可能となる。
また、前記FPGAは、FPGA間LED Status同期制御部 328を有する。前記FPGA間LED Status同期制御部 328は、前記記憶装置コントローラ303から出力されるリモートのLEDを制御するための信号を、前記SIO I/F
CTL 320を経由して、入力として受け取る。
前記ローカルのHDDのプレゼンスを示すサイドバンド信号314は、前記HDD Presence Monitor Register 322aに加え、前記FPGA301内の、FPGA間HDD Presence同期制御部 329に接続される。
本同期制御部は、ローカルのHDDからのPresence信号314をラッチし値を保持する。
例として、Presence信号314が、HDD搭載の場合は0(Low)、HDD未搭載の場合は1(High)となる場合、HDD搭載時、前記HDD Presence同期制御部は値0をラッチし、HDD未搭載時、前記HDD Presence同期制御部は値1をラッチする。
前記FPGA301は、Arbiter 330を備えており、前記BMC302が、ローカルとリモートのFPGAの状態を管理するために用いる、FPGA間通信を制御するためのFPGA間通信制御部327からの信号と、前記FPGA間LED Status同期制御部 329からの信号と、前記FPGA間HDD Presence同期制御部からの信号の調停を行う。
前記Arbiter330からの出力信号は、SerDesなどのI/F 331、ローカルとリモートのFPGA間を接続する伝送路312を経由してリモートのFPGAに伝送される。
また、前記Arbiter330は、前記FPGA間通信制御部327からの信号と、FPGA間LED Status同期制御部 328からの信号と、FPGA間HDD Presence同期制御部 329からの信号間の帯域制御を行う帯域制御部335を有す。
前記帯域制御部335は、常に一定の間隔で前記FPGA間LED Status同期制御部 328からの信号を、前記SerDesなどのI/F331に出力する機能を有し、前記FPGA間LED Status同期制御部 328からの出力信号が、リモートの情報処理装置内のFPGAに向けて、一定時間以内で転送されることを保証する。
同様に、前記帯域制御部335は、常に一定の間隔で前記FPGA間HDD Presence同期制御部 329からの信号を、前記SerDesなどのI/F331に出力する機能を有し、前記FPGA間HDD Presence同期制御部 329からの出力信号が、リモートの情報処理装置内のFPGAに対して、一定時間以内で転送されることを保証する。
前記FPGA301は、リモートのFPGAから伝送される信号をデコードする機能を有するDecoder336も有する。
前記Decoder336は、リモートのFPGAから伝送される信号を、リモートFPGA内部のFPGA間通信制御部からの信号と、FPGA間LED Status同期制御部 328からの信号と、前記FPGA間HDD Presence同期制御部 329からの信号にデコードする機能を有する。
前記デコーダ336により得られたリモートのFPGAからのFPGA間LED Status同期制御部からの信号は、前記FPGA301内部のLED Status Control Register(リモート用) 321bに信号332を経由して接続され、値が記録される。
本レジスタ321bはセレクタ323を介して前記Status LED 304と接続される。記憶装置切り替えスイッチ制御用の信号315の値が1の場合、前記LED Status Control Register(リモート用) 321bと、前記Status LED 304が接続され、リモートの記憶装置コントローラにより、ローカルの前記Status LED 304が制御可能となる。
同様に、前記デコーダにより得られたリモートのFPGAからのFPGA間HDD Presence同期制御部からの信号は、前記FPGA301内部のHDD Presence Monitor Register(リモート用) 322bに信号333を経由して接続され、値が記録される。
本レジスタは、前記SIO I/F CTL 320と接続されており、ローカルの記憶装置コントローラが、リモートの前記HDD305のプレゼンスを認識することが可能となる。
結果として、本技術を用いることにより、複数の情報処理装置が相互に接続されたSMPシステムにおいて、異なる情報処理装置内の各々のHDDを、特定の情報処理装置内の記憶装置コントローラに接続することが可能となり、リモートのHDDの搭載/非搭載情報を、ローカルの記憶装置コントローラが認識でき、ローカルの記憶装置コントローラがリモートのHDDの状態を示すLEDを制御することが可能となる。
よって、異なる情報処理装置内の各々のHDDを、オペレーティングシステムから単一の記憶装置(Disk)として使用することが可能となる。
また、図5は、記憶装置切り替えスイッチ有さないドータカード527a、527bの例を示している。前期ドータカードは伝送路512a,512bを介してHDD507a,507bと、記憶装置コントローラ504a,504bのHDD接続用ポート525a,525bを接続している。本発明における記憶装置共有機構を必要としないユーザに対しては、図5に示すドータカードを用いることで、HDDを直接記憶装置コントローラに接続することができ、同じ情報処理装置を用いながら、ドータカードを入れ替えることにより、ユーザの使用用途に応じ、システムの導入コストを抑えることが可能となる。
100a〜100b 情報処理装置
101a〜101b CPU
102a〜102b メインメモリ
104a〜104b 記憶装置コントローラ
105a〜105b BMC
106a〜106b FPGA
107a〜107b HDD
108a〜108b 記憶装置切り替えスイッチ
109 フロントプレーン
115 バックプレーン
116 システム装置制御モジュール
117 システム制御コントローラ
127a〜127b 記憶装置切り替えスイッチを擁するドータカード
300 情報処理装置
301 FPGA
302 BMC(Board Management Controller)
303 記憶装置コントローラ
304 HDD Status LED
305 HDD
306 記憶装置切り替えスイッチ
320 SIO I/F Controller (CTL)
321a ローカル情報処理装置用LED Status Control Register
321b リモート情報処理装置用LED Status Control Register
322a ローカル情報処理装置用HDD Presence Monitor Register
322b リモート情報処理装置用HDD Presence Monitor Register
323 セレクタ
324 HDD制御モードを管理するためのレジスタ(HDD Control Register)
327 FPGA間通信制御部
328 FPGA間HDD LED Status同期制御部
329 FPGA間HDD Presence同期制御部
330 Arbitor
331 I/F (SerDes)
336 Decoder
400 バックプレーン
401 情報処理装置
402 システム装置制御モジュール
404 システム制御コントローラ
405 BMC
406 BMCの役割を管理するためのレジスタ(BMC Role Control Register)
408 FPGA
409 HDD
410 HDD制御モードを管理するためのレジスタ(HDD Control Register)
412 記憶装置切り替えスイッチ
413 記憶装置コントローラ
504a〜504b 記憶装置コントローラ
507a〜507b HDD
527a〜527b ドータカード
600a〜600b 情報処理装置
601a〜601b CPU
602a〜602b メインメモリ
604a〜604b 記憶装置コントローラ
605a〜605b BMC
606a〜606b FPGA
607a〜607b HDD
608a〜608b 記憶装置切り替えスイッチ
615 フロントプレーン
618 システム装置制御モジュール
619 システム制御コントローラ
620 バックプレーン

Claims (12)

  1. 1つ以上のCPUと、メインメモリと、1つ以上の記憶装置と、前記記憶装置の制御を行う記憶装置コントローラとを備えた情報処理装置をSMP結合により相互に接続した情報処理システムにおいて、
    ある1つの情報処理装置内の記憶装置コントローラが自情報処理装置内の記憶装置及び他情報処理装置内の記憶装置を制御することを特徴とする情報処理システム。
  2. 各情報処理装置は自情報処理装置内の記憶装置を自情報処理装置内の記憶装置コントローラ又は他情報処理装置内の記憶装置コントローラのいずれに接続するかを排他的に切り替える記憶装置切り替えスイッチを備えることを特徴とする請求項1記載の情報処理システム。
  3. 前記記憶装置切り替えスイッチはドータカード上に実装されることを特徴とする請求項2記載の情報処理システム。
  4. 各情報処理装置は自情報処理装置が主系情報処理装置として動作するか従属系情報処理装置として動作するかを設定するレジスタを備え、前記レジスタに設定された情報に応じて前記記憶装置切り替えスイッチを制御することを特徴とする請求項2又は3のいずれかに記載の情報処理システム。
  5. 前記レジスタに従属系情報処理装置として動作する情報が設定された第1の情報処理装置は、自情報処理装置の記憶装置が、前記レジスタに主系情報処理装置として動作する情報が設定された第2の情報処理装置の記憶装置コントローラに接続されるように自情報処理装置の記憶装置切り替えスイッチを制御し、前記第2の情報処理装置は、自情報処理装置の記憶装置コントローラが前記第1の情報処理装置の記憶装置に接続されるように自情報処理装置の記憶装置切り替えスイッチを制御することを特徴とする請求項4記載の情報処理システム。
  6. 前記情報処理装置はブレードサーバモジュールであることを特徴とする請求項1乃至5のいずれかに記載の情報処理システム。
  7. 1つ以上のCPUと、メインメモリと、1つ以上の記憶装置と、前記記憶装置の制御を行う記憶装置コントローラから成る情報処理装置が複数用意され、前記複数の情報処理装置を制御するシステム制御装置を備えた情報処理システムにおいて、
    前記システム制御装置は、各情報処理装置が各々独立した情報処理装置として動作するか、又は前記複数の情報処理装置がSMP結合により相互に接続された単一システムとして動作するか、を設定し、
    各情報処理装置が各々独立した情報処理装置として動作する際に、各情報処理装置内の記憶装置コントローラが各情報処理装置内の記憶装置を制御し、
    前記複数の情報処理装置が単一システムとして動作する際に、ある1つの情報処理装置内の記憶装置コントローラが自情報処理装置内の記憶装置及び他情報処理装置内の記憶装置を制御することを特徴とする情報処理システム。
  8. 各情報処理装置は自情報処理装置内の記憶装置を自情報処理装置内の記憶装置コントローラ又は他情報処理装置内の記憶装置コントローラのいずれに接続するかを排他的に切り替える記憶装置切り替えスイッチを備えることを特徴とする請求項7記載の情報処理システム。
  9. 前記記憶装置切り替えスイッチはドータカード上に実装されることを特徴とする請求項8記載の情報処理システム。
  10. 各情報処理装置は自情報処理装置が主系情報処理装置として動作するか従属系情報処理装置として動作するかを設定するレジスタを備え、前記レジスタに設定された情報に応じて前記記憶装置切り替えスイッチを制御することを特徴とする請求項8又は9のいずれかに記載の情報処理システム。
  11. 前記レジスタに従属系情報処理装置として動作する情報が設定された第1の情報処理装置は、自情報処理装置の記憶装置が、前記レジスタに主系情報処理装置として動作する情報が設定された第2の情報処理装置の記憶装置コントローラに接続されるように自情報処理装置の記憶装置切り替えスイッチを制御し、前記第2の情報処理装置は、自情報処理装置の記憶装置コントローラが前記第1の情報処理装置の記憶装置に接続されるように自情報処理装置の記憶装置切り替えスイッチを制御することを特徴とする請求項10記載の情報処理システム。
  12. 前記情報処理装置はブレードサーバモジュールであることを特徴とする請求項7乃至11のいずれかに記載の情報処理システム。
JP2013553242A 2012-01-13 2012-12-26 情報処理システム Pending JPWO2013105433A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013553242A JPWO2013105433A1 (ja) 2012-01-13 2012-12-26 情報処理システム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2012004632 2012-01-13
JP2012004632 2012-01-13
JP2013553242A JPWO2013105433A1 (ja) 2012-01-13 2012-12-26 情報処理システム

Publications (1)

Publication Number Publication Date
JPWO2013105433A1 true JPWO2013105433A1 (ja) 2015-05-11

Family

ID=48781391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013553242A Pending JPWO2013105433A1 (ja) 2012-01-13 2012-12-26 情報処理システム

Country Status (4)

Country Link
US (1) US9361043B2 (ja)
EP (1) EP2804090A4 (ja)
JP (1) JPWO2013105433A1 (ja)
WO (1) WO2013105433A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10198389B2 (en) * 2014-07-14 2019-02-05 Cavium, Llc Baseboard interconnection device, system and method
US10491701B2 (en) * 2016-07-14 2019-11-26 Cisco Technology, Inc. Interconnect method for implementing scale-up servers
US10448438B2 (en) * 2016-09-22 2019-10-15 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Wireless communication between a management controller and one or more drives
JP7266067B2 (ja) * 2021-06-25 2023-04-27 株式会社日立製作所 ストレージシステム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08320768A (ja) * 1995-05-26 1996-12-03 Hitachi Ltd ディスクアレイ装置
US5611057A (en) * 1994-10-06 1997-03-11 Dell Usa, L.P. Computer system modular add-in daughter card for an adapter card which also functions as an independent add-in card
JP2008242872A (ja) * 2007-03-28 2008-10-09 Hitachi Ltd ストレージシステム
JP2010009628A (ja) * 2004-12-09 2010-01-14 Hitachi Ltd サーバ装置
JP2010079467A (ja) * 2008-09-25 2010-04-08 Hitachi Ltd サーバ装置
JP2011526038A (ja) * 2008-06-27 2011-09-29 マイクロソフト コーポレーション クラスタ共有ボリューム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69521101T2 (de) * 1994-10-31 2001-10-18 Ibm Gemeinsam genutzte virtuelle Platten mit anwendungstransparenter Wiedergewinnung
JP2005228170A (ja) 2004-02-16 2005-08-25 Hitachi Ltd 記憶装置システム
JP4484757B2 (ja) 2004-12-09 2010-06-16 株式会社日立製作所 情報処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5611057A (en) * 1994-10-06 1997-03-11 Dell Usa, L.P. Computer system modular add-in daughter card for an adapter card which also functions as an independent add-in card
JPH08320768A (ja) * 1995-05-26 1996-12-03 Hitachi Ltd ディスクアレイ装置
JP2010009628A (ja) * 2004-12-09 2010-01-14 Hitachi Ltd サーバ装置
JP2008242872A (ja) * 2007-03-28 2008-10-09 Hitachi Ltd ストレージシステム
JP2011526038A (ja) * 2008-06-27 2011-09-29 マイクロソフト コーポレーション クラスタ共有ボリューム
JP2010079467A (ja) * 2008-09-25 2010-04-08 Hitachi Ltd サーバ装置

Also Published As

Publication number Publication date
WO2013105433A1 (ja) 2013-07-18
EP2804090A1 (en) 2014-11-19
EP2804090A4 (en) 2015-08-19
US9361043B2 (en) 2016-06-07
US20140344534A1 (en) 2014-11-20

Similar Documents

Publication Publication Date Title
US9965223B2 (en) Systems and methods for scalable storage management
US9298648B2 (en) Method and system for I/O flow management using RAID controller with DMA capabilitiy to directly send data to PCI-E devices connected to PCI-E switch
US10127170B2 (en) High density serial over LAN management system
KR20180012190A (ko) 멀티 모드에서 동작하는 장치 및 그것을 포함하는 시스템
US11086813B1 (en) Modular non-volatile memory express storage appliance and method therefor
US20160335209A1 (en) High-speed data transmission using pcie protocol
KR20160105294A (ko) 모듈화된 불휘발성 플래시 메모리 블레이드
JP2019153300A (ja) マルチモード及び/又はマルチ速度NVMe−oFデバイスを支援するシステム及び方法
US10261698B2 (en) Systems and methods for hardware-based raid acceleration for variable-length and out-of-order transactions
US20130198450A1 (en) Shareable virtual non-volatile storage device for a server
CN106776387B (zh) 硬盘通道扩展装置
US11923992B2 (en) Modular system (switch boards and mid-plane) for supporting 50G or 100G Ethernet speeds of FPGA+SSD
WO2015136619A1 (ja) ストレージ装置
US10445279B1 (en) Automatic PCIe operating mode configuration
WO2013105433A1 (ja) 情報処理システム
CN108345555B (zh) 基于高速串行通信的接口桥接电路及其方法
RU156778U1 (ru) Реконфигурируемая вычислительная система
US20080040564A1 (en) Sychronized Light Path Scheme Across Mutiple SAS Storage Enclosures
WO2013025221A1 (en) Connecting expansion slots
US10261699B2 (en) Systems and methods for hardware-based RAID acceleration
US7778244B1 (en) Storage system management with diplexing using USB signal conversion
CN104460857A (zh) 一种高速外设部件互连标准卡及其使用方法和装置
US8612548B2 (en) Computer server system and computer server for a computer server system
EP1794953B1 (en) Method and system for using an in-line credit extender with a host bus adapter
CN112306920A (zh) 一种减少硬盘逻辑控制器的方法及服务器

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150630

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20151208