JP2019148986A - Passage control apparatus, control method, control program and storage system - Google Patents
Passage control apparatus, control method, control program and storage system Download PDFInfo
- Publication number
- JP2019148986A JP2019148986A JP2018033209A JP2018033209A JP2019148986A JP 2019148986 A JP2019148986 A JP 2019148986A JP 2018033209 A JP2018033209 A JP 2018033209A JP 2018033209 A JP2018033209 A JP 2018033209A JP 2019148986 A JP2019148986 A JP 2019148986A
- Authority
- JP
- Japan
- Prior art keywords
- path
- raid
- storage device
- control unit
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、経路制御装置、その経路制御装置の制御方法及び制御プログラム、並びにストレージシステムに関する。特に、本発明は、ホストコンピュータと記憶装置との間におけるデータの格納又は読み出しの経路を制御する経路制御装置、制御方法、制御プログラム及びストレージシステムに関する。 The present invention relates to a path control device, a control method and control program for the path control device, and a storage system. In particular, the present invention relates to a path control device, a control method, a control program, and a storage system that control a data storage or read path between a host computer and a storage device.
同一のデータを複数のHDD(Hard Disk Drive)に格納することによってデータ記憶の信頼性を向上させる技術として、RAID(Redundant Arrays of Inexpensive Disks)のレベル1が知られている。2台のHDDがRAIDのレベル1により制御される場合、2台のHDDは論理的に1台のHDDとして扱われ、同一のデータがそれぞれのHDDに格納される。RAIDのレベル1を使用すると、一方のHDDが故障したときに他方のHDDからデータを読み出すことができるため、データ記憶の信頼性が向上する。 As a technique for improving the reliability of data storage by storing the same data in a plurality of HDDs (Hard Disk Drives), RAID (Redundant Arrays of Inexpensive Disks) level 1 is known. When two HDDs are controlled by RAID level 1, the two HDDs are logically treated as one HDD, and the same data is stored in each HDD. When RAID level 1 is used, when one HDD fails, data can be read from the other HDD, thereby improving the reliability of data storage.
RAID機能を制御するRAID制御手段が故障した場合であっても、故障したRAID制御手段を交換するにあたって、システム全体を停止することがないRAID制御システムが開示されている(特許文献1を参照)。このRAID制御システムは、RAID制御手段を複数個有し、動作中のRAID制御手段に異常が発生すると他のRAID制御手段が動作することにより、システム全体が停止することを防止する。 A RAID control system is disclosed that does not stop the entire system when replacing a failed RAID control means even if the RAID control means that controls the RAID function fails (see Patent Document 1). . This RAID control system has a plurality of RAID control means, and when an abnormality occurs in the operating RAID control means, other RAID control means operate to prevent the entire system from being stopped.
RAID制御を実行する装置では、装置サイズの大型化を抑制しつつ、可用性を高めることが望まれている。 In an apparatus that performs RAID control, it is desired to increase availability while suppressing an increase in apparatus size.
本発明の目的は、RAID制御を実行する装置において、装置サイズの大型化を抑制しつつ、可用性を高めることが可能な経路制御装置、制御方法、制御プログラム及びストレージシステムを提供することにある。 An object of the present invention is to provide a path control device, a control method, a control program, and a storage system that can increase availability while suppressing an increase in device size in a device that performs RAID control.
本発明の一側面に係る経路制御装置は、ホストコンピュータからのデータを受信し、第1経路を介して複数の記憶装置に格納するRAID制御部と、RAID制御部を介さずに、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すための第2経路と、第1経路と第2経路を切り換える第1切換部と、RAID制御部に異常があった場合に、第2経路により、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すように第1切換部を制御する切換制御部と、を有する。 A path control device according to an aspect of the present invention includes a RAID control unit that receives data from a host computer and stores the data in a plurality of storage devices via a first path, and the host computer does not pass through the RAID control unit. A second path for storing data in one storage device of the plurality of storage devices or reading data from one storage device of the plurality of storage devices, and a first switching between the first path and the second path When there is an abnormality in the switching unit and the RAID control unit, the host computer stores data in one storage device of the plurality of storage devices or one storage in the plurality of storage devices by the second path. A switching control unit that controls the first switching unit so as to read data from the device.
また、本発明の他の側面に係る制御方法は、ホストコンピュータからのデータを受信し、第1経路を介して複数の記憶装置に格納するRAID制御部と、RAID制御部を介さずに、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すための第2経路と、第1経路と第2経路を切り換える第1切換部と、を有する経路制御装置の制御方法であって、RAID制御部に異常があった場合に、第2経路により、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すように第1切換部を制御する。 A control method according to another aspect of the present invention includes a RAID control unit that receives data from a host computer and stores the data in a plurality of storage devices via a first path, and a host without using a RAID control unit. A second path for the computer to store data in one of the plurality of storage devices or to read data from one of the plurality of storage devices, and to switch between the first path and the second path A path control device control method having a first switching unit, and when there is an abnormality in the RAID control unit, the host computer transmits data to one storage device among a plurality of storage devices by the second route. Or the first switching unit is controlled to read out data from one of the plurality of storage devices.
また、本発明の一側面に係る制御プログラムは、ホストコンピュータからのデータを受信し、第1経路を介して複数の記憶装置に格納するRAID制御部と、RAID制御部を介さずに、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すための第2経路と、第1経路と第2経路を切り換える第1切換部と、を有する経路制御装置の制御プログラムであって、RAID制御部に異常があった場合に、第2経路により、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すように第1切換部を制御する、ことを経路制御装置に実行させる。 According to another aspect of the present invention, there is provided a control program that receives data from a host computer and stores the data in a plurality of storage devices via a first path, and the host computer without using the RAID control unit. Stores the data in one storage device of the plurality of storage devices or reads the data from one storage device of the plurality of storage devices, and switches between the first route and the second route. A control program for a path control device having a switching unit, and when there is an abnormality in the RAID control unit, the host computer transfers data to one storage device among a plurality of storage devices by the second route. The path control device is caused to control the first switching unit to store or read data from one of the plurality of storage devices.
また、本発明の他の側面に係るストレージシステムは、ホストコンピュータと、複数の記憶装置と、ホストコンピュータからのデータを受信し、第1経路を介して複数の記憶装置に格納するRAID制御部と、経路制御装置と、を有し、経路制御装置は、RAID制御部を介さずに、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は1つの記憶装置からデータを読み出すための第2経路と、第1経路と第2経路を切り換える第1切換部と、RAID制御部に異常があった場合に、第2経路により、ホストコンピュータが1つの記憶装置にデータを格納する又は1つの記憶装置からデータを読み出すように第1切換部を制御する切換制御部と、を有する。 A storage system according to another aspect of the present invention includes a host computer, a plurality of storage devices, and a RAID control unit that receives data from the host computer and stores the data in the plurality of storage devices via the first path. A path control device, and the path control device stores data in one storage device of a plurality of storage devices or data from one storage device without going through a RAID control unit. When there is an abnormality in the second path for reading, the first switching section for switching between the first path and the second path, and the RAID control section, the host computer stores data in one storage device by the second path. Or a switching control unit that controls the first switching unit so as to read data from one storage device.
本発明に係る経路制御装置、制御方法、制御プログラム及びストレージシステムは、RAID制御を実行する装置において、装置サイズの大型化を抑制しつつ、可用性を高めることが可能である。 A path control device, a control method, a control program, and a storage system according to the present invention can increase availability while suppressing an increase in device size in a device that performs RAID control.
以下、本発明の一側面に係る経路制御装置及び制御方法について図を参照しつつ説明する。但し、本発明の技術的範囲はそれらの実施の形態に限定されず、特許請求の範囲に記載された発明とその均等物に及ぶ点に留意されたい。 Hereinafter, a route control device and a control method according to an aspect of the present invention will be described with reference to the drawings. However, it should be noted that the technical scope of the present invention is not limited to these embodiments, but extends to the invention described in the claims and equivalents thereof.
<第1実施形態>
図1は、第1実施形態に係るストレージシステムのハードウェア構成を示す図である。
<First Embodiment>
FIG. 1 is a diagram illustrating a hardware configuration of the storage system according to the first embodiment.
ストレージシステム1は、例えば特定の装置に組み込んで使用される組み込みコンピュータであり、特定の装置からの要求に従ってデータを格納するとともに、格納したデータを読み出す。ストレージシステム1は、ホストコンピュータ10と、第1記憶装置20aと、第2記憶装置20bと、経路制御装置30とを有する。以下、ストレージシステム1の各部について詳細に説明する。
The storage system 1 is an embedded computer that is used by being incorporated in a specific device, for example, and stores data according to a request from the specific device and reads out the stored data. The storage system 1 includes a
ホストコンピュータ10は、例えばサーバ等のコンピュータである。ホストコンピュータ10は、ホストコンピュータ10が記憶するデータ又はホストコンピュータ10と接続するサーバ等の他装置からのデータを、第1記憶装置20a又は第2記憶装置20bに格納する。また、ホストコンピュータ10は、格納したデータを第1記憶装置20a又は第2記憶装置20bから読み出し、ホストコンピュータ10に記憶又は他装置に送信する。ホストコンピュータ10は、制御インタフェース11と、メインインタフェース12と、サブインタフェース13と、ホスト記憶装置14と、ホストCPU(Central Processing Unit)15とを有する。これらの各部は、ホストコンピュータ10のマザーボード上に実装される。以下、ホストコンピュータ10の各部について詳細に説明する。
The
制御インタフェース11は、経路制御装置30と通信可能なインタフェース回路を有し、制御ケーブル54を介して経路制御装置30と電気的に接続して各種のデータ及び情報を送受信する。制御インタフェース11は、例えばI2C(Inter-Integrated Circuit)等の方式で通信するための回路を有する。
The control interface 11 has an interface circuit that can communicate with the
メインインタフェース12は、経路制御装置30と通信可能なインタフェース回路を有し、メインケーブル51を介して経路制御装置30と電気的に接続して各種のデータ及び情報を送受信する。メインインタフェース12は、例えばSATA(Serial ATA)、PCIe(PCI express)等の規格に準じた方式で通信するための回路を有する。
The
サブインタフェース13は、経路制御装置30と通信可能なインタフェース回路を有し、第1サブケーブル52を介して経路制御装置30と電気的に接続して各種のデータ及び情報を送受信する。サブインタフェース13は、例えばSATA、PCIe等の規格に準じた方式で通信するための回路を有する。
The
ホスト記憶装置14は、RAM(Random Access Memory)、ROM(Read Only Memory)等のメモリ装置、HDD等の固定ディスク装置、又はフレキシブルディスク、光ディスク等の可搬用の記憶装置等を有する。また、ホスト記憶装置14には、BIOS(Basic Input Output System)、ブートローダ、ホストコンピュータ10の各種処理に用いられる各種データ、コンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、コンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いてホストコンピュータ10にインストールされてもよい。可搬型記録媒体は、例えばCD−ROM(compact disk read only memory)、DVD−ROM(digital versatile disk read only memory)等である。
The
ホストCPU15は、予めホスト記憶装置14に記憶されているプログラムに基づいて動作する。なお、ホストCPU15に代えて、DSP(digital signal processor)、LSI(large scale integration)等が用いられてもよい。また、ホストCPU15に代えて、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programming Gate Array)等が用いられてもよい。
The
図2は、ホスト記憶装置及びホストCPUの概略構成を示す図である。 FIG. 2 is a diagram showing a schematic configuration of the host storage device and the host CPU.
ホスト記憶装置14には、リンク確立プログラム141、RAID状態取得プログラム142、経路切換プログラム143等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。ホストCPU15は、ホスト記憶装置14に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作することにより、リンク確立部151、RAID状態取得部152、経路切換部153等として機能する。
The
第1記憶装置20a及び第2記憶装置20bは、例えばHDD等の固定ディスク装置である。第1記憶装置20a及び第2記憶装置20bには、ホストコンピュータ10から経路制御装置30を介して送信された各種データ等が格納される。以後、第1記憶装置20a及び第2記憶装置20bを記憶装置20と総称する。記憶装置20は、複数の記憶装置であればよく、3個以上の記憶装置であってもよい。
The
経路制御装置30は、例えばRAIDカードのような、ホストコンピュータ10の拡張スロットに装着して使用される拡張カードである。経路制御装置30は、第1切換部31と、第2切換部32と、第3切換部33と、RAID制御部34と、切換制御部35とを有する。以下、経路制御装置30の各部について詳細に説明する。
The path control
第1切換部31は、第1RAIDケーブル37aを介してRAID制御部34と接続し、第1非RAIDケーブル38aを介して第2切換部32と接続する。第1切換部31は、更に、第1HDDケーブル53aを介して第1記憶装置20aと接続し、制御ケーブル45を介して切換制御部35と接続する。第1RAIDケーブル37aは、第1経路の一例であり、第1非RAIDケーブル38aは、第2経路の一例である。
The
第1切換部31は、切換制御部35による制御ケーブル45を介した制御に応じて、第1HDDケーブル53aの接続先を第1RAIDケーブル37a及び第1非RAIDケーブル38aのいずれか一つに切り換えるスイッチである。
The
第1切換部31は、起動処理後の初期状態において、第1HDDケーブル53aと第1RAIDケーブル37aとを接続している。第1切換部31は、例えばマルチプレクサのような切換回路を使用して、第1HDDケーブル53aの接続先を切り換える。
The
第2切換部32は、第1サブケーブル52を介してホストコンピュータ10と接続し、第2サブケーブル36を介してRAID制御部34と接続する。第2切換部32は、更に、第1非RAIDケーブル38aを介して第1切換部31と接続し、第2非RAIDケーブル38bを介して第3切換部33と接続し、制御ケーブル46を介して切換制御部35と接続する。第2非RAIDケーブル38bは、第3経路の一例である。
The
第2切換部32は、切換制御部35による制御ケーブル46を介した制御に応じて、第1サブケーブル52の接続先を第2サブケーブル36、第1非RAIDケーブル38a及び第2非RAIDケーブル38bのいずれか一つに切り換えるスイッチである。
The
第2切換部32は、起動処理後の初期状態において、第1サブケーブル52と第2サブケーブル36とを接続している。第2切換部32は、例えばマルチプレクサのような切換回路を使用して、第1サブケーブル52の接続先を切り換える。
The
第3切換部33は、第2RAIDケーブル37bを介してRAID制御部34と接続し、第2非RAIDケーブル38bを介して第2切換部32と接続する。第3切換部33は、更に、第2HDDケーブル53bを介して第2記憶装置20bと接続し、制御ケーブル47を介して切換制御部35と接続する。第2RAIDケーブル37bは第1経路の一例である。
The
第3切換部33は、切換制御部35による制御ケーブル47を介した制御に応じて、第2HDDケーブル53bの接続先を第2RAIDケーブル37b及び第2非RAIDケーブル38bのいずれか一つに切り換えるスイッチである。
The
第3切換部33は、起動処理後の初期状態において、第2HDDケーブル53bと第2RAIDケーブル37bとを接続している。第3切換部33は、例えばマルチプレクサのような切換回路を使用して、第2HDDケーブル53bの接続先を切り換える。
The
RAID制御部34は、第1記憶装置20a及び第2記憶装置20bを論理的に1台のHDDとして扱うように制御し、ホストコンピュータ10にRAIDのレベル1の機能を提供する。RAID制御部34は、例えばSoC(System on a Chip)、CPU、DSP、LSI、ASIC、FPGA等により実装される。RAID制御部34は、第2サブケーブル36、第1RAIDケーブル37a、第2RAIDケーブル37b、制御ケーブル48及びメインケーブル51と接続する。
The
RAID制御部34は、第1RAIDケーブル37a及び第1HDDケーブル53aを介して、第1記憶装置20aの動作状態を示す情報を周期的に読み取り、読み取った情報をRAID制御部34の第1レジスタ(不図示)に記憶する。RAID制御部34は、第2RAIDケーブル37b及び第2HDDケーブル53bを介して、第2記憶装置20bの動作状態を示す情報を周期的に読み取り、読み取った情報をRAID制御部34の第2レジスタ(不図示)に記憶する。記憶装置20の動作状態を示す情報は、記憶装置20への最後の書き込みが正常に終了したか否かの情報、記憶装置20の動作状態を示すS.M.A.R.T.(Self-Monitoring, Analysis and Reporting Technology)情報等を含む。
The
RAID制御部34は、自らの動作に異常を検出すると、検出した異常を示す情報をRAID制御部34の第3レジスタ(不図示)に記憶する。
When the
RAID制御部34は、ホストコンピュータ10から送信されるデータを受信し、第1RAIDケーブル37aを介して第1記憶装置20aに格納するとともに、第2RAIDケーブル37bを介して第2記憶装置20bに格納する。RAID制御部34は、第1記憶装置20a又は第2記憶装置20bに記憶されているデータを第1RAIDケーブル37a又は第2RAIDケーブル37bを介して読み出す。RAID制御部34は、読み出したデータをメインケーブル51又は第2サブケーブル36を介してホストコンピュータ10に送信する。
The
RAID制御部34は、ホストコンピュータ10から送信された要求信号を受信し、要求信号に対応する処理を実行すると、要求信号に対する応答信号を、要求信号が送信されたケーブルと同一のケーブルを使用してホストコンピュータ10へ送信する。また、RAID制御部34は、ホストコンピュータ10又は経路制御装置30の他の構成要素から送信された第1〜第3レジスタの読み出し要求信号を受信すると、該当するレジスタの値を含む読み出し応答信号を要求信号の送信元へ送信する。
When the
切換制御部35は、制御ケーブル54を介してホストコンピュータ10と接続され、制御ケーブル45〜48を介して第1切換部31、第2切換部32、第3切換部33及びRAID制御部34と接続される。切換制御部35は、RAID制御部34に異常があった場合に、第1切換部31を制御して、第1非RAIDケーブル38aを介し且つRAID制御部34を介さずにホストコンピュータ10と第1記憶装置20aとを接続するように通信経路を切り換える。又は、切換制御部35は、RAID制御部34に異常があった場合に、第3切換部33を制御して、第2非RAIDケーブル38bを介し且つRAID制御部34を介さずにホストコンピュータ10と第2記憶装置20bとを接続するように通信経路を切り換える。
The switching
切換制御部35は、例えばSoC、CPU、DSP、LSI、ASIC、FPGA等により実装される。切換制御部35は、インタフェース351と、制御部記憶装置352と、CPU353とを有する。以下、切換制御部35の各部について詳細に説明する。
The switching
インタフェース351は、制御インタフェース11と同様のインタフェース回路を有し、制御ケーブル54を介してホストコンピュータ10と電気的に接続して各種のデータ及び情報を送受信する。インタフェース351は、更に第1切換部31、第2切換部32、第3切換部33及びRAID制御部34と、それぞれ制御ケーブル45〜48を介して電気的に接続して、各種のデータ及び情報を送受信する。
The
制御部記憶装置352は、ROM、RAM等のメモリ装置等を有する。また、制御部記憶装置352には、切換制御部35の各種処理に用いられる各種データ、コンピュータプログラム、データベース、テーブル等が格納される。コンピュータプログラムは、例えばCD−ROM、DVD−ROM等のコンピュータ読み取り可能な可搬型記録媒体から、公知のセットアッププログラム等を用いて切換制御部35にインストールされてもよい。
The control
CPU353は、プロセッサの一例であり、予め制御部記憶装置352に記憶されているプログラムに基づいて動作する。なお、CPU353に代えて、DSP、LSI、ASIC、FPGA等が用いられてもよい。
The
図3は、制御部記憶装置及びCPUの概略構成を示す図である。 FIG. 3 is a diagram illustrating a schematic configuration of the control unit storage device and the CPU.
制御部記憶装置352には、HDD状態取得プログラム354、経路設定プログラム355等の各プログラムが記憶される。これらの各プログラムは、プロセッサ上で動作するソフトウェアにより実装される機能モジュールである。CPU353は、制御部記憶装置352に記憶された各プログラムを読み取り、読み取った各プログラムに従って動作することにより、HDD状態取得部356、経路設定部357等として機能する。
The control
図4は、ホストコンピュータの動作の例を示すフローチャートである。以下、図4に示したフローチャートを参照しつつ、ホストコンピュータの動作の例を説明する。なお、以下に説明する動作のフローは、主にホストCPU15によりホストコンピュータ10の各要素と協働して実行される。
FIG. 4 is a flowchart illustrating an example of the operation of the host computer. An example of the operation of the host computer will be described below with reference to the flowchart shown in FIG. The operation flow described below is mainly executed by the
ユーザがストレージシステム1の電源を投入すると、ホストCPU15は、BIOSを動作させる等の起動処理を実行する(ステップS11)。次に、リンク確立部151は、メインインタフェース12と経路制御装置30のRAID制御部34との間に、データ送受信用のリンクを確立し(ステップS12)、確立が成功したか否かを判定する(ステップS13)。リンク確立部151は、所定の手順に従って要求信号を送信し、一定期間内にリンク確立成功を示す応答信号を受信した場合、リンク確立成功と判定し、一定期間内にリンク確立成功を示す応答信号を受信しなかった場合、リンク確立失敗と判定する。
When the user turns on the power to the storage system 1, the
リンクの確立に失敗した場合(ステップS13−N)、リンク確立部151は、サブインタフェース13と経路制御装置30のRAID制御部34との間に、データ送受信用のリンクを確立する(ステップS14)。次に、リンク確立部151は、確立が成功したか否かを判定する(ステップS15)。リンク確立部151は、所定の手順に従って要求信号を送信し、一定期間内にリンク確立成功を示す応答信号を受信した場合、リンク確立成功と判定し、一定期間内にリンク確立成功を示す応答信号を受信しなかった場合、リンク確立失敗と判定する。経路切換部153は、ステップS13−NとS14との間に、制御インタフェース11を介して経路制御装置30の切換制御部35に所定の要求信号を送信し、切換制御部35によって第1サブケーブル52と第2サブケーブル36とを接続させてもよい。
When link establishment fails (step S13-N), the
ステップS13及びS15のいずれか一方でリンクの確立に成功した場合、RAID状態取得部152は、確立されたリンクを介して、RAID制御部34の第3レジスタの読み出し要求信号を送信する。RAID状態取得部152は、読み出し要求信号に対する応答信号を受信し、応答信号からRAID制御部34の状態を取得する(ステップS16)。次に、RAID状態取得部152は、取得された状態が正常を示すか否かを判定する(ステップS17)。
When the link is successfully established in any one of steps S13 and S15, the RAID
取得された状態が正常を示す場合(ステップS17−Y)、ホストCPU15は、一連の処理を終了する。以後、ホストCPU15は、確立されたリンクを介して、RAID機能を提供するように制御された記憶装置20にデータを格納する、又は記憶装置20からデータを読み出す。
When the acquired state indicates normal (step S17-Y), the
ステップS15でリンクの確立に失敗した場合、又は、ステップS17で取得された状態が異常を示す場合、経路切換部153は、RAID制御部34に異常があると判定し、非RAID接続処理を実行して(ステップS18)、一連の処理を終了する。
If link establishment fails in step S15, or if the state acquired in step S17 indicates an abnormality, the
図5は、ステップS18に示す非RAID接続処理の動作の例を示すフローチャートである。 FIG. 5 is a flowchart showing an example of the operation of the non-RAID connection process shown in step S18.
最初に、経路切換部153は、制御インタフェース11を介して、経路制御装置30に切換要求信号を送信する(ステップS31)。切換要求信号は、ホストコンピュータ10と記憶装置20とを結ぶ通信経路を、RAID制御部34を介する通信経路から介さない通信経路に切り換えることを要求する信号である。経路切換部153は、制御インタフェース11を介して、通信経路の切換結果を含む切換応答信号を経路制御装置30から受信する(ステップS32)。次に、経路切換部153は、切換結果が第1記憶装置20aへの切換、第2記憶装置20bへの切換及び切換不可のいずれを示すかを判定する(ステップS33)。
First, the
切換結果が第1記憶装置20aへの切換を示す場合、リンク確立部151は、サブインタフェース13と第1記憶装置20aとの間にデータ送受信用のリンクを確立するため、所定の手順に従って要求信号を送信する(ステップS34)。要求信号は、サブインタフェース13、第1サブケーブル52、第2切換部32、第1非RAIDケーブル38a、第1切換部31及び第1HDDケーブル53aから構成される通信経路を介して第1記憶装置20aへ送信される。
When the switching result indicates switching to the
切換結果が第2記憶装置20bへの切換を示す場合、リンク確立部151は、サブインタフェース13と第2記憶装置20bとの間にデータ送受信用のリンクを確立するため、所定の手順に従って要求信号を送信する(ステップS35)。要求信号は、サブインタフェース13、第1サブケーブル52、第2切換部32、第2非RAIDケーブル38b、第3切換部33及び第2HDDケーブル53bから構成される通信経路を介して第2記憶装置20bへ送信される。
When the switching result indicates switching to the
ステップS34又はステップS35の次に、リンク確立部151は、リンクの確立に成功したか否かを判定する(ステップS36)。リンク確立部151は、要求信号の送信から一定期間内にリンク確立成功を示す応答信号を受信した場合、リンク確立成功と判定し、一定期間内にリンク確立成功を示す応答信号を受信しなかった場合、リンク確立失敗と判定する。
Following step S34 or step S35, the
リンクの確立に成功した場合(ステップS36−Y)、ホストCPU15は、一連の処理を終了する。以後、ホストCPU15は、確立されたリンクを介して、リンクが確立された記憶装置20にデータを格納する、又はリンクが確立された記憶装置20からデータを読み出す。
If the link is successfully established (step S36-Y), the
ステップS33で切換結果が切換不可を示す場合、又は、ステップS36でリンクの確立に失敗した場合、ホストCPU15は、記憶装置20が使用できないこと示す画面を表示装置(不図示)に表示して(ステップS37)、一連の処理を終了する。
If the switching result indicates that switching cannot be performed in step S33, or if link establishment fails in step S36, the
図6は、経路制御装置の動作の例を示すフローチャートである。以下、図6に示したフローチャートを参照しつつ、経路制御装置30の動作の例を説明する。なお、以下に説明する動作のフローは、主にCPU353により経路制御装置30の各要素と協働して実行される。
FIG. 6 is a flowchart illustrating an example of the operation of the path control device. Hereinafter, an example of the operation of the
最初に、CPU353は、インタフェース351を介して、ホストコンピュータ10から切換要求信号を受信する(ステップS51)。次に、HDD状態取得部356は、インタフェース351を介して、RAID制御部34に第1レジスタの読み出し要求信号を送信する。次に、HDD状態取得部356は、インタフェース351を介して、RAID制御部34から第1レジスタの読み出し応答信号を受信し、応答信号から第1記憶装置20aの動作状態を示す情報を取得する(ステップS52)。
First, the
次に、経路設定部357は、第1記憶装置20aが正常に動作しているか否かを判定する(ステップS53)。例えば、取得した情報が、第1記憶装置20aへの最後の書き込みが正常に終了していないことを示す場合、経路設定部357は、第1記憶装置20aが正常に動作していないと判定する。また、取得した情報が、第1記憶装置20aからデータを読み出すときに発生したエラーの割合が所定の閾値を超えていることを示す場合、経路設定部357は、第1記憶装置20aが正常に動作していないと判定する。経路設定部357は、第1記憶装置20aが正常に動作していないと判定されない場合、第1記憶装置20aが正常に動作していると判定する。
Next, the
第1記憶装置20aが正常に動作している場合(ステップS53−Y)、経路設定部357は、第1サブケーブル52の接続先を第1非RAIDケーブル38aに設定するように、インタフェース351を介して第2切換部32を制御する。第2切換部32は、第1サブケーブル52と第1非RAIDケーブル38aを接続する(ステップS54)。
When the
次に、経路設定部357は、第1HDDケーブル53aの接続先を第1非RAIDケーブル38aに設定するように、インタフェース351を介して第1切換部31を制御する。第1切換部31は、第1非RAIDケーブル38aと第1HDDケーブル53aを接続する(ステップS55)。ステップS54及びS55の処理により、切換制御部35は、ホストコンピュータ10が第1非RAIDケーブル38aを介して第1記憶装置20aにデータを格納する又は第1記憶装置20aからデータを読み出すための通信経路を設定する。
Next, the
次に、CPU353は、インタフェース351を介して、第1記憶装置20aへの切換を示す切換応答信号をホストコンピュータ10に送信し(ステップS56)、一連の処理を終了する。
Next, the
ステップS53において第1記憶装置20aが正常に動作していない場合(ステップS53−N)、HDD状態取得部356は、インタフェース351を介して、RAID制御部34に第2レジスタの読み出し要求信号を送信する。HDD状態取得部356は、インタフェース351を介して、RAID制御部34から第2レジスタの読み出し応答信号を受信して、応答信号から第2記憶装置20bの動作状態を示す情報を取得する(ステップS57)。
If the
次に、経路設定部357は、第1記憶装置20aが正常に動作しているか否かの判定と同様の基準により、第2記憶装置20bが正常に動作しているか否かを判定する(ステップS58)。
Next, the
第2記憶装置20bが正常に動作している場合(ステップS58−Y)、経路設定部357は、第1サブケーブル52の接続先を第2非RAIDケーブル38bに設定するように、インタフェース351を介して第2切換部32を制御する。第2切換部32は、第1サブケーブル52と第2非RAIDケーブル38bを接続する(ステップS59)。
When the
次に、経路設定部357は、第2HDDケーブル53bの接続先を第2非RAIDケーブル38bに設定するように、インタフェース351を介して第3切換部33を制御する。第3切換部33は、第2非RAIDケーブル38bと第2HDDケーブル53bを接続する(ステップS60)。ステップS59及びS60の処理により、切換制御部35は、ホストコンピュータ10が第2非RAIDケーブル38bを介して第2記憶装置20bにデータを格納する又は第2記憶装置20bからデータを読み出すための通信経路を設定する。
Next, the
次に、CPU353は、インタフェース351を介して、第2記憶装置20bへの切換を示す切換応答信号をホストコンピュータ10に送信し(ステップS61)、一連の処理を終了する。
Next, the
ステップS58において第2記憶装置20bが正常に動作していない場合(S58−N)、CPU353は、インタフェース351を介して、切換不可を示す切換応答信号をホストコンピュータ10に送信し(ステップS62)、一連の処理を終了する。
When the
以上詳述したように、経路制御装置は、RAID制御部に異常があった場合に、他のRAID制御部を使用することなく、ホストコンピュータが1つの記憶装置にデータを格納する又は1つの記憶装置からデータを読み出すことを可能にする。ホストコンピュータのユーザは、経路制御装置を使用することにより、RAID制御部に異常があった場合でも記憶装置にデータを格納する又は記憶装置からデータを読み出すことが可能なため、RAID制御部を修理するまでの間にデータを使用することができる。従って、経路制御装置は、RAID制御を実行する装置において、装置サイズの大型化を抑制しつつ、可用性を高めることが可能である。 As described above in detail, the path control device stores data in one storage device or one storage without using another RAID control unit when there is an abnormality in the RAID control unit. Allows data to be read from the device. The user of the host computer can repair the RAID control unit because it can store data in the storage device or read data from the storage device even if there is an abnormality in the RAID control unit by using the path control device You can use the data in the meantime. Therefore, the path control device can increase availability while suppressing an increase in device size in a device that performs RAID control.
また、経路制御装置は、第2経路を切り換える第2切換部を更に有することにより、RAID制御部に異常があった場合に、データの格納又は読み出しを実行する記憶装置を選択することができる。従って、経路制御装置は、第1記憶装置20aが故障した場合でも、第2記憶装置20bにより処理を継続させることが可能となり、可用性をさらに向上させることが可能となる。
Further, the path control device further includes a second switching unit that switches the second route, so that when the RAID control unit has an abnormality, it is possible to select a storage device that stores or reads data. Therefore, the path control device can continue the processing by the
また、経路制御装置は、1つの記憶装置への最終の書き込みが正常に完了していると判定したとき、1つの記憶装置に接続される第2経路を選択するように第2切換部を制御する。これにより、経路制御装置は、データが正常に記憶されている可能性の高い記憶装置を適切に選択できる。 The path control device also controls the second switching unit to select the second path connected to one storage device when it is determined that the last write to one storage device has been normally completed. To do. Thus, the path control device can appropriately select a storage device that is highly likely to store data normally.
なお、第1実施形態においては、ステップS17におけるRAID制御部34の異常判定をホストコンピュータ10が実行したが、経路制御装置30の切換制御部35が実行してもよい。
In the first embodiment, the
例えば、ステップS16のRAID制御部の状態取得及びステップS17の異常判定の代わりに、切換制御部35は、ホストコンピュータ10の起動処理後に周期的にRAID制御部34の第3レジスタの読み出し要求信号をRAID制御部34へ送信する。切換制御部35は、一定期間内に対応する応答信号を受信しない場合、又は、異常を示す情報を含む応答信号を受信した場合、ステップS52〜S62の処理を、切換応答信号の送信を切換通知信号の送信に代えて実行する。ホストコンピュータ10は、切換通知信号を受信すると、ステップS33〜S37の処理を実行する。
For example, instead of acquiring the status of the RAID control unit in step S16 and determining the abnormality in step S17, the switching
また、第2サブケーブル36、第1RAIDケーブル37a、第2RAIDケーブル37b、第1非RAIDケーブル38a及び第2非RAIDケーブル38bは、バス配線であってもよい。同様に、メインケーブル51、第1サブケーブル52、第1HDDケーブル53a、第2HDDケーブル53b、制御ケーブル45〜48及び54は、バス配線であってもよい。
The
また、リンク確立部151がリンクを確立し、リンクが確立されたか否かを判定することに代えて、CPU15は、BIOSの動作においてホストコンピュータ10へ接続するデバイスを認識し、リンク確立部151は、その認識結果を判定してもよい。この場合、CPU15は、デバイスを認識し、デバイスを認識したか否かをCPU15内のレジスタ(不図示)に書き込む。次に、リンク確立部151は、CPU15内のレジスタを読み取り、デバイスが認識されたことをレジスタが示す場合はリンク確立成功と判定し、デバイスが認識されていないことをレジスタが示す場合はリンク確立失敗と判定する。
Further, instead of the
<第2実施形態>
図7は、第2実施形態に係るストレージシステムのハードウェア構成を示す図である。
Second Embodiment
FIG. 7 is a diagram illustrating a hardware configuration of the storage system according to the second embodiment.
第2実施形態は、ストレージシステム1´が経路制御装置130とは別個にRAIDカード131を有し、RAID制御部34がRAIDカード131に実装されている点で第1実施形態と相違し、その他の点は第1実施形態と同様である。経路制御装置130及びRAIDカード131以外のストレージシステム1´の構成要素の構成及び機能は、同一符号が付されたストレージシステム1の構成要素の構成及び機能と同一であるため、ここでは詳細な説明を省略する。
The second embodiment is different from the first embodiment in that the storage system 1 ′ has a
RAIDカード131は、例えばホストコンピュータ10の拡張スロットに装着して使用される拡張カードであり、経路制御装置130が装着される拡張スロットとは異なる拡張スロットに装着して使用される。
The
RAID制御を実行するストレージシステム1´は、経路制御装置のサイズの大型化を抑制しつつ、可用性を高めることが可能である。 The storage system 1 ′ that executes RAID control can increase availability while suppressing an increase in the size of the path control device.
<第3実施形態>
図8は、他の実施形態に係る経路制御装置30´の概略構成を示すブロック図である。
<Third Embodiment>
FIG. 8 is a block diagram showing a schematic configuration of a
経路制御装置30´は、切換制御部35の代わりに切換制御回路35´を有する点が第1実施形態の経路制御装置30と相違し、その他の点は第1実施形態と同様である。切換制御回路35´以外の経路制御装置30´の構成要素の構成及び機能は、同一符号が付された経路制御装置30の構成要素の構成及び機能と同一であるため、ここでは詳細な説明を省略する。また、図8において、HDDにデータを格納する又はHDDからデータを読み出す際の通信経路となる各ケーブルと記憶装置20の記載は省略する。
The
経路制御装置30´の切換制御回路35´は、経路制御装置30のCPU353の代わりに各種処理を実行する。切換制御回路35´は、HDD状態取得回路356´、経路設定回路357´等を有する。
The switching
HDD状態取得回路356´は、HDD状態取得部356、及び、RAID制御部34に対するインタフェース351と同様の機能を有する。HDD状態取得回路356´は、RAID制御部34から記憶装置20の動作状態を示す情報を取得する。
The HDD
経路設定回路357´は、経路設定部357、及び、ホストコンピュータ10、第1切換部31、第2切換部32及び第3切換部33に対するインタフェース351と同様の機能を有する。経路設定回路357´は、ホストコンピュータ10から受信する切換要求信号及び記憶装置20の動作状態に応じて、第1切換部31、第2切換部32及び第3切換部33を制御し、ホストコンピュータ10と記憶装置20との間の通信経路を切り換える。
The
経路制御装置は、切換制御回路35´を使用する場合においても、装置サイズの大型化を抑制しつつ、可用性を高めることが可能である。 Even in the case of using the switching control circuit 35 ', the path control device can increase the availability while suppressing an increase in the size of the device.
1 ストレージシステム
10 ホストコンピュータ
20a 第1記憶装置
20b 第2記憶装置
30、130 経路制御装置
31 第1切換部
32 第2切換部
33 第3切換部
34 RAID制御部
35 切換制御部
37a 第1RAIDケーブル(第1経路)
37b 第2RAIDケーブル(第1経路)
38a 第1非RAIDケーブル(第2経路)
38b 第2非RAIDケーブル(第3経路)
DESCRIPTION OF SYMBOLS 1
37b Second RAID cable (first route)
38a First non-RAID cable (second route)
38b 2nd non-RAID cable (3rd route)
Claims (7)
前記RAID制御部を介さずに、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すための第2経路と、
前記第1経路と前記第2経路を切り換える第1切換部と、
前記RAID制御部に異常があった場合に、前記第2経路により、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すように前記第1切換部を制御する切換制御部と、
を有することを特徴とする経路制御装置。 A RAID (Redundant Arrays of Inexpensive Disks) control unit that receives data from a host computer and stores the data in a plurality of storage devices via a first path;
A second path for the host computer to store data in one storage device of the plurality of storage devices or to read data from one storage device of the plurality of storage devices without going through the RAID control unit; ,
A first switching unit that switches between the first path and the second path;
When there is an abnormality in the RAID control unit, the host computer stores data in one storage device of the plurality of storage devices or from one storage device of the plurality of storage devices by the second path. A switching control unit for controlling the first switching unit to read data;
A path control device comprising:
前記第2切換部は、前記第2経路と前記第3経路とを切り換え、
前記切換制御部は、前記1つの記憶装置への最終の書き込みが正常に完了していないと判定したとき、前記他の1つの記憶装置への最終の書き込みが正常に完了しているか否かを判定し、前記他の1つの記憶装置への最終の書き込みが正常に完了しているとき、前記第3経路を選択するように前記第2切換部を制御する、請求項3に記載の経路制御装置。 A third path for storing data from a host computer in another storage device of the plurality of storage devices without going through the RAID control unit;
The second switching unit switches between the second route and the third route,
When the switching control unit determines that the final writing to the one storage device is not normally completed, whether or not the final writing to the other one storage device is normally completed. 4. The path control according to claim 3, wherein the second switching unit is controlled to determine and select the third path when the final writing to the one other storage device is normally completed. apparatus.
前記RAID制御部に異常があった場合に、前記第2経路により、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すように前記第1切換部を制御する、
ことを含むことを特徴とする制御方法。 A RAID (Redundant Array of Inexpensive Disks) control unit that receives data from the host computer and stores the data in a plurality of storage devices via a first path, and the host computer does not pass through the RAID control unit, A second path for storing data in one of the storage devices or reading data from one of the plurality of storage devices, and a first switching unit for switching between the first path and the second path And a control method for a path control device comprising:
When there is an abnormality in the RAID control unit, the host computer stores data in one storage device of the plurality of storage devices or from one storage device of the plurality of storage devices by the second path. Controlling the first switching unit to read data;
A control method comprising:
前記RAID制御部に異常があった場合に、前記第2経路により、ホストコンピュータが複数の記憶装置の内の1つの記憶装置にデータを格納する又は複数の記憶装置の内の1つの記憶装置からデータを読み出すように前記第1切換部を制御する、
ことを前記経路制御装置に実行させることを特徴とする制御プログラム。 A RAID (Redundant Array of Inexpensive Disks) control unit that receives data from the host computer and stores the data in a plurality of storage devices via a first path, and the host computer does not pass through the RAID control unit, A second path for storing data in one of the storage devices or reading data from one of the plurality of storage devices, and a first switching unit for switching between the first path and the second path A control program for a path control device, comprising:
When there is an abnormality in the RAID control unit, the host computer stores data in one storage device of the plurality of storage devices or from one storage device of the plurality of storage devices by the second path. Controlling the first switching unit to read data;
A control program that causes the path control device to execute the above-described process.
複数の記憶装置と、
前記ホストコンピュータからのデータを受信し、第1経路を介して前記複数の記憶装置に格納するRAID(Redundant Arrays of Inexpensive Disks)制御部と、
経路制御装置と、を有し、
前記経路制御装置は、
前記RAID制御部を介さずに、前記ホストコンピュータが前記複数の記憶装置の内の1つの記憶装置にデータを格納する又は前記1つの記憶装置からデータを読み出すための第2経路と、
前記第1経路と前記第2経路を切り換える第1切換部と、
前記RAID制御部に異常があった場合に、前記第2経路により、前記ホストコンピュータが前記1つの記憶装置にデータを格納する又は前記1つの記憶装置からデータを読み出すように前記第1切換部を制御する切換制御部と、を有する、
ことを特徴とするストレージシステム。 A host computer;
A plurality of storage devices;
A RAID (Redundant Arrays of Inexpensive Disks) control unit that receives data from the host computer and stores the data in the plurality of storage devices via a first path;
A route control device,
The route control device
A second path for the host computer to store data in one of the plurality of storage devices or to read data from the one storage device without going through the RAID control unit;
A first switching unit that switches between the first path and the second path;
When there is an abnormality in the RAID control unit, the first switching unit is configured so that the host computer stores data in the one storage device or reads data from the one storage device by the second path. A switching control unit for controlling,
A storage system characterized by that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018033209A JP6942655B2 (en) | 2018-02-27 | 2018-02-27 | Route control device, control method, control program and storage system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018033209A JP6942655B2 (en) | 2018-02-27 | 2018-02-27 | Route control device, control method, control program and storage system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019148986A true JP2019148986A (en) | 2019-09-05 |
JP6942655B2 JP6942655B2 (en) | 2021-09-29 |
Family
ID=67850642
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018033209A Active JP6942655B2 (en) | 2018-02-27 | 2018-02-27 | Route control device, control method, control program and storage system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6942655B2 (en) |
-
2018
- 2018-02-27 JP JP2018033209A patent/JP6942655B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP6942655B2 (en) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8037362B2 (en) | Storage system that finds occurrence of power source failure | |
US7904744B2 (en) | Data storage using multiple protocols | |
US9983812B1 (en) | Automated node failure detection in an active/hot-standby storage cluster | |
US8443237B2 (en) | Storage apparatus and method for controlling the same using loopback diagnosis to detect failure | |
US10027532B2 (en) | Storage control apparatus and storage control method | |
KR100640037B1 (en) | File control system and file control device | |
US10846159B2 (en) | System and method for managing, resetting and diagnosing failures of a device management bus | |
US9838110B2 (en) | Dynamic link repair from lane failure with minimal link-down time while sparing fault channels | |
US20170139605A1 (en) | Control device and control method | |
JP2009205316A (en) | Disk array device, disk array control method and disk array controller | |
JP2007025933A (en) | Storage system and its firmware automatic updating method | |
US20110154165A1 (en) | Storage apparatus and data transfer method | |
JP6942655B2 (en) | Route control device, control method, control program and storage system | |
CN107818061B (en) | Data bus and management bus for associated peripheral devices | |
CN113342593B (en) | Method and apparatus for high availability management of full flash memory array servers | |
JP5511546B2 (en) | Fault tolerant computer system, switch device connected to multiple physical servers and storage device, and server synchronization control method | |
US9246848B2 (en) | Relay apparatus, storage system, and method of controlling relay apparatus | |
US10664429B2 (en) | Systems and methods for managing serial attached small computer system interface (SAS) traffic with storage monitoring | |
US10489334B2 (en) | Server system and method for detecting transmission mode of server system | |
EP2541390A2 (en) | Method and system of detecting redundant array of independent disks and transferring data | |
KR101469059B1 (en) | A system for improving the redundancy and a method for driving the same | |
KR101406455B1 (en) | Data transmission apparatus for computer and Method for changing data channel thereof | |
CN113282231B (en) | Memory device and related flash memory controller | |
JP6930153B2 (en) | Path switching device, path switching method and path switching program, and computer system | |
JP2011076528A (en) | Method and device for providing redundancy to raid card |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210330 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210608 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210802 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210817 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210908 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6942655 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |