JP2008234385A - Redundant system, server, information processor, control method, and program - Google Patents
Redundant system, server, information processor, control method, and program Download PDFInfo
- Publication number
- JP2008234385A JP2008234385A JP2007074022A JP2007074022A JP2008234385A JP 2008234385 A JP2008234385 A JP 2008234385A JP 2007074022 A JP2007074022 A JP 2007074022A JP 2007074022 A JP2007074022 A JP 2007074022A JP 2008234385 A JP2008234385 A JP 2008234385A
- Authority
- JP
- Japan
- Prior art keywords
- storage device
- failure
- server
- information processing
- hdd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、HDDに障害が発生した時の制御技術に関し、特に、HDDに障害が発生した時に、このHDDを有する装置の外部に設けられた装置が行う制御技術に関する。 The present invention relates to a control technique when a failure occurs in an HDD, and more particularly, to a control technique performed by a device provided outside the device having the HDD when a failure occurs in the HDD.
一般に、RAID(Redundant Arrays of Inexpensive Disk)装置はHDDの障害監視をRAID装置本体で行い、障害を検出した場合は障害HDDの切り離しや、予備HDDの組込み処理等を自動的に行う(例えば特許文献1)。 In general, a RAID (Redundant Array of Inexpensive Disk) device performs HDD failure monitoring on the RAID device main body, and when a failure is detected, it automatically detaches the failed HDD and automatically installs a spare HDD (for example, Patent Documents). 1).
しかしながら、例えば、対向サーバ側では一時的なHDDのI/Oアクセスエラーを検出していながら、RAID装置本体ではHDD障害を検出していない等、障害内容やRAID装置本体における各種動作のタイミングによってはRAID装置側で完全には障害を検出できない場合もあった。
本発明が解決しようとする課題は、上記問題点を改善することであり、RAID装置内のHDDに障害が発生し、対向サーバ側で一時的なHDDのI/Oアクセスエラーを検出できたが、RAID装置本体ではHDD障害を検出できなかった場合であっても、障害対応ができる技術を提供することである。 The problem to be solved by the present invention is to improve the above-mentioned problem. A failure occurred in the HDD in the RAID device, and a temporary HDD I / O access error could be detected on the opposite server side. Therefore, it is to provide a technique capable of handling a failure even when an HDD failure cannot be detected in the RAID apparatus main body.
上記課題を解決するための本発明は、冗長システムであって、記憶装置を有する情報処理装置と、前記情報処理装置の外部に設けられたサーバとを有し、前記サーバは、前記記憶装置における障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示する指示部を有し、前記情報処理装置は、前記指示に基づいて前記記憶装置を切り離す制御部を有することを特徴とする。 The present invention for solving the above problems is a redundant system, comprising an information processing device having a storage device, and a server provided outside the information processing device, wherein the server is in the storage device. When a failure is detected, the information processing apparatus includes an instruction unit that instructs to disconnect the storage device, and the information processing apparatus includes a control unit that disconnects the storage device based on the instruction. And
上記課題を解決するための本発明は、サーバであって、自装置に接続されている情報処理装置内の記憶装置における障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示することを特徴とする。 The present invention for solving the above problem is a server, and when a failure is detected in a storage device in an information processing device connected to the own device, the storage device is disconnected from the information processing device. It is characterized by instructing.
上記課題を解決するための本発明は、RAID装置であって、自装置内に設けられた記憶装置の障害を、外部に設けられた装置が検出した場合、その外部装置の指示に基づいて前記記憶装置を切り離すことを特徴とする。 The present invention for solving the above problem is a RAID device, and when an external device detects a failure of a storage device provided in the own device, the device is based on an instruction from the external device. The storage device is disconnected.
上記課題を解決するための本発明は、記憶装置を有する情報処理装置と前記情報処理装置の外部に設けられたサーバとを有する冗長システムの制御方法であって、前記記憶装置における障害を検出する検出ステップと、前記サーバが前記障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示する指示ステップと、前記指示に基づいて前記記憶装置を切り離す切り離しステップとを有することを特徴とする。 The present invention for solving the above problem is a control method of a redundant system having an information processing apparatus having a storage device and a server provided outside the information processing apparatus, and detects a failure in the storage device A detection step; an instruction step for instructing the information processing apparatus to disconnect the storage device when the server detects the failure; and a disconnection step of disconnecting the storage device based on the instruction. Features.
上記課題を解決するための本発明は、サーバのプログラムであって、前記プログラムは前記サーバに、自装置に接続されている情報処理装置内の記憶装置における障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示する処理を行わせることを特徴とする。 The present invention for solving the above-described problem is a server program, and when the program detects a failure in a storage device in an information processing apparatus connected to the server, the information processing apparatus And a process of instructing to disconnect the storage device.
上記課題を解決するための本発明は、RAID装置のプログラムであって、前記プログラムは前記RAID装置に、自装置内に設けられた記憶装置の障害を、外部に設けられた装置が検出した場合、その外部装置の指示に基づいて前記記憶装置を切り離す処理を行わせることを特徴とする。 The present invention for solving the above problems is a RAID device program, wherein the program detects a failure of a storage device provided in the RAID device by an external device. The storage device is disconnected based on an instruction from the external device.
本発明は、RAID装置の対向サーバから特定HDDの切り離し操作を行えるインタフェースをRAID装置側に設け、対向サーバ側で例えばI/Oアクセスエラー等の異常を検出した場合にサーバからの指示でHDDを切り離し、被疑箇所を取り除く構成となっている。この様なインタフェースをRAID側に実装することにより、一回のアクセスエラーで被疑HDDを切り離す処理や、複数回のエラー発生で被疑HDDを切り離す処理等、システムに要求される信頼性に応じた障害検出機能をサーバ側で柔軟に実現できる。 In the present invention, an interface is provided on the RAID device side so that a specific HDD can be disconnected from the opposite server of the RAID device. When an abnormality such as an I / O access error is detected on the opposite server side, the HDD is specified by an instruction from the server. It is configured to separate and remove the suspected part. By implementing such an interface on the RAID side, a failure according to the reliability required for the system, such as a process of disconnecting a suspected HDD with a single access error or a process of disconnecting a suspected HDD with multiple errors. The detection function can be flexibly realized on the server side.
本発明によると、本RAID装置では、対向サーバ側では異常を検出しているがRAID装置本体ではHDD障害を検出できないような異常が発生した場合に、サーバ側の指示により被疑HDDの切り離しができ、効果的な障害検出が可能となる。 According to the present invention, in the present RAID device, when an abnormality occurs on the opposite server side but an HDD failure cannot be detected on the main body of the RAID device, the suspected HDD can be disconnected by an instruction on the server side. Effective fault detection becomes possible.
また、本発明によると、RAID装置に接続しているサーバへの処理追加のみで、容易に障害検出機能を強化できる。 Further, according to the present invention, the failure detection function can be easily enhanced only by adding processing to the server connected to the RAID device.
本発明のRAID装置は、RAID装置に搭載されるHDDの障害検出処理、及び障害HDDの切り離し処理を、RAID装置に接続した対向サーバから実施可能なインタフェースを有する。 The RAID device of the present invention has an interface capable of executing a failure detection process for an HDD mounted on a RAID device and a disconnection process for the failed HDD from an opposing server connected to the RAID device.
この様なRAID装置を実現する事により、RAID装置で持っている以上の障害検出機能を、サーバ側への機能追加により実現する事ができ、要求されるシステムの信頼性に応じ、柔軟に障害検出機能を拡張することが可能となる。 By realizing such a RAID device, it is possible to realize more fault detection functions than those possessed by the RAID device by adding functions to the server side, and flexibly fail according to the required system reliability. The detection function can be expanded.
本発明の特徴を説明するために、以下において、図面を参照して具体的に述べる。 In order to explain the features of the present invention, it will be specifically described below with reference to the drawings.
本発明を実施するための第1の実施の形態について図面を参照して詳細に説明する。 A first embodiment for carrying out the present invention will be described in detail with reference to the drawings.
図1は、本発明の冗長システムの構成図である。 FIG. 1 is a configuration diagram of a redundant system according to the present invention.
本発明の冗長システムは、RAID装置1と対向サーバ7とを有する。
The redundant system of the present invention includes a RAID device 1 and a
RAID装置1は、HDD(Hard Disk Drive)2とコントローラ3とを有する。
The RAID device 1 includes an HDD (Hard Disk Drive) 2 and a
HDD2は、各種データを保持するものである。 The HDD 2 holds various data.
コントローラ3は、I/Oアクセス処理部4と、障害検出/切り離し処理部5と、対向サーバインタフェース部6とを有する。
The
I/Oアクセス処理部4は、対向サーバ7とHDD2との間でのデータのリード/ライト(読み出し/書き込み)アクセス処理を行う。
The I / O access processing unit 4 performs data read / write (read / write) access processing between the
障害検出/切り離し処理部5は、HDD2に関する障害を検出する。また、HDD2に何らかの障害が発生した時に、HDD2の切り離し処理を行う。
The failure detection / separation processing unit 5 detects a failure related to the
対向サーバインタフェース部6は、外部の対向サーバ7からHDD2の切り離し操作を可能にする為に、障害検出/切り離し処理部5との接続処理を行う。
The opposing server interface unit 6 performs a connection process with the failure detection / separation processing unit 5 in order to enable the
対向サーバ7は、RAID装置1の外部に設けられており、互いにネットワークを介して接続されている。そして、対向サーバ7は、HDD2に関する障害を検出した時に、HDD2の切り離し処理を行う制御部を有する。
The
続いて、本発明の動作について図を用いて説明する。尚、以下の説明では、データリード処理を行う場合を用いて説明するが、データライト処理であっても良い。また、対向サーバ7は、1回のアクセスエラーでHDD2を切り離す場合を用いて説明するが、複数回のエラー発生でHDD2を切り離すようにしても異。
Next, the operation of the present invention will be described with reference to the drawings. In the following description, the case of performing data read processing will be described, but data write processing may be used. Further, the
図2は、本発明の動作を説明するためのタイムチャートである。 FIG. 2 is a time chart for explaining the operation of the present invention.
対向サーバ7は、HDD2に対してデータリード処理を行う。
The
I/Oアクセス処理部4は、対向サーバ7のHDD2に対してのデータリード処理を受け付ける。
The I / O access processing unit 4 receives a data read process for the
I/Oアクセス処理部4は、HDD2にアクセスする。このとき、何らかの障害が発生してI/Oアクセス処理部4がHDD2にアクセスできなかった場合、対向サーバ7に対して障害が発生したことを通知する。
The I / O access processing unit 4 accesses the
対向サーバ7は、対向サーバインタフェース部6に対して、HDD切り離し要求を送信する。
The
対向サーバインタフェース部6は、対向サーバ7からのHDD切り離し要求を受けて、障害検出/切り離し処理部5にHDD2を切り離す処理を行うよう通知する。
The opposing server interface unit 6 receives the HDD disconnection request from the
障害検出/切り離し処理部5は、既に障害を検出してHDDの切り離し処理が終了している場合には、対向サーバインタフェース部6からの通知を破棄し、障害を検出していない場合には、対向サーバインタフェース部6からの通知に基づいて、HDD2を切り離す処理を行う。
The failure detection / separation processing unit 5 discards the notification from the opposing server interface unit 6 when the failure has already been detected and the HDD disconnection processing has ended, and when the failure has not been detected, Based on the notification from the opposite server interface unit 6, the
一方、I/Oアクセス処理部4は、対向サーバ7のHDD2に対するデータリード処理を受け付けてHDD2にアクセスしたとき、障害が発生することなく通常通りにデータを読み出すことができた場合、対向サーバ7はI/Oアクセス処理部4が読み出したデータを受信して、通常の動作を行う。
On the other hand, when the I / O access processing unit 4 receives data read processing for the
上述したとおり、本発明の特徴は、コントローラ3に対向サーバインタフェース部6を設け、障害検出/切り離し処理部5の判断のみでなく、外部の対向サーバ7側の判断で、指定するHDD2の切り離し操作が可能となる点である。
As described above, the feature of the present invention is that the opposite server interface unit 6 is provided in the
尚、上記説明では、データリード/データアクセスの動作において発生した障害をサーバ7が検出した場合を用いて説明したが、対向サーバ7が検出できる障害であれば他の動作時に発生した障害を検出した場合であっても良い。
In the above description, the case where the
尚、上述した本発明のRAID装置及び対向サーバは、上記説明からも明らかなように、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。 The RAID device and the opposite server of the present invention described above can be configured by hardware as is apparent from the above description, but can also be realized by a computer program.
この場合、プログラムメモリに格納されているプログラムで動作するプロセッサによって、上述した実施の形態と同様の機能、動作を実現させる。尚、上述した実施の形態の一部の機能のみをコンピュータプログラムにより実現することも可能である。 In this case, functions and operations similar to those of the above-described embodiment are realized by a processor that operates according to a program stored in the program memory. Note that only a part of the functions of the above-described embodiment can be realized by a computer program.
1 RAID装置
2 HDD(Hard Disk Drive)
3 コントローラ
4 I/Oアクセス処理部
5 障害検出/切り離し処理部
6 対向サーバインタフェース部
7 対向サーバ7
1
3 Controller 4 I / O access processing unit 5 Fault detection / separation processing unit 6 Counter
Claims (10)
記憶装置を有する情報処理装置と、
前記情報処理装置の外部に設けられたサーバと
を有し、
前記サーバは、前記記憶装置における障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示する指示部を有し、
前記情報処理装置は、前記指示に基づいて前記記憶装置を切り離す制御部
を有することを特徴とする冗長システム。 A redundant system,
An information processing apparatus having a storage device;
A server provided outside the information processing apparatus,
The server includes an instruction unit that instructs the information processing device to disconnect the storage device when a failure is detected in the storage device.
The redundant system according to claim 1, wherein the information processing apparatus includes a control unit that disconnects the storage device based on the instruction.
自装置に接続されている情報処理装置内の記憶装置における障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示することを特徴とするサーバ。 A server,
A server characterized by instructing the information processing device to disconnect the storage device when a failure is detected in the storage device in the information processing device connected to the own device.
自装置内に設けられた記憶装置の障害を、外部に設けられた装置が検出した場合、その外部装置の指示に基づいて前記記憶装置を切り離すことを特徴とするRAID装置。 A RAID device,
A RAID device characterized in that, when a device provided outside detects a failure of a storage device provided in the device itself, the storage device is disconnected based on an instruction from the external device.
前記記憶装置における障害を検出する検出ステップと、
前記サーバが前記障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示する指示ステップと、
前記指示に基づいて前記記憶装置を切り離す切り離しステップと
を有することを特徴とする制御方法。 A redundant system control method comprising an information processing apparatus having a storage device and a server provided outside the information processing apparatus,
A detection step of detecting a failure in the storage device;
An instruction step for instructing the information processing device to disconnect the storage device when the server detects the failure;
And a disconnecting step of disconnecting the storage device based on the instruction.
自装置に接続されている情報処理装置内の記憶装置における障害を検出した場合、前記情報処理装置に対して前記記憶装置を切り離すよう指示する処理を行わせることを特徴とするプログラム。 A server program, the program on the server,
A program that, when detecting a failure in a storage device in an information processing device connected to the own device, causes the information processing device to instruct to disconnect the storage device.
自装置内に設けられた記憶装置の障害を、外部に設けられた装置が検出した場合、その外部装置の指示に基づいて前記記憶装置を切り離す処理を行わせることを特徴とするプログラム。 A RAID device program, the program being stored in the RAID device,
A program that, when a device provided externally detects a failure of a storage device provided in its own device, causes the storage device to be disconnected based on an instruction from the external device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007074022A JP2008234385A (en) | 2007-03-22 | 2007-03-22 | Redundant system, server, information processor, control method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007074022A JP2008234385A (en) | 2007-03-22 | 2007-03-22 | Redundant system, server, information processor, control method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008234385A true JP2008234385A (en) | 2008-10-02 |
Family
ID=39907075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007074022A Pending JP2008234385A (en) | 2007-03-22 | 2007-03-22 | Redundant system, server, information processor, control method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008234385A (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05290494A (en) * | 1992-04-03 | 1993-11-05 | Nec Eng Ltd | Disk array device |
JPH06187250A (en) * | 1992-12-16 | 1994-07-08 | Nec Eng Ltd | Disk array device |
JP2001256000A (en) * | 2000-03-09 | 2001-09-21 | Nec Eng Ltd | Disk array device and degeneration control method used for the same |
-
2007
- 2007-03-22 JP JP2007074022A patent/JP2008234385A/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05290494A (en) * | 1992-04-03 | 1993-11-05 | Nec Eng Ltd | Disk array device |
JPH06187250A (en) * | 1992-12-16 | 1994-07-08 | Nec Eng Ltd | Disk array device |
JP2001256000A (en) * | 2000-03-09 | 2001-09-21 | Nec Eng Ltd | Disk array device and degeneration control method used for the same |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4523639B2 (en) | Memory error address management by firmware | |
US20070028041A1 (en) | Extended failure analysis in RAID environments | |
JP4387968B2 (en) | Fault detection apparatus and fault detection method | |
JP2011170589A (en) | Storage control device, storage device, and storage control method | |
JP2006031332A (en) | Disk array control program, method and device | |
JP4500346B2 (en) | Storage system | |
JP4640071B2 (en) | Information processing apparatus, information processing restoration method, and information processing restoration program | |
JP2009245391A (en) | Information processor, error processing method, and program | |
JP2011076344A (en) | Information processing apparatus, method of controlling information processing apparatus and control program | |
US10095867B2 (en) | Antivirus scan during a data scrub operation | |
JP2010536112A (en) | Data storage method, apparatus and system for recovery of interrupted writes | |
JP2008234385A (en) | Redundant system, server, information processor, control method, and program | |
JP2007233915A (en) | Disk array controller, error monitoring method and program | |
JP2008250671A (en) | Information processor and information processing method | |
JP2006318105A (en) | Monitoring system | |
JP2008146365A (en) | Failure avoidance method for storage system | |
JP2009054116A (en) | Memory system and information processor | |
JP2010214932A (en) | Printer controller and printer provided with the same | |
JP2008250777A (en) | Medium checking load reducing device in array system, its method, and program therefor | |
US9323472B2 (en) | Storage controlling device and controlling method | |
JP2007164451A (en) | Input/output control method, input/output control program and magnetic disk device | |
JP2004133744A (en) | Disk array controller | |
JP2008310846A (en) | Precheck device, method and program for hard disk drive failure of general-purpose server | |
JP2008052382A (en) | Method for detecting failure of secondary storage device | |
JP2005275479A (en) | Disk array control system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111214 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120222 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120627 |