JP2018116472A - Disk management system, disk management method, and disk management program - Google Patents

Disk management system, disk management method, and disk management program Download PDF

Info

Publication number
JP2018116472A
JP2018116472A JP2017006786A JP2017006786A JP2018116472A JP 2018116472 A JP2018116472 A JP 2018116472A JP 2017006786 A JP2017006786 A JP 2017006786A JP 2017006786 A JP2017006786 A JP 2017006786A JP 2018116472 A JP2018116472 A JP 2018116472A
Authority
JP
Japan
Prior art keywords
physical block
block
disk
address
medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017006786A
Other languages
Japanese (ja)
Other versions
JP6805838B2 (en
Inventor
嘉造 西田
Kazo Nishida
嘉造 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2017006786A priority Critical patent/JP6805838B2/en
Publication of JP2018116472A publication Critical patent/JP2018116472A/en
Application granted granted Critical
Publication of JP6805838B2 publication Critical patent/JP6805838B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To perform efficient media error checking.SOLUTION: A disk management system including: an OS that secures a logical block to which an unclosed physical block of a disk device is allocated and uses it as a data writing area; driving means for converting an input address of a physical block into an address of a logical block to which the physical block is allocated, and acquiring use state information indicating whether the logical block of the converted address is in use from the OS and outputting the use state information; and medium inspection means for executing sequential test lead for physical blocks of the disk device and, if a failure is detected, acquiring the use state information from the driving means, and determining whether the logical block to which the failed physical block is allocated is in use, and a) if it is not in use, closing the physical block and proceeding to the test lead of the next physical block, and b) if it is in use, outputting a failure report.SELECTED DRAWING: Figure 1

Description

本発明は、ディスク管理システム、ディスク管理方法、および、ディスク管理プログラム、特に、メディアエラーチェックを行うディスク管理システム等に関する。   The present invention relates to a disk management system, a disk management method, and a disk management program, and more particularly to a disk management system that performs a media error check.

ディスクアレイ装置は、データ保全を目的として、RAID(Redundant Arrays of Inexpensive Disks)構成によりディスクを冗長化させる。しかしながら、冗長化されたディスクの同一アドレスでメディアエラーとなった場合、データは消失する。   The disk array device makes disks redundant by a RAID (Redundant Arrays of Inexpensive Disks) configuration for the purpose of data integrity. However, if a media error occurs at the same address of the redundant disk, the data is lost.

その場合でも、データが消失した箇所が、ユーザにとって重要なデータを格納していた領域であったのか、全くの未使用領域であったかの切り分けが可能であり、未使用だったのであればデータ消失に対する対応も可能である。(後述する特許文献1参照)。   Even in such a case, it is possible to determine whether the location where the data was lost was an area where data important to the user was stored or an entirely unused area. Is also possible. (See Patent Document 1 described later).

しかしながら、ディスクアレイコントローラのファームウェア等が実施するメディアエラーチェックによってデータ消失が検出された場合、使用状況の確認は困難である。チェック時の入出力が、OSOperating System)を経由しない為である。   However, when data loss is detected by a media error check performed by the firmware of the disk array controller or the like, it is difficult to confirm the usage status. This is because the input / output during the check does not go through the OS Operating System).

特許文献1は、この問題に対応するディスクアレイコントローラを開示する。この、ディスクアレイコントローラは、データ読み出しに失敗したストライプが未使用であれば、冗長ディスク装置のデータによるデータ復旧は行わず、代替セクター割当と代替セクターへの固定データ書き込みで復旧を完了させる。これを行う為、このディスクアレイコントローラは、媒体検査を行う前に、その時点のファイルシステムによる論理ブロックの使用状況についての情報を、ホスト計算機から取得している。   Patent Document 1 discloses a disk array controller corresponding to this problem. The disk array controller completes the recovery by allocating the alternative sector and writing the fixed data to the alternative sector without performing the data recovery by the data of the redundant disk device if the stripe in which the data reading has failed is unused. In order to do this, this disk array controller obtains information about the usage status of the logical block by the file system at that time from the host computer before performing the medium inspection.

特開2003―303057号公報JP 2003-303057 A

特許文献1のディスクアレイコントローラは、メディアエラーチェックに先立ち、その時点のファイルシステムにおけるストライプの使用状況についての情報を、ホスト計算機から取得する。そのためチェックの実行効率が悪い。メディアエラーチェックを行うたびに多量な情報の授受オーバヘッドが発生するとともに、メディアエラーチェック中は、ファイルの生成、消滅、拡張のストライプの使用状況変更が出来ないからである。   Prior to the media error check, the disk array controller of Patent Document 1 acquires information about the stripe usage status in the file system at that time from the host computer. Therefore, the execution efficiency of the check is bad. This is because a large amount of information transmission / reception overhead occurs each time the media error check is performed, and during the media error check, it is not possible to change the usage status of the file generation, disappearance, and expansion stripes.

なお、この課題は、RAIDを構成するディスク装置に限られない。単体のディスク装置のメディアエラーチェックについても、同様の課題は存在する。   This problem is not limited to the disk device constituting the RAID. A similar problem exists in the media error check of a single disk device.

本発明は、上記課題を解決し、効率の良いメディアエラーチェックを提供することを目的とする。   An object of the present invention is to solve the above problems and provide an efficient media error check.

本発明の1実施の形態のディスク管理システムは、ディスク装置の閉塞されていない物理ブロックが割り当てられている論理ブロックを、確保してデータ書き込み領域として使用するOSと、前記物理ブロックのアドレスを入力されて、当該物理ブロックが割り当てられている前記論理ブロックのアドレスに変換し、変換されたアドレスの前記論理ブロックが、使用中であるか否かを示す使用状況情報を、前記OSから取得して出力する駆動手段と、前記ディスク装置の前記物理ブロックに対して順次テストリードを実行し、媒体障害を検出すると、前記駆動手段から前記使用状況情報を取得して、前記媒体障害のあった前記物理ブロックが割り当てられている前記論理ブロックが使用中であるか判定し、a)未使用であれば当該物理ブロックを閉塞して次の前記物理ブロックの前記テストリードに進み、b)使用中であれば、障害報告を出力する媒体検査手段と、を包含する
本発明の1実施の形態のディスク管理方法は、閉塞されていない物理ブロックが割り当てられている論理ブロックが、データ書き込み領域として使用されている前記ディスク装置の、前記物理ブロックに対して順次テストリードを実行し、媒体障害を検出すると、検出された前記物理ブロックのアドレスを、当該物理ブロックが割り当てられている前記論理ブロックのアドレスに変換し、変換されたアドレスの前記論理ブロックが、使用中であるか否かを示す使用状況情報を取得して、当該論理ブロックが使用中であるか判定し、a)未使用であれば当該物理ブロックを閉塞して次の前記物理ブロックの前記テストリードに進み、b)使用中であれば、障害報告を出力する。
The disk management system according to one embodiment of the present invention inputs an OS that secures and uses a logical block to which a non-blocked physical block of a disk device is allocated as a data writing area, and the address of the physical block Then, the address is converted into the address of the logical block to which the physical block is allocated, and usage status information indicating whether or not the logical block at the converted address is in use is acquired from the OS. When a test read is sequentially executed on the drive means for outputting and the physical block of the disk device and a medium failure is detected, the usage status information is obtained from the drive means, and the physical that has the medium failure It is determined whether the logical block to which the block is allocated is in use. A) If it is unused, the physical block The disk management method according to an embodiment of the present invention includes: a medium inspection unit that outputs a failure report if in use, and proceeds to the test read of the next physical block. Detected when a logical block to which an unoccluded physical block is allocated performs a test read on the physical block of the disk device used as a data write area sequentially and detects a media failure. The address of the physical block is converted into the address of the logical block to which the physical block is allocated, and usage status information indicating whether or not the logical block at the converted address is in use is acquired. Determine whether the logical block is in use; a) block the physical block if it is not used before the next physical block Proceed to test lead, b) if it is in use, and outputs a fault report.

本発明の1実施の形態のディスク管理プログラムは、ディスク装置の閉塞されていない物理ブロックが割り当てられている論理ブロックを、確保してデータ書き込み領域として使用するOS処理と、前記物理ブロックのアドレスを入力されて、当該物理ブロックが割り当てられている前記論理ブロックのアドレスに変換し、変換されたアドレスの前記論理ブロックが、使用中であるか否かを示す使用状況情報を、前記OSから取得して出力する駆動処理と、前記ディスク装置の前記物理ブロックに対して順次テストリードを実行し、媒体障害を検出すると、前記駆動手段から前記使用状況情報を取得して、前記媒体障害のあった前記物理ブロックが割り当てられている前記論理ブロックが使用中であるか判定し、a)未使用であれば当該物理ブロックを閉塞して次の前記物理ブロックの前記テストリードに進み、b)使用中であれば、障害報告を出力する媒体検査処理と、をコンピュータに実行させる。   The disk management program according to an embodiment of the present invention secures a logical block to which a physical block that is not blocked of a disk device is allocated and uses it as a data write area, and an address of the physical block. The input is converted into the address of the logical block to which the physical block is allocated, and usage status information indicating whether or not the logical block at the converted address is in use is acquired from the OS. When the medium processing is detected by sequentially performing a test read on the physical block of the disk device and detecting a medium failure, the usage status information is obtained from the driving means, and the medium failure is detected. It is determined whether the logical block to which the physical block is allocated is in use. A) If not used, the physical block To close the lock advances to the test leads of the next of said physical block, b) if in use, to perform a medium testing process of outputting failure report, to the computer.

本発明にかかるディスク管理システムは、効率の良いメディアエラーチェックを実施することが出来る。   The disk management system according to the present invention can perform an efficient media error check.

図1は、第1の実施の形態にかかるディスク管理システム40の構成を示す図である。FIG. 1 is a diagram showing a configuration of a disk management system 40 according to the first embodiment. 図2は、コンピュータ装置60の構成図である。FIG. 2 is a configuration diagram of the computer device 60. 図3は、ディスク管理システム40が実行する媒体検査処理のフローチャートである。FIG. 3 is a flowchart of medium inspection processing executed by the disk management system 40. 図4は、第1の実施の形態にかかるディスク管理システム40の構成を示す図である。FIG. 4 is a diagram illustrating a configuration of the disk management system 40 according to the first embodiment.

<第1の実施の形態>
<構成>
図1は、第1の実施の形態にかかるディスク管理システム40の構成を示す図である。ディスク管理システム40は、ディスク管理装置20、ディスク管理装置20に接続されたディスク制御装置10、および、ディスク制御装置10に接続されたディスク装置30を包含する。
<First Embodiment>
<Configuration>
FIG. 1 is a diagram showing a configuration of a disk management system 40 according to the first embodiment. The disk management system 40 includes a disk management device 20, a disk control device 10 connected to the disk management device 20, and a disk device 30 connected to the disk control device 10.

ディスク管理装置20は、ホストサーバ等と呼ばれることも有り、OS21、および、駆動部22を備える。OS21は、一般的なオペレーティングシステムの機能を備える。OS21は、特に、ディスク装置30の未使用中の論理ブロックを確保して、データ格納域として使用するモジュール、例えば、ファイルシステム、データベースシステム、を包含する。駆動部22は、ファイルシステム等から起動されて、ディスク装置30に対する入出力を実行する。   The disk management device 20 is sometimes called a host server or the like, and includes an OS 21 and a drive unit 22. The OS 21 has a general operating system function. In particular, the OS 21 includes modules that secure unused logical blocks of the disk device 30 and use them as data storage areas, such as a file system and a database system. The drive unit 22 is started from a file system or the like and executes input / output with respect to the disk device 30.

ディスク制御装置10は、ディスクコントローラ等と呼ばれることも有り、媒体検査部11、管理テーブル12、および、入出力部13を備える。入出力部13は、駆動部22から起動されて、ファイルシステム等のための入出力を実行する。媒体検査部11、および、管理テーブル12については、後述する。   The disk control device 10 is sometimes called a disk controller or the like, and includes a medium inspection unit 11, a management table 12, and an input / output unit 13. The input / output unit 13 is activated from the drive unit 22 and executes input / output for a file system or the like. The medium inspection unit 11 and the management table 12 will be described later.

ディスク装置30は、例えば、磁気ディスク装置である。ディスク装置30は、複数台存在するときは、RAIDを構成していても良い。ディスク装置30の記憶領域は、複数の、例えば521バイトの物理ブロックに分割されている。OS21の管理単位である論理ブロックには、連続したアドレスの複数の物理ブロックが割り当てられている。論理ブロックは、例えば8キロバイトである。論理ブロックのサイズは、OS21が決定する。   The disk device 30 is, for example, a magnetic disk device. When a plurality of disk devices 30 are present, a RAID may be configured. The storage area of the disk device 30 is divided into a plurality of physical blocks of, for example, 521 bytes. A plurality of physical blocks having consecutive addresses are allocated to the logical block which is a management unit of the OS 21. The logical block is, for example, 8 kilobytes. The OS 21 determines the size of the logical block.

OS21は論理ブロック単位で処理を行い、媒体検査部11や入出力部13は物理ブロック単位で処理を行う。駆動部22は、論理ブロックと物理ブロックのアドレスの変換を行う。   The OS 21 performs processing in units of logical blocks, and the medium inspection unit 11 and the input / output unit 13 perform processing in units of physical blocks. The drive unit 22 converts the addresses of the logical block and the physical block.

ディスク制御装置10の媒体検査部11は、ディスク装置30の媒体不良、メディアエラーとも呼ばれる、の検査を行う。媒体検査部11は、ディスク装置30の物理ブロックを、例えばアドレス順に、順次テストリードしてメディアエラーの検査を行う。媒体検査部11は、或る物理ブロックのメディアエラーを検出すると、以下の処置を行う。
・障害のある物理ブロックが使用中であれば、冗長構成を成す他のディスク装置30のデータで復旧を試み、復旧に失敗すれば、例えばOS21に報告する。
・障害のある物理ブロックが未使用であれば、当該物理ブロックの閉塞を管理テーブル12に記録する。閉塞された物理ブロックは、OS21に使用される論理ブロックに割当てられない。
The medium inspection unit 11 of the disk control device 10 inspects the medium of the disk device 30 and is also called a medium error. The medium inspection unit 11 inspects a media error by sequentially test-reading the physical blocks of the disk device 30 in, for example, the order of addresses. When the medium inspection unit 11 detects a media error of a certain physical block, the medium inspection unit 11 performs the following processing.
If a failed physical block is in use, recovery is attempted with the data of another disk device 30 having a redundant configuration, and if the recovery fails, a report is made to the OS 21, for example.
If the faulty physical block is unused, the block of the physical block is recorded in the management table 12. The blocked physical block is not assigned to a logical block used for the OS 21.

ここで、ディスク制御装置10の媒体検査部11、および、入出力部13は、論理回路で構成される。   Here, the medium inspection unit 11 and the input / output unit 13 of the disk control device 10 are configured by logic circuits.

ディスク制御装置10は、コンピュータ装置60により実現されても良い。図2は、コンピュータ装置60の構成図である。コンピュータ装置60は、バス64で相互に接続された、プロセッサ61、主記憶部63、および、外部記憶装置62を備える。プロセッサ61は、バス64を経由して、主記憶部63、および、外部記憶装置62に対してデータの読み書きを行う。また、プロセッサ61は、主記憶部63に格納されているプログラム65を実行する。なお、プログラム65は、当初外部記憶装置62に格納されており、コンピュータ装置60の初期設定時に、プロセッサ61が外部記憶装置62から主記憶部63にロードしても良い。   The disk control device 10 may be realized by the computer device 60. FIG. 2 is a configuration diagram of the computer device 60. The computer device 60 includes a processor 61, a main storage unit 63, and an external storage device 62 that are connected to each other via a bus 64. The processor 61 reads and writes data from and to the main storage unit 63 and the external storage device 62 via the bus 64. Further, the processor 61 executes a program 65 stored in the main storage unit 63. Note that the program 65 is initially stored in the external storage device 62, and the processor 61 may load the main storage unit 63 from the external storage device 62 when the computer device 60 is initially set.

ここで、主記憶部63は半導体メモリ装置である。外部記憶装置62はHDD(Hard Disk Drive)、または、半導体記憶装置等の記憶装置である。   Here, the main storage unit 63 is a semiconductor memory device. The external storage device 62 is an HDD (Hard Disk Drive) or a storage device such as a semiconductor storage device.

ディスク制御装置10のプロセッサ61は、プログラム65を実行することにより、媒体検査部11、および、入出力部13として機能する。すなわち、プロセッサ61は、プログラム65を実行することにより、媒体検査部11、および、入出力部13が行う処理を実行する。   The processor 61 of the disk control device 10 functions as the medium inspection unit 11 and the input / output unit 13 by executing the program 65. That is, the processor 61 executes the process performed by the medium inspection unit 11 and the input / output unit 13 by executing the program 65.

外部記憶装置62は、OS21から取得した論理ブロックの使用状況情報の記憶域として使用されても良い。   The external storage device 62 may be used as a storage area for logical block usage status information acquired from the OS 21.

なお、図6のプログラム65は、図示されないROM(Read Only Memory)に記憶されたファームウェアであっても良い。すなわち、媒体検査部11、および、入出力部13は、ファームウェアによって、実現されても良い。   Note that the program 65 in FIG. 6 may be firmware stored in a ROM (Read Only Memory) (not shown). That is, the medium inspection unit 11 and the input / output unit 13 may be realized by firmware.

ディスク管理装置20は、コンピュータ装置60により実現されている。ディスク管理装置20のプロセッサ61は、プログラム65を実行することにより、OS21、および、駆動部22として機能する。   The disk management device 20 is realized by a computer device 60. The processor 61 of the disk management device 20 functions as the OS 21 and the drive unit 22 by executing the program 65.

<動作>
図3は、ディスク管理システム40が実行する媒体検査処理のフローチャートである。
<Operation>
FIG. 3 is a flowchart of medium inspection processing executed by the disk management system 40.

まず、ディスク制御装置10において、例えば定期的に、あるいは、コマンドにより、媒体検査部11が起動される。媒体検査部11は、検査対象のディスク装置30、例えば、図1のディスク装置30(1)を選択する。   First, in the disk control device 10, the medium inspection unit 11 is activated, for example, periodically or by a command. The medium inspection unit 11 selects the disk device 30 to be inspected, for example, the disk device 30 (1) in FIG.

起動された媒体検査部11は、選択したディスク装置30(1)の先頭の物理ブロックのブロックを選択し、テスト用のリードを発行する(S1)。正常であれば(S2でY)、媒体検査部11は、順次(S8でN)、次の物理ブロックにテストリードを発行し、ディスク装置30(1)の全ての物理ブロックのテストが終了するまで(S8でY)、これを繰り返す。この後、媒体検査部11は、次の検査対象のディスク装置30、例えば、図1のディスク装置30(2)を選択し、同様の検査を行う。   The activated medium inspection unit 11 selects the first physical block of the selected disk device 30 (1) and issues a test read (S1). If it is normal (Y in S2), the medium inspection unit 11 sequentially issues a test read to the next physical block (N in S8), and the test of all physical blocks in the disk device 30 (1) is completed. This is repeated until (S8: Y). Thereafter, the medium inspection unit 11 selects the next disk device 30 to be inspected, for example, the disk device 30 (2) in FIG. 1, and performs the same inspection.

検査対象ディスク装置30の或る物理ブロックのテストリード(S1)でメディアエラーが検出されると(S2でN)、媒体検査部11は、他のディスク装置30内の同一アドレスの物理ブロックにテストリードを発行する(S3)。ここで、他のディスク装置30は、検査対象ディスク装置30、例えばディスク装置30(1)の冗長データを格納しているディスク装置30、例えばディスク装置30(2)を指す。   When a media error is detected in a test read (S1) of a certain physical block of the disk device 30 to be inspected (N in S2), the medium inspection unit 11 tests a physical block of the same address in another disk device 30. A lead is issued (S3). Here, the other disk device 30 refers to a disk device 30 that stores redundant data of the disk device 30 to be inspected, for example, the disk device 30 (1), for example, the disk device 30 (2).

冗長データを格納するディスク装置30へのテストリード(S3)が正常に終われば(S4でY)、媒体検査部11は、メディアエラーが検出された物理ブロックのデータを冗長データで修復し(S9)、検査を継続する。   If the test read (S3) to the disk device 30 storing the redundant data ends normally (Y in S4), the medium inspection unit 11 repairs the data of the physical block in which the media error is detected with the redundant data (S9). ) Continue the inspection.

冗長ディスク装置30へのテストリード(S3)も異常に終われば(S4でN)、媒体検査部11は、駆動部22を経由して、OS21からメディアエラーが検出された物理ブロックが割り当てられている論理ブロックが使用されているか否かを示す使用状況情報を取得する(S5)。本ステップの処理には、代替可能な幾つかのやり方がある。   If the test read (S3) to the redundant disk device 30 also ends abnormally (N in S4), the medium inspection unit 11 is assigned the physical block in which the media error is detected from the OS 21 via the drive unit 22. Usage status information indicating whether or not a logical block is used is acquired (S5). There are several alternative ways of processing in this step.

第1のやり方は、以下の通りである。先ず、媒体検査部11は、駆動部22にメディアエラーが検出されたことと、メディアエラーが検出された物理ブロックのアドレスを通知する。   The first method is as follows. First, the medium inspection unit 11 notifies the drive unit 22 that a media error has been detected and the address of the physical block in which the media error has been detected.

通知を受けた駆動部22は、OS21から、全論理ブロックの使用状況がわかるテーブル情報、および、論理ブロックサイズ等アドレス変換に必要な情報を取得する。次いで、駆動部22は、メディアエラーが検出された物理ブロックのアドレスを、当該物理ブロックが割り当てられている論理ブロックのアドレスに変換する。この変換は、論理ブロックと物理ブロックのサイズ比に基づいて行われる。最後に、駆動部22は、論理ブロックのアドレスとOS21から得たテーブル情報を媒体検査部11に通知する。   Upon receiving the notification, the drive unit 22 acquires, from the OS 21, table information indicating the usage status of all logical blocks, and information necessary for address conversion such as the logical block size. Next, the drive unit 22 converts the address of the physical block in which the media error is detected into the address of the logical block to which the physical block is assigned. This conversion is performed based on the size ratio between the logical block and the physical block. Finally, the drive unit 22 notifies the medium inspection unit 11 of the logical block address and the table information obtained from the OS 21.

なお、OS21は、論理アドレスの使用状況がわかるテーブル情報を出力した後、後述する解除通知まで、論理ブロックの使用状況を変更する処理は行わない。この処理は、例えば、ファイルの生成、拡張、消去である。   Note that the OS 21 does not perform the process of changing the usage status of the logical block until the release notification described later after outputting the table information indicating the usage status of the logical address. This process is, for example, file generation, expansion, or deletion.

なお、駆動部22は、論理ブロックのアドレスとOS21から得たテーブル情報を媒体検査部11に通知する代わりに、OS21から得たテーブル情報を論理ブロックのアドレスで検索して、論理ブロックが使用されているか否かだけを、媒体検査部11に通知しても良い。   Instead of notifying the medium checking unit 11 of the logical block address and the table information obtained from the OS 21, the driving unit 22 searches the table information obtained from the OS 21 using the logical block address and uses the logical block. It is also possible to notify the medium inspection unit 11 only of whether or not it is present.

第2のやり方は、以下の通りである。先ず、媒体検査部11は、駆動部22にメディアエラーが検出されたことと、メディアエラーが検出された物理ブロックのアドレスを通知する。   The second way is as follows. First, the medium inspection unit 11 notifies the drive unit 22 that a media error has been detected and the address of the physical block in which the media error has been detected.

通知を受けた駆動部22は、OS21から、論理ブロックサイズ等アドレス変換に必要な情報を取得する。この情報は、前もって、例えばディスク制御装置10の初期設定時に、駆動部22がOS21から取得して記憶しておいても良い。次いで、駆動部22は、メディアエラーが検出された物理ブロックのアドレスを、当該物理ブロックが割り当てられている論理ブロックのアドレスに変換する。その後、駆動部22は、論理ブロックのアドレスを付加して、論理ブロックの使用状況がわかる情報要求をOS21に出力する。当該要求を受けたOS21は、指定されたアドレスの論理ブロックの使用状況がわかる分だけのテーブル情報を駆動部22に出力する。最後に、駆動部22は、OS21から得たテーブル情報を媒体検査部11に通知する。   Upon receiving the notification, the drive unit 22 acquires information necessary for address conversion, such as a logical block size, from the OS 21. This information may be acquired in advance by the drive unit 22 from the OS 21 and stored in advance, for example, when the disk controller 10 is initially set. Next, the drive unit 22 converts the address of the physical block in which the media error is detected into the address of the logical block to which the physical block is assigned. Thereafter, the drive unit 22 adds an address of the logical block and outputs an information request indicating the usage status of the logical block to the OS 21. The OS 21 that has received the request outputs table information to the drive unit 22 as much as the usage status of the logical block at the specified address can be known. Finally, the drive unit 22 notifies the medium inspection unit 11 of the table information obtained from the OS 21.

第3のやり方は、以下の通りである。第3のやり方は、第2のやり方に類似している。但し、論理ブロックのアドレスが付加された、論理ブロックの使用状況がわかる情報要求を受けたOS21は、指定されたアドレスの論理ブロックの使用状況がわかる分だけのテーブル情報を駆動部22に出力しない。代わりに、OS21は、指定されたアドレスの論理ブロックが使用中であるか否かを判定し、判定結果を示すフラグ情報を出力する。最後に、駆動部22は、OS21から得たフラグ情報を媒体検査部11に通知する。   The third way is as follows. The third way is similar to the second way. However, the OS 21 having received the information request indicating the use status of the logical block to which the logical block address is added does not output to the drive unit 22 the table information as much as the use status of the specified logical block. . Instead, the OS 21 determines whether or not the logical block at the designated address is in use, and outputs flag information indicating the determination result. Finally, the drive unit 22 notifies the medium inspection unit 11 of flag information obtained from the OS 21.

OS21から得た使用状況情報に基づく判断で(S6)、メディアエラーが検出された物理ブロックが割り当てられている論理ブロックが未使用であった場合(S6でY)、媒体検査部11は、当該物理ブロックを閉塞して(S7)、次物理ブロックの検査(S8)に進む。この時、媒体検査部11は、当該物理ブロックの閉塞を管理テーブル12に記録するとともに、駆動部22経由で、OS21に前述の解除通知を送る。   In the determination based on the usage status information obtained from the OS 21 (S6), if the logical block to which the physical block in which the media error is detected is unused (Y in S6), the medium inspection unit 11 The physical block is blocked (S7), and the process proceeds to the next physical block inspection (S8). At this time, the medium inspection unit 11 records the block of the physical block in the management table 12 and sends the above-described release notification to the OS 21 via the drive unit 22.

OS21は、管理テーブル12に閉塞が記録された物理ブロックが割り当てられた論理ブロックを使用しない。ここでは、この為のOS21と媒体検査部11との間のインターフェースの記載は省略する。   The OS 21 does not use a logical block to which a physical block whose blockage is recorded in the management table 12 is assigned. Here, description of the interface between the OS 21 and the medium inspection unit 11 for this purpose is omitted.

OS21から得た使用状況情報に基づく判断で(S6)、メディアエラーが検出された物理ブロックが割り当てられている論理ブロックが使用中であった場合(S6でN)、媒体検査部11は、メディアエラーによるデータ消失を、例えばOS21に報告する(S10)。このとき、媒体検査部11は、駆動部22経由で、OS21に前述の解除通知を送る。   If the logical block to which the physical block in which the media error has been detected is in use (N in S6) in the determination based on the usage status information obtained from the OS 21 (N in S6), the medium inspection unit 11 Data loss due to an error is reported to, for example, the OS 21 (S10). At this time, the medium inspection unit 11 sends the above-described release notification to the OS 21 via the drive unit 22.

データ消失の報告を受けたOS21は、例えば、フルバックアップファイルのリストアや、再インストール、ファイルの再構築を実行する。   The OS 21 that has received the report of data loss executes, for example, full backup file restoration, reinstallation, and file reconstruction.

<効果>
本実施の形態にかかるディスク管理システム40は、効率の良いメディアエラーチェックを実施することが出来る。その理由は、媒体検査部11は、物理ブロックの障害を検出しない場合には、論理ブロックが使用中か否かが分かる情報を必要としないからである。すなわち、当該使用状況情報の転送が不要なのである。
<Effect>
The disk management system 40 according to the present embodiment can perform an efficient media error check. The reason is that the medium checking unit 11 does not need information for determining whether or not a logical block is in use when a physical block failure is not detected. That is, it is not necessary to transfer the usage status information.

さらに、障害が検出された物理ブロックのアドレスが特定できているため、転送される使用状況情報の量を絞り込むことが可能である。   Furthermore, since the address of the physical block in which the failure is detected can be specified, the amount of usage status information to be transferred can be narrowed down.

すなわち、本実施の形態にかかるディスク管理システム40は、論理ブロックの使用状況情報の転送契機と、転送量の両方を削減することにより、情報の授受オーバヘッドと、OS21がファイルの生成、消滅、拡張の使用状況変更が出来ない期間を削減するのである。   In other words, the disk management system 40 according to the present embodiment reduces both the transfer timing of the logical block usage status information and the transfer amount, so that the information transmission / reception overhead and the OS 21 generate, erase, and expand the file. The period during which the usage status cannot be changed is reduced.

<変形例>
駆動部22は、ディスク管理装置20ではなく、ディスク制御装置10が備えていても良い。
<Modification>
The drive unit 22 may be included in the disk control device 10 instead of the disk management device 20.

さらに、ディスク管理装置20とディスク制御装置10は、一つの装置として実装されていても良い。つまり、一方の装置が他方の装置の構成要素の全てを備えていても良い。   Further, the disk management device 20 and the disk control device 10 may be implemented as one device. That is, one device may include all of the components of the other device.

ディスク装置30は、必ずしもRAIDを成している必要は無い。その場合、図3のフローチャートにおいて、S3、S4、および、S9のステップは不要である。   The disk device 30 does not necessarily have to be RAID. In that case, the steps of S3, S4, and S9 are not necessary in the flowchart of FIG.

媒体検査部11は、データ消失した物理ブロックを管理テーブル12で管理するのではなく、特定のデータパターンを上書きすることでメディアエラー状態を解消できるかを試すようにしても良い。管理テーブル12で管理する場合、多数の物理ブロックで問題が出た際など、ディスク装置30の代替えセクター不足が発生する可能性がある。上書きでメディアエラーが解消されれば、媒体障害が検出された物理ブロックを、使用可能なままとすることができる効果がある。   The medium inspection unit 11 may test whether the media error state can be resolved by overwriting a specific data pattern, instead of managing the physical block whose data has been lost by the management table 12. When managing with the management table 12, there is a possibility that a shortage of alternative sectors of the disk device 30 may occur when a problem occurs in a large number of physical blocks. If the media error is eliminated by overwriting, there is an effect that the physical block in which the medium failure is detected can remain usable.

<第2の実施形態>
図4は、第2の実施の形態にかかるディスク管理システム40の構成を示す図である。
<Second Embodiment>
FIG. 4 is a diagram illustrating a configuration of a disk management system 40 according to the second embodiment.

ディスク管理システム40は、OS21、駆動部22、および、媒体検査部11を包含する。また、ディスク管理システム40は、例えば、通信ネットワークを経由して1台以上のディスク装置30に接続されている。ディスク装置30は、RAIDを構成していても良いし、構成していなくても良い。   The disk management system 40 includes an OS 21, a drive unit 22, and a medium inspection unit 11. The disk management system 40 is connected to one or more disk devices 30 via a communication network, for example. The disk device 30 may or may not constitute a RAID.

OS21は、ディスク装置30の閉塞されていない物理ブロックが割り当てられている論理ブロックを、確保してデータ書き込み領域として使用する。OS21は、例えば、ファイルシステムである。   The OS 21 secures a logical block to which an unblocked physical block of the disk device 30 is allocated and uses it as a data writing area. The OS 21 is, for example, a file system.

駆動部22は、物理ブロックのアドレスを入力されて、当該物理ブロックが割り当てられている論理ブロックのアドレスに変換し、変換されたアドレスの論理ブロックが、使用中であるか否かを示す使用状況情報を、OS21から取得して媒体検査部11に出力する。   The drive unit 22 receives the address of the physical block, converts it to the address of the logical block to which the physical block is assigned, and indicates whether or not the logical block of the converted address is in use Information is acquired from the OS 21 and output to the medium inspection unit 11.

媒体検査部11は、ディスク装置30の物理ブロックに対して順次テストリードを実行し、障害を検出すると、駆動部22から使用状況情報を取得して、障害のあった物理ブロックが割り当てられている論理ブロックが使用中であるか判定する。媒体検査部11は、未使用であれば、当該物理ブロックを閉塞して次の物理ブロックのテストリードに進み、使用中であれば、障害報告を、例えば、OS21に出力する。   When the medium inspection unit 11 sequentially performs a test read on the physical blocks of the disk device 30 and detects a failure, the medium inspection unit 11 acquires usage status information from the drive unit 22 and is assigned a failed physical block. Determine if the logical block is in use. The medium checking unit 11 closes the physical block if it is not used and proceeds to the test read of the next physical block, and outputs a failure report to, for example, the OS 21 if it is in use.

障害報告を受けたOS21は、例えば、フルバックアップファイルのリストアや、プログラムファイルの再インストールを実施する。   The OS 21 that has received the failure report restores a full backup file or reinstalls a program file, for example.

本実施の形態にかかるディスク管理システム40は、効率の良いメディアエラーチェックを実施することが出来る。その理由は、媒体検査部11は、物理ブロックの障害を検出しない場合には、論理ブロックが使用中か否かが分かる情報を必要としないからである。すなわち、当該使用状況情報の転送が不要なのである。   The disk management system 40 according to the present embodiment can perform an efficient media error check. The reason is that the medium checking unit 11 does not need information for determining whether or not a logical block is in use when a physical block failure is not detected. That is, it is not necessary to transfer the usage status information.

さらに、障害が検出された物理ブロックのアドレスが特定できているため、転送される使用状況情報の量を絞り込むことが可能である。   Furthermore, since the address of the physical block in which the failure is detected can be specified, the amount of usage status information to be transferred can be narrowed down.

以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。   While the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.

10 ディスク制御装置
11 媒体検査部
12 管理テーブル
13 入出力部
20 ディスク管理装置
21 OS
22 駆動部
30 ディスク装置
40 ディスク管理システム
60 コンピュータ装置
61 プロセッサ
62 外部記憶装置
63 主記憶部
64 バス
65 プログラム
DESCRIPTION OF SYMBOLS 10 Disk control apparatus 11 Medium inspection part 12 Management table 13 Input / output part 20 Disk management apparatus 21 OS
22 drive unit 30 disk device 40 disk management system 60 computer device 61 processor 62 external storage device 63 main storage unit 64 bus 65 program

Claims (10)

ディスク装置の閉塞されていない物理ブロックが割り当てられている論理ブロックを、確保してデータ書き込み領域として使用するOSと、
前記物理ブロックのアドレスを入力されて、当該物理ブロックが割り当てられている前記論理ブロックのアドレスに変換し、変換されたアドレスの前記論理ブロックが、使用中であるか否かを示す使用状況情報を、前記OSから取得して出力する駆動手段と、
前記ディスク装置の前記物理ブロックに対して順次テストリードを実行し、媒体障害を検出すると、前記駆動手段から前記使用状況情報を取得して、前記媒体障害のあった前記物理ブロックが割り当てられている前記論理ブロックが使用中であるか判定し、a)未使用であれば当該物理ブロックを閉塞して次の前記物理ブロックの前記テストリードに進み、b)使用中であれば、障害報告を出力する媒体検査手段と、を包含するディスク管理システム。
An OS that secures a logical block to which a physical block that is not blocked in the disk device is allocated and uses it as a data writing area;
When the address of the physical block is input, the address is converted into the address of the logical block to which the physical block is allocated, and usage status information indicating whether or not the logical block of the converted address is in use. Driving means for obtaining and outputting from the OS;
When a test read is sequentially performed on the physical blocks of the disk device and a medium failure is detected, the usage status information is acquired from the drive unit, and the physical block having the medium failure is allocated. Determine whether the logical block is in use, a) block the physical block if it is not used, and proceed to the test read of the next physical block, b) output a failure report if it is in use And a medium inspection means.
前記ディスク装置は、他のディスク装置と冗長構成をなしており
前記媒体検査手段は、前記ディスク装置の前記物理ブロックに対して順次、前記テストリードを実行し、前記媒体障害を検出すると、前記他のディスク装置内の対応する前記物理ブロックに前記テストリードを実行し、再度、前記媒体障害を検出すると、前記駆動手段から前記使用状況情報を取得して、前記媒体障害のあった前記物理ブロックが割り当てられている前記論理ブロックが使用中であるか判定する、請求項1のディスク管理システム。
The disk device has a redundant configuration with another disk device, and the medium checking means sequentially executes the test read on the physical block of the disk device, and detects the medium failure, the other When the test read is executed on the corresponding physical block in the disk device and the medium failure is detected again, the usage status information is obtained from the drive unit, and the physical block having the medium failure is The disk management system according to claim 1, wherein it is determined whether the allocated logical block is in use.
前記駆動手段は、入力された前記物理ブロックのアドレスから、当該物理ブロックが割り当てられている前記論理ブロックの前記アドレスを算出して前記OSに出力し、
前記OSは、入力された前記アドレスの前記論理ブロックが使用中であるか否かを判定し、判定結果を出力する、請求項1乃至請求項2の何れか1項のディスク管理システム。
The drive means calculates the address of the logical block to which the physical block is allocated from the input address of the physical block, and outputs the calculated address to the OS.
The disk management system according to claim 1, wherein the OS determines whether or not the logical block at the input address is in use, and outputs a determination result.
前記OSと、前記駆動手段と、を備えるディスク管理装置と、
前記媒体検査手段を備えるディスク制御装置と、
前記ディスク装置と、を包含する請求項1乃至請求項3の何れか1項のディスク管理システム。
A disk management device comprising the OS and the drive means;
A disk control device comprising the medium inspection means;
The disk management system according to any one of claims 1 to 3, comprising the disk device.
前記OSを備えるディスク管理装置と、
前記媒体検査手段と、前記駆動手段と、を備えるディスク制御装置と、
前記ディスク装置と、を包含する請求項1乃至請求項3の何れか1項のディスク管理システム。
A disk management device comprising the OS;
A disk control device comprising the medium inspection means and the drive means;
The disk management system according to any one of claims 1 to 3, comprising the disk device.
前記OSと、前記媒体検査手段と、前記駆動手段と、を備えるディスク制御装置と、
前記ディスク装置と、を包含する請求項1乃至請求項3の何れか1項のディスク管理システム。
A disk control device comprising the OS, the medium inspection unit, and the driving unit;
The disk management system according to any one of claims 1 to 3, comprising the disk device.
閉塞されていない物理ブロックが割り当てられている論理ブロックが、データ書き込み領域として使用されている前記ディスク装置の、前記物理ブロックに対して順次テストリードを実行し、
媒体障害を検出すると、検出された前記物理ブロックのアドレスを、当該物理ブロックが割り当てられている前記論理ブロックのアドレスに変換し、変換されたアドレスの前記論理ブロックが、使用中であるか否かを示す使用状況情報を取得して、
当該論理ブロックが使用中であるか判定し、a)未使用であれば当該物理ブロックを閉塞して次の前記物理ブロックの前記テストリードに進み、b)使用中であれば、障害報告を出力する、ディスク管理方法。
A logical block to which a physical block that is not blocked is assigned performs a test read sequentially on the physical block of the disk device that is used as a data write area,
When a medium failure is detected, the address of the detected physical block is converted to the address of the logical block to which the physical block is allocated, and whether or not the logical block at the converted address is in use. Get usage information that indicates
Determine whether the logical block is in use, a) block the physical block if it is not used, and proceed to the test read of the next physical block, b) output a failure report if it is in use Disk management method.
前記ディスク装置は、他のディスク装置と冗長構成をなしており、
前記ディスク装置の前記物理ブロックに対して順次、前記テストリードを実行し、前記媒体障害を検出すると、前記他のディスク装置内の対応する前記物理ブロックに前記テストリードを実行し、再度、前記媒体障害を検出すると、前記駆動手段から前記使用状況情報を取得して、前記媒体障害のあった前記物理ブロックが割り当てられている前記論理ブロックが使用中であるか判定する、請求項7のディスク管理方法。
The disk device has a redundant configuration with other disk devices,
When the test read is sequentially performed on the physical block of the disk device and the medium failure is detected, the test read is performed on the corresponding physical block in the other disk device, and the medium is again performed. 8. The disk management according to claim 7, wherein when a failure is detected, the usage status information is acquired from the drive means to determine whether the logical block to which the physical block having the medium failure is allocated is in use. Method.
ディスク装置の閉塞されていない物理ブロックが割り当てられている論理ブロックを、確保してデータ書き込み領域として使用するOS処理と、
前記物理ブロックのアドレスを入力されて、当該物理ブロックが割り当てられている前記論理ブロックのアドレスに変換し、変換されたアドレスの前記論理ブロックが、使用中であるか否かを示す使用状況情報を、前記OSから取得して出力する駆動処理と、
前記ディスク装置の前記物理ブロックに対して順次テストリードを実行し、媒体障害を検出すると、前記駆動手段から前記使用状況情報を取得して、前記媒体障害のあった前記物理ブロックが割り当てられている前記論理ブロックが使用中であるか判定し、a)未使用であれば当該物理ブロックを閉塞して次の前記物理ブロックの前記テストリードに進み、b)使用中であれば、障害報告を出力する媒体検査処理と、をコンピュータに実行させるディスク管理プログラム。
OS processing for securing a logical block to which a physical block that is not blocked in the disk device is allocated and using it as a data writing area;
When the address of the physical block is input, the address is converted into the address of the logical block to which the physical block is allocated, and usage status information indicating whether or not the logical block of the converted address is in use. Driving processing to be obtained and output from the OS;
When a test read is sequentially performed on the physical blocks of the disk device and a medium failure is detected, the usage status information is acquired from the drive unit, and the physical block having the medium failure is allocated. Determine whether the logical block is in use, a) block the physical block if it is not used, and proceed to the test read of the next physical block, b) output a failure report if it is in use A disk management program for causing a computer to execute medium inspection processing.
前記ディスク装置は、他のディスク装置と冗長構成をなしており
前記ディスク装置の前記物理ブロックに対して順次、前記テストリードを実行し、前記媒体障害を検出すると、前記他のディスク装置内の対応する前記物理ブロックに前記テストリードを実行し、再度、前記媒体障害を検出すると、前記駆動手段から前記使用状況情報を取得して、前記媒体障害のあった前記物理ブロックが割り当てられている前記論理ブロックが使用中であるか判定する前記媒体検査処理を、コンピュータに実行させる請求項9のディスク管理プログラム。
The disk device has a redundant configuration with another disk device. When the test read is sequentially performed on the physical block of the disk device and the medium failure is detected, a response in the other disk device is performed. When the test read is executed on the physical block and the medium failure is detected again, the usage status information is acquired from the driving unit, and the physical block having the medium failure is allocated to the logical block. 10. The disk management program according to claim 9, which causes a computer to execute the medium inspection process for determining whether a block is in use.
JP2017006786A 2017-01-18 2017-01-18 Disk management system, disk management method, and disk management program Active JP6805838B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017006786A JP6805838B2 (en) 2017-01-18 2017-01-18 Disk management system, disk management method, and disk management program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017006786A JP6805838B2 (en) 2017-01-18 2017-01-18 Disk management system, disk management method, and disk management program

Publications (2)

Publication Number Publication Date
JP2018116472A true JP2018116472A (en) 2018-07-26
JP6805838B2 JP6805838B2 (en) 2020-12-23

Family

ID=62985212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017006786A Active JP6805838B2 (en) 2017-01-18 2017-01-18 Disk management system, disk management method, and disk management program

Country Status (1)

Country Link
JP (1) JP6805838B2 (en)

Also Published As

Publication number Publication date
JP6805838B2 (en) 2020-12-23

Similar Documents

Publication Publication Date Title
US8448047B2 (en) Storage device, storage control device, data transfer intergrated circuit, and storage control method
US8392752B2 (en) Selective recovery and aggregation technique for two storage apparatuses of a raid
JP2005301497A (en) Storage management system, restoration method and its program
JP2005122338A (en) Disk array device having spare disk drive, and data sparing method
JP2007334593A (en) Raid controller and raid device
CN109726036B (en) Data reconstruction method and device in storage system
US10606490B2 (en) Storage control device and storage control method for detecting storage device in potential fault state
CN111124264B (en) Method, apparatus and computer program product for reconstructing data
JP2006079418A (en) Storage control apparatus, control method and program
JP2006139478A (en) Disk array system
CN113835923A (en) Reset system, data processing system and related equipment
JP4491330B2 (en) Disk array device, data recovery method and data recovery program
JP6540334B2 (en) SYSTEM, INFORMATION PROCESSING DEVICE, AND INFORMATION PROCESSING METHOD
US8977892B2 (en) Disk control apparatus, method of detecting failure of disk apparatus, and recording medium for disk diagnosis program
JP2006079219A (en) Disk array controller and disk array control method
JP4460596B2 (en) Disk management method, disk management apparatus, and storage system
CN116204137A (en) Distributed storage system, control method, device and equipment based on DPU
CN111124740A (en) Data reading method and device, storage equipment and machine-readable storage medium
JP2018116472A (en) Disk management system, disk management method, and disk management program
JP3841595B2 (en) Storage device alternation processing time judgment test method
CN109542687B (en) RAID level conversion method and device
JP2014041524A (en) Semiconductor memory device, storage device, semiconductor memory device control method, storage control method, and computer program
WO2016139774A1 (en) Information processing device and information processing system
JPH06119125A (en) Disk array device
JP6957845B2 (en) Storage control device and storage device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201117

R150 Certificate of patent or registration of utility model

Ref document number: 6805838

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150