JP6760619B1 - ハードディスクの耐用年数の最適化方法及びそのシステム - Google Patents
ハードディスクの耐用年数の最適化方法及びそのシステム Download PDFInfo
- Publication number
- JP6760619B1 JP6760619B1 JP2020008082A JP2020008082A JP6760619B1 JP 6760619 B1 JP6760619 B1 JP 6760619B1 JP 2020008082 A JP2020008082 A JP 2020008082A JP 2020008082 A JP2020008082 A JP 2020008082A JP 6760619 B1 JP6760619 B1 JP 6760619B1
- Authority
- JP
- Japan
- Prior art keywords
- hard disk
- test parameter
- test
- module
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000005457 optimization Methods 0.000 title claims description 10
- 238000012360 testing method Methods 0.000 claims abstract description 101
- 238000012544 monitoring process Methods 0.000 claims abstract description 26
- 238000012217 deletion Methods 0.000 claims description 6
- 230000037430 deletion Effects 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 abstract description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
クラスタハードディスクのうちの各ハードディスクに監視ポイントを追加して、各ハードディスクにおける監視ポイントのテストパラメータをテストするステップS1と、
テストパラメータの値を収集して入力し、この値を事前に設定されたテストパラメータ閾値と比較するステップS2と、
値がテストパラメータ閾値に達したハードディスクに対して、クラスタハードディスクにおいてこのハードディスクに対してosdとしての役割を削除してオフラインにし、これに替わり他のハードディスクを作動させるステップS3と、
ステップS1〜ステップS3を繰り返し、クラスタハードディスクのうちの各ハードディスクがいずれもテストパラメータ閾値に達したとき、クラスタハードディスクにおいて削除してオフラインにされたすべてのハードディスクを再オンラインにするステップS4と、を含む。
クラスタハードディスクのうちの各ハードディスクにおける監視ポイントを設置して、監視ポイントを監視する監視モジュールと、
監視ポイントにおけるテストパラメータをテストするテストモジュールと、
前記テストモジュールによりテストされたテストパラメータの具体的な値を収集して入力するテストパラメータ収集モジュールと、
テストパラメータ閾値を事前に設定して保存するテストパラメータ閾値事前設定モジュールと、
前記テストパラメータ収集モジュールにより収集されたテストパラメータの具体的な値を、前記テストパラメータ閾値事前設定モジュールにより事前に設定されたテストパラメータ閾値と比較して判断する比較モジュールと、
テストパラメータの具体的な値がテストパラメータ閾値に達したハードディスクを削除してオフラインにするハードディスク削除オフラインモジュールと、
クラスタハードディスクのうちのすべてのハードディスクがいずれも、前記ハードディスク削除オフラインモジュールによって削除してオフラインにされた後、クラスタハードディスクのうちのすべてのハードディスクを再オンラインにして使用する再オンラインモジュールと、を備える。
ceph分散ストレージ(すなわち、ハードディスククラスタ)では、個別のハードディスクをOSDストレージ対象として、データ、コピーをそれぞれストレージに書き込む。このようにして、同じハードディスククラスタにおいて、統一したスケジューリング及び監視プラットフォームがある。本発明は、主に、最下層ハードディスクの耐用年数、読み書き状態、不良セクタなどの一連のテストパラメータに基づいて、ハードディスククラスタのうちのハードディスクに対してオンライン及び再オフライン処理を行い、それにより、ハードディスク応答の指標の一貫性を調整して、最終的に耐用年数を延ばすという目的を達成する。
S1、クラスタハードディスクのうちの各ハードディスクに監視ポイントを追加して、各ハードディスクにおける監視ポイントのテストパラメータをテストし、一般的には、好ましくは、テストパラメータの具体的な値は、smartctlツールで収集される。
S2、テストパラメータの値を収集して入力し、この値を事前に設定されたテストパラメータ閾値と比較し、前記テストパラメータ閾値は、選択されたテストパラメータのタイプに応じて事前に設定され、テストパラメータ閾値の設定方式は、ユーザがニーズに応じてテストパラメータ閾値の具体的な値を設定することである。
S3、値がテストパラメータ閾値に達したハードディスクに対して、クラスタハードディスクにおいてこのハードディスクに対してosdとしての役割を削除してオフラインにし、これに替わり他のハードディスクを作動させる。
S4、ステップS1〜ステップS3を繰り返し、クラスタハードディスクのうちの各ハードディスクがいずれもテストパラメータ閾値に達したとき、クラスタハードディスクにおいて削除してオフラインにされたすべてのハードディスクを再オンラインにし、それにより、クラスタハードディスクのうちのすべてのハードディスクの耐用年数の一貫性を保持するという目的を達成する。
本実施例は、実施例1に基づき、ハードディスク温度をテストパラメータとして具体的な方法を説明する。ハードディスクの耐用年数の最適化方法は、
クラスタハードディスクのうちの各ハードディスクに監視ポイントを追加して、各ハードディスクにおける監視ポイントのハードディスク温度をテストするステップS11と、
各ハードディスクのリアルタイムなハードディスク温度を収集して入力し、リアルタイムなハードディスク温度の値を、好ましくは50℃に事前に設定されたハードディスク温度閾値と比較するステップS12と、
ハードディスク温度の値が50℃以上であると、このハードディスクに対してosdとしての役割を削除してオフラインにし、これに替わり他のハードディスクを作動させるステップS13と、
ステップS11〜ステップS13を繰り返し、クラスタハードディスクのうちのハードディスクに対して、ハードディスク温度を比較し、クラスタハードディスクのうちのすべてのハードディスクのハードディスク温度がいずれも50℃に達しており且つオフラインにされた場合、クラスタハードディスクのうちのすべてのハードディスクを再オンラインにするステップS14と、を含む。
本実施例は、ハードディスクの耐用年数の最適化方法を開示し、これも、実施例1に基づき最適化を行い、具体的には、事前に設定された閾値を削除し、クラスタハードディスクシステムプログラムにすべてのテストパラメータの処理を自動的に実行させる。本実施例のハードディスクの耐用年数の最適化方法は、
クラスタハードディスクのうちの各ハードディスクに監視ポイントを追加して、各ハードディスクにおける監視ポイントのテストパラメータをテストするステップS21と、
テストパラメータの値を収集して入力し、同じテストパラメータの値を加算した後、同じテストパラメータのハードディスク数で割って、テストパラメータの平均値を得るステップS22と、
値が平均値より大きいハードディスクに対して、クラスタハードディスクにおいてこのハードディスクに対してosdとしての役割を削除してオフラインにし、これに替わり他のハードディスクを作動させるステップS23と、
ステップS22、ステップS23を繰り返し、増大し続けている異なるテストパラメータの平均値を絶えずに得て、テストパラメータの平均値が増大すると、すべてのハードディスクのテストパラメータが同じになるまで、オフラインにされたハードディスクを徐々にオンラインにし、次に、全てのハードディスクを一緒に再オンラインにして作動させ、このようにして、ハードディスクの耐用年数の一貫性を実現でき、ハードディスクの破損が早すぎる可能性を減少させるステップS24と、を含む。
図2に示されるように、本実施例は、ハードディスクの耐用年数の最適化システムを提供し、該システムは、
クラスタハードディスクのうちの各ハードディスクにおける監視ポイントを設置して、監視ポイントを監視する監視モジュールと、
監視ポイントにおけるテストパラメータをテストするテストモジュールと、
前記テストモジュールによりテストされたテストパラメータの具体的な値を収集して入力し、好ましくは、smartctlツールを使用するテストパラメータ収集モジュールと、
テストパラメータ閾値を事前に設定して保存するテストパラメータ閾値事前設定モジュールと、
前記テストパラメータ収集モジュールにより収集されたテストパラメータの具体的な値を、前記テストパラメータ閾値事前設定モジュールにより事前に設定されたテストパラメータ閾値と比較して判断する比較モジュールと、
テストパラメータの具体的な値がテストパラメータ閾値に達したハードディスクを削除してオフラインにするハードディスク削除オフラインモジュールと、
クラスタハードディスクのうちのすべてのハードディスクがいずれも、前記ハードディスク削除オフラインモジュールによって削除してオフラインにされた後、クラスタハードディスクのうちのすべてのハードディスクを再オンラインにして使用する再オンラインモジュールと、を備える。
Claims (6)
- ハードディスクの耐用年数の最適化方法であって、
クラスタハードディスクのうちの各ハードディスクに監視ポイントを追加して、各ハードディスクにおける監視ポイントのテストパラメータをテストするステップS1と、
テストパラメータの値を収集して入力し、この値を事前に設定されたテストパラメータ閾値と比較するステップS2と、
値がテストパラメータ閾値に達したハードディスクに対して、クラスタハードディスクにおいてこのハードディスクに対してosdとしての役割を削除してオフラインにし、これに替わり他のハードディスクを作動させるステップS3と、
ステップS1〜ステップS3を繰り返し、クラスタハードディスクのうちの各ハードディスクがいずれもテストパラメータ閾値に達したとき、クラスタハードディスクにおいて削除してオフラインにされたすべてのハードディスクを再オンラインにするステップS4と、を含む、
ことを特徴とするハードディスクの耐用年数の最適化方法。 - 前記ステップS1のテストパラメータは、起動回数、リマップセクタの数、ハードディスクの電源投入回数、累積電源投入時間、スピンドルモーターのスピンアップ再試行回数、ハードディスク校正再試行回数、基礎となるデータの読み取りエラー率、パリティチェックエラー率、書込みエラー率、読み書き回数、読み書き容量、及びハードディスク温度のうちの1種又は複数種である、
ことを特徴とする請求項1に記載のハードディスクの耐用年数の最適化方法。 - 前記テストパラメータ閾値は、選択されたテストパラメータのタイプに応じて事前に設定され、テストパラメータ閾値の設定方式は、ユーザがニーズに応じてテストパラメータ閾値の具体的な値を設定することである、
ことを特徴とする請求項2に記載のハードディスクの耐用年数の最適化方法。 - 前記テストパラメータの具体的な値は、smartctlツールで収集される、
ことを特徴とする請求項1〜3のいずれか1項に記載のハードディスクの耐用年数の最適化方法。 - ハードディスクの耐用年数の最適化システムであって、
クラスタハードディスクのうちの各ハードディスクにおける監視ポイントを設置して、監視ポイントを監視する監視モジュールと、
監視ポイントにおけるテストパラメータをテストするテストモジュールと、
前記テストモジュールによりテストされたテストパラメータの具体的な値を収集して入力するテストパラメータ収集モジュールと、
テストパラメータ閾値を事前に設定して保存するテストパラメータ閾値事前設定モジュールと、
前記テストパラメータ収集モジュールにより収集されたテストパラメータの具体的な値を、前記テストパラメータ閾値事前設定モジュールにより事前に設定されたテストパラメータ閾値と比較して判断する比較モジュールと、
テストパラメータの具体的な値がテストパラメータ閾値に達したハードディスクを削除してオフラインにするハードディスク削除オフラインモジュールと、
クラスタハードディスクのうちのすべてのハードディスクがいずれも、前記ハードディスク削除オフラインモジュールによって削除してオフラインにされた後、クラスタハードディスクのうちのすべてのハードディスクを再オンラインにして使用する再オンラインモジュールと、を備える、
ことを特徴とするハードディスクの耐用年数の最適化システム。 - 前記テストパラメータ収集モジュールは、smartctlツールを使用する、
ことを特徴とする請求項5に記載のハードディスクの耐用年数の最適化システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2019106812852 | 2019-07-26 | ||
CN201910681285.2A CN110489299A (zh) | 2019-07-26 | 2019-07-26 | 一种优化硬盘使用寿命的方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6760619B1 true JP6760619B1 (ja) | 2020-09-23 |
JP2021022416A JP2021022416A (ja) | 2021-02-18 |
Family
ID=68547681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020008082A Expired - Fee Related JP6760619B1 (ja) | 2019-07-26 | 2020-01-22 | ハードディスクの耐用年数の最適化方法及びそのシステム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6760619B1 (ja) |
CN (1) | CN110489299A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113608915A (zh) * | 2021-08-31 | 2021-11-05 | 新华三技术有限公司成都分公司 | 一种磁盘故障检测方法以及装置 |
CN113625957A (zh) * | 2021-06-30 | 2021-11-09 | 济南浪潮数据技术有限公司 | 一种硬盘故障的检测方法、装置及设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112162705B (zh) * | 2020-09-30 | 2024-07-16 | 新浪技术(中国)有限公司 | 一种raid盘组故障自动下线报修方法及系统 |
-
2019
- 2019-07-26 CN CN201910681285.2A patent/CN110489299A/zh active Pending
-
2020
- 2020-01-22 JP JP2020008082A patent/JP6760619B1/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113625957A (zh) * | 2021-06-30 | 2021-11-09 | 济南浪潮数据技术有限公司 | 一种硬盘故障的检测方法、装置及设备 |
CN113625957B (zh) * | 2021-06-30 | 2024-02-13 | 济南浪潮数据技术有限公司 | 一种硬盘故障的检测方法、装置及设备 |
CN113608915A (zh) * | 2021-08-31 | 2021-11-05 | 新华三技术有限公司成都分公司 | 一种磁盘故障检测方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110489299A (zh) | 2019-11-22 |
JP2021022416A (ja) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6760619B1 (ja) | ハードディスクの耐用年数の最適化方法及びそのシステム | |
US11132133B2 (en) | Workload-adaptive overprovisioning in solid state storage drive arrays | |
JP2022508320A (ja) | ハードディスク故障発生時期の予測方法、装置及び記憶媒体 | |
US10664354B2 (en) | Selecting a resource to be used in a data backup or restore operation | |
JP5850048B2 (ja) | システムおよび方法をセーブして修復するメモリアクセステーブル | |
US10825477B2 (en) | RAID storage system with logical data group priority | |
CN1296835C (zh) | 用于控制计算机系统的引导操作的装置和方法 | |
US9052826B2 (en) | Selecting storage locations for storing data based on storage location attributes and data usage statistics | |
US10067840B1 (en) | Life expectancy data migration | |
JP2005122338A (ja) | スペアディスクドライブをもつディスクアレイ装置及びデータスペアリング方法 | |
US8863110B2 (en) | Firmware updating system and method | |
CN101055537A (zh) | 存储系统以及数据管理方法 | |
US20110126055A1 (en) | Information processing apparatus, and method of diagnosis | |
Li et al. | ProCode: A proactive erasure coding scheme for cloud storage systems | |
US20180329477A1 (en) | Computer system, method for conserving power, and computer | |
DE112019005558T5 (de) | Verwendung einer auf fehlerkorrektur basierenden metrik zur identifizierung schlecht funktionierender datenspeichervorrichtungen | |
CN109947353A (zh) | 存储管理方法、固态硬盘及可读存储介质 | |
US20170097784A1 (en) | Storage control device | |
TW201344436A (zh) | 系統事件日誌記錄系統及方法 | |
JP2012079100A (ja) | ディスク制御装置及びディスク制御方法、並びにプログラム | |
TWI751580B (zh) | 儲存空間暫存檔案的管理方法及用於儲存多個暫存檔案的記錄裝置 | |
Liang et al. | Reliability characterization of solid state drives in a scalable production datacenter | |
US10268421B2 (en) | Information recording device and information recording method | |
CN112219189B (zh) | 用于调度的反熵修复设计的技术 | |
JP2013149112A (ja) | 記憶媒体の管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200125 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200618 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200728 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200827 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6760619 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |