TW202046297A - 用於磁存儲介質的健康管理 - Google Patents

用於磁存儲介質的健康管理 Download PDF

Info

Publication number
TW202046297A
TW202046297A TW109101526A TW109101526A TW202046297A TW 202046297 A TW202046297 A TW 202046297A TW 109101526 A TW109101526 A TW 109101526A TW 109101526 A TW109101526 A TW 109101526A TW 202046297 A TW202046297 A TW 202046297A
Authority
TW
Taiwan
Prior art keywords
storage medium
area
magnetic storage
magnetic
read
Prior art date
Application number
TW109101526A
Other languages
English (en)
Other versions
TWI845597B (zh
Inventor
N 南加勒
Original Assignee
新加坡商馬維爾亞洲私人有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 新加坡商馬維爾亞洲私人有限公司 filed Critical 新加坡商馬維爾亞洲私人有限公司
Publication of TW202046297A publication Critical patent/TW202046297A/zh
Application granted granted Critical
Publication of TWI845597B publication Critical patent/TWI845597B/zh

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/36Monitoring, i.e. supervising the progress of recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/455Arrangements for functional testing of heads; Measuring arrangements for heads
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/62Record carriers characterised by the selection of the material
    • G11B5/64Record carriers characterised by the selection of the material comprising only the magnetic material without bonding agent
    • G11B5/66Record carriers characterised by the selection of the material comprising only the magnetic material without bonding agent the record carriers consisting of several layers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1008Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
    • G06F11/1044Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices with specific ECC/EDC distribution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2263Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0616Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • G06F3/0676Magnetic disk device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10305Improvement or modification of read or write signals signal quality assessment
    • G11B20/10472Improvement or modification of read or write signals signal quality assessment derived from statistics of other quality measures, e.g. their mean, variance or skew
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10009Improvement or modification of read or write signals
    • G11B20/10481Improvement or modification of read or write signals optimisation methods
    • G11B20/10518Improvement or modification of read or write signals optimisation methods using neural networks
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/012Recording on, or reproducing or erasing from, magnetic disks
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B2020/1869Preventing ageing phenomena from causing data loss, e.g. by monitoring the age of record carriers or by recognising wear, and by copying information elsewhere when a record carrier becomes unreliable

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Probability & Statistics with Applications (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Digital Magnetic Recording (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公開描述了用於磁存儲介質的健康管理的各態樣。在一些態樣,介質健康管理器利用讀取通道來確定針對磁存儲介質的磁區的讀取度量,磁存儲介質的該磁區駐留在磁存儲介質的區域中。介質健康管理器存取區域的讀取度量,並且基於針對磁區而被確定的讀取度量,來更新區域的讀取度量,以提供針對磁存儲介質的區域的經更新的讀取度量。然後,基於磁存儲介質的區域的經更新的讀取量度,針對磁存儲介質的區域的健康得分利用神經網路而被確定。通過這樣做,磁存儲介質的逐漸磨損可以使用健康得分而被預測,從而使得能夠在無法提高存儲到設備的資料的可靠性或可用性之前替換磁存儲介質設備。

Description

用於磁存儲介質的健康管理
(相關申請案的交互參照)
本申請主張於2019年1月31日提交的美國臨時專利申請No. 62/799,608的優先權以及2020年1月8日遞交的美國專利申請No. 16/737,174的優先權,該兩件美國申請的揭示內容通過引用整體併入本文。
電子設備為現代社會提供許多服務。該等服務使得電子設備能夠提供娛樂、説明科學研究和開發、並且提供許多現代便利。該等服務中的許多服務創建或使用電子設備存儲的資料。該資料可以包括諸如書籍或電影的數位媒體、執行複雜類比的演算法、個人使用者資料、應用等。為了避免超出資料存儲限制,增加電子設備的資料存儲容量並且避免刪除資料、限制服務、或購買附加的外部存放裝置是有益的。
許多電子設備使用介質驅動器來將資料存儲在磁片上,諸如硬碟驅動器(HDD)。通常,當磁片高速旋轉時,通過在介質磁片的表面上移動讀取元素或寫入元素來存取存儲到HDD的資料。這樣,HDD是由互連的機械、電氣、和磁構件組成的複雜系統,該等構件協同操作以促進資料的存儲和存取。在災難性事件(諸如跌落)之外,HDD的該等機械、電氣、和磁構件在HDD的操作壽命期間會逐漸磨損,直到構件中的一個構件的嚴重故障阻止了資料存取。如果不知道隨著時間的流逝發生了多少磨損,HDD可能在替換或資料備份之前意外失敗,從而導致資料的丟失或資料存儲服務的正常執行時間減少。
提供本發明內容是為了介紹在具體實施方式和附圖中進一步描述的主題。因此,本發明內容不應被認為描述基本特徵,也不應被用於限制所主張保護的主題的範圍。
在一些態樣,磁存儲介質的介質健康管理器實現一種方法,該方法接收針對讀取磁存儲介質的磁區的請求,磁存儲介質的該磁區駐留在磁存儲介質的區域中。該方法利用讀取通道,針對基於該請求而被讀取的磁存儲介質的磁區來確定讀取度量。該方法包括:存取磁存儲介質的區域的讀取度量,並且基於針對磁區而被確定的讀取度量,來更新區域的讀取度量,以提供針對磁存儲介質的區域的經更新的讀取度量。然後,該方法利用神經網路,基於針對磁存儲介質的區域的經更新的讀取度量來確定針對磁存儲介質的區域的健康得分。
在其他態樣,一種裝置,包括:介面,用以與主機傳送資料;磁存儲介質的磁片,用以存儲資料;讀取通道,用以從磁存儲介質的磁區讀取資料;以及神經網路,用以確定介質健康得分。該裝置亦包括介質健康管理器,該介質健康管理器被配置為利用讀取通道,針對資料從其中被讀取的磁存儲介質的磁區來確定讀取度量。介質健康管理器亦可以從磁存儲介質的多個區域中,確定磁區所駐留的磁存儲介質的區域。磁存儲介質的每個區域可以對應於磁存儲介質的磁片上的磁軌的相應子集。介質健康管理器存取磁存儲介質的區域的讀取度量,並且基於針對磁區而被確定的讀取度量,來更新區域的讀取度量,以提供針對磁存儲介質的區域的經更新的讀取度量。然後,介質健康管理器利用神經網路,基於磁存儲介質的區域的經更新的讀取度量來確定針對磁存儲介質的區域的健康得分。
在其他態樣,描述了一種系統單晶片(SoC),其包括前置放大器介面,用以接收與從磁存儲介質的磁區被讀取的資料相對應的訊號。SoC亦包括讀取通道邏輯,用以處理與從磁存儲介質的磁區被讀取的資料相對應的訊號;基於硬體的處理器;和記憶體,該記憶體存儲處理器可執行指令,該存儲處理器可執行指令用以實現介質健康管理器。介質健康管理器利用讀取通道邏輯,針對資料從其中被讀取的磁存儲介質的磁區來確定讀取度量。介質健康管理器亦可以從磁存儲介質的多個區域中,確定磁區所駐留的磁存儲介質的區域。磁存儲介質的每個區域可以對應於磁存儲介質的磁片上的磁軌的相應子集。介質健康管理器存取磁存儲介質的區域的讀取度量,並且基於針對磁區而被確定的讀取度量,來更新區域的讀取度量,以提供針對磁存儲介質的區域的經更新的讀取度量。然後,介質健康管理器利用神經網路,基於磁存儲介質的區域的經更新的讀取度量,來確定針對磁存儲介質的區域的健康得分。
在附圖和以下描述中闡述了一個或多個實現的細節。根據說明書和附圖以及權利要求,其他特徵和優點將顯而易見。
跟蹤硬碟驅動器(HDD)磨損或預期壽命的傳統技術通常僅提供實際驅動器使用的高級視圖,諸如操作小時或驅動器中重新定位的磁區的數目。如前所述,HDD是由互連的機械、電氣、和磁構件組成的複雜系統,該等構件協同操作以促進資料的存儲和存取。隨著每代HDD的發佈,隨著驅動器的寫入密度和存儲容量的增加,此種複雜性和驅動器組件的容限變得更加重要。在災難性事件(諸如跌落)之外,HDD的該等機械、電氣、和磁構件在HDD的操作壽命期間會逐漸磨損,直到關鍵構件故障發生並且HDD報廢為止。在資料丟失、資料恢復成本、服務停機時間(例如,雲資源)、驅動器替換成本等態樣,HDD的丟失可能會非常昂貴。利用傳統技術提供的驅動器使用的高級視圖,使用者和其他存儲用戶端(例如,資料中心)通常無法準確地估計HDD在其預期的使用壽命期間何時會失敗。因此,許多HDD在實現驅動器替換或資料備份之前意外失敗,從而導致存儲資料的丟失或資料存儲服務的可用性降低。
本公開描述了用於磁存儲介質的健康管理的裝置和技術。與傳統磁體寫入技術相對照,所描述的裝置和技術使用由讀取通道提供的度量,該等度量可以較準確地直接或間接地捕獲介質驅動器的元件的逐漸磨損或退化。通常,當資料從存儲介質磁片被讀取時,存儲介質驅動器的讀取通道處理並且解碼訊號。讀取通道對讀取訊號的訊號處理和解碼可以包括訊號調節、採樣、均衡、檢測、糾錯等。這樣,讀取通道可以確定或生成各種度量(例如,低水準類比和糾錯度量),該等度量反映存儲介質驅動器的電氣、機械、或磁元件的相應狀況。
基於由讀取通道提供的度量,介質健康管理器可以利用神經網路來確定或更新針對磁存儲介質的一部分或區域的健康得分。在一些態樣,神經網路被預訓練以將大量存儲介質度量分類為幾個或若干健康得分,這對於確定磁存儲介質的健康或存儲介質驅動器的健康是有用的。通過這樣做,可以優化存儲介質驅動器的內部操作以避免健康狀況差的磁存儲介質的區域,或者可以基於該健康預測來替換存儲介質驅動器。例如,大多數資料中心或雲服務提供方運行數百萬個HDD,該等HDD可以被部署在一個或多個位置中。利用由用於磁存儲介質的健康管理的各態樣所提供的健康得分,資料中心管理員可以在HDD失敗之前有效地實現HDD替換或存取重定向(例如,到另一HDD)。這可以使得管理員能夠保護關鍵任務資料,並且較好地確保資料伺服器HDD的24/7可用性,以符合各種服務水準協定(SLA)進行資料存取。在其他情況下,介質健康管理器可以確定針對磁存儲介質的一個或多個磁區的故障概率。當讀取磁區可能失敗時,介質健康管理器可以實現較具攻擊性的錯誤糾正,或通知服務提供方(例如,雲)該資料可能將不可用,從而使得提供方能夠從另一驅動器獲得所需的資料。在某些情況下,通過在等待直到低概率磁區發生最終讀取故障之前從備選位置提供所需的資料,這可以有效地使得服務提供方能夠滿足SLA的條件。
在用於磁存儲介質的健康管理的各個態樣中,介質健康管理器可以利用讀取通道,針對駐留在磁存儲介質的區域中的磁存儲介質的磁區來確定讀取度量。介質健康管理器存取區域的讀取度量,並且基於針對磁區而被確定的讀取度量,來更新區域的讀取度量,以提供針對磁存儲介質的區域的經更新的讀取度量。然後,介質健康管理器利用神經網路,基於針對磁存儲介質的區域的經更新的讀取度量,來確定針對磁存儲介質的區域的健康得分。通過這樣做,可以使用健康得分來預測磁存儲介質的逐漸磨損,從而使得能夠在故障之前替換磁存儲介質設備以提高存儲到磁存儲介質設備的資料的可靠性或可用性。
以下討論描述了操作環境、可以在該操作環境中採用的技術、以及可以在其中實施操作環境的元件的系統單晶片(SoC)。在本公開的上下文中,僅通過實例的方式參考操作環境。操作環境
圖1示出了具有計算設備102的實例操作環境100,該計算設備102能夠存儲或存取各種形式的資料或資訊。計算設備102的實例可以包括膝上型電腦104、桌上型電腦106、和伺服器108,它們中的任何一個都可以被配置為存儲網路或雲存儲的一部分。計算設備102(未示出)的其他實例可以包括平板電腦、機上盒、資料存放裝置、可穿戴智慧設備、電視、內容流設備、高清多媒體介面(HDMI)媒體棒、智慧家電、家庭自動化控制器、智慧恒溫器、物聯網(IoT)設備、移動互聯網設備(MID)、網路附接存儲(NAS)驅動器、聚合存儲系統、遊戲機、汽車娛樂設備、汽車計算系統、汽車控制模組(例如,發動機或動力傳動系控制模組)等。
通常,計算設備102可以出於任何合適的目的提供、傳送或存儲資料,諸如啟用特定類型的設備的功能、提供使用者介面、啟用網路存取、實現遊戲應用、重播媒體、提供導航、編輯內容、提供資料存儲等。備選地或另外地,計算設備102能夠存儲各種資料,諸如資料庫、使用者資料、多媒體、應用、作業系統等。一個或多個計算設備102可以被配置為提供遠端資料存儲或服務,諸如雲存儲、歸檔、備份、用戶端服務、記錄保留等。
計算設備102包括處理器110和電腦可讀存儲介質(CRM)112。處理器110可以被實現為任何合適類型或數目的處理器,單核或多核(例如,ARM或x86處理器核),以用於執行計算設備102的作業系統或其他程式的指令或命令。CRM 112包括存儲介質114和介質驅動器116。計算設備102的記憶體介質或系統記憶體可以包括易失性記憶體或非易失性記憶體的任何合適類型或組合。例如,計算設備102的易失性記憶體可以包括各種類型的隨機存取記憶體(RAM)、動態RAM(DRAM)、靜態RAM(SRAM)等。非易失性記憶體可以包括唯讀記憶體(ROM)、電可擦除可程式設計ROM(EEPROM)或快閃記憶體(例如,NOR快閃記憶體或NAND快閃記憶體)。該等記憶體可以單獨地或組合地存儲與計算設備102的應用和/或作業系統相關聯的資料。
計算設備102的介質驅動器116可以包括一個或多個介質驅動器,或者可以被實現為與計算設備102相關聯的資料存儲系統的一部分。在該實例中,介質驅動器116包括硬碟驅動器(HDD)118,該硬碟驅動器118能夠存儲資料並且參考用於磁存儲介質的健康管理的各個態樣來描述。備選地或另外地,介質驅動器116可以被配置為任何合適類型的資料存儲驅動器或系統,諸如存放裝置、存儲驅動器、存儲陣列、存儲卷等。儘管參考計算設備102進行了描述,但是介質驅動器116也可以單獨實現為獨立設備或者較大的存儲集合的一部分,諸如資料中心、伺服器群、或虛擬化存儲系統(例如,用於基於雲的存儲或服務),其中實現了用於磁存儲介質的健康管理的各態樣。
計算設備102亦可以包括I/O埠120、圖形處理單元(GPU,未示出)、和資料介面122。通常,I/O埠120允許計算設備102與其他設備、週邊設備、或使用者交互。例如,I/O埠120可以包括通用序列匯流排、人機周邊設備、音訊輸入、音訊輸出等或者與之耦合。GPU處理並渲染計算設備102的圖形相關資料,諸如作業系統的使用者介面元素、應用等。在一些情況下,GPU存取本端存放區器的一部分以渲染圖形,或者GPU包括用於渲染計算設備102的圖形(例如,視訊RAM)的專用記憶體。
計算設備102的資料介面122提供到一個或多個網路以及連接到那些網路的其他設備的連線性。資料介面122可以包括有線介面,諸如用於通過局域網、內聯網、或互聯網傳送的資料的乙太網介面或光纖介面。備選地或另外地,資料介面122可以包括無線介面,該等無線介面有助於通過無線網路(諸如無線局域網(WLAN)、廣域無線網路(WAN,例如,蜂窩網路)、和/或無線個域網(WPAN))進行通信。根據用於磁存儲介質的健康管理的一個或多個態樣,可以將通過I/O埠120或資料介面122傳送的任何資料寫入計算設備102的存儲系統或從計算設備102的存儲系統中讀取。
返回到介質驅動器116,計算設備102可以包括如圖所示的硬碟驅動器118和/或可以針對其實現健康管理的各態樣的其他類型的存儲介質。儘管未示出,但是亦可以預期介質驅動器116的其他配置,諸如固態驅動器(SSD)、磁帶驅動器、光學介質驅動器、HDD/SSD混合驅動器、以及將資料寫入記憶體介質(例如,磁或光學存儲介質)的其他存儲系統。備選地或另外地,計算設備102可以包括介質驅動器的陣列、或者用作其中可以實現健康管理的各態樣的用於多個介質驅動器的介質驅動器聚合設備或主機。
在該實例中,磁碟機118包括磁頭磁盤組件(HDA)124和驅動器控制模組126,以實現或啟用硬碟驅動器118的功能。在某些情況下,驅動器控制模組126被實現為具有半導體設備、邏輯、或其他電路系統的印刷電路板元件(PCBA)。HDA 124包括安裝在集成主軸和馬達(例如,音圈馬達(VCM))元件130上的一個或多個介質磁片128(或碟片)。主軸和馬達元件130可以在與HAD 124的頭元件(未示出)耦合的讀取/寫入頭132下方(或上方)旋轉介質磁片128。介質磁片128可以塗覆有硬磁材料(例如,顆粒表面或薄膜表面),並且可以被寫入單面或雙面或從單面或兩面讀取。讀取/寫入頭132可以與HDA 124的前置放大器/寫入器模組134(pre-amp/寫入器134)可操作地耦合,該前置放大器/寫入器模組134包括前置放大器電路系統和分別用於放大寫入訊號和讀取訊號的其他邏輯。前置放大器/寫入器134可以接收或存儲對於將資料寫入磁介質202或從磁介質202讀取資料有用的頭的選擇、放大、或者感測電流值。
如圖1所示,硬碟驅動器118的實例驅動器控制模組126可以包括存儲介質控制器136、伺服控制單元138、和讀取/寫入通道140(讀取通道140)。存儲介質控制器136使得計算設備102能夠存取介質驅動器116的磁存儲介質的內容,諸如作業系統、應用、或用於應用或其他服務的資料。存儲介質控制器亦可以向介質驅動器的磁存儲介質寫入計算設備102的資料以及從介質驅動器的磁存儲介質讀取計算設備102的資料。通常,驅動器控制模組126可以指導或使用伺服控制單元138來控制機械操作,諸如通過HDA 124的讀取/寫入頭132定位和通過主軸和馬達元件130的轉速控制。
讀取/寫入通道140可以包括數模路徑和類比對數位路徑,分別用於將寫入資料轉換為寫入訊號或將讀取訊號轉換為讀取資料。例如,當從介質磁片128讀取資料時,讀取通道140可以處理和解碼訊號。讀取訊號的該訊號處理和解碼可以包括訊號調節、採樣、均衡、檢測、糾錯等。在整個本公開中,對讀取通道140的實現和使用進行了變化和描述。驅動器控制模組126或者其元件可以被實現為一個或多個IC晶片、系統單晶片、系統級封裝、或者提供有或實現硬碟驅動器控制器的微處理器。驅動器控制模組126亦可以包括驅動電子設備(未示出)和/或包括各種介面,諸如主機匯流排界面、存儲介質介面、主軸介面、或前置放大器/寫入器介面。
在一些態樣,讀取通道140包括或與介質健康管理器142、神經網路144、和介質健康資料146相關聯。介質健康管理器142可以從讀取通道140獲得針對從其中讀取資料的磁存儲介質的磁區的度量。基於由讀取通道140提供的度量,介質健康管理器142可以諸如通過使用神經網路144來確定或更新針對磁存儲介質的一部分或區域的健康得分。可以對該等神經網路144中的一個或多個進行預訓練,以將大量存儲介質度量分類為幾個或若干健康得分,這對於確定磁存儲介質的健康或存儲介質驅動器的健康是有用的。介質健康資料146可以包括針對磁存儲介質的區域或部分先前計算的健康得分,以及針對磁存儲介質的磁區或磁軌的讀取通道度量的平均值。在某些情況下,介質健康管理器142將針對磁存儲介質的部分或區域而被確定的健康得分存儲到介質健康資料146,該介質健康資料146可以是針對磁存儲介質的區域或部分的資訊表的一部分。在整個本公開中,對介質健康管理器142、神經網路144、或介質健康資料146的實現和使用進行了變化和描述。
通過實例的方式,考慮通常在200處示出的圖2(未示出保護外殼),其提供了硬碟驅動器118的實例配置。如圖2所示,硬碟驅動器118的HDA 124包括集成的主軸和馬達元件130,通過主軸和馬達元件130來支撐和/或操作磁存儲介質202的介質磁片128(或碟片)。通常,每個介質磁片128可以被分割或劃分為磁存儲介質202的預定區域或區。在該實例中,介質磁片128的表面204被劃分為或包括三個區域206(例如,圓形帶/環或楔形),該三個區域包括磁存儲介質202的磁軌208和磁區210的相應子集。介質磁片128的其他介質磁片或那些磁片的表面可以被配置為與圖2中所示的那些相似或不同(例如,不同數目的區域)。在一些態樣,介質健康管理器以針對磁存儲介質的一個或多個區域206的區域健康得分卡的形式來維護驅動器健康狀態。
在操作期間,臂212可以操縱,並且因此將讀取/寫入頭132(或多個讀取/寫入頭132)定位在介質磁片128上的磁存儲介質202的所需磁軌208或磁區210上。在各個態樣,讀取/寫入頭132可以包括具有組合或單獨功能(例如,專用R/W功能)的各種數目的頭元件。例如,讀取/寫入頭132可以包括一個或多個讀取器(讀取頭/元素)和一個寫入器(寫入頭/元素)。在其他情況下,讀取/寫入頭132可以包括專用寫入頭(元件)和一個或多個單獨的附加專用讀頭(元件)。備選地或另外地,儘管在圖2中示出了多個臂212,但是HDA 124或主軸和馬達元件可以利用單個臂212或用於定位讀取/寫入頭132的其他合適的結構來實現。
HDA 124和驅動器控制模組126可以單獨地、在單獨的基板上、和/或作為介質驅動器的單獨的PCBA實現。HDA 124和驅動器控制模組126之間傳送的訊號或資料可以通過柔性印刷電纜或其他合適的連接結構(諸如磁軌、連接器、鍵合線、焊球等)攜帶。硬碟驅動器118的HDA 124可以被配置為根據任何合適的記錄技術來執行寫入操作,諸如垂直磁記錄(PMR)、疊片磁記錄(SMR)、熱輔助磁記錄(HAMR)、微波輔助磁記錄(MAMR)等。
圖2亦在214處示出了具有根據一個或多個態樣實現的磁存儲介質202的區域206的介質磁片128的平面圖。在該實例中,碟片216的表面204的磁軌208和磁區210被組織或劃分為三個磁存儲介質的區域,其包括區域1 206-1、區域2 206-2、和區域3 206-3。儘管利用三個區域206示出,但是介質磁片128的碟片216或表面204可以被組織成或包括任何合適數目的區域206,諸如區域1 206-1至區域n 206-n,其中n是任何合適的數目。通常,每個區域206可以被配置為包括表面204的磁存儲介質202的磁軌208和磁區210的子集。在某些情況下,區域206被配置為使得每個區域包括大約相等數目的磁區210或碟片216的表面積。
在磁存儲介質的健康管理的各個態樣中,介質健康管理器142可以維護針對介質磁片128的區域206的健康得分。通常,當存取該區域206的磁區210以從磁存儲介質的磁區210讀取資料時,區域健康得分可以基於由讀取通道140提供的度量而被更新。針對磁存儲介質的區域的健康得分可以指示磁存儲介質的區域的磨損水準、退化水準、或可靠性水準。備選地或另外地,亦可以針對硬碟驅動器118的多個介質磁片128編譯該等區域健康得分,以使得能夠確定針對硬碟驅動器118的驅動器健康得分。
圖3示出了通常在300處的讀取通道和前置放大器的實例配置,其根據用於磁存儲介質的健康管理的一個或多個態樣來實現。在該實例中,介質健康管理器142和類比前端302可操作地與讀取通道140耦合。另外,神經網路144和介質健康資料146可操作地與讀取通道140的介質健康管理器142耦合或可由其存取。儘管在圖3中示出為單獨的元件或電路系統,但讀取通道140和介質健康管理器142可以被集成為在硬碟驅動器118的其他元件之間分開的一個元件,和/或與前置放大器134和/或讀取通道140的其他微電子裝置或電路系統集成。
在該實例中,在從磁存儲介質202(磁介質202)的磁區讀取資料的上下文中描述了讀取通道140和其他元件。例如,主機系統或計算設備102可以發出針對存儲到介質磁片128的一個或多個磁區210的資料的讀取命令。當介質磁片128在讀取頭132下方旋轉時,讀取頭132感測存儲到磁介質202的資料的磁場304,其在讀取頭132處產生類比訊號306。前置放大器134(pre-amp134)放大從讀取頭132接收的類比訊號306,並且將經放大的訊號308提供給讀取通道140的類比前端302。
通常,類比前端302調節並且採樣由前置放大器134提供的經放大的訊號308(例如,回讀連續時間訊號)。讀取通道140將經採樣的訊號轉換為數位訊號並且恢復經解碼的資料310,該經解碼的資料310被提供給存儲介質控制器136。讀取通道140可以包括等化器模組、檢測器模組、適配模組、或增益模組的任何合適的組合,以用於從前置放大器134接收的訊號中檢測、均衡、和/或解碼資料310。結束本實例,存儲控制器136然後可以將經解碼的資料310作為讀取資料312發送到主機介面314,以完成由主機系統或計算設備102發出的讀取命令。
關於各種資料存取操作,諸如針對存儲到介質磁片128的一個或多個磁區210的資料的讀取操作,介質健康管理器142可以實現用於磁存儲介質的健康管理的各個態樣。通常,區域資訊表和/或介質健康資料可以包括與磁存儲介質的特定區域相關聯或可用於存取磁存儲介質的特定區域的校準參數。介質健康管理器142或讀取通道140可以以區域健康得分或得分卡的形式維護磁存儲介質健康的狀態,諸如通過將區域的健康從1(例如,差)到5(例如,優異)進行分級。每當從該特定區域讀取磁區時,就可以更新或重新計算針對區域的健康得分。在某些態樣,介質健康管理器通過從區域的給定磁區的讀取通道獲得各種內部度量來生成或更新健康得分(例如,在讀取操作期間),並且使用機器學習演算法或神經網路基於內部度量來確定健康得分。該等內部度量可以包括未恢復的磁區、重試方法計數、由改錯碼糾正的平均錯誤、對數似然比(LLR)概率密度函數(PDF)統計、同步標記錯誤、各種迴圈錯誤等。
例如,當介質磁片128尋找特定區域206以讀取一個或多個磁區210時,介質健康管理器142可以從介質健康資料146讀取先前計算的區域度量,介質健康資料146可以被實現為區域資訊表的一部分(未示出)。基於針對正在讀取的區域206的磁區210的當前度量,介質健康管理器更新針對該等磁區210的度量的長期和短期平均值。然後,介質健康管理器可以利用神經網路,基於經更新的長期和短期度量來確定針對區域206的健康得分。神經網路可以被預訓練,以將各種各樣的讀取通道度量映射到幾個或若干健康狀況狀態。針對區域206的經更新的健康得分和經更新的度量也可以在退出給定區域時被寫回到介質健康資料146或區域資訊表。
貫穿本公開描述的用於磁存儲介質的健康管理的各個態樣可以由介質健康管理器142來實現,介質健康管理器142與神經網路144(例如,圖4和圖5)或存儲系統控制器或讀取通道的、或與存儲系統控制器或讀取通道相關聯的任何合適的人工智慧(AI)引擎、AI模型、或AI驅動器、或AI驅動器交互。關於處理存儲介質驅動器或系統的各種度量(例如,讀取度量、訊號度量、或機電度量),一個或多個神經網路144可以利用機器學習來實現,該機器學習基於一個或多個神經網路(例如,經預訓練的)以進行介質健康得分、元件磨損估算、或預測驅動器健康。介質健康管理器142的任何AI模型、AI演算法、或神經網路可以包括一組連接的節點,諸如神經元或感知器,它們被組織成一個或多個層。
與介質健康管理器142相關聯的神經網路144的例子可以利用深度神經網路來實現,該深度神經網路包括輸入層、輸出層、以及位於神經網路的輸入層和輸出層之間的一個或多個隱藏的中間層。深度神經網路的每個節點又可以在神經網路的各層之間完全連接或部分連接。神經網路144可以是任何深層神經網路(DNN),諸如包括AlexNet、ResNet、GoogleNet、MobileNet等中的一項的卷積神經網路(CNN)。備選地或另外地,神經網路144可以包括任何合適的遞迴神經網路(RNN)或其任何變型。通常,由介質健康管理器142採用的AI模型或神經網路亦可以包括任何其他監督學習、非監督學習、強化學習演算法等。
在各個態樣中,神經網路144可以被實現為遞迴神經網路,其中節點之間的連接形成迴圈,以保留來自輸入資料序列的先前部分的資訊以用於輸入資料序列的後續部分(例如,讀取通道的內部度量)。備選地,神經網路144可以被實現為前饋神經網路,該前饋神經網路在節點之間具有不形成輸入資料序列之間的迴圈的連接。在其他情況下,介質健康管理器142的神經網路144可以包括具有多層感知器的卷積神經網路(CNN),其中給定層中的每個神經元與相鄰層的所有神經元連接。在某些態樣,神經網路144基於卷積神經網路,該卷積神經網路可以被應用於先前的介質健康得分以預測或預報磁存儲介質的某種形式的後續或未來的健康趨勢。備選地或另外地,神經網路144可以包括或利用各種回歸模型,諸如多個線性回歸模型、單個線性回歸模型、邏輯回歸模型、逐步回歸模型、多變數自我調整回歸模型、局部估計的散點模型等。
通過實例的方式,考慮在其中通常在400處示出了神經網路的實例配置的圖4。根據一個或多個態樣來實現該實例神經網路144,以計算針對磁存儲介質的區域的健康得分。通常,神經網路144被配置為將讀取通道140的內部度量402(讀取度量402)映射或分類到針對磁存儲介質的區域的區域健康得分404。
如圖4所示,神經網路144的輸入可以包括讀取通道140的任何合適數目的內部度量402。在某些態樣,神經網路144被預訓練以將讀取度量402映射到範圍為差、警告、公平、良好、和優異的五個區域健康得分404中的一個區域健康得分。讀取通道140可以生成或可以存取各種各樣的內部度量,這對於計算或確定針對磁存儲介質的區域的健康得分可能有用。在該實例中,讀取度量包括未恢復的磁區率406、平均重試方法率408、偏離磁軌檢測的平均410、尋找錯誤的平均數目412、由改錯碼(ECC)糾正的錯誤的平均數目414、ECC中的平均校驗子(syndrome)權重416、ECC反覆運算的平均次數418、對數似然比(LLR)概率密度函數(PDF)統計的平均420、前端環路訊號的平均均方誤差(MSE)422、檢測到的介質缺陷的平均長度424、類比對數位轉換器(ADC)飽和度的平均長度426、自我調整參數的平均增量428、同步標記(SM)錯誤的平均430、或其他各種度量432。這樣,基於可用于介質健康管理器142的詳細內部度量,與通過小時或磁區重新映射來跟蹤驅動器壽命的傳統技術相比,神經網路144可以以更高的準確性確定預測存儲介質驅動器磨損或可靠性的區域健康得分。
圖5在500處示出了根據一個或多個態樣實現的、用以計算針對磁存儲介質的磁區的故障概率的神經網路的實例配置。在一些態樣,磁區故障的概率針對優化資料的佇列管理或選擇用於解碼磁區的資料的特定管線可能是有用的。例如,讀取通道的前端部分可以將每個磁區分類為三個或五個信噪比水準中的一個,該分類可以由讀取通道的後端部分使用以選擇用於解碼每個磁區的管線,以提高解碼效率。在該實例中,神經網路144被配置為基於前端度量502來針對磁區確定磁區故障的概率504。使用該磁區故障的概率504,讀取通道140的後端可以選擇用於解碼磁區的管線,該管線比因為對解碼磁區的初始嘗試失敗而默認地逐步通過多個管線更可能成功。備選地或另外地,介質健康管理器可以通知服務提供方(例如,雲)該資料很可能無法從低概率磁區獲得,從而使得提供方能夠從另一驅動器獲得所需的資料,而不必等到讀操作最終失敗為止。
如圖5所示,讀取通道140的前端可以生成或可以存取各種各樣的內部度量,這對於計算或確定磁區故障的概率可能有用。在該實例中,前端度量包括對以下的指示:同步標記發現506、同步標記分佈508、檢測到的偏離磁軌510、增量前饋有限衝激回應(FAFIR)濾波器抽頭512、增量FIR-3T抽頭514、基線累加器516、頻率累加器518、來自Vmm和不歸零(NRZ)的相互資訊520、具有各種閾值的Vmm計數522、根據誤差訊號計算的MSE 524、檢測到的缺陷標誌的長度526、增量增益變化528、增量ASC變化530、或其他各種度量532。這樣,基於可用於讀取通道140的詳細內部度量,神經網路144可以預測磁區故障的概率504,該概率對於改變或優化管線選擇以改善對非最優磁區的解碼是有用的。用於磁存儲介質的健康管理的技術
以下討論描述了用於磁存儲介質的健康管理的技術,其使得能夠通過預測或跟蹤磁存儲介質元件的健康(例如,磨損)來提高資料的可靠性或可用性(例如,正常執行時間)。該等技術可以使用本文中所描述的任何環境和實體來實現,諸如讀取通道140、介質健康管理器142、神經網路144、或介質健康資料146。該等技術包括圖6至圖9中所示的方法600至900,每個方法被示出為由一個或多個實體執行的操作集合。
該等方法不必限於相關聯附圖中所示的操作順序。而是,可以重複、跳過、更換、或重新排序任何操作以實現本文描述的各個態樣。此外,該等方法可以全部或部分地彼此結合使用,而不管是由相同實體、單獨實體、亦是它們的任何組合來執行。例如,所描述的方法的各個態樣可以被組合以實現針對磁存儲介質的各種細微性的健康得分,諸如針對磁存儲介質的區域、表面、磁片、或驅動器的相應的健康得分。在以下討論的部分中,將參考圖1的操作環境100、圖2至圖5的實體。這樣的參考不應被視為將所描述的態樣限制為操作環境100、實體、配置、或實現,而是作為各種實例之一的說明。備選地或另外地,方法的操作亦可以由或利用參考圖10的系統單晶片和/或圖11的存儲介質控制器描述的實體實現。
圖6描繪了用於確定針對磁存儲介質的區域的健康得分的實例方法600,包括由或利用讀取通道140、介質健康管理器142、神經網路144、和/或介質健康資料146執行的操作。
在602處,接收用以讀取磁存儲介質的磁區的請求。磁存儲介質的磁區可以駐留在磁存儲介質的區域中。在某些情況下,讀取通道從存儲介質控制器接收對讀取磁區(或來自磁區的資料)的請求。該請求可以是引起從介質磁片或磁存儲介質的碟片的特定磁區讀取多個相應磁區的多個請求中的一個請求。備選地或另外地,介質健康管理器可以從磁存儲介質的多個區域中確定磁區所駐留在的磁存儲介質的區域。
在604處,針對具有讀取通道的磁區確定讀取度量。針對基於請求而被讀取的磁區確定讀取度量。在某些情況下,讀取度量包括讀取通道的內部度量,諸如未恢復的磁區率、平均重試方法率、偏離磁軌檢測的平均、尋找錯誤的平均數目、由改錯碼(ECC)糾正的錯誤的平均數目、ECC中的平均校驗子權重、ECC反覆運算的平均次數、對數似然比(LLR)概率密度函數(PDF)統計的平均、前端環路訊號的平均均方誤差(MSE)、檢測到的介質缺陷的平均長度、類比對數位轉換器(ADC)飽和度的平均長度、自我調整參數的平均增量、或同步標記錯誤的平均。
在606處,磁存儲介質的區域的讀取度量被存取。該等讀取度量可以包括針對區域的磁區的先前確定或計算的讀取度量。在某些情況下,區域資訊表或介質健康資料存儲庫被存取,以獲得區域的讀取度量。通常,該區域的讀取度量可以包括針對正在讀取的磁區以及駐留在磁存儲介質的區域中的其他磁區的相應讀取度量。備選地或另外地,磁區的讀取度量可以包括特定讀取度量的長期平均值和特定讀取度量的短期平均值。
在608處,磁存儲介質的區域的讀取度量基於針對磁存儲介質的磁區而被確定的讀取度量來更新。從該區域讀取的每個磁區的讀取度量可以基於由該磁區的讀取通道提供的當前相應的讀取度量來更新。在某些情況下,更新可以包括更新該磁區的度量的長期平均值和短期平均值兩者。
在610處,利用神經網路針對磁存儲介質的區域來確定健康得分。神經網路基於磁存儲介質的區域的經更新的讀取度量來確定健康得分。神經網路可以被配置或預訓練以將讀取通道的經更新的讀取度量映射到至少三個健康得分分類中的一個健康得分分類,以確定針對磁存儲介質的區域的健康得分。針對磁存儲介質的區域的健康得分可以指示磁存儲介質的區域的磨損水準、退化水準、或可靠性水準。
可選地,在612處,磁存儲介質的區域的健康得分被存儲。針對磁存儲介質的區域的健康得分可以被寫入區域資訊表或介質健康資料存儲庫中。備選地或另外地,針對區域的磁區的經更新的讀取度量也可以被寫回到區域資訊表或介質健康資料存儲庫中。
可選地,在614處,磁存儲介質的區域的健康得分被傳輸到存儲介質控制器。在某些情況下,將磁存儲介質的區域的健康得分發送到存儲介質控制器,使得存儲介質控制器能夠將健康得分與其他度量進行編譯,以確定針對與存儲介質控制器相關聯的介質驅動器或較高水準存儲實體的健康得分。
圖7描繪了用於基於由讀取通道提供的讀取度量的平均值來確定針對區域的健康得分的實例方法700,包括由或利用讀取通道140、介質健康管理器142、神經網路144、和/或介質健康資料146執行的操作。
在702處,針對磁存儲介質的磁區的讀取度量利用讀取通道來確定。磁存儲介質的磁區可以駐留在磁存儲介質的區域中或位於其中。在某些情況下,針對從磁存儲介質的區域讀取的多個磁區,確定相應的讀取度量。備選地或另外地,介質健康管理器可以從磁存儲介質的多個區域中確定磁區所駐留在的磁存儲介質的區域。
在704處,區域的先前確定的讀取度量從區域資訊表中被讀取。通常,區域的先前確定的讀取度量可以包括針對被讀取的磁區以及駐留在磁存儲介質的區域中的其他磁區的相應讀取度量。備選地或另外地,磁區的讀取度量可以包括特定讀取度量的長期平均值和特定讀取度量的短期平均值。
可選地,在706處,區域的讀取度量的短期平均值基於針對磁區而被確定的讀取度量來更新。通常,針對磁區的讀取度量的短期平均值基於讀取通道提供的當前讀取度量來更新。在從區域讀取多個磁區的情況下,針對從該區域讀取的多個磁區中的每個磁區,讀取度量的相應短期平均值可以被更新。
可選地,在708處,區域的讀取度量的長期平均值基於針對所該磁區而被確定的讀取度量來更新。通常,針對磁區的讀取度量的長期平均值基於由讀取通道提供的當前讀取度量來更新。在從區域讀取多個磁區的情況下,針對從該區域讀取的多個磁區中的每個磁區,讀取度量的相應長期平均值可以被更新。
在710處,針對磁存儲介質的區域利用神經網路來確定健康得分。神經網路基於區域的讀取度量的經更新的短期平均值和/或長期平均值來確定健康得分。神經網路可以被配置或預訓練,以將區域的讀取度量的經更新的短期平均值和/或長期平均值映射到至少三個健康得分分類中的一個健康得分分類,以確定針對磁存儲介質的區域的健康得分。針對磁存儲介質的區域的健康得分可以指示磁存儲介質的區域的磨損水準、退化水準、或可靠性水準。
在712處,磁存儲介質的區域的健康得分被存儲到區域資訊表。備選地或另外地,針對磁存儲介質的區域的健康得分被寫入介質健康資料存儲庫。在714處,區域的讀取度量的經更新的短期平均值和長期平均值被存儲到區域資訊表。在某些情況下,區域的讀取度量的經更新的短期平均值和長期平均值可以被寫入介質健康資料存儲庫。
可選地,在716處,磁存儲介質的區域的健康得分被傳輸到存儲介質控制器。在某些情況下,將磁存儲介質的區域的健康得分發送到存儲介質控制器,使得存儲介質控制器能夠將健康得分與其他度量(例如,機電或訊號度量)進行編譯,並且使用組合的度量來確定針對與存儲介質控制器相關聯的介質驅動器或較高水準存儲實體的健康得分。
圖8描繪了根據一個或多個態樣的用於確定存儲介質驅動器健康得分的實例方法800,包括由或利用讀取通道140、介質健康管理器142、神經網路144、和/或介質健康資料146執行的操作。
在802處,從存儲介質驅動器的讀取通道接收針對磁存儲介質的一個或多個區域的相應健康得分。可以從介質健康管理器或與在其上實施或組織區域的介質磁片的碟片或表面相關聯的讀取通道接收相應健康得分。
在804處,從存儲介質驅動器的主軸和音圈馬達元件接收存儲介質驅動器的機電度量。機電度量可以包括與以下有關的任何合適的度量:參數、校準資訊、或與存儲介質驅動器的主軸、音圈馬達、或其他機電元件相關聯的性能資料。
在806處,從存儲介質驅動器的前置放大器接收存儲介質驅動器的訊號度量。訊號度量可以包括前置放大器的各種放大或增益設置。在某些情況下,訊號度量包括針對存儲介質驅動器的磁存儲介質的多個碟片或表面的相應訊號度量。
在808處,針對存儲介質驅動器基於區域的相應健康得分、機電度量、和訊號度量來確定驅動器健康得分。在某些情況下,健康得分、機電度量、或訊號度量中的至少兩項被使用以確定針對存儲介質驅動器的總體或最終健康得分。針對存儲介質驅動器的健康得分可以指示存儲介質驅動器的磨損水準、退化水準、或可靠性水準。
圖9描繪了用於確定針對磁存儲介質的磁區的故障概率的實例方法900,包括由或利用類比前端302、介質健康管理器142、神經網路144、和/或介質健康資料146執行的操作。
在902處,接收用以讀取磁存儲介質的磁區的請求。可以從與磁區所駐留在的媒體磁片相關聯的存儲媒體控制器接收該請求。在某些情況下,存儲介質控制器請求讀取多個磁區,作為從主機系統或計算設備接收的讀取命令的一部分。
在904處,從讀取通道的前端接收針對磁存儲介質的磁區的訊號度量。讀取通道140的前端可以生成或可以存取各種各樣的內部度量,這對於計算或確定磁區故障的概率是有用的。例如,前端度量可以包括對以下的指示:同步標記發現、同步標記分佈、檢測到的偏離磁軌、增量FAFIR濾波器抽頭、增量FIR-3T抽頭、基線累加器、頻率累加器、來自Vmm和NRZ的相互資訊、具有各種閾值的Vmm計數、根據誤差訊號計算的MSE、檢測到的缺陷標誌的長度、增量增益變化、增量ASC變化、或其他各種度量。
在906處,基於該磁區的訊號度量,利用神經網路確定針對該磁區的故障概率。神經網路144可以被配置或預訓練以基於由前端提供的訊號度量來確定磁區故障的概率。
在908處,針對磁區的故障概率被提供給讀取通道的後端。後端可以使用磁區故障的概率來選擇用於磁區的解碼參數,以改善後端的解碼、檢測、或糾錯操作。在某些情況下,讀取通道的後端可以選擇用於解碼磁區的管線,該管線比因為對解碼磁區的初始嘗試失敗而默認地逐步通過多個管線更可能成功。系統單晶片
圖10示出了可以實現用於磁存儲介質的健康管理的各個態樣的實例性系統單晶片(SoC)1000。SoC 1000可以在任何合適的設備中實現,諸如智慧型電話、上網本、平板電腦、接入點、網路附接存儲、相機、智慧電器、印表機、機上盒、伺服器、固態驅動器(SSD)、磁帶驅動器、硬碟驅動器(HDD)、存儲驅動器陣列、記憶體模組、存儲介質控制器、存儲介質介面、磁頭磁盤元件、磁介質前置放大器、汽車計算系統、或任何其他合適類型的設備(例如,本文中所描述的其他設備)。儘管參考SoC進行了描述,但是圖10的實體亦可以被實現為其他類型的積體電路或嵌入式系統,諸如專用積體電路(ASIC)、記憶體控制器、讀取通道元件、存儲控制器、通信控制器、專用標準產品(ASSP)、數位訊號處理器(DSP)、可程式設計SoC(PSoC)、系統級封裝(SiP)、或現場可程式設計閘陣列(FPGA)。
SoC 1000可以與電子電路系統、微處理器、記憶體、輸入-輸出(I/O)控制邏輯、通信介面、固件、和/或可用於提供計算設備或磁存儲系統的功能的軟體集成在一起,諸如本文描述的任何設備或元件(例如,硬碟驅動器)。SoC 1000亦可以包括集成資料匯流排或互連結構(未示出),該集成資料匯流排或互連結構耦合SoC的各種元件以用於元件之間的資料通信或路由。SoC 1000的集成資料匯流排、互連結構或其他元件可以通過外部埠、並行資料介面、串列資料介面、週邊元件介面、或任何其他合適的資料介面來被揭示或被存取。例如,SoC 1000的元件可以通過外部介面或片外資料介面存取或控制外部存儲介質或磁讀取電路系統。
在該實例中,SoC 1000被示出具有各種元件,該等元件包括輸入-輸出(I/O)控制邏輯1002和基於硬體的處理器1004(處理器1004),諸如微處理器、處理器內核、應用處理器、DSP等。SoC 1000亦包括記憶體1006,記憶體1006可以包括RAM、SRAM、DRAM、非易失性記憶體、ROM、一次性可程式設計(OTP)記憶體、多次可程式設計(MTP)記憶體、快閃記憶體、和/或其他合適的電子資料存儲中的任何類型和/或組合。在某些態樣,處理器1004和存儲在記憶體1006上的代碼(例如,固件)被實現為讀取/寫入通道模組或作為存儲介質介面的一部分,以提供與用於磁存儲介質的健康管理相關聯的各種功能。在本公開的上下文中,記憶體1006經由非瞬態訊號來存儲資料、代碼、指令、或其他資訊,並且不包括載波或瞬態訊號。備選地或另外地,SoC 1000可以包括用於存取附加的或可擴展的片外存儲介質(諸如磁記憶體或固態記憶體(例如,快閃記憶體或NAND記憶體))的資料介面(未示出)。
SoC 1000亦可以包括固件1008、應用、程式、軟體、和/或作業系統,其可以被實施為保持在記憶體1006上的處理器可執行指令,以由處理器1004執行來實現SoC 1000的功能。在該實例中,根據一個或多個態樣,SoC 1000包括前置放大器介面1010,以接收與從磁存儲介質的磁區讀取的資料相對應的訊號。SoC 1000亦可以包括其他通信介面,諸如用於控制本端片上(未示出)或片外通信收發器的組件或與本端片上(未示出)或片外通信收發器的元件通信的收發器介面。備選地或另外地,收發器介面亦可以包括或實現訊號介面,以在片外傳送射頻(RF)、中頻(IF)、或基頻頻率訊號,以促進通過耦合到SoC 1000的收發器、實體層收發器(PHY)、或者介質存取控制器(MAC)進行有線或無線通訊。例如,SoC 1000可以包括收發器介面,該收發器介面被配置為使得能夠通過有線或無線網路進行存儲,諸如提供具有介質健康管理特徵的網路附接存儲(NAS)設備。
SoC 1000亦包括類比前端302和讀取通道邏輯1012(例如,前端部分),以用於處理通過前置放大器介面1010從前置放大器接收的訊號。通常,類比前端302調節和採樣由前置放大器提供的讀取訊號(例如,讀回連續時間訊號)。讀取通道邏輯1012可以包括等化器模組、檢測器模組、適配模組、或增益模組的任何合適的組合,以用於從前置放大器接收的讀取訊號中檢測、均衡、和解碼資料。在一些態樣,SoC 1000包括介質健康管理器142、神經網路144、和介質健康資料146,它們可以如圖所示單獨地實現,或與處理元件或資料介面組合。備選地或另外地,SoC 1000可以包括到存儲介質控制器或磁介質磁碟機的主軸/馬達元件的介面。
如本文中所描述,介質健康管理器可以從讀取通道接收讀取度量(例如,內部讀取通道或類比前端度量),並且基於該等度量和/或使用神經網路來確定或更新磁存儲介質區域的健康得分,以實現用於磁存儲介質的健康管理的各個態樣。如參考本文所呈現的各個態樣所描述的,該等實體中的任何實體可以被實施為不同的或組合的元件。參考圖1的環境100的相應元件或實體或圖2至圖5所示的相應配置來描述該等元件和/或實體、或相應功能的實例。介質健康管理器142可以全部或部分地被實現為由記憶體1006維護並且由處理器1004執行的數位邏輯、電路系統、和/或處理器可執行指令,以實現用於磁存儲介質的健康管理的各個態樣或特徵。
介質健康管理器142可以獨立地或者與任何合適的元件或電路系統組合地實現,以實現本文描述的態樣。例如,介質健康管理器可以被實現為DSP、處理器/存儲橋、I/O橋、圖形處理單元、記憶體控制器、存儲控制器、算數邏輯單位(ALU)等的一部分。亦可以與SoC 1000的其他實體集成地提供介質健康管理器142,諸如與SoC 1000的處理器1004、記憶體1006、存儲介質介面、或固件1008集成。備選地或另外地,介質健康管理器和/或SoC 1000的其他元件可以被實現為硬體、固件、固定邏輯電路系統、或其任何組合。
作為另一實例,考慮圖11,其示出了根據用於磁存儲介質的健康管理的一個或多個態樣的實例存儲介質控制器1100。通常,存儲介質控制器1100使得計算設備102能夠存取磁存儲介質的內容,諸如作業系統、應用、或用於應用或其他服務的資料。存儲介質控制器亦可以向與控制器相關聯的磁存儲介質寫入計算設備102的資料以及從該磁存儲介質讀取計算設備102的資料。
在各個態樣,存儲介質控制器1100或其元件的任何組合可以被實現為存儲驅動器控制器(例如,HDD控制器或HDD晶片組)、存儲介質控制器、NAS控制器、存儲介質介面、存儲介質端點、存儲介質目標、或用於磁存儲介質、固態存儲介質等的存儲聚合控制器(例如,混合SSD/HDD存儲系統)。在某些情況下,類似于或利用如參考圖10或圖1所描述的SoC 1500的元件(例如,存儲介質控制器136)來實現存儲介質控制器1100。換言之,SoC 1000的例子可以被配置為存儲介質控制器(或控制器的子系統),諸如用以管理磁存儲介質的存儲介質控制器1100。在該實例中,存儲介質控制器1100包括輸入-輸出(I/O)控制邏輯1102和處理器1104,諸如微處理器、微控制器、處理器內核、應用處理器、DSP等。存儲介質控制器亦包括主機介面1106(例如,SATA、PCIe、NVMe、或Fabric介面)和存儲介質介面1108(例如,磁介質介面或磁頭磁盤元件(HDA)介面),其使得能夠分別存取主機系統(或結構)和存儲介質。在該實例中,存儲介質介面包括主軸/VCM介面1110、前置放大器介面1112、以及讀取/寫入通道介面1114的單獨例子,使得能夠與介質驅動器的磁頭磁盤元件和讀取通道通信。如圖11所示,存儲介質控制器1100亦可包括伺服控制單元138。在某些情況下,伺服控制單元可操作地耦合到主軸介面1110,並且提供主軸或音圈控制以用於媒體驅動器操作。
在一些態樣,當管理或啟用對耦合到存儲介質介面1108的存儲介質(例如,介質磁片)的存取時,存儲介質控制器1100實現用於磁存儲介質的健康管理的各態樣。在該實例中,存儲介質控制器1100包括驅動器健康管理器1016,該驅動器健康管理器1016可以包括針對磁存儲介質的多個區域的介質健康資料146。在一些態樣,驅動器健康管理器1016通過讀取/寫入通道介面1114從讀取/寫入通道接收讀取度量或區域健康得分。使用來自多個介質磁片或介質磁片表面的讀取度量或區域健康得分,驅動器健康管理器1016可以確定或更新針對介質驅動器的磁存儲介質(例如,多個磁片)的健康得分(例如,HDD的總體健康得分)。因此,驅動器健康管理器1016可以監測和跟蹤跨介質驅動器的磁存儲介質的多個磁片或表面的相應健康得分。備選地或另外地,驅動器健康管理器1016可以基於那些磁片或表面的相應健康得分來管理對特定磁片或表面的存取。例如,如果介質驅動器的一個磁片具有差的健康得分,則驅動器健康管理器1016可以將資料存取引導到介質驅動器的其他磁片(例如,具有較好的健康得分),以提高介質驅動器的資料可靠性和可用性(例如,正常執行時間)。在一些態樣,處理器1104和存儲介質控制器1100的固件或邏輯被實現為提供與用於磁存儲介質的健康管理相關聯的各種資料寫入或處理功能。
存儲介質控制器1100的驅動器健康管理器1016可以如圖所示單獨實現,或與處理器1104、讀取/寫入通道介面1114、或存儲介質介面1108組合實現。根據各個態樣,驅動器健康管理器1016可以通過讀取/寫入通道介面1114接收來自讀取通道的區域健康得分,通過前置放大器介面1112接收來自前置放大器的訊號度量,或從主軸/VCM介面1110接收來自主軸和VCM組件的機電度量。驅動器健康管理器1016可以編譯區域健康得分、訊號度量、和/或機電度量,並且計算其中實施存儲介質控制器1100的HDD的總體介質驅動器健康得分。該介質驅動器健康得分可以指示HDD的內部元件的總體磨損量或HDD的可靠性,使得能夠在HDD失敗之前替換HDD或將資料移轉(或重定向)到另一HDD。參考圖1的環境100的各個元件或實體或圖2至圖5所示的相應配置來描述該等元件和/或實體、或對應功能的實例。驅動器健康管理器1016(或介質健康管理器142)全部或部分可以被實現為處理器可執行指令,該等處理器可執行指令由控制器的記憶體維護並且由處理器1104執行以實現用於磁存儲介質的健康管理的各個態樣和/或特徵。
儘管已經用特定於結構特徵和/或方法操作的語言描述了主題,但是應當理解,所附權利要求書中定義的主題不必限於本文所描述的具體實例、特徵、或操作,包括其執行的順序。
100:操作環境 102:計算設備 104:膝上型電腦 106:桌上型電腦 108:伺服器 110:處理器 112:電腦可讀存儲介質 114:存儲介質 116:介質驅動器 118:硬碟驅動器 120:I/O埠 122:資料介面 124:磁頭磁盤組件(HDA) 126:驅動器控制模組 128:介質磁片(碟片) 130:主軸和馬達元件 132:讀取/寫入頭 134:前置放大器/寫入器模組 136:存儲介質控制器 138:伺服控制單元 140:讀取/寫入通道(讀取通道) 142:介質健康管理器 144:神經網路 146:介質健康資料 202:磁存儲介質 204:表面 206:區域 206-1~206-n:區域 208:磁軌 210:磁區 212:臂 216:碟片 302:類比前端 304:磁場 306:類比訊號 308:經放大的訊號 310:經解碼的資料 312:讀取資料 314:主機介面 402:內部度量 404:區域健康得分 406:未恢復的磁區率 408:平均重試方法率 410:偏離磁軌檢測的平均 412:尋找錯誤的平均數目 414:由改錯碼(ECC)糾正的錯誤的平均數目 416:ECC中的平均校驗子權重 418:ECC反覆運算的平均次數 420:對數似然比(LLR)概率密度函數(PDF)統計的平均 422:前端環路訊號的平均均方誤差(MSE) 424:檢測到的介質缺陷的平均長度 426:類比對數位轉換器(ADC)飽和度的平均長度 428:自我調整參數的平均增量 430:同步標記(SM)錯誤的平均 432:其他各種度量 502:前端度量 504:磁區故障的概率 506:同步標記發現 508:同步標記分佈 510:檢測到的偏離磁軌 512:增量前饋有限衝激回應(FAFIR)濾波器抽頭 514:增量FIR-3T抽頭 516:基線累加器 518:頻率累加器 520:來自Vmm和不歸零(NRZ)的相互資訊 522:Vmm計數 524:根據誤差訊號計算的MSE 526:檢測到的缺陷標誌的長度 528:增量增益變化 530:增量ASC變化 532:其他各種度量 1000:系統單晶片(SoC) 1002:輸入-輸出(I/O)控制邏輯 1004:基於硬體的處理器(處理器) 1006:記憶體 1008:固件 1010:前置放大器介面 1012:讀取通道邏輯 1016:驅動器健康管理器 1100:存儲介質控制器 1102:I/O控制邏輯 1104:處理器 1106:主機介面 1108:存儲介質介面 1110:主軸/VCN介面 1112:前置放大器介面 1114:讀取/寫入通道介面
用於磁存儲介質的健康管理的一個或多個實現的細節在附圖和下面的具體實施方式中闡述。在附圖中,附圖標記的最左邊的數位識別碼該附圖標記首次出現的附圖。在說明書和附圖的不同例子中使用相同的附圖標記表示相似的元素: 圖1示出了根據一個或多個態樣的具有在其中實現了磁存儲介質的設備的實例操作環境。 圖2示出了圖1所示的硬碟驅動器的實例配置。 圖3示出了根據用於磁存儲介質的健康管理的一個或多個態樣的讀取通道和前置放大器的實例配置。 圖4示出了可以被實現以計算針對磁存儲介質的區域的健康得分的神經網路的實例配置。 圖5示出了可以被實現以計算針對磁存儲介質的磁區的故障概率的神經網路的實例配置。 圖6描繪了用於確定針對磁存儲介質的區域的健康得分的實例方法。 圖7描繪了用於基於由讀取通道提供的讀取度量的平均值來確定針對區域的健康得分的實例方法。 圖8描繪了根據一個或多個態樣的用於確定存儲介質驅動器健康得分的實例方法。 圖9描繪了用於確定針對磁存儲介質的磁區的故障概率的實例方法。 圖10示出了用於實現用於磁存儲介質的健康管理的各態樣的實例系統單晶片(SoC)環境。 圖11示出了被配置為在與控制器相關聯的存儲介質驅動器中實現健康管理的各個態樣的實例存儲介質控制器。
132:讀取/寫入頭
134:前置放大器
136:存儲介質控制器
140:讀取通道
142:介質健康管理器
144:神經網路
146:介質健康資料
202:磁存儲介質
302:類比前端
304:磁場
306:類比訊號
308:經放大的訊號
310:經解碼的資料
312:讀取資料
314:主機介面

Claims (20)

  1. 一種用於管理磁存儲介質的健康的方法,該方法包括: 接收用以讀取磁存儲介質的一磁區的一請求,磁存儲介質的該磁區駐留在磁存儲介質的一區域中; 利用一讀取通道,確定基於該請求而被讀取的該磁存儲介質的該磁區之讀取度量; 存取磁存儲介質的該區域的讀取度量; 基於磁存儲介質的該磁區之被確定的該讀取度量,更新磁存儲介質的該區域的該讀取度量,以提供磁存儲介質的該區域之經更新的讀取度量;以及 利用一神經網路,基於磁存儲介質的該區域之該經更新的讀取度量,確定磁存儲介質的該區域之一健康得分。
  2. 如請求項1之方法,進一步包括: 將磁存儲介質的該區域之該健康得分存儲到一區域資訊表;或 將磁存儲介質的該區域之該健康得分傳輸到一存儲介質控制器。
  3. 如請求項1之方法,其中: 存取磁存儲介質的該區域之該讀取度量包括:從一區域資訊表讀取該讀取度量的相應平均值;以及 更新磁存儲介質的該區域的該讀取度量包括:基於磁存儲介質的該磁區之被確定的該讀取度量,更新該讀取度量的該相應平均值。
  4. 如請求項3之方法,其中: 該讀取度量的該相應平均值包括:該讀取度量的相應短期平均值和該讀取度量的相應長期平均值;以及 更新磁存儲介質的該區域的該讀取度量包括:基於磁存儲介質的該磁區之被確定的該讀取度量,更新該讀取度量的該相應短期平均值和該讀取度量的該相應長期平均值。
  5. 如請求項1之方法,其中該讀取通道是一存儲介質驅動器的一讀取通道,並且該方法進一步包括: 從該存儲介質驅動器的一主軸和音圈馬達元件接收該存儲介質驅動器之機電度量;或者 從該存儲介質驅動器的一前置放大器接收該存儲介質驅動器之訊號度量;以及 基於該區域的該健康得分、該機電度量、或該訊號度量中的至少兩項,確定該存儲介質驅動器之一驅動器健康得分。
  6. 如請求項1之方法,其中磁存儲介質的該區域之該健康得分係指示磁存儲介質的該區域的一磨損水準、一退化水準、或一可靠性水準。
  7. 如請求項1之方法,其中磁存儲介質的該區域對應於一磁存儲介質磁片的碟片表面上的磁軌的至少三個子集中的第一子集。
  8. 如請求項1之方法,其中所述磁存儲介質的該磁區之該讀取度量包括以下中的一項或多項:未恢復的磁區率、平均重試方法率、偏離磁軌檢測的平均、尋找錯誤的平均數目、由改錯碼(ECC)糾正的錯誤的平均數目、ECC中的平均校驗子權重、ECC反覆運算的平均次數、對數似然比(LLR)概率密度函數(PDF)統計的平均、前端環路訊號的平均均方誤差(MSE)、檢測到的介質缺陷的平均長度、類比對數位轉換器(ADC)飽和度的平均長度、自我調整參數的平均增量、或同步標記錯誤的平均。
  9. 如請求項1之方法,其中該神經網路包括一預訓練的神經網路,該預訓練的神經網路被配置為:將該讀取通道的該讀取度量映射到至少三個健康得分分類中的一個健康得分分類,以確定磁存儲介質的該區域之該健康得分。
  10. 一種裝置,包括: 一介面,用以與一主機傳送資料; 一磁存儲介質的磁片,用以存儲該資料; 一讀取通道,用以從該磁存儲介質的磁區讀取該資料; 一神經網路,用以確定介質健康得分;以及 一介質健康管理器,被配置為: 利用該讀取通道,確定從中讀取出該資料之該磁存儲介質的磁區之讀取度量; 從磁存儲介質的多個區域中,確定該磁區所駐留的磁存儲介質的一區域,磁存儲介質的每個區域係對應於磁存儲介質的該磁片上的磁軌的一相應子集; 存取磁存儲介質的該區域的讀取度量; 基於磁存儲介質的該磁區之被確定的該讀取度量,更新磁存儲介質的該區域的該讀取度量,以提供磁存儲介質的該區域之經更新的讀取度量;以及 利用該神經網路,基於磁存儲介質的該區域的該經更新的讀取度量來確定磁存儲介質的該區域之一健康得分。
  11. 如請求項10之裝置,其中該介質健康管理器進一步被配置為: 將磁存儲介質的該區域的該健康得分存儲到一區域資訊表;或者 將磁存儲介質的該區域的該健康得分傳輸到該裝置的一存儲介質控制器。
  12. 如請求項10之裝置,其中: 為存取磁存儲介質的該區域的該讀取度量,該介質健康管理器進一步被配置以從一區域資訊表讀取該讀取度量的相應平均值;以及 為更新磁存儲介質的該區域之該讀取度量,該介質健康管理器進一步被配置以基於磁存儲介質的該磁區之被確定的該讀取度量更新該讀取度量的該相應平均值。
  13. 如請求項10之裝置,其中該裝置進一步包括: 一主軸和音圈馬達組件,其與磁存儲介質的該磁片相關聯; 一前置放大器,用以放大由與磁存儲介質的該磁片相關聯的一讀取頭所生成的讀取訊號;以及 該介質健康管理器係進一步配置以: 從該主軸和音圈馬達元件接收該裝置的該磁片之機電度量;或者 從該前置放大器接收該裝置的該磁片之訊號度量;以及 基於磁存儲介質的該區域的該健康得分、該機電度量、或該訊號度量中的至少兩項,確定該裝置之一健康得分。
  14. 如請求項10之裝置,其中所述磁存儲介質的該磁區之該讀取度量包括以下中的一項或多項:未恢復的磁區率、平均重試方法率、偏離磁軌檢測的平均、尋找錯誤的平均數目、由改錯碼(ECC)糾正的錯誤的平均數目、ECC中的平均校驗子權重、ECC反覆運算的平均次數、對數似然比(LLR)概率密度函數(PDF)統計的平均、前端環路訊號的平均均方誤差(MSE)、檢測到的介質缺陷的平均長度、類比對數位轉換器(ADC)飽和度的平均長度、自我調整參數的平均增量、或同步標記錯誤的平均。
  15. 如請求項10之裝置,其中該神經網路包括一預訓練的神經網路,該預訓練的神經網路被配置以將該讀取通道的該讀取度量映射到至少三個健康得分分類中的一個健康得分分類,以確定磁存儲介質的該區域之該健康得分。
  16. 一種系統單晶片(System on Chip,SoC),包括: 一前置放大器介面,用以接收與從磁存儲介質的磁區讀取的資料相對應的訊號; 讀取通道邏輯,用以處理與從磁存儲介質的該磁區讀取的該資料相對應的該訊號; 一基於硬體的處理器; 一記憶體,其存儲處理器可執行指令,所述處理器可執行指令回應於由該基於硬體的處理器的執行而實現一介質健康管理器以: 利用該讀取通道邏輯,確定從中讀取出該資料的該磁存儲介質的磁區之讀取度量; 從磁存儲介質的多個區域中,確定該磁區所駐留的磁存儲介質的一區域,磁存儲介質的每個區域係對應於磁存儲介質的磁片上的磁軌的一相應子集; 存取磁存儲介質的該區域的讀取度量; 基於磁存儲介質的該磁區之被確定的該讀取度量,更新磁存儲介質的該區域的該讀取度量,以提供磁存儲介質的該區域之經更新的讀取度量;以及 利用該神經網路,基於磁存儲介質的該區域之該經更新的讀取度量,確定磁存儲介質的該區域之健康得分。
  17. 如請求項16之系統單晶片(SoC),其中該介質健康管理器進一步被實現以: 將磁存儲介質的該區域的該健康得分存儲到一區域資訊表;或 將磁存儲介質的該區域的該健康得分傳輸到該裝置的一存儲介質控制器。
  18. 如請求項16之系統單晶片(SoC),其中: 為存取磁存儲介質的該區域之該讀取度量,該介質健康管理器進一步被實現為:從一區域資訊表讀取該讀取度量的相應平均值;以及 為更新磁存儲介質的該區域之該讀取度量,該介質健康管理器進一步被實現為:基於磁存儲介質的該磁區之被確定的該讀取度量,更新該讀取度量的該相應平均值。
  19. 如請求項16之系統單晶片(SoC),其中所述磁存儲介質的該磁區之該讀取度量包括以下中的一項或多項:未恢復的磁區率、平均重試方法率、偏離磁軌檢測的平均、尋找錯誤的平均數目、由改錯碼(ECC)糾正的錯誤的平均數目、ECC中的平均校驗子權重、ECC反覆運算的平均次數、對數似然比(LLR)概率密度函數(PDF)統計的平均、前端環路訊號的平均均方誤差(MSE)、檢測到的介質缺陷的平均長度、類比對數位轉換器(ADC)飽和度的平均長度、自我調整參數的平均增量、或同步標記錯誤的平均。
  20. 如請求項16之系統單晶片(SoC),其中該神經網路包括一預訓練的神經網路,該預訓練的神經網路被配置為:將該讀取通道的該讀取度量映射到至少五個健康得分分類中的一個健康得分分類,以確定磁存儲介質的該區域之該健康得分。
TW109101526A 2019-01-31 2020-01-16 用於磁存儲介質的健康管理 TWI845597B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201962799608P 2019-01-31 2019-01-31
US62/799,608 2019-01-31
US16/737,174 2020-01-08
US16/737,174 US11450348B2 (en) 2019-01-31 2020-01-08 Health management for magnetic storage media

Publications (2)

Publication Number Publication Date
TW202046297A true TW202046297A (zh) 2020-12-16
TWI845597B TWI845597B (zh) 2024-06-21

Family

ID=

Also Published As

Publication number Publication date
CN111508532A (zh) 2020-08-07
KR20200095364A (ko) 2020-08-10
US11450348B2 (en) 2022-09-20
EP3690883A1 (en) 2020-08-05
US20200251143A1 (en) 2020-08-06
CN111508532B (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN111508532B (zh) 用于磁存储介质的健康管理
US10114716B2 (en) Virtual failure domains for storage systems
CN116312657A (zh) 用于磁存储介质的码字交织
US8885287B1 (en) Method and apparatus for prevention of Fe contamination with oxygen mixture in a hard disk drive
US9837115B1 (en) Unequal error correction code in multi-track recording
US20150109700A1 (en) Shingled magnetic recording system with adaptive write buffer area
US20130027800A1 (en) Method of tuning skew between read head and write head and storage device thereof
US20230020009A1 (en) Health Management for Magnetic Storage Media
US11237893B2 (en) Use of error correction-based metric for identifying poorly performing data storage devices
CN111344788B (zh) 基于设备群体数据完整性共享的系统级纠错编码分配
US10275309B2 (en) Multi-layer integrated zone partition system error correction
TWI845597B (zh) 用於磁存儲介質的健康管理
US10790933B1 (en) Constrained receiver parameter optimization
US11593204B2 (en) Fleet health management device classification framework
US7885024B2 (en) Oscillation test for off track write
US20180012627A1 (en) Managing far and near track erasure by dynamic control of a write current parameter of a magnetic disk drive
US10552252B2 (en) Patterned bit in error measurement apparatus and method
US20150116860A1 (en) System and methods for combining multiple offset read-backs
US9390751B1 (en) Reducing overcounting of track-level damage caused by adjacent-track and far-track interference
Coughlin et al. Fundamentals of Hard Disk Drives
US8730606B1 (en) Read channel error correction using multiple calibrators
US11341989B2 (en) Read head stress reduction
US11386921B2 (en) Read head stress reduction
US10969969B2 (en) Use of recovery behavior for prognosticating and in-situ repair of data storage devices
US10319404B1 (en) Positioning shuttle cars in a tape storage shuttle complex