CN111508532B - 用于磁存储介质的健康管理 - Google Patents
用于磁存储介质的健康管理 Download PDFInfo
- Publication number
- CN111508532B CN111508532B CN202010076783.7A CN202010076783A CN111508532B CN 111508532 B CN111508532 B CN 111508532B CN 202010076783 A CN202010076783 A CN 202010076783A CN 111508532 B CN111508532 B CN 111508532B
- Authority
- CN
- China
- Prior art keywords
- storage medium
- read
- magnetic storage
- region
- metrics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000036541 health Effects 0.000 title claims abstract description 248
- 238000013528 artificial neural network Methods 0.000 claims abstract description 73
- 238000000034 method Methods 0.000 claims description 44
- 230000015654 memory Effects 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 14
- 230000007774 longterm Effects 0.000 claims description 14
- 238000012937 correction Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 8
- 101000606504 Drosophila melanogaster Tyrosine-protein kinase-like otk Proteins 0.000 claims description 7
- 230000006978 adaptation Effects 0.000 claims description 7
- 230000007547 defect Effects 0.000 claims description 7
- 230000015556 catabolic process Effects 0.000 claims description 6
- 238000006731 degradation reaction Methods 0.000 claims description 6
- 208000011580 syndromic disease Diseases 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims 3
- 230000000750 progressive effect Effects 0.000 abstract 1
- 238000007726 management method Methods 0.000 description 29
- 238000013500 data storage Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000013473 artificial intelligence Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 239000007787 solid Substances 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000003750 conditioning effect Effects 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000000696 magnetic material Substances 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 238000004377 microelectronic Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000005195 poor health Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 229910000679 solder Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/18—Error detection or correction; Testing, e.g. of drop-outs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B5/00—Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
- G11B5/455—Arrangements for functional testing of heads; Measuring arrangements for heads
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/36—Monitoring, i.e. supervising the progress of recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B5/00—Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
- G11B5/62—Record carriers characterised by the selection of the material
- G11B5/64—Record carriers characterised by the selection of the material comprising only the magnetic material without bonding agent
- G11B5/66—Record carriers characterised by the selection of the material comprising only the magnetic material without bonding agent the record carriers consisting of several layers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/08—Error detection or correction by redundancy in data representation, e.g. by using checking codes
- G06F11/10—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
- G06F11/1008—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices
- G06F11/1044—Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's in individual solid state devices with specific ECC/EDC distribution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2263—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0616—Improving the reliability of storage systems in relation to life time, e.g. increasing Mean Time Between Failures [MTBF]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0619—Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0653—Monitoring storage devices or systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0674—Disk device
- G06F3/0676—Magnetic disk device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
- G11B20/10305—Improvement or modification of read or write signals signal quality assessment
- G11B20/10472—Improvement or modification of read or write signals signal quality assessment derived from statistics of other quality measures, e.g. their mean, variance or skew
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
- G11B20/10481—Improvement or modification of read or write signals optimisation methods
- G11B20/10518—Improvement or modification of read or write signals optimisation methods using neural networks
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B5/00—Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
- G11B5/012—Recording on, or reproducing or erasing from, magnetic disks
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/18—Error detection or correction; Testing, e.g. of drop-outs
- G11B2020/1869—Preventing ageing phenomena from causing data loss, e.g. by monitoring the age of record carriers or by recognising wear, and by copying information elsewhere when a record carrier becomes unreliable
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Computer Hardware Design (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Debugging And Monitoring (AREA)
- Digital Magnetic Recording (AREA)
Abstract
本公开描述了用于磁存储介质的健康管理的各方面。在一些方面,介质健康管理器利用读取通道来确定针对磁存储介质的扇区的读取度量,磁存储介质的该扇区驻留在磁存储介质的区域中。介质健康管理器访问区域的读取度量,并且基于针对扇区而被确定的读取度量,来更新区域的读取度量,以提供针对磁存储介质的区域的经更新的读取度量。然后,基于磁存储介质的区域的经更新的读取量度,针对磁存储介质的区域的健康得分利用神经网络而被确定。通过这样做,磁存储介质的逐渐磨损可以使用健康得分而被预测,从而使得能够在无法提高存储到设备的数据的可靠性或可用性之前替换磁存储介质设备。
Description
相关申请的交叉引用
本申请要求于2019年1月31日提交的美国临时专利申请No.62/799,608的优先权以及2020年1月8日递交的美国专利申请No.16/737,174的优先权,该两件美国申请的公开内容通过引用整体并入本文。
背景技术
电子设备为现代社会提供许多服务。这些服务使得电子设备能够提供娱乐、帮助科学研究和开发、并且提供许多现代便利。这些服务中的许多服务创建或使用电子设备存储的数据。该数据可以包括诸如书籍或电影的数字媒体、执行复杂模拟的算法、个人用户数据、应用等。为了避免超出数据存储限制,增加电子设备的数据存储容量并且避免删除数据、限制服务、或购买附加的外部存储设备是有益的。
许多电子设备使用介质驱动器来将数据存储在磁盘上,诸如硬盘驱动器(HDD)。通常,当磁盘高速旋转时,通过在介质磁盘的表面上移动读取元素或写入元素来访问存储到HDD的数据。这样,HDD是由互连的机械、电气、和磁部件组成的复杂系统,这些部件协同操作以促进数据的存储和访问。在灾难性事件(诸如跌落)之外,HDD的这些机械、电气、和磁部件在HDD的操作寿命期间会逐渐磨损,直到部件中的一个部件的严重故障阻止了数据访问。如果不知道随着时间的流逝发生了多少磨损,HDD可能在替换或数据备份之前意外失败,从而导致数据的丢失或数据存储服务的正常运行时间减少。
发明内容
提供本发明内容是为了介绍在具体实施方式和附图中进一步描述的主题。因此,本发明内容不应被认为描述基本特征,也不应被用于限制所要求保护的主题的范围。
在一些方面,磁存储介质的介质健康管理器实现一种方法,该方法接收针对读取磁存储介质的扇区的请求,磁存储介质的该扇区驻留在磁存储介质的区域中。该方法利用读取通道,针对基于该请求而被读取的磁存储介质的扇区来确定读取度量。该方法包括:访问磁存储介质的区域的读取度量,并且基于针对扇区而被确定的读取度量,来更新区域的读取度量,以提供针对磁存储介质的区域的经更新的读取度量。然后,该方法利用神经网络,基于针对磁存储介质的区域的经更新的读取度量来确定针对磁存储介质的区域的健康得分。
在其他方面,一种装置,包括:接口,用以与主机传送数据;磁存储介质的磁盘,用以存储数据;读取通道,用以从磁存储介质的扇区读取数据;以及神经网络,用以确定介质健康得分。该装置还包括介质健康管理器,该介质健康管理器被配置为利用读取通道,针对数据从其中被读取的磁存储介质的扇区来确定读取度量。介质健康管理器还可以从磁存储介质的多个区域中,确定扇区所驻留的磁存储介质的区域。磁存储介质的每个区域可以对应于磁存储介质的磁盘上的磁道的相应子集。介质健康管理器访问磁存储介质的区域的读取度量,并且基于针对扇区而被确定的读取度量,来更新区域的读取度量,以提供针对磁存储介质的区域的经更新的读取度量。然后,介质健康管理器利用神经网络,基于磁存储介质的区域的经更新的读取度量来确定针对磁存储介质的区域的健康得分。
在其他方面,描述了一种片上系统(SoC),其包括前置放大器接口,用以接收与从磁存储介质的扇区被读取的数据相对应的信号。SoC还包括读取通道逻辑,用以处理与从磁存储介质的扇区被读取的数据相对应的信号;基于硬件的处理器;和存储器,该存储器存储处理器可执行指令,该存储处理器可执行指令用以实现介质健康管理器。介质健康管理器利用读取通道逻辑,针对数据从其中被读取的磁存储介质的扇区来确定读取度量。介质健康管理器还可以从磁存储介质的多个区域中,确定扇区所驻留的磁存储介质的区域。磁存储介质的每个区域可以对应于磁存储介质的磁盘上的磁道的相应子集。介质健康管理器访问磁存储介质的区域的读取度量,并且基于针对扇区而被确定的读取度量,来更新区域的读取度量,以提供针对磁存储介质的区域的经更新的读取度量。然后,介质健康管理器利用神经网络,基于磁存储介质的区域的经更新的读取度量,来确定针对磁存储介质的区域的健康得分。
在附图和以下描述中阐述了一个或多个实现的细节。根据说明书和附图以及权利要求,其他特征和优点将显而易见。
附图说明
用于磁存储介质的健康管理的一个或多个实现的细节在附图和下面的具体实施方式中阐述。在附图中,附图标记的最左边的数字标识该附图标记首次出现的附图。在说明书和附图的不同实例中使用相同的附图标记表示相似的元素:
图1示出了根据一个或多个方面的具有在其中实现了磁存储介质的设备的示例操作环境。
图2示出了图1所示的硬盘驱动器的示例配置。
图3示出了根据用于磁存储介质的健康管理的一个或多个方面的读取通道和前置放大器的示例配置。
图4示出了可以被实现以计算针对磁存储介质的区域的健康得分的神经网络的示例配置。
图5示出了可以被实现以计算针对磁存储介质的扇区的故障概率的神经网络的示例配置。
图6描绘了用于确定针对磁存储介质的区域的健康得分的示例方法。
图7描绘了用于基于由读取通道提供的读取度量的平均值来确定针对区域的健康得分的示例方法。
图8描绘了根据一个或多个方面的用于确定存储介质驱动器健康得分的示例方法。
图9描绘了用于确定针对磁存储介质的扇区的故障概率的示例方法。
图10示出了用于实现用于磁存储介质的健康管理的各方面的示例片上系统(SoC)环境。
图11示出了被配置为在与控制器相关联的存储介质驱动器中实现健康管理的各个方面的示例存储介质控制器。
具体实施方式
跟踪硬盘驱动器(HDD)磨损或预期寿命的传统技术通常仅提供实际驱动器使用的高级视图,诸如操作小时或驱动器中重新定位的扇区的数目。如前所述,HDD是由互连的机械、电气、和磁部件组成的复杂系统,这些部件协同操作以促进数据的存储和访问。随着每代HDD的发布,随着驱动器的写入密度和存储容量的增加,这种复杂性和驱动器组件的容限变得更加重要。在灾难性事件(诸如跌落)之外,HDD的这些机械、电气、和磁部件在HDD的操作寿命期间会逐渐磨损,直到关键部件故障发生并且HDD报废为止。在数据丢失、数据恢复成本、服务停机时间(例如,云资源)、驱动器替换成本等方面,HDD的丢失可能会非常昂贵。利用传统技术提供的驱动器使用的高级视图,用户和其他存储客户端(例如,数据中心)通常无法准确地估计HDD在其预期的使用寿命期间何时会失败。因此,许多HDD在实现驱动器替换或数据备份之前意外失败,从而导致存储数据的丢失或数据存储服务的可用性降低。
本公开描述了用于磁存储介质的健康管理的装置和技术。与传统磁体写入技术相对照,所描述的装置和技术使用由读取通道提供的度量,这些度量可以较准确地直接或间接地捕获介质驱动器的组件的逐渐磨损或退化。通常,当数据从存储介质磁盘被读取时,存储介质驱动器的读取通道处理并且解码信号。读取通道对读取信号的信号处理和解码可以包括信号调节、采样、均衡、检测、纠错等。这样,读取通道可以确定或生成各种度量(例如,低水平模拟和纠错度量),这些度量反映存储介质驱动器的电气、机械、或磁组件的相应状况。
基于由读取通道提供的度量,介质健康管理器可以利用神经网络来确定或更新针对磁存储介质的一部分或区域的健康得分。在一些方面,神经网络被预训练以将大量存储介质度量分类为几个或若干健康得分,这对于确定磁存储介质的健康或存储介质驱动器的健康是有用的。通过这样做,可以优化存储介质驱动器的内部操作以避免健康状况差的磁存储介质的区域,或者可以基于该健康预测来替换存储介质驱动器。例如,大多数数据中心或云服务提供方运行数百万个HDD,这些HDD可以被部署在一个或多个位置中。利用由用于磁存储介质的健康管理的各方面所提供的健康得分,数据中心管理员可以在HDD失败之前有效地实现HDD替换或访问重定向(例如,到另一HDD)。这可以使得管理员能够保护关键任务数据,并且较好地确保数据服务器HDD的24/7可用性,以符合各种服务水平协议(SLA)进行数据访问。在其他情况下,介质健康管理器可以确定针对磁存储介质的一个或多个扇区的故障概率。当读取扇区可能失败时,介质健康管理器可以实现较具攻击性的错误纠正,或通知服务提供方(例如,云)该数据可能将不可用,从而使得提供方能够从另一驱动器获得所需的数据。在某些情况下,通过在等待直到低概率扇区发生最终读取故障之前从备选位置提供所需的数据,这可以有效地使得服务提供方能够满足SLA的条件。
在用于磁存储介质的健康管理的各个方面中,介质健康管理器可以利用读取通道,针对驻留在磁存储介质的区域中的磁存储介质的扇区来确定读取度量。介质健康管理器访问区域的读取度量,并且基于针对扇区而被确定的读取度量,来更新区域的读取度量,以提供针对磁存储介质的区域的经更新的读取度量。然后,介质健康管理器利用神经网络,基于针对磁存储介质的区域的经更新的读取度量,来确定针对磁存储介质的区域的健康得分。通过这样做,可以使用健康得分来预测磁存储介质的逐渐磨损,从而使得能够在故障之前替换磁存储介质设备以提高存储到磁存储介质设备的数据的可靠性或可用性。
以下讨论描述了操作环境、可以在该操作环境中采用的技术、以及可以在其中实施操作环境的组件的片上系统(SoC)。在本公开的上下文中,仅通过示例的方式参考操作环境。
操作环境
图1示出了具有计算设备102的示例操作环境100,该计算设备102能够存储或访问各种形式的数据或信息。计算设备102的示例可以包括膝上型计算机104、台式计算机106、和服务器108,它们中的任何一个都可以被配置为存储网络或云存储的一部分。计算设备102(未示出)的其他示例可以包括平板计算机、机顶盒、数据存储设备、可穿戴智能设备、电视、内容流设备、高清多媒体接口(HDMI)媒体棒、智能家电、家庭自动化控制器、智能恒温器、物联网(IoT)设备、移动互联网设备(MID)、网络附接存储(NAS)驱动器、聚合存储系统、游戏机、汽车娱乐设备、汽车计算系统、汽车控制模块(例如,发动机或动力传动系控制模块)等。
通常,计算设备102可以出于任何合适的目的提供、传送或存储数据,诸如启用特定类型的设备的功能、提供用户接口、启用网络访问、实现游戏应用、回放媒体、提供导航、编辑内容、提供数据存储等。备选地或另外地,计算设备102能够存储各种数据,诸如数据库、用户数据、多媒体、应用、操作系统等。一个或多个计算设备102可以被配置为提供远程数据存储或服务,诸如云存储、归档、备份、客户端服务、记录保留等。
计算设备102包括处理器110和计算机可读存储介质(CRM)112。处理器110可以被实现为任何合适类型或数目的处理器,单核或多核(例如,ARM或x86处理器核),以用于执行计算设备102的操作系统或其他程序的指令或命令。CRM 112包括存储介质114和介质驱动器116。计算设备102的存储器介质或系统存储器可以包括易失性存储器或非易失性存储器的任何合适类型或组合。例如,计算设备102的易失性存储器可以包括各种类型的随机存取存储器(RAM)、动态RAM(DRAM)、静态RAM(SRAM)等。非易失性存储器可以包括只读存储器(ROM)、电可擦除可编程ROM(EEPROM)或闪存(例如,NOR闪存或NAND闪存)。这些存储器可以单独地或组合地存储与计算设备102的应用和/或操作系统相关联的数据。
计算设备102的介质驱动器116可以包括一个或多个介质驱动器,或者可以被实现为与计算设备102相关联的数据存储系统的一部分。在该示例中,介质驱动器116包括硬盘驱动器(HDD)118,该硬盘驱动器118能够存储数据并且参考用于磁存储介质的健康管理的各个方面来描述。备选地或另外地,介质驱动器116可以被配置为任何合适类型的数据存储驱动器或系统,诸如存储设备、存储驱动器、存储阵列、存储卷等。尽管参考计算设备102进行了描述,但是介质驱动器116也可以单独实现为独立设备或者较大的存储集合的一部分,诸如数据中心、服务器群、或虚拟化存储系统(例如,用于基于云的存储或服务),其中实现了用于磁存储介质的健康管理的各方面。
计算设备102还可以包括I/O端口120、图形处理单元(GPU,未示出)、和数据接口122。通常,I/O端口120允许计算设备102与其他设备、外围设备、或用户交互。例如,I/O端口120可以包括通用串行总线、人机接口设备、音频输入、音频输出等或者与之耦合。GPU处理并渲染计算设备102的图形相关数据,诸如操作系统的用户接口元素、应用等。在一些情况下,GPU访问本地存储器的一部分以渲染图形,或者GPU包括用于渲染计算设备102的图形(例如,视频RAM)的专用存储器。
计算设备102的数据接口122提供到一个或多个网络以及连接到那些网络的其他设备的连接性。数据接口122可以包括有线接口,诸如用于通过局域网、内联网、或互联网传送的数据的以太网接口或光纤接口。备选地或另外地,数据接口122可以包括无线接口,这些无线接口有助于通过无线网络(诸如无线局域网(WLAN)、广域无线网络(WAN,例如,蜂窝网络)、和/或无线个域网(WPAN))进行通信。根据用于磁存储介质的健康管理的一个或多个方面,可以将通过I/O端口120或数据接口122传送的任何数据写入计算设备102的存储系统或从计算设备102的存储系统中读取。
返回到介质驱动器116,计算设备102可以包括如图所示的硬盘驱动器118和/或可以针对其实现健康管理的各方面的其他类型的存储介质。尽管未示出,但是还可以预期介质驱动器116的其他配置,诸如固态驱动器(SSD)、磁带驱动器、光学介质驱动器、HDD/SSD混合驱动器、以及将数据写入存储器介质(例如,磁或光学存储介质)的其他存储系统。备选地或另外地,计算设备102可以包括介质驱动器的阵列、或者用作其中可以实现健康管理的各方面的用于多个介质驱动器的介质驱动器聚合设备或主机。
在该示例中,磁盘驱动器118包括头-盘组件(HDA)124和驱动器控制模块126,以实现或启用硬盘驱动器118的功能。在某些情况下,驱动器控制模块126被实现为具有半导体设备、逻辑、或其他电路系统的印刷电路板组件(PCBA)。HDA 124包括安装在集成主轴和电机(例如,音圈电机(VCM))组件130上的一个或多个介质磁盘128(或盘片)。主轴和电机组件130可以在与HAD 124的头组件(未示出)耦合的读取/写入头132下方(或上方)旋转介质磁盘128。介质磁盘128可以涂覆有硬磁材料(例如,颗粒表面或薄膜表面),并且可以被写入单面或双面或从单面或两面读取。读取/写入头132可以与HDA 124的前置放大器/写入器模块134(pre-amp/写入器134)可操作地耦合,该前置放大器/写入器模块134包括前置放大器电路系统和分别用于放大写入信号和读取信号的其他逻辑。前置放大器/写入器134可以接收或存储对于将数据写入磁介质202或从磁介质202读取数据有用的头的选择、放大、或者感测电流值。
如图1所示,硬盘驱动器118的示例驱动器控制模块126可以包括存储介质控制器136、伺服控制单元138、和读取/写入通道140(读取通道140)。存储介质控制器136使得计算设备102能够访问介质驱动器116的磁存储介质的内容,诸如操作系统、应用、或用于应用或其他服务的数据。存储介质控制器还可以向介质驱动器的磁存储介质写入计算设备102的数据以及从介质驱动器的磁存储介质读取计算设备102的数据。通常,驱动器控制模块126可以指导或使用伺服控制单元138来控制机械操作,诸如通过HDA 124的读取/写入头132定位和通过主轴和电机组件130的转速控制。
读取/写入通道140可以包括数模路径和模数路径,分别用于将写入数据转换为写入信号或将读取信号转换为读取数据。例如,当从介质磁盘128读取数据时,读取通道140可以处理和解码信号。读取信号的该信号处理和解码可以包括信号调节、采样、均衡、检测、纠错等。在整个本公开中,对读取通道140的实现和使用进行了变化和描述。驱动器控制模块126或者其组件可以被实现为一个或多个IC芯片、片上系统、系统级封装、或者提供有或实现硬盘驱动器控制器的微处理器。驱动器控制模块126还可以包括驱动电子设备(未示出)和/或包括各种接口,诸如主机总线接口、存储介质接口、主轴接口、或前置放大器/写入器接口。
在一些方面,读取通道140包括或与介质健康管理器142、神经网络144、和介质健康数据146相关联。介质健康管理器142可以从读取通道140获得针对从其中读取数据的磁存储介质的扇区的度量。基于由读取通道140提供的度量,介质健康管理器142可以诸如通过使用神经网络144来确定或更新针对磁存储介质的一部分或区域的健康得分。可以对这些神经网络144中的一个或多个进行预训练,以将大量存储介质度量分类为几个或若干健康得分,这对于确定磁存储介质的健康或存储介质驱动器的健康是有用的。介质健康数据146可以包括针对磁存储介质的区域或部分先前计算的健康得分,以及针对磁存储介质的扇区或磁道的读取通道度量的平均值。在某些情况下,介质健康管理器142将针对磁存储介质的部分或区域而被确定的健康得分存储到介质健康数据146,该介质健康数据146可以是针对磁存储介质的区域或部分的信息表的一部分。在整个本公开中,对介质健康管理器142、神经网络144、或介质健康数据146的实现和使用进行了变化和描述。
通过示例的方式,考虑通常在200处示出的图2(未示出保护外壳),其提供了硬盘驱动器118的示例配置。如图2所示,硬盘驱动器118的HDA 124包括集成的主轴和电机组件130,通过主轴和电机组件130来支撑和/或操作磁存储介质202的介质磁盘128(或盘片)。通常,每个介质磁盘128可以被分割或划分为磁存储介质202的预定区域或区。在该示例中,介质磁盘128的表面204被划分为或包括三个区域206(例如,圆形带/环或楔形),该三个区域包括磁存储介质202的磁道208和扇区210的相应子集。介质磁盘128的其他介质磁盘或那些磁盘的表面可以被配置为与图2中所示的那些相似或不同(例如,不同数目的区域)。在一些方面,介质健康管理器以针对磁存储介质的一个或多个区域206的区域健康得分卡的形式来维护驱动器健康状态。
在操作期间,臂212可以操纵,并且因此将读取/写入头132(或多个读取/写入头132)定位在介质磁盘128上的磁存储介质202的所需磁道208或扇区210上。在各个方面,读取/写入头132可以包括具有组合或单独功能(例如,专用R/W功能)的各种数目的头元件。例如,读取/写入头132可以包括一个或多个读取器(读取头/元素)和一个写入器(写入头/元素)。在其他情况下,读取/写入头132可以包括专用写入头(元件)和一个或多个单独的附加专用读头(元件)。备选地或另外地,尽管在图2中示出了多个臂212,但是HDA 124或主轴和电机组件可以利用单个臂212或用于定位读取/写入头132的其他合适的结构来实现。
HDA 124和驱动器控制模块126可以单独地、在单独的基板上、和/或作为介质驱动器的单独的PCBA实现。HDA 124和驱动器控制模块126之间传送的信号或数据可以通过柔性印刷电缆或其他合适的连接结构(诸如磁道、连接器、键合线、焊球等)携带。硬盘驱动器118的HDA 124可以被配置为根据任何合适的记录技术来执行写入操作,诸如垂直磁记录(PMR)、叠片磁记录(SMR)、热辅助磁记录(HAMR)、微波辅助磁记录(MAMR)等。
图2还在214处示出了具有根据一个或多个方面实现的磁存储介质202的区域206的介质磁盘128的平面图。在该示例中,盘片216的表面204的磁道208和扇区210被组织或划分为三个磁存储介质的区域,其包括区域1 206-1、区域2 206-2、和区域3 206-3。尽管利用三个区域206示出,但是介质磁盘128的盘片216或表面204可以被组织成或包括任何合适数目的区域206,诸如区域1 206-1至区域n206-n,其中n是任何合适的数目。通常,每个区域206可以被配置为包括表面204的磁存储介质202的磁道208和扇区210的子集。在某些情况下,区域206被配置为使得每个区域包括大约相等数目的扇区210或盘片216的表面积。
在磁存储介质的健康管理的各个方面中,介质健康管理器142可以维护针对介质磁盘128的区域206的健康得分。通常,当访问该区域206的扇区210以从磁存储介质的扇区210读取数据时,区域健康得分可以基于由读取通道140提供的度量而被更新。针对磁存储介质的区域的健康得分可以指示磁存储介质的区域的磨损水平、退化水平、或可靠性水平。备选地或另外地,还可以针对硬盘驱动器118的多个介质磁盘128编译这些区域健康得分,以使得能够确定针对硬盘驱动器118的驱动器健康得分。
图3示出了通常在300处的读取通道和前置放大器的示例配置,其根据用于磁存储介质的健康管理的一个或多个方面来实现。在该示例中,介质健康管理器142和模拟前端302可操作地与读取通道140耦合。另外,神经网络144和介质健康数据146可操作地与读取通道140的介质健康管理器142耦合或可由其访问。尽管在图3中示出为单独的组件或电路系统,但读取通道140和介质健康管理器142可以被集成为在硬盘驱动器118的其他组件之间分开的一个组件,和/或与前置放大器134和/或读取通道140的其他微电子装置或电路系统集成。
在该示例中,在从磁存储介质202(磁介质202)的扇区读取数据的上下文中描述了读取通道140和其他组件。例如,主机系统或计算设备102可以发出针对存储到介质磁盘128的一个或多个扇区210的数据的读取命令。当介质磁盘128在读取头132下方旋转时,读取头132感测存储到磁介质202的数据的磁场304,其在读取头132处产生模拟信号306。前置放大器134(pre-amp134)放大从读取头132接收的模拟信号306,并且将经放大的信号308提供给读取通道140的模拟前端302。
通常,模拟前端302调节并且采样由前置放大器134提供的经放大的信号308(例如,回读连续时间信号)。读取通道140将经采样的信号转换为数字信号并且恢复经解码的数据310,该经解码的数据310被提供给存储介质控制器136。读取通道140可以包括均衡器模块、检测器模块、适配模块、或增益模块的任何合适的组合,以用于从前置放大器134接收的信号中检测、均衡、和/或解码数据310。结束本示例,存储控制器136然后可以将经解码的数据310作为读取数据312发送到主机接口314,以完成由主机系统或计算设备102发出的读取命令。
关于各种数据访问操作,诸如针对存储到介质磁盘128的一个或多个扇区210的数据的读取操作,介质健康管理器142可以实现用于磁存储介质的健康管理的各个方面。通常,区域信息表和/或介质健康数据可以包括与磁存储介质的特定区域相关联或可用于访问磁存储介质的特定区域的校准参数。介质健康管理器142或读取通道140可以以区域健康得分或得分卡的形式维护磁存储介质健康的状态,诸如通过将区域的健康从1(例如,差)到5(例如,优异)进行分级。每当从该特定区域读取扇区时,就可以更新或重新计算针对区域的健康得分。在某些方面,介质健康管理器通过从区域的给定扇区的读取通道获得各种内部度量来生成或更新健康得分(例如,在读取操作期间),并且使用机器学习算法或神经网络基于内部度量来确定健康得分。这些内部度量可以包括未恢复的扇区、重试方法计数、由纠错码纠正的平均错误、对数似然比(LLR)概率密度函数(PDF)统计、同步标记错误、各种循环错误等。
例如,当介质磁盘128寻找特定区域206以读取一个或多个扇区210时,介质健康管理器142可以从介质健康数据146读取先前计算的区域度量,介质健康数据146可以被实现为区域信息表的一部分(未示出)。基于针对正在读取的区域206的扇区210的当前度量,介质健康管理器更新针对这些扇区210的度量的长期和短期平均值。然后,介质健康管理器可以利用神经网络,基于经更新的长期和短期度量来确定针对区域206的健康得分。神经网络可以被预训练,以将各种各样的读取通道度量映射到几个或若干健康状况状态。针对区域206的经更新的健康得分和经更新的度量也可以在退出给定区域时被写回到介质健康数据146或区域信息表。
贯穿本公开描述的用于磁存储介质的健康管理的各个方面可以由介质健康管理器142来实现,介质健康管理器142与神经网络144(例如,图4和图5)或存储系统控制器或读取通道的、或与存储系统控制器或读取通道相关联的任何合适的人工智能(AI)引擎、AI模型、或AI驱动器、或AI驱动器交互。关于处理存储介质驱动器或系统的各种度量(例如,读取度量、信号度量、或机电度量),一个或多个神经网络144可以利用机器学习来实现,该机器学习基于一个或多个神经网络(例如,经预训练的)以进行介质健康得分、组件磨损估算、或预测驱动器健康。介质健康管理器142的任何AI模型、AI算法、或神经网络可以包括一组连接的节点,诸如神经元或感知器,它们被组织成一个或多个层。
与介质健康管理器142相关联的神经网络144的实例可以利用深度神经网络来实现,该深度神经网络包括输入层、输出层、以及位于神经网络的输入层和输出层之间的一个或多个隐藏的中间层。深度神经网络的每个节点又可以在神经网络的各层之间完全连接或部分连接。神经网络144可以是任何深层神经网络(DNN),诸如包括AlexNet、ResNet、GoogleNet、MobileNet等中的一项的卷积神经网络(CNN)。备选地或另外地,神经网络144可以包括任何合适的递归神经网络(RNN)或其任何变型。通常,由介质健康管理器142采用的AI模型或神经网络还可以包括任何其他监督学习、非监督学习、强化学习算法等。
在各个方面中,神经网络144可以被实现为递归神经网络,其中节点之间的连接形成循环,以保留来自输入数据序列的先前部分的信息以用于输入数据序列的后续部分(例如,读取通道的内部度量)。备选地,神经网络144可以被实现为前馈神经网络,该前馈神经网络在节点之间具有不形成输入数据序列之间的循环的连接。在其他情况下,介质健康管理器142的神经网络144可以包括具有多层感知器的卷积神经网络(CNN),其中给定层中的每个神经元与相邻层的所有神经元连接。在某些方面,神经网络144基于卷积神经网络,该卷积神经网络可以被应用于先前的介质健康得分以预测或预报磁存储介质的某种形式的后续或未来的健康趋势。备选地或另外地,神经网络144可以包括或利用各种回归模型,诸如多个线性回归模型、单个线性回归模型、逻辑回归模型、逐步回归模型、多变量自适应回归模型、局部估计的散点模型等。
通过示例的方式,考虑在其中通常在400处示出了神经网络的示例配置的图4。根据一个或多个方面来实现该示例神经网络144,以计算针对磁存储介质的区域的健康得分。通常,神经网络144被配置为将读取通道140的内部度量402(读取度量402)映射或分类到针对磁存储介质的区域的区域健康得分404。
如图4所示,神经网络144的输入可以包括读取通道140的任何合适数目的内部度量402。在某些方面,神经网络144被预训练以将读取度量402映射到范围为差、警告、公平、良好、和优异的五个区域健康得分404中的一个区域健康得分。读取通道140可以生成或可以访问各种各样的内部度量,这对于计算或确定针对磁存储介质的区域的健康得分可能有用。在该示例中,读取度量包括未恢复的扇区率406、平均重试方法率408、偏离磁道检测的平均410、寻找错误的平均数目412、由纠错码(ECC)纠正的错误的平均数目414、ECC中的平均校验子(syndrome)权重416、ECC迭代的平均次数418、对数似然比(LLR)概率密度函数(PDF)统计的平均420、前端环路信号的平均均方误差(MSE)422、检测到的介质缺陷的平均长度424、模数转换器(ADC)饱和度的平均长度426、自适应参数的平均增量428、同步标记(SM)错误的平均430、或其他各种度量432。这样,基于可用于介质健康管理器142的详细内部度量,与通过小时或扇区重新映射来跟踪驱动器寿命的传统技术相比,神经网络144可以以更高的准确性确定预测存储介质驱动器磨损或可靠性的区域健康得分。
图5在500处示出了根据一个或多个方面实现的、用以计算针对磁存储介质的扇区的故障概率的神经网络的示例配置。在一些方面,扇区故障的概率针对优化数据的队列管理或选择用于解码扇区的数据的特定管线可能是有用的。例如,读取通道的前端部分可以将每个扇区分类为三个或五个信噪比水平中的一个,该分类可以由读取通道的后端部分使用以选择用于解码每个扇区的管线,以提高解码效率。在该示例中,神经网络144被配置为基于前端度量502来针对扇区确定扇区故障的概率504。使用该扇区故障的概率504,读取通道140的后端可以选择用于解码扇区的管线,该管线比因为对解码扇区的初始尝试失败而默认地逐步通过多个管线更可能成功。备选地或另外地,介质健康管理器可以通知服务提供方(例如,云)该数据很可能无法从低概率扇区获得,从而使得提供方能够从另一驱动器获得所需的数据,而不必等到读操作最终失败为止。
如图5所示,读取通道140的前端可以生成或可以访问各种各样的内部度量,这对于计算或确定扇区故障的概率可能有用。在该示例中,前端度量包括对以下的指示:同步标记发现506、同步标记分布508、检测到的偏离磁道510、增量前馈有限冲激响应(FAFIR)滤波器抽头512、增量FIR-3T抽头514、基线累加器516、频率累加器518、来自Vmm和不归零(NRZ)的互信息520、具有各种阈值的Vmm计数522、根据误差信号计算的MSE 524、检测到的缺陷标志的长度526、增量增益变化528、增量ASC变化530、或其他各种度量532。这样,基于可用于读取通道140的详细内部度量,神经网络144可以预测扇区故障的概率504,该概率对于改变或优化管线选择以改善对非最优扇区的解码是有用的。
用于磁存储介质的健康管理的技术
以下讨论描述了用于磁存储介质的健康管理的技术,其使得能够通过预测或跟踪磁存储介质组件的健康(例如,磨损)来提高数据的可靠性或可用性(例如,正常运行时间)。这些技术可以使用本文所述的任何环境和实体来实现,诸如读取通道140、介质健康管理器142、神经网络144、或介质健康数据146。这些技术包括图6至图9中所示的方法600至900,每个方法被示出为由一个或多个实体执行的操作集合。
这些方法不必限于相关联附图中所示的操作顺序。而是,可以重复、跳过、更换、或重新排序任何操作以实现本文描述的各个方面。此外,这些方法可以全部或部分地彼此结合使用,而不管是由相同实体、单独实体、还是它们的任何组合来执行。例如,所描述的方法的各个方面可以被组合以实现针对磁存储介质的各种粒度的健康得分,诸如针对磁存储介质的区域、表面、磁盘、或驱动器的相应的健康得分。在以下讨论的部分中,将参考图1的操作环境100、图2至图5的实体。这样的参考不应被视为将所描述的方面限制为操作环境100、实体、配置、或实现,而是作为各种示例之一的说明。备选地或另外地,方法的操作还可以由或利用参考图10的片上系统和/或图11的存储介质控制器描述的实体实现。
图6描绘了用于确定针对磁存储介质的区域的健康得分的示例方法600,包括由或利用读取通道140、介质健康管理器142、神经网络144、和/或介质健康数据146执行的操作。
在602处,接收用以读取磁存储介质的扇区的请求。磁存储介质的扇区可以驻留在磁存储介质的区域中。在某些情况下,读取通道从存储介质控制器接收对读取扇区(或来自扇区的数据)的请求。该请求可以是引起从介质磁盘或磁存储介质的盘片的特定扇区读取多个相应扇区的多个请求中的一个请求。备选地或另外地,介质健康管理器可以从磁存储介质的多个区域中确定扇区所驻留在的磁存储介质的区域。
在604处,针对具有读取通道的扇区确定读取度量。针对基于请求而被读取的扇区确定读取度量。在某些情况下,读取度量包括读取通道的内部度量,诸如未恢复的扇区率、平均重试方法率、偏离磁道检测的平均、寻找错误的平均数目、由纠错码(ECC)纠正的错误的平均数目、ECC中的平均校验子权重、ECC迭代的平均次数、对数似然比(LLR)概率密度函数(PDF)统计的平均、前端环路信号的平均均方误差(MSE)、检测到的介质缺陷的平均长度、模数转换器(ADC)饱和度的平均长度、自适应参数的平均增量、或同步标记错误的平均。
在606处,磁存储介质的区域的读取度量被访问。这些读取度量可以包括针对区域的扇区的先前确定或计算的读取度量。在某些情况下,区域信息表或介质健康数据存储库被访问,以获得区域的读取度量。通常,该区域的读取度量可以包括针对正在读取的扇区以及驻留在磁存储介质的区域中的其他扇区的相应读取度量。备选地或另外地,扇区的读取度量可以包括特定读取度量的长期平均值和特定读取度量的短期平均值。
在608处,磁存储介质的区域的读取度量基于针对磁存储介质的扇区而被确定的读取度量来更新。从该区域读取的每个扇区的读取度量可以基于由该扇区的读取通道提供的当前相应的读取度量来更新。在某些情况下,更新可以包括更新该扇区的度量的长期平均值和短期平均值两者。
在610处,利用神经网络针对磁存储介质的区域来确定健康得分。神经网络基于磁存储介质的区域的经更新的读取度量来确定健康得分。神经网络可以被配置或预训练以将读取通道的经更新的读取度量映射到至少三个健康得分分类中的一个健康得分分类,以确定针对磁存储介质的区域的健康得分。针对磁存储介质的区域的健康得分可以指示磁存储介质的区域的磨损水平、退化水平、或可靠性水平。
可选地,在612处,磁存储介质的区域的健康得分被存储。针对磁存储介质的区域的健康得分可以被写入区域信息表或介质健康数据存储库中。备选地或另外地,针对区域的扇区的经更新的读取度量也可以被写回到区域信息表或介质健康数据存储库中。
可选地,在614处,磁存储介质的区域的健康得分被传输到存储介质控制器。在某些情况下,将磁存储介质的区域的健康得分发送到存储介质控制器,使得存储介质控制器能够将健康得分与其他度量进行编译,以确定针对与存储介质控制器相关联的介质驱动器或较高水平存储实体的健康得分。
图7描绘了用于基于由读取通道提供的读取度量的平均值来确定针对区域的健康得分的示例方法700,包括由或利用读取通道140、介质健康管理器142、神经网络144、和/或介质健康数据146执行的操作。
在702处,针对磁存储介质的扇区的读取度量利用读取通道来确定。磁存储介质的扇区可以驻留在磁存储介质的区域中或位于其中。在某些情况下,针对从磁存储介质的区域读取的多个扇区,确定相应的读取度量。备选地或另外地,介质健康管理器可以从磁存储介质的多个区域中确定扇区所驻留在的磁存储介质的区域。
在704处,区域的先前确定的读取度量从区域信息表中被读取。通常,区域的先前确定的读取度量可以包括针对被读取的扇区以及驻留在磁存储介质的区域中的其他扇区的相应读取度量。备选地或另外地,扇区的读取度量可以包括特定读取度量的长期平均值和特定读取度量的短期平均值。
可选地,在706处,区域的读取度量的短期平均值基于针对扇区而被确定的读取度量来更新。通常,针对扇区的读取度量的短期平均值基于读取通道提供的当前读取度量来更新。在从区域读取多个扇区的情况下,针对从该区域读取的多个扇区中的每个扇区,读取度量的相应短期平均值可以被更新。
可选地,在708处,区域的读取度量的长期平均值基于针对所该扇区而被确定的读取度量来更新。通常,针对扇区的读取度量的长期平均值基于由读取通道提供的当前读取度量来更新。在从区域读取多个扇区的情况下,针对从该区域读取的多个扇区中的每个扇区,读取度量的相应长期平均值可以被更新。
在710处,针对磁存储介质的区域利用神经网络来确定健康得分。神经网络基于区域的读取度量的经更新的短期平均值和/或长期平均值来确定健康得分。神经网络可以被配置或预训练,以将区域的读取度量的经更新的短期平均值和/或长期平均值映射到至少三个健康得分分类中的一个健康得分分类,以确定针对磁存储介质的区域的健康得分。针对磁存储介质的区域的健康得分可以指示磁存储介质的区域的磨损水平、退化水平、或可靠性水平。
在712处,磁存储介质的区域的健康得分被存储到区域信息表。备选地或另外地,针对磁存储介质的区域的健康得分被写入介质健康数据存储库。在714处,区域的读取度量的经更新的短期平均值和长期平均值被存储到区域信息表。在某些情况下,区域的读取度量的经更新的短期平均值和长期平均值可以被写入介质健康数据存储库。
可选地,在716处,磁存储介质的区域的健康得分被传输到存储介质控制器。在某些情况下,将磁存储介质的区域的健康得分发送到存储介质控制器,使得存储介质控制器能够将健康得分与其他度量(例如,机电或信号度量)进行编译,并且使用组合的度量来确定针对与存储介质控制器相关联的介质驱动器或较高水平存储实体的健康得分。
图8描绘了根据一个或多个方面的用于确定存储介质驱动器健康得分的示例方法800,包括由或利用读取通道140、介质健康管理器142、神经网络144、和/或介质健康数据146执行的操作。
在802处,从存储介质驱动器的读取通道接收针对磁存储介质的一个或多个区域的相应健康得分。可以从介质健康管理器或与在其上实施或组织区域的介质磁盘的盘片或表面相关联的读取通道接收相应健康得分。
在804处,从存储介质驱动器的主轴和音圈电机组件接收存储介质驱动器的机电度量。机电度量可以包括与以下有关的任何合适的度量:参数、校准信息、或与存储介质驱动器的主轴、音圈电机、或其他机电组件相关联的性能数据。
在806处,从存储介质驱动器的前置放大器接收存储介质驱动器的信号度量。信号度量可以包括前置放大器的各种放大或增益设置。在某些情况下,信号度量包括针对存储介质驱动器的磁存储介质的多个盘片或表面的相应信号度量。
在808处,针对存储介质驱动器基于区域的相应健康得分、机电度量、和信号度量来确定驱动器健康得分。在某些情况下,健康得分、机电度量、或信号度量中的至少两项被使用以确定针对存储介质驱动器的总体或最终健康得分。针对存储介质驱动器的健康得分可以指示存储介质驱动器的磨损水平、退化水平、或可靠性水平。
图9描绘了用于确定针对磁存储介质的扇区的故障概率的示例方法900,包括由或利用模拟前端302、介质健康管理器142、神经网络144、和/或介质健康数据146执行的操作。
在902处,接收用以读取磁存储介质的扇区的请求。可以从与扇区所驻留在的媒体磁盘相关联的存储媒体控制器接收该请求。在某些情况下,存储介质控制器请求读取多个扇区,作为从主机系统或计算设备接收的读取命令的一部分。
在904处,从读取通道的前端接收针对磁存储介质的扇区的信号度量。读取通道140的前端可以生成或可以访问各种各样的内部度量,这对于计算或确定扇区故障的概率是有用的。例如,前端度量可以包括对以下的指示:同步标记发现、同步标记分布、检测到的偏离磁道、增量FAFIR滤波器抽头、增量FIR-3T抽头、基线累加器、频率累加器、来自Vmm和NRZ的互信息、具有各种阈值的Vmm计数、根据误差信号计算的MSE、检测到的缺陷标志的长度、增量增益变化、增量ASC变化、或其他各种度量。
在906处,基于该扇区的信号度量,利用神经网络确定针对该扇区的故障概率。神经网络144可以被配置或预训练以基于由前端提供的信号度量来确定扇区故障的概率。
在908处,针对扇区的故障概率被提供给读取通道的后端。后端可以使用扇区故障的概率来选择用于扇区的解码参数,以改善后端的解码、检测、或纠错操作。在某些情况下,读取通道的后端可以选择用于解码扇区的管线,该管线比因为对解码扇区的初始尝试失败而默认地逐步通过多个管线更可能成功。
片上系统
图10示出了可以实现用于磁存储介质的健康管理的各个方面的示例性片上系统(SoC)1000。SoC 1000可以在任何合适的设备中实现,诸如智能电话、上网本、平板电脑、接入点、网络附接存储、相机、智能电器、打印机、机顶盒、服务器、固态驱动器(SSD)、磁带驱动器、硬盘驱动器(HDD)、存储驱动器阵列、存储器模块、存储介质控制器、存储介质接口、头-盘组件、磁介质前置放大器、汽车计算系统、或任何其他合适类型的设备(例如,本文所述的其他设备)。尽管参考SoC进行了描述,但是图10的实体还可以被实现为其他类型的集成电路或嵌入式系统,诸如专用集成电路(ASIC)、存储器控制器、读取通道组件、存储控制器、通信控制器、专用标准产品(ASSP)、数字信号处理器(DSP)、可编程SoC(PSoC)、系统级封装(SiP)、或现场可编程门阵列(FPGA)。
SoC 1000可以与电子电路系统、微处理器、存储器、输入-输出(I/O)控制逻辑、通信接口、固件、和/或可用于提供计算设备或磁存储系统的功能的软件集成在一起,诸如本文描述的任何设备或组件(例如,硬盘驱动器)。SoC 1000还可以包括集成数据总线或互连结构(未示出),该集成数据总线或互连结构耦合SoC的各种组件以用于组件之间的数据通信或路由。SoC 1000的集成数据总线、互连结构或其他组件可以通过外部端口、并行数据接口、串行数据接口、外围组件接口、或任何其他合适的数据接口来被公开或被访问。例如,SoC1000的组件可以通过外部接口或片外数据接口访问或控制外部存储介质或磁读取电路系统。
在该示例中,SoC 1000被示出具有各种组件,这些组件包括输入-输出(I/O)控制逻辑1002和基于硬件的处理器1004(处理器1004),诸如微处理器、处理器内核、应用处理器、DSP等。SoC 1000还包括存储器1006,存储器1006可以包括RAM、SRAM、DRAM、非易失性存储器、ROM、一次性可编程(OTP)存储器、多次可编程(MTP)存储器、闪存、和/或其他合适的电子数据存储中的任何类型和/或组合。在某些方面,处理器1004和存储在存储器1006上的代码(例如,固件)被实现为读取/写入通道模块或作为存储介质接口的一部分,以提供与用于磁存储介质的健康管理相关联的各种功能。在本公开的上下文中,存储器1006经由非瞬态信号来存储数据、代码、指令、或其他信息,并且不包括载波或瞬态信号。备选地或另外地,SoC 1000可以包括用于访问附加的或可扩展的片外存储介质(诸如磁存储器或固态存储器(例如,闪存或NAND存储器))的数据接口(未示出)。
SoC 1000还可以包括固件1008、应用、程序、软件、和/或操作系统,其可以被实施为保持在存储器1006上的处理器可执行指令,以由处理器1004执行来实现SoC 1000的功能。在该示例中,根据一个或多个方面,SoC 1000包括前置放大器接口1010,以接收与从磁存储介质的扇区读取的数据相对应的信号。SoC 1000还可以包括其他通信接口,诸如用于控制本地片上(未示出)或片外通信收发器的组件或与本地片上(未示出)或片外通信收发器的组件通信的收发器接口。备选地或另外地,收发器接口还可以包括或实现信号接口,以在片外传送射频(RF)、中频(IF)、或基带频率信号,以促进通过耦合到SoC 1000的收发器、物理层收发器(PHY)、或者介质访问控制器(MAC)进行有线或无线通信。例如,SoC 1000可以包括收发器接口,该收发器接口被配置为使得能够通过有线或无线网络进行存储,诸如提供具有介质健康管理特征的网络附接存储(NAS)设备。
SoC 1000还包括模拟前端302和读取通道逻辑1012(例如,前端部分),以用于处理通过前置放大器接口1010从前置放大器接收的信号。通常,模拟前端302调节和采样由前置放大器提供的读取信号(例如,读回连续时间信号)。读取通道逻辑1012可以包括均衡器模块、检测器模块、适配模块、或增益模块的任何合适的组合,以用于从前置放大器接收的读取信号中检测、均衡、和解码数据。在一些方面,SoC 1000包括介质健康管理器142、神经网络144、和介质健康数据146,它们可以如图所示单独地实现,或与处理组件或数据接口组合。备选地或另外地,SoC 1000可以包括到存储介质控制器或磁介质磁盘驱动器的主轴/电机组件的接口。
如本文所述,介质健康管理器可以从读取通道接收读取度量(例如,内部读取通道或模拟前端度量),并且基于这些度量和/或使用神经网络来确定或更新磁存储介质区域的健康得分,以实现用于磁存储介质的健康管理的各个方面。如参考本文所呈现的各个方面所描述的,这些实体中的任何实体可以被实施为不同的或组合的组件。参考图1的环境100的相应组件或实体或图2至图5所示的相应配置来描述这些组件和/或实体、或相应功能的示例。介质健康管理器142可以全部或部分地被实现为由存储器1006维护并且由处理器1004执行的数字逻辑、电路系统、和/或处理器可执行指令,以实现用于磁存储介质的健康管理的各个方面或特征。
介质健康管理器142可以独立地或者与任何合适的组件或电路系统组合地实现,以实现本文描述的方面。例如,介质健康管理器可以被实现为DSP、处理器/存储桥、I/O桥、图形处理单元、存储器控制器、存储控制器、算术逻辑单元(ALU)等的一部分。还可以与SoC1000的其他实体集成地提供介质健康管理器142,诸如与SoC 1000的处理器1004、存储器1006、存储介质接口、或固件1008集成。备选地或另外地,介质健康管理器和/或SoC 1000的其他组件可以被实现为硬件、固件、固定逻辑电路系统、或其任何组合。
作为另一示例,考虑图11,其示出了根据用于磁存储介质的健康管理的一个或多个方面的示例存储介质控制器1100。通常,存储介质控制器1100使得计算设备102能够访问磁存储介质的内容,诸如操作系统、应用、或用于应用或其他服务的数据。存储介质控制器还可以向与控制器相关联的磁存储介质写入计算设备102的数据以及从该磁存储介质读取计算设备102的数据。
在各个方面,存储介质控制器1100或其组件的任何组合可以被实现为存储驱动器控制器(例如,HDD控制器或HDD芯片组)、存储介质控制器、NAS控制器、存储介质接口、存储介质端点、存储介质目标、或用于磁存储介质、固态存储介质等的存储聚合控制器(例如,混合SSD/HDD存储系统)。在某些情况下,类似于或利用如参考图10或图1所描述的SoC 1500的组件(例如,存储介质控制器136)来实现存储介质控制器1100。换言之,SoC 1000的实例可以被配置为存储介质控制器(或控制器的子系统),诸如用以管理磁存储介质的存储介质控制器1100。在该示例中,存储介质控制器1100包括输入-输出(I/O)控制逻辑1102和处理器1104,诸如微处理器、微控制器、处理器内核、应用处理器、DSP等。存储介质控制器还包括主机接口1106(例如,SATA、PCIe、NVMe、或Fabric接口)和存储介质接口1108(例如,磁介质接口或头-盘组件(HDA)接口),其使得能够分别访问主机系统(或结构)和存储介质。在该示例中,存储介质接口包括主轴/VCM接口1110、前置放大器接口1112、以及读取/写入通道接口1114的单独实例,使得能够与介质驱动器的头-盘组件和读取通道通信。如图11所示,存储介质控制器1100还可包括伺服控制单元138。在某些情况下,伺服控制单元可操作地耦合到主轴接口1110,并且提供主轴或音圈控制以用于媒体驱动器操作。
在一些方面,当管理或启用对耦合到存储介质接口1108的存储介质(例如,介质磁盘)的访问时,存储介质控制器1100实现用于磁存储介质的健康管理的各方面。在该示例中,存储介质控制器1100包括驱动器健康管理器1016,该驱动器健康管理器1016可以包括针对磁存储介质的多个区域的介质健康数据146。在一些方面,驱动器健康管理器1016通过读取/写入通道接口1114从读取/写入通道接收读取度量或区域健康得分。使用来自多个介质磁盘或介质磁盘表面的读取度量或区域健康得分,驱动器健康管理器1016可以确定或更新针对介质驱动器的磁存储介质(例如,多个磁盘)的健康得分(例如,HDD的总体健康得分)。因此,驱动器健康管理器1016可以监测和跟踪跨介质驱动器的磁存储介质的多个磁盘或表面的相应健康得分。备选地或另外地,驱动器健康管理器1016可以基于那些磁盘或表面的相应健康得分来管理对特定磁盘或表面的访问。例如,如果介质驱动器的一个磁盘具有差的健康得分,则驱动器健康管理器1016可以将数据访问引导到介质驱动器的其他磁盘(例如,具有较好的健康得分),以提高介质驱动器的数据可靠性和可用性(例如,正常运行时间)。在一些方面,处理器1104和存储介质控制器1100的固件或逻辑被实现为提供与用于磁存储介质的健康管理相关联的各种数据写入或处理功能。
存储介质控制器1100的驱动器健康管理器1016可以如图所示单独实现,或与处理器1104、读取/写入通道接口1114、或存储介质接口1108组合实现。根据各个方面,驱动器健康管理器1016可以通过读取/写入通道接口1114接收来自读取通道的区域健康得分,通过前置放大器接口1112接收来自前置放大器的信号度量,或从主轴/VCM接口1110接收来自主轴和VCM组件的机电度量。驱动器健康管理器1016可以编译区域健康得分、信号度量、和/或机电度量,并且计算其中实施存储介质控制器1100的HDD的总体介质驱动器健康得分。该介质驱动器健康得分可以指示HDD的内部组件的总体磨损量或HDD的可靠性,使得能够在HDD失败之前替换HDD或将数据迁移(或重定向)到另一HDD。参考图1的环境100的各个组件或实体或图2至图5所示的相应配置来描述这些组件和/或实体、或对应功能的示例。驱动器健康管理器1016(或介质健康管理器142)全部或部分可以被实现为处理器可执行指令,这些处理器可执行指令由控制器的存储器维护并且由处理器1104执行以实现用于磁存储介质的健康管理的各个方面和/或特征。
尽管已经用特定于结构特征和/或方法操作的语言描述了主题,但是应当理解,所附权利要求书中定义的主题不必限于本文所描述的具体示例、特征、或操作,包括其执行的顺序。
Claims (15)
1.一种用于管理存储介质驱动器的磁存储介质的健康的方法,所述方法包括:
接收用以读取所述磁存储介质的扇区的请求;
利用所述存储介质驱动器的读取通道,针对基于所述请求而被读取的所述磁存储介质的所述扇区来确定读取度量;
从所述磁存储介质的多个区域中,确定所述扇区所驻留的所述磁存储介质的区域,所述磁存储介质的每个区域对应于所述磁存储介质的磁盘上的磁道的相应子集,每个磁道包括多个扇区;
访问所述磁存储介质的所述区域的读取度量,所述区域的所述读取度量包括针对被读取的所述扇区以及驻留在所述磁存储介质的所述区域中的其他扇区的相应读取度量;
基于针对所述磁存储介质的所述扇区而被确定的所述读取度量,来更新所述磁存储介质的所述区域的所述读取度量,以提供针对所述磁存储介质的所述区域的经更新的读取度量,所述读取度量的更新包括更新基于针对所述扇区而被确定的所述读取度量而被读取的所述扇区的所述读取度量;以及
利用神经网络,基于针对所述磁存储介质的所述区域的所述经更新的读取度量来确定针对所述扇区所驻留的所述磁存储介质的所述区域的健康得分。
2.根据权利要求1所述的方法,进一步包括:
将所述磁存储介质的所述区域的所述健康得分存储到区域信息表;或
将所述磁存储介质的所述区域的所述健康得分传输到所述存储介质驱动器的存储介质控制器。
3.根据权利要求1或2所述的方法,其中:
访问针对所述磁存储介质的所述区域的所述读取度量包括:从区域信息表读取所述读取度量的相应平均值;以及
更新针对所述磁存储介质的所述区域的所述读取度量包括:基于针对所述磁存储介质的所述扇区而被确定的所述读取度量,来更新所述读取度量所述相应平均值。
4.根据权利要求3所述的方法,其中:
所述读取度量的所述相应平均值包括:所述读取度量的相应短期平均值和所述读取度量的相应长期平均值;以及
更新针对所述磁存储介质的所述区域的所述读取度量包括:基于针对所述磁存储介质的所述扇区而被确定的所述读取度量,来更新所述读取度量的所述相应短期平均值和所述读取度量的所述相应长期平均值。
5.根据权利要求1或2所述的方法,进一步包括:
从所述存储介质驱动器的主轴和音圈电机组件接收针对所述存储介质驱动器的机电度量;或者
从所述存储介质驱动器的前置放大器接收针对所述存储介质驱动器的信号度量;以及
基于所述区域的所述健康得分、所述机电度量、或所述信号度量中的至少两项,来确定针对所述存储介质驱动器的驱动器健康得分;或
其中针对所述磁存储介质的所述区域的所述健康得分指示所述磁存储介质的所述区域的磨损水平、退化水平、或可靠性水平;或
其中所述磁存储介质的所述区域对应于磁存储介质磁盘的盘片表面上的磁道的至少三个子集中的子集。
6.根据权利要求1或2所述的方法,其中针对所述磁存储介质的所述扇区的所述读取度量包括以下中的一项或多项:未恢复的扇区率、平均重试方法率、偏离磁道检测的平均、寻找错误的平均数目、由纠错码ECC纠正的错误的平均数目、ECC中的平均校验子权重、ECC迭代的平均次数、对数似然比(LLR)概率密度函数(PDF)统计的平均、前端环路信号的平均均方误差(MSE)、检测到的介质缺陷的平均长度、模数转换器(ADC)饱和度的平均长度、自适应参数的平均增量、或同步标记错误的平均;或
其中所述神经网络包括预训练的神经网络,所述预训练的神经网络被配置为:将所述读取通道的所述读取度量映射到至少三个健康得分分类中的一个健康得分分类,以确定针对所述磁存储介质的所述区域的所述健康得分。
7.一种装置,包括:
接口,用以与主机传送数据;
磁存储介质的磁盘,用以存储所述数据;
读取通道,用以从所述磁存储介质的扇区读取所述数据;
神经网络,用以确定介质健康得分;以及
介质健康管理器,被配置为:
利用所述读取通道,针对所述数据从其中被读取的所述磁存储介质的扇区来确定读取度量;
从所述磁存储介质的多个区域中,确定所述扇区所驻留的所述磁存储介质的区域,所述磁存储介质的每个区域对应于磁存储介质的所述磁盘上的磁道的相应子集,每个磁道包括多个扇区;
访问所述磁存储介质的所述区域的读取度量;
基于针对所述磁存储介质的所述扇区而被确定的所述读取度量,来更新所述磁存储介质的所述区域的所述读取度量,以提供针对所述磁存储介质的所述区域的经更新的读取度量,所述读取度量的更新包括更新基于针对所述扇区而被确定的所述读取度量而被读取的所述扇区的所述读取度量;以及
利用所述神经网络,基于所述磁存储介质的所述区域的所述经更新的读取度量来确定针对所述磁存储介质的所述区域的健康得分。
8.根据权利要求7所述的装置,其中所述介质健康管理器进一步被配置为:
将所述磁存储介质的所述区域的所述健康得分存储到区域信息表;或者
将所述磁存储介质的所述区域的所述健康得分传输到所述装置的存储介质控制器;和/或
用以访问针对所述磁存储介质的所述区域的所述读取度量,所述介质健康管理器进一步被配置为:从区域信息表读取所述读取度量的相应平均值;以及
用以更新针对所述磁存储介质的所述区域的所述读取度量,所述介质健康管理器进一步被配置为:基于针对所述磁存储介质的所述扇区而被确定的所述读取度量,来更新所述读取度量的所述相应平均值。
9.根据权利要求7或8所述的装置,其中所述装置进一步包括:
主轴和音圈电机组件,所述主轴和音圈电机组件与磁存储介质的所述磁盘相关联;
前置放大器,所述前置放大器被配置为:放大由读取头生成的读取信号,所述读取头与磁存储介质的所述磁盘相关联;以及
所述介质健康管理器进一步被配置为:
从所述主轴和音圈电机组件接收针对所述装置的所述磁盘的机电度量;或者
从所述前置放大器接收针对所述装置的所述磁盘的信号度量;以及
基于所述磁存储介质的所述区域的所述健康得分、所述机电度量、或所述信号度量中的至少两项,来确定针对所述装置的健康得分。
10.根据权利要求7或8所述的装置,其中针对所述磁存储介质的所述扇区的所述读取度量包括以下中的一项或多项:未恢复的扇区率、平均重试方法率、偏离磁道检测的平均、寻找错误的平均数目、由纠错码ECC纠正的错误的平均数目、ECC中的平均校验子权重、ECC迭代的平均次数、对数似然比(LLR)概率密度函数(PDF)统计的平均、前端环路信号的平均均方误差(MSE)、检测到的介质缺陷的平均长度、模数转换器(ADC)饱和度的平均长度、自适应参数的平均增量、或同步标记错误的平均;和/或
其中所述神经网络包括预训练的神经网络,所述预训练的神经网络被配置为:将所述读取通道的所述读取度量映射到至少三个健康得分分类中的一个健康得分分类,以确定针对所述磁存储介质的所述区域的所述健康得分。
11.一种片上系统(SoC),包括:
前置放大器接口,用以接收与从磁存储介质的扇区被读取的数据相对应的信号;
读取通道逻辑,用以处理与从所述磁存储介质的所述扇区被读取的所述数据相对应的所述信号;
基于硬件的处理器;
存储器,所述存储器存储处理器可执行指令,所述处理器可执行指令响应于由所述基于硬件的处理器的执行而实现介质健康管理器,用于:
利用所述读取通道逻辑,针对所述数据从其中被读取的所述磁存储介质的扇区来确定读取度量;
从所述磁存储介质的多个区域中,确定所述扇区所驻留的所述磁存储介质的区域,所述磁存储介质的每个区域对应于磁存储介质的磁盘上的磁道的相应子集,每个磁道包括多个扇区;
访问所述磁存储介质的所述区域的读取度量;
基于针对所述磁存储介质的所述扇区而被确定的所述读取度量,来更新所述磁存储介质的所述区域的所述读取度量,以提供针对所述磁存储介质的所述区域的经更新的读取度量,所述读取度量的更新包括更新基于针对所述扇区而被确定的所述读取度量而被读取的所述扇区的所述读取度量;以及
利用神经网络,基于所述磁存储介质的所述区域的所述经更新的读取度量,来确定针对所述磁存储介质的所述区域的健康得分。
12.根据权利要求11所述的片上系统,其中所述介质健康管理器进一步被实现为:
将所述磁存储介质的所述区域的所述健康得分存储到区域信息表;或
将所述磁存储介质的所述区域的所述健康得分传输到所述片上系统的存储介质控制器。
13.根据权利要求11或12所述的片上系统,其中:
用以访问针对所述磁存储介质的所述区域的所述读取度量,所述介质健康管理器进一步被实现为:从区域信息表读取所述读取度量的相应平均值;以及
用以更新针对所述磁存储介质的所述区域的所述读取度量,所述介质健康管理器进一步被实现为:基于针对所述磁存储介质的所述扇区而被确定的所述读取度量,来更新所述读取度量所述相应平均值。
14.根据权利要求11所述的片上系统,其中针对所述磁存储介质的所述扇区的所述读取度量包括以下中的一项或多项:未恢复的扇区率、平均重试方法率、偏离磁道检测的平均、寻找错误的平均数目、由纠错码ECC纠正的错误的平均数目、ECC中的平均校验子权重、ECC迭代的平均次数、对数似然比(LLR)概率密度函数(PDF)统计的平均、前端环路信号的平均均方误差(MSE)、检测到的介质缺陷的平均长度、模数转换器(ADC)饱和度的平均长度、自适应参数的平均增量、或同步标记错误的平均。
15.根据权利要求11或12所述的片上系统,其中所述神经网络包括预训练的神经网络,所述预训练的神经网络被配置为:将所述读取通道的所述读取度量映射到至少五个健康得分分类中的一个健康得分分类,以确定针对所述磁存储介质的所述区域的所述健康得分。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962799608P | 2019-01-31 | 2019-01-31 | |
US62/799,608 | 2019-01-31 | ||
US16/737,174 | 2020-01-08 | ||
US16/737,174 US11450348B2 (en) | 2019-01-31 | 2020-01-08 | Health management for magnetic storage media |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111508532A CN111508532A (zh) | 2020-08-07 |
CN111508532B true CN111508532B (zh) | 2023-11-03 |
Family
ID=69423067
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010076783.7A Active CN111508532B (zh) | 2019-01-31 | 2020-01-23 | 用于磁存储介质的健康管理 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11450348B2 (zh) |
EP (1) | EP3690883A1 (zh) |
KR (1) | KR20200095364A (zh) |
CN (1) | CN111508532B (zh) |
TW (1) | TW202046297A (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10734016B2 (en) | 2018-08-21 | 2020-08-04 | Marvell Asia Pte, Ltd. | Pulse-based writing for magnetic storage media |
CN116312657A (zh) | 2019-02-26 | 2023-06-23 | 马维尔亚洲私人有限公司 | 用于磁存储介质的码字交织 |
US10971187B2 (en) | 2019-03-11 | 2021-04-06 | Marvell Asia Pte, Ltd. | Constant-density writing for magnetic storage media |
CN112506420A (zh) * | 2019-09-16 | 2021-03-16 | 伊姆西Ip控股有限责任公司 | 在存储系统中管理擦洗操作的方法、设备和产品 |
CN112051969B (zh) * | 2020-08-07 | 2021-10-08 | 东北大学 | 一种基于深度强化学习的分级存储数据自适应迁移方法 |
CN112214169B (zh) * | 2020-09-28 | 2021-08-10 | 深圳大学 | 一种数据存储装置及存储数据的迁移方法 |
US11563623B2 (en) * | 2020-10-13 | 2023-01-24 | Arris Enterprises Llc | Home network health metrics reporting |
US11899558B2 (en) * | 2021-01-15 | 2024-02-13 | Netflix, Inc. | Systems and methods for optimizing hard drive throughput |
CN112817523B (zh) * | 2021-01-19 | 2021-09-07 | 置富科技(深圳)股份有限公司 | 存储介质可靠性等级判断方法及系统、存储介质、设备 |
CN114822664A (zh) | 2022-05-12 | 2022-07-29 | 合肥兆芯电子有限公司 | 基于数据优先级的风险评估方法、存储装置及控制电路 |
CN114860624B (zh) * | 2022-05-23 | 2023-04-28 | 深圳市芯存科技有限公司 | 一种基于Nandflash芯片的数据擦写方法及系统 |
Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628766A (ja) * | 1992-07-09 | 1994-02-04 | Fujitsu Ltd | 磁気記憶媒体,磁気書込み/読出し処理装置及びその制御方法 |
JPH10188451A (ja) * | 1996-12-25 | 1998-07-21 | Toshiba Corp | ディスク装置及び同装置におけるデフェクトに基づく故障予測方法 |
JP2001250292A (ja) * | 2000-03-06 | 2001-09-14 | Fujitsu Ltd | 記憶装置及び記録媒体 |
CN1347115A (zh) * | 2000-09-11 | 2002-05-01 | 国际商业机器公司 | 旋转存储设备及其控制方法 |
US6574754B1 (en) * | 2000-02-14 | 2003-06-03 | International Business Machines Corporation | Self-monitoring storage device using neural networks |
US6658201B1 (en) * | 1999-06-24 | 2003-12-02 | Sony Electronics, Inc. | Data storage device having multiple heads traveling in opposite directions for capacity and throughput optimization |
JP2006285519A (ja) * | 2005-03-31 | 2006-10-19 | Hitachi Global Storage Technologies Netherlands Bv | データ転送システムの障害診断方法、データ転送システム及びデータ記憶装置 |
JP2006351134A (ja) * | 2005-06-17 | 2006-12-28 | Fujitsu Ltd | 磁気ディスク装置及びパトロール診断方法 |
CN102129397A (zh) * | 2010-12-29 | 2011-07-20 | 深圳市永达电子股份有限公司 | 一种自适应磁盘阵列故障预测方法及系统 |
CN102800328A (zh) * | 2011-05-25 | 2012-11-28 | 日立环球储存科技荷兰有限公司 | 磁芯宽度预测的人工神经网络应用和磁盘驱动器制造的建模 |
US8953271B1 (en) * | 2013-05-13 | 2015-02-10 | Western Digital Technologies, Inc. | Disk drive compensating for repeatable run out selectively per zone |
US8953265B1 (en) * | 2014-07-24 | 2015-02-10 | Emc Corporation | Method and system for monitoring disk reliability with global disk scrubbing |
WO2015029163A1 (ja) * | 2013-08-28 | 2015-03-05 | パイオニア株式会社 | 記録再生装置及び方法、並びに記録媒体 |
CN104932834A (zh) * | 2014-03-21 | 2015-09-23 | 西部数据技术公司 | 使用终极手段区域进行数据存储设备的数据管理 |
GB201516823D0 (en) * | 2014-09-26 | 2015-11-04 | HGST Netherlands BV | Storage device health diagnosis |
US9189309B1 (en) * | 2013-09-25 | 2015-11-17 | Emc Corporation | System and method for predicting single-disk failures |
US9672853B1 (en) * | 2015-06-01 | 2017-06-06 | Marvell International Ltd. | Digital data driven position error signal for magnetic recording |
CN107861829A (zh) * | 2017-11-06 | 2018-03-30 | 郑州云海信息技术有限公司 | 一种磁盘故障检测的方法、系统、装置及存储介质 |
CN107886992A (zh) * | 2017-11-06 | 2018-04-06 | 郑州云海信息技术有限公司 | 一种raid健康状态检测方法、系统及相关装置 |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4553178A (en) | 1983-01-18 | 1985-11-12 | Electronic Processors, Inc. | Magnetic recording system with peak shift compensation |
JPS60185258A (ja) | 1984-03-02 | 1985-09-20 | Nec Corp | デイスク装置の情報記録方式 |
US5420730A (en) | 1990-08-17 | 1995-05-30 | Moon; Ronald R. | Servo data recovery circuit for disk drive having digital embedded sector servo |
JPH0795056A (ja) | 1993-05-10 | 1995-04-07 | Internatl Business Mach Corp <Ibm> | 可変周波数基準クロック生成装置 |
JP2557203B2 (ja) | 1993-12-27 | 1996-11-27 | インターナショナル・ビジネス・マシーンズ・コーポレイション | ファジィ・パッキング方法及びデータ記憶システム |
JPH07211004A (ja) | 1994-01-20 | 1995-08-11 | Fujitsu Ltd | 磁気ディスク装置および記録媒体 |
JP3456781B2 (ja) | 1995-02-06 | 2003-10-14 | 富士通株式会社 | 磁気記録再生装置の復調回路 |
JPH08287618A (ja) | 1995-04-17 | 1996-11-01 | Matsushita Electric Ind Co Ltd | 記録再生装置 |
KR100212982B1 (ko) | 1996-05-22 | 1999-08-02 | 윤종용 | 하드디스크드라이브에 있어 헤드레스 포멧을 위한 콘스턴트 덴시티 기록방법 및 시스템 |
JPH10255402A (ja) | 1997-03-10 | 1998-09-25 | Fujitsu Ltd | 磁気ディスク装置 |
US6023386A (en) | 1997-10-31 | 2000-02-08 | Cirrus Logic, Inc. | Fault tolerant sync mark detector for synchronizing a time varying sequence detector in a sampled amplitude read channel |
KR100633477B1 (ko) | 1998-08-04 | 2006-10-16 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 광 디스크 및 이 광 디스크를 주사하는 장치 |
DE19852037A1 (de) | 1998-11-11 | 2000-05-18 | Thomson Brandt Gmbh | Magnetbandgerät mit Treiberschaltung für Matrixkopf |
US6175319B1 (en) | 1999-05-20 | 2001-01-16 | Storage Technology Corporation | Power-tailored write-current method |
KR100611956B1 (ko) | 1999-08-19 | 2006-08-11 | 삼성전자주식회사 | 에러 정정 방법과 장치 |
US6894967B2 (en) | 2000-11-21 | 2005-05-17 | Yamaha Corporation | Optical disk recorder for writing data with variable density |
US6765736B2 (en) | 2001-06-29 | 2004-07-20 | Seagate Technology Llc | Write-safe condition verification apparatus and method for the write element in a disc drive |
US7088534B2 (en) | 2003-04-08 | 2006-08-08 | Marvell International Ltd. | Disk synchronous write |
US7236911B1 (en) | 2004-06-16 | 2007-06-26 | Western Digital Technologies, Inc. | Using a genetic algorithm to select a subset of quality metrics as input to a disk drive failure prediction algorithm |
JP2006031825A (ja) | 2004-07-16 | 2006-02-02 | Sony Corp | 記録再生制御方法、記録再生制御装置 |
KR100604892B1 (ko) | 2004-08-10 | 2006-07-28 | 삼성전자주식회사 | 재기록 가능한 광디스크의 결함 관리를 위한 결함 검출회로를 구비한 광디스크 재생/기록 시스템 및 그 방법 |
US7796355B2 (en) | 2005-12-01 | 2010-09-14 | Seagate Technology Llc | Reverse write current preshoot |
JP2007184063A (ja) | 2006-01-10 | 2007-07-19 | Renesas Technology Corp | 不揮発性半導体記憶装置 |
JP2010218631A (ja) | 2009-03-17 | 2010-09-30 | Toshiba Storage Device Corp | 誤り訂正回路及びデータ記憶装置 |
KR20110048776A (ko) * | 2009-11-03 | 2011-05-12 | 삼성전자주식회사 | 기록매체의 디펙 처리 방법과 이를 적용한 데이터 저장 장치 및 저장매체 |
US8687304B1 (en) | 2010-01-18 | 2014-04-01 | Marvell International, Ltd. | Sensor-aided patterned magnetic media synchronization systems |
US8508878B1 (en) | 2010-01-21 | 2013-08-13 | Marvell International Ltd. | Write clock phase tracking for magnetic recording device |
US8508879B1 (en) | 2010-01-21 | 2013-08-13 | Marvell International Ltd. | Write clock rephase for magnetic recording device |
WO2013085888A1 (en) | 2011-12-05 | 2013-06-13 | Varian Semiconductor Equipment Associates, Inc. | Magnetic storage device |
US9059737B2 (en) | 2013-01-11 | 2015-06-16 | HGST Netherlands B.V. | Disk drive with distributed codeword blocks |
US20140244926A1 (en) | 2013-02-26 | 2014-08-28 | Lsi Corporation | Dedicated Memory Structure for Sector Spreading Interleaving |
US8749911B1 (en) | 2013-03-11 | 2014-06-10 | Western Digital Technologies, Inc. | Disk drive accounting for fractional clock cycle when measuring reader/writer gap |
US8861117B2 (en) | 2013-03-15 | 2014-10-14 | Seagate Technology Llc | Data intersector gaps for data sector format |
US9094046B2 (en) | 2013-09-03 | 2015-07-28 | Lsi Corporation | Systems and methods for variable sector count spreading and de-spreading |
US8792197B1 (en) | 2013-09-20 | 2014-07-29 | Lsi Corporation | Storage device with driver controller providing pattern-dependent write functionality |
US8929013B1 (en) | 2013-11-08 | 2015-01-06 | Lsi Corporation | Storage system with pattern dependent write |
US9355677B2 (en) | 2014-01-30 | 2016-05-31 | Seagate Technology Llc | Preamplifier for adjustable write current |
US9281009B1 (en) | 2014-12-18 | 2016-03-08 | Western Digital Technologies, Inc. | Data storage device employing variable size interleave written track segments |
US9530447B2 (en) | 2015-02-27 | 2016-12-27 | Seagate Technology Llc | Adaptive HAMR power data storage device |
CN107179968B (zh) * | 2016-03-09 | 2020-06-26 | 株式会社东芝 | 信息存储装置、故障预测装置及故障预测方法 |
CN107204196A (zh) | 2016-03-17 | 2017-09-26 | 株式会社东芝 | 磁盘装置、数据处理装置及数据记录方法 |
US10268553B2 (en) | 2016-08-31 | 2019-04-23 | Seagate Technology Llc | Adaptive failure prediction modeling for detection of data storage device failures |
US10310749B2 (en) * | 2016-09-16 | 2019-06-04 | Netscout Systems Texas, Llc | System and method for predicting disk failure |
US10649655B2 (en) * | 2016-09-30 | 2020-05-12 | Western Digital Technologies, Inc. | Data storage system with multimedia assets |
US10276198B1 (en) | 2017-01-12 | 2019-04-30 | Marvell International Ltd. | Method and apparatus for multi-channel servo demodulation |
US10068609B1 (en) | 2017-02-23 | 2018-09-04 | Marvell International Ltd. | Variable frequency write pattern generation |
US10115415B1 (en) | 2018-03-23 | 2018-10-30 | Headway Technologies, Inc. | Magnetic pulse recording scheme in perpendicular magnetic recording |
US10734016B2 (en) | 2018-08-21 | 2020-08-04 | Marvell Asia Pte, Ltd. | Pulse-based writing for magnetic storage media |
US10832716B2 (en) | 2018-12-19 | 2020-11-10 | Marvell Asia Pte, Ltd. | Zone self servo writing with synchronized parallel clocks |
CN116312657A (zh) | 2019-02-26 | 2023-06-23 | 马维尔亚洲私人有限公司 | 用于磁存储介质的码字交织 |
US10971187B2 (en) | 2019-03-11 | 2021-04-06 | Marvell Asia Pte, Ltd. | Constant-density writing for magnetic storage media |
-
2020
- 2020-01-08 US US16/737,174 patent/US11450348B2/en active Active
- 2020-01-13 KR KR1020200004183A patent/KR20200095364A/ko not_active Application Discontinuation
- 2020-01-16 TW TW109101526A patent/TW202046297A/zh unknown
- 2020-01-23 CN CN202010076783.7A patent/CN111508532B/zh active Active
- 2020-01-30 EP EP20154549.8A patent/EP3690883A1/en active Pending
Patent Citations (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0628766A (ja) * | 1992-07-09 | 1994-02-04 | Fujitsu Ltd | 磁気記憶媒体,磁気書込み/読出し処理装置及びその制御方法 |
JPH10188451A (ja) * | 1996-12-25 | 1998-07-21 | Toshiba Corp | ディスク装置及び同装置におけるデフェクトに基づく故障予測方法 |
US6658201B1 (en) * | 1999-06-24 | 2003-12-02 | Sony Electronics, Inc. | Data storage device having multiple heads traveling in opposite directions for capacity and throughput optimization |
US6574754B1 (en) * | 2000-02-14 | 2003-06-03 | International Business Machines Corporation | Self-monitoring storage device using neural networks |
JP2001250292A (ja) * | 2000-03-06 | 2001-09-14 | Fujitsu Ltd | 記憶装置及び記録媒体 |
CN1347115A (zh) * | 2000-09-11 | 2002-05-01 | 国际商业机器公司 | 旋转存储设备及其控制方法 |
JP2006285519A (ja) * | 2005-03-31 | 2006-10-19 | Hitachi Global Storage Technologies Netherlands Bv | データ転送システムの障害診断方法、データ転送システム及びデータ記憶装置 |
JP2006351134A (ja) * | 2005-06-17 | 2006-12-28 | Fujitsu Ltd | 磁気ディスク装置及びパトロール診断方法 |
CN102129397A (zh) * | 2010-12-29 | 2011-07-20 | 深圳市永达电子股份有限公司 | 一种自适应磁盘阵列故障预测方法及系统 |
CN102800328A (zh) * | 2011-05-25 | 2012-11-28 | 日立环球储存科技荷兰有限公司 | 磁芯宽度预测的人工神经网络应用和磁盘驱动器制造的建模 |
US8953271B1 (en) * | 2013-05-13 | 2015-02-10 | Western Digital Technologies, Inc. | Disk drive compensating for repeatable run out selectively per zone |
WO2015029163A1 (ja) * | 2013-08-28 | 2015-03-05 | パイオニア株式会社 | 記録再生装置及び方法、並びに記録媒体 |
US9189309B1 (en) * | 2013-09-25 | 2015-11-17 | Emc Corporation | System and method for predicting single-disk failures |
CN104932834A (zh) * | 2014-03-21 | 2015-09-23 | 西部数据技术公司 | 使用终极手段区域进行数据存储设备的数据管理 |
US8953265B1 (en) * | 2014-07-24 | 2015-02-10 | Emc Corporation | Method and system for monitoring disk reliability with global disk scrubbing |
GB201516823D0 (en) * | 2014-09-26 | 2015-11-04 | HGST Netherlands BV | Storage device health diagnosis |
US9672853B1 (en) * | 2015-06-01 | 2017-06-06 | Marvell International Ltd. | Digital data driven position error signal for magnetic recording |
CN107861829A (zh) * | 2017-11-06 | 2018-03-30 | 郑州云海信息技术有限公司 | 一种磁盘故障检测的方法、系统、装置及存储介质 |
CN107886992A (zh) * | 2017-11-06 | 2018-04-06 | 郑州云海信息技术有限公司 | 一种raid健康状态检测方法、系统及相关装置 |
Non-Patent Citations (1)
Title |
---|
分布式存储系统中磁盘故障检测机制;刘榴;李小勇;;信息技术(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
TW202046297A (zh) | 2020-12-16 |
EP3690883A1 (en) | 2020-08-05 |
US11450348B2 (en) | 2022-09-20 |
CN111508532A (zh) | 2020-08-07 |
US20200251143A1 (en) | 2020-08-06 |
KR20200095364A (ko) | 2020-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111508532B (zh) | 用于磁存储介质的健康管理 | |
US11119660B2 (en) | Determining when to replace a storage device by training a machine learning module | |
US8645641B2 (en) | Intelligent storage device controller | |
CN113474838B (zh) | 用于改善磁存储介质数据可靠性的方法、装置和片上系统 | |
US9837115B1 (en) | Unequal error correction code in multi-track recording | |
US20080192378A1 (en) | Adaptive data-dependent noise prediction (ddnp) | |
JP2013255221A (ja) | 保持されたセクターの再処理を用いるデータ処理システム | |
US20230020009A1 (en) | Health Management for Magnetic Storage Media | |
US10275309B2 (en) | Multi-layer integrated zone partition system error correction | |
CN107102953B (zh) | 非易失性存储器装置及其迭代排序方法 | |
CN111344788B (zh) | 基于设备群体数据完整性共享的系统级纠错编码分配 | |
US11593204B2 (en) | Fleet health management device classification framework | |
US8743493B1 (en) | Fixed-point processing using quantization levels based on floating-point processing | |
US10382166B1 (en) | Constrained receiver parameter optimization | |
US10552252B2 (en) | Patterned bit in error measurement apparatus and method | |
US20180012627A1 (en) | Managing far and near track erasure by dynamic control of a write current parameter of a magnetic disk drive | |
US11237893B2 (en) | Use of error correction-based metric for identifying poorly performing data storage devices | |
JP2014182848A (ja) | 情報再生装置および情報再生方法 | |
US8730606B1 (en) | Read channel error correction using multiple calibrators | |
CN115087962A (zh) | 用于全跨度降级的抢先升级 | |
US10969969B2 (en) | Use of recovery behavior for prognosticating and in-situ repair of data storage devices | |
Coughlin et al. | Fundamentals of Hard Disk Drives | |
US11984910B1 (en) | Reinforcement learning-enabled low-density parity check decoder | |
US11341989B2 (en) | Read head stress reduction | |
US11386921B2 (en) | Read head stress reduction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |