一般的数据存储系统包括一个或多个同轴地安装在一个主轴电机轮毂上的数据存储盘。主轴电机以一般每分钟大约几千转的速度转动盘。代表各类型数据的数字信息一般通过一个或多个传感器或读/写头写到数据存储盘或从数据存储盘读出,这些传感器或头安装到一个传动装置上并越过快速旋转的盘的表面。
传动装置一般包括多个向外伸展的臂,一个或多个传感器弹性或刚性地安装在臂的末端。传动装置臂一般利用安装到传动装置上的线圈组件交错地插入/出旋转盘的叠层。线圈组件一般与永磁结构作用,加到线圈的一个极性的电流使传动装置臂和传感器在一个方向上移动,而相反极性的电流使传动装置臂和传感器在相反方向上移动。
在一般数字数据存储系统中,数字数据以磁变换的形式存储在一系列同轴的、紧密间隔的道上,这些道组成可磁化的刚性数据存储盘的表面。道一般被分为多个扇区,每个扇区包括若干个信息域。信息域中的一个一般设计用来存储数据,而其他的域含有例如扇区标识和同步信息。一般在控制器的控制下,利用在道间移动的传感器将数据传送到特定的道和扇区位置或从中恢复数据。传感器组件一般包括一个读元件和一个写元件。其他传感器组件结构装有单个传感器元件,用于将数据写到盘上并从盘上读数据。
将数据写到数据存储盘一般是使电流流过传感器组件的写元件,以产生磁力线,该磁力线磁化盘表面上的特定位置。从特定盘位置读数据一般是通过感测由盘的磁化位置发射的磁场或磁力线的传感器组件的读元件完成的。当读元件越过旋转的盘表面时,读元件与盘表面上的磁化位置之间的相互作用导致在读元件中产生电脉冲。该电脉冲与磁场变换相应。
本领域中熟练的技术人员能认识到,主轴电机的性能对于提供高级别的数据存储系统性能和稳定性是至关重要的。主轴电机组件的正常和加速磨损,尤其是主轴轴承的磨损与数据存储系统性能的一般退化有关。主轴电机轴承表面加工精度的一致性以及轴承圈的变形一般导致主轴轴承组件内增大摩擦和轴承组件加速疲劳。主轴轴承组件工作状态的这种不理想的改变一般导致主轴电机性能逐渐退化,增加为克服另外机械摩擦而消耗的主轴电机电流,并且更重要的是,更可能对主轴电机轮毂上所安装的一个或多个数据存储盘上所存储的数据造成暂时或永久丢失。
一般认为在早期和整个使用寿命中检测主轴电机的性能改变是相当必要的,以便使数据存储系统的断续的和严重的故障的可能性最小化。已经采用许多完善的、一般是昂贵的预测故障分析方法,以试图检测与主轴电机轴承组件退化有关的故障方式的存在。这些现有技术方法中的许多方法需要数据通道或伺服通道是活动的,以便执行各个测试程序,并且获得数据,当分析这些数据时,只间接地指明主轴电机故障机制的存在或不存在。
经常将另外的电子硬件和控制电路安装到数据存储系统中,以便支持这些和其他已知预测分析故障分析方案,因而增加系统的总体成本和复杂性。在小或非常小的形状系数的数据存储系统中,这些系统一般尤其易受到主轴轴承疲劳,这种小型系统的相当紧凑的包装结构经常不可能采用需要安装另外系统部件的预测故障分析方案。另外,常规主轴电机预测故障分析方法不能检测能够不利地影响主轴电机性能而不使主轴轴承退化或磨损的内部数据存储系统故障方式的存在。
现在参照附图,尤其参照图1和图2,示出一个数据存储系统20,从外壳21的基座22上去除了盖。该数据存储系统20一般包括一个或多个刚性数据存储盘24,它们以串联相间隔的关系同轴地叠地一起,并以相对高的转速绕主轴电机26转动。一般对每个盘24进行格式化,以包括多个相间隔的同心道50,每个道分为一系列扇区52,这些扇区又进一步分为各个信息域。也可以对一个或多个盘24格式化为包括螺旋的道结构。
传动装置30一般包括多个交错的传动臂28,每个臂具有一个或多个传感器27和滑块体35组件,这些组件安装到加载梁25,用于从数据存储盘24读数据和向所述数据存储盘24写数据。一般将滑块体35设计为空气动力学提升体,当主轴电机26的转速增加时,滑块体35将传感器27提升离开盘24的表面,并使传感器27悬浮在盘24上,在由高速盘转动所产生的气流结构所产生的空气轴承上。另一方案是,可以在盘表面24上设置敷形润滑剂,以降低在滑块体35与盘表面24之间的静摩擦和动摩擦。
传动装置30通常安装在静止传动轴32上,并且在该轴上转动,将传动臂28移入和移出数据存储盘组24。安装到传动装置30的线圈架34的线圈组件36一般在永磁结构38的上下磁组件40和42限定的间隙44内转动,使得传动臂28又越过数据存储盘24的表面。主轴电机26一般包括一个多相交流电机,或另一方案包括一个直流电机,由电源46供电,用于转动数据存储盘24。
线圈组件36和永磁结构38的上下磁组件40和42协同工作,作为传动装置音圈电机39,对控制器58所产生的控制信号进行响应。在存在永磁结构38所产生的磁场的情况下,当变化方向和大小的控制电流流过线圈组件36时,传动装置音圈电机39在传动装置线圈架34上产生扭力。该扭力作用到传动装置线圈架34上,又引起传动臂28的相应转动移动,移动方向取决于线圈组件36中流动的控制电流的极性。控制器58最好包括控制电路,当从盘24读数据和向盘24写数据时,该电路协调到数据存储盘24的以及自数据存储盘24的数据传送,并与传动装置音圈电机39配合,将传动臂28和传感器27移动到指定的道50的扇区52位置。
可以理解,为了维持高级别的数据存储系统20的性能和稳定性,最佳的主轴电机26操作是至关重要的。主轴电机26性能的退化通常认为是由主轴电机26轴承组件的机械疲劳引起的。例如,当主轴电机26一般以大约每分钟5000至7000转速度转动时,轴承或轴承支架结构的不规则性会阻碍轴承的移动。与各精度轴承、轴承支架和主轴电机组件的制造有关的装配和组装缺陷经常引起主轴电机26使用寿命的显著下降。
新颖的主轴电机预测故障分析方法和装置提供对主轴轴承状态的细微和明显改变的早期检测,如果未检测出这些改变,则能够导致主轴电机组件26的逐渐退化和加速故障。通过在主轴电机使用寿命期间周期性地执行该新颖的主轴电机退化检测方法,也能够检测主轴轴承组件的自然磨损。该新颖的预测故障分析方法还检测影响主轴电机26性能而不直接与主轴轴承损坏和磨损有关的数据存储系统20故障的存在。
在一个实施方式中,用于评价主轴电机26工作状况的该新颖预测故障分析方法和装置最好用于在主轴电机26的制造时间和在使用寿命期间的各时间确定主轴电机26的下降时间。这里所讨论的主轴电机26的下降时间(CDT)是指主轴电机在初始角速度(ωI)与测试角速度(ωT)之间变换所需的时间宽度。
实际上,初始角速度ωI最好选定为主轴电机26的标称设计速度(ωN),而测试角速度ωT最好选定为相对于初始角速度ωI相对慢的速度。已经确定到,特定主轴电机26的使用期间下降时间的下降一般指示一种导致主轴电机26性能逐渐和加速退化的故障机制。一种常见的故障机制,如前所述,与轴承组件内的机械摩擦的增加有关。
现有参照图3,示出一种描绘特定主轴电机26的特性下降时间曲线66和68的概括图形,是分别在或接近数据存储系统20制造时间以及在主轴电机26使用寿命期间的较后时间确定的。下降时间曲线66一般描绘主轴电机26掉电后的自然减速,作为主轴电机速度(ωSM)和时间(t)的函数测绘。在数据存储系统20制造时间,并且最好在系统20已经通过最后验收测试之后,确定主轴电机的特性下降时间。将影响减速和加速时间的主轴轴承摩擦高度依赖于温度。因此,主轴电机26的特性下降时间应该在数据存储系统保持在正常工作温度时确定。在主轴电机26达到其标称设计速度ωN64之后,并且在数据存储系统20达到稳定状态工作温度之后,关掉加到主轴电机26的电源,或者不允许它工作。最好是,然后主轴电机26减速,不受制动机制或其他可能增加主轴电机26减速速率的装置的影响。
然后确定主轴电机26从初速度ωN64减速至主轴电机26测试速度ωT62所需的时间宽度。这个时间宽度,在图3中由tB72指示,是数据存储系统26制造时间时的主轴电机26的特性下降时间,以后称为用于检测主轴电机26性能的基准。注意,在制造时建立主轴电机26基准下降时间tB的过程可以重复若干次,以便获得平均基准下降时间tB72。还应注意,最好主轴电机26测试速度ωT62选定为与初速度ωN64比较起来相对低,以便增加新颖预测故障分析过程的准确性。
再次参照图3,下降时间曲线68一般表示在主轴电机26使用寿命期间某时间点的主轴电机26的减速特性。主轴电机26的使用期间下降时间示为tS70,并被描绘为在宽度上相对于在数据存储系统20制造时间所建立的基准下降时间tB72短许多。标称基准下降时间tB72与下降的使用期间下降时间tS70之间的差71是主轴电机26性能退化幅度的一般量度。基本上与基准下降时间tB72相等的使用期间下降时间tS一般指示主轴电机26几乎没有使用,或者相对于最初使用所确定的性能特性没有性能退化。还应注意到,当执行使用期间下降时间确定过程时数据存储系统20的工作温度与建立基准下降时间tB72时的工作温度不同时,在确定使用期间下降时间tS70时,可以应用校正因子。校正因子最好说明作为工作温度的函数的主轴轴承组件性能的正常变化,并且一般改进使用期间下降时间确定的准确性。
在另一个实施方式中,一个新颖的预测故障分析方法和装置最好采用来在数据存储系统20制造时间以及在主轴电机26使用寿命期间各时间确定主轴电机26的上升时间(SUT)。上升时间是指主轴电机26在主轴电机26的初始角速度ωI与相对较高的测试角速度ωT(最好是标称设计速度ωN)之间变换所需的时间宽度。上升时间的增加也可以指示主轴电机组件26性能的退化。
在图4中,示出描绘主轴电机26的特性上升时间曲线80和82的概括图形,是在数据存储系统20制造时间和主轴电机26使用寿命期间的较后时间测试的。上升时间曲线80一般表示主轴电机26从初始角速度ωI76变换到较高的测试角速度ωT78时的加速曲线。在测试时,主轴电机26的初速度ωI可以选定为零速度或比测试速度ωT78低许多的速度。在主轴电机26的使用寿命期间,最好进行若干次上升时间确定,以确定相对于在或接近数据存储系统20制造时间所确定的标称基准上升时间tB84的上升时间偏差的存在和大小。基准上升时间tB84与使用期间上升时间tS86之间的时间差90的大小一般指示主轴电机26性能退化。
利用主轴电机下降时间作为性能测试参数对主轴电机26性能退化进行检测的最佳方法用图5-7中的流程图说明。为特定主轴电机26建立标称基准下降时间tB是在数据存储系统20制造期间或稍后首次确定的。在步骤100中,主轴电机26最好转动到其标称设计速度ωN,并且转动足够的时间,足以允许数据存储系统20达到稳定状态工作温度。然后在步骤102,启动定时器同时关掉主轴电机26的电源,开始该新颖的主轴电机预测故障分析过程。让主轴电机26不受制动机制的帮助而减速认为是有利的。这种制动可能掩盖预示退化的主轴轴承状况的任何微小减速因素。
在步骤104,监测主轴电机26的减速,并在主轴电机26减速期间的各时刻对速度ωSM抽样。在步骤106,对抽样的主轴电机速度ωSM与预定测试速度ωT进行比较,该预定测试速度最好显著低于主轴电机26初速度ωI。监测主轴电机26减速,直到主轴电机26速度ωSM基本上等于预定测试速度ωT,眦时定时器在步骤108停止。然后在步骤110计算主轴电机26的下降时间tB,作为步骤102与步骤108之间逝去的时间,如定时器所记录的总时间所指。该下降时间tB在以后用作在使用寿命期间评价主轴电机26工作状况的基准。基准下降时间tB最好代表在重复方法步骤100至110若干次后所确定的平均下降时间tB。
注意,在步骤106可以采用若干公知的装置确定主轴电机26是否已经减速到预定测试速度ωT。最好将测试速度ωT选定为显著低于主轴电机26初速度ωI,并且一般受特定数据存储系统20的具体速度和时间测量装置的精度和分辨度的限制。例如,在确定是否已达到预定测试速度ωT时,可以使用主轴电机26的反-EMF(反电动势)。最好将测试速度ωT选定为使得在测试速度ωT的反-EMF电压能够容易地分辨于背景噪声。例如,采用霍耳类型传感器以确定主轴电机26速度的数据存储系统20,对于相同的速度确定,一般能够分辨比利用反-EMF的系统20低的测试速度ωT。
在主轴电机26的使用寿命期间,最好根据基于图6至图7所示流程图的程序,在时间域内执行类似于参照图5所述的过程的下降时间确定过程。该新颖的主轴电机预测故障分析过程的重要优点是:在正常掉电序列或者数据存储系统20所执行的节电程序期间执行该过程。在一个实施方式中,该新颖的下降时间确定过程最好在系统20的正常掉电序列期间进行,从而很少影响或不影响数据存储系统20的正常工作。在另一实施方式中,该新颖的下降时间确定过程最好在系统20所执行的节电程序期间进行。在延长的非使用时间内,某些数据存储系统采用控制硬件和软件,来暂时中止加到主轴电机26的电流传送,一般是在传感器27已经移到一停止位置或被卸载到停止斜台60之后,以便于节约系统功率。该新颖的主轴电机预测故障分析过程最好在该节电方式期间进行,从而对数据存储系统20的正常工作没有明显影响。
在主轴电机26使用寿命早期,最好相对不经常地执行下降时间确定过程,比如每500或1000个启动/停止序列。随着主轴电机26的老化,最好增加使用期间下降时间确定的频率,比如每50或100个启动/停止序列。在一个实施方式中,下降时间确定的频率是由数据存储系统20动态确定的,并根据使用期间下降时间tS与预定基准下降时间tB之间改变的大小而变化。例如,使用期间下降时间tS相对于预定基准下降时间tB的一个可接受的偏差可以是与均值相差一至三个σ,如图3中由在tB72边缘的tB-Xσ75与tB+Xσ77所限定的容差带73所表示。然而,与均值相差大约五至六个σ的偏差最好动态地增加使用期间下降时间确定的频率。例如,50个启动/停止序列的测试频率可以增加到10个启动/停止序列,以响应使用期间下降时间tS与基准下降时间tB之间相对大的偏差。
进一步参照图6,在步骤112开始使用期间主轴电机预测故障分析过程,向主轴电机26开始供电。在步骤114,主轴电机26转动到其用于正常数据存储系统20工作的标称速度ωN。在步骤116,停止/启动计数器增1。停止/启动计数器,最好作为数据存储系统20的控制器58电路的部件,存储自从先前执行的使用期间下降时间确定过程起算的停止/启动序列的累计个数。如果在步骤118停止/启动计数器的计数C不等于测试频率计数N,则在步骤120执行下降时间确定过程。然而,如果停止/启动计数器的计数C等于测试频率计数N,则最好在步骤123不中断数据存储系统20的正常工作,直到系统20执行正常掉电序列或节电程序,此时最好执行该新颖的主轴电机预测故障分析过程,作为步骤122和124。
现有参照图7,在步骤126,启动定时器,同时关掉主轴电机26的电源,开始该新颖的使用期间下降时间确定过程。如前所述,最好允许主轴电机26不受制动装置的影响而减速。在主轴电机26减速期间,在步骤128进行速度确定。在步骤130,主轴电机的速度ωSM与测试速度ωT进行比较,如果不等,则在步骤128继续监测主轴电机速度ωSM。如果主轴电机速度ωSM等于测试速度ωT,则在步骤132停止定时器。在步骤134计算主轴电机26的使用期间下降时间tS,作为定时器记录的总逝去时间。然后,在步骤136对所计算的使用期间下降时间tS与预定基准下降时间tB进行比较。注意,在数据存储系统20的制造时间,最好将预定基准下降时间tB参数存储在控制器58的电路内所包括的存储装置中。例如,最好也将测试速度ωT、初速度ωI、基准下降时间tB和容差带参数存储在存储器中。
实际上,需要建立一个容差范围,计算出的在该范围内的使用期间主轴电机下降时间tS可认为是可接受的,并且一般指示主轴电机26性能的不重要的改变。在步骤138,对计算出的使用期间下降时间tS进行测试,以确定它是否落入图3所示的容差带73内,如果计算出的使用期间下降时间tS落入该容差带73内,则在步骤140继续数据存储系统的正常操作。注意,例如在步骤140恢复系统20的正常工作需要继续数据存储系统20的掉电序列或节电程序。根据计算出的使用期间下降时间tS与预定基准下降时间tB之间偏差的大小,最好实现不同的系统响应。计算出的下降时间tS与预定基准下降时间tB之间微小的偏差只保证最小的系统20响应,比如在步骤142记录容差外的事件。记录容差外的事件可以包括增加控制器58电路内专用于监测数据存储系统20故障的计数器或位状态寄存器。较大的偏差保证更大的系统20响应,比如在步骤144调节用于执行使用期间主轴电机预测故障分析过程的测试频率。计算出的使用期间下降时间tS与预定基准下降时间tB之间大的偏差,例如使数据存储系统20在步骤146产生警告信号,该信号传输到数据存储系统所连接的主计算机。该警告信号最好警告用户需要及时修复或更换数据存储系统20。
注意,使用期间下降时间tS与预定基准下降时间tB之间大的偏差经常指示即将来临的主轴电机轴承故障。中度到大的偏差也可以指示不会造成轴承组件的轴承故障或过度磨损的数据存储系统20故障机制。该新颖的主轴电机预测故障分析过程的显著优点在于能够检测影响主轴电机性能的、而利用常规预测故障分析方法却检测不到的其他内部数据存储系统20故障方式。例如,在数据存储系统20外壳21内偏移的或移位的组件对主轴电机26或盘24转动的干挠能够负面影响主轴电机26的性能。例如,松动的或移位的内部粒子过滤器可能接触盘24的表面或主轴电机26的轮毂27。尽管在其某情况下,这种接触可能不造成严重损坏的数据存储系统20故障,但是另外造成的摩擦可能最终损坏读/写传感器27、数据存储盘24的敏感表面,或者使主轴电机26的电流过大。执行该新颖的下降时间确定过程将检测主轴电机26下降时间的明显改变,从而,指示主轴电机26性能的实际退化。内部组件与数据存储盘24或主轴电机26中的任何一个的直接接触最好通过产生警告信号来指示,当该信号传输到主计算机时,警告用户数据存储系统20的严重异常状态。
能严重影响主轴电机26性能的另一内部数据存储系统20故障机制与起飞速度增长很大的一个或多个读/写传感器27和滑块体36组件有关。起飞速度的这种增长一般指示传感器27/滑块体35组件与盘表面24之间的周期性的或即将来临的接触。这种有害接触能够显著降低主轴电机26的使用期间下降时间tS。注意,该新颖的主轴电机预测故障分析过程可以与其他的(一般是更复杂的)故障分析过程结合使用。例如,利用数据或伺服通道测量的用于确定传感器27/滑块体35组件飞行特性的各种已知的方法,经常被用来测量组件的飞行高度的改变。与相对简单但是完美新颖的下降时间确定过程相结合,采用这些及其他已知的复杂预测故障分析过程,能够有效地检测和准确地隔离特定数据存储系统20故障机制。
现有转到图8,以流程图的形式示出采用根据先前参照图4所述的另一实施方式的新颖的主轴电机预测故障分析过程的方法步骤。不是确定作为下降时间的函数的主轴电机性能退化,而是确定主轴电机26在最初低速度ωI与相对高的测试速度ωT之间变换的启动时间。测试速度ωT最好是主轴电机26标称设计速度ωN,而初速度ωI最好是比测试速度ωT低许多的主轴电机26速度,比如零速度。
仍然参照图8,在步骤148使主轴电机26的电源工作,开始使用期间启动时间确定过程。当主轴电机速度ωSM等于预定初速度ωI时,在步骤150启动定时器。在主轴电机26加速期间,在步骤152监测并计算主轴电机速度ωSW,并在步骤154与测试速度ωT比较。当主轴电机速度ωSM基本等于测试速度ωT时,在步骤156停止定时器。然后在步骤158计算使用期间上升时间tS,该时间与定时器在步骤156所记录的时间相等。然后,在步骤160对计算出的使用期间上升时间tS与先前在数据存储系统20制造时所建立的主轴电机26的预定基准上升时间tB进行比较。如果在步骤162中计算出的使用期间启动时间tS落在如图4中tB-Xσ81与tB+Xσ85之间所限定的带所示的预定基准启动时间tS界定的容差带88之内,则在步骤164继续数据存储系统20的正常工作。如果计算出的使用期间启动时间tS落在容差带88的范围之外,则数据存储系统20最好根据上升时间偏差的相对大小响应,例如,在步骤166记录容差外的事件,在步骤168调节使用期间启动时间确定过程的测试频率,或者在步骤170向数据存储系统20所连接的主计算机传送警告信号。
控制器58的电子电路一般包括一个微处理器或其他处理电路,适于存储并执行该新颖的主轴电机预测故障分析过程。用于确定下降时间和启动时间的定时器可以用硬件或软件实现。另外,控制器58所执行的用于管理数据存储系统20的正常操作的微代码可以包括表示用于执行该新颖的主轴电机预测故障分析过程的子程序的代码,该代码最好在数据存储系统20的掉电序列或节电程序期间执行。因此,不需另外的硬件,并且只需最少地改动现有软件,完全实现该新颖的主轴电机预测故障分析方法和装置。
当然应理解到,对以上所述的实施方式可以进行各种修改和增加,而不背离本发明的范围和实质。例如,执行下降时间或启动时间确定过程的频率可以设为增加的,而不是上述那样,并且可以时时执行该过程,而不是在数据存储系统20的掉电序列或节电程序期间。另外,应理解到,在确定下降或启动时间时,可以采用除逝去时间之外的测量值,比如作为时间的函数的与主轴电机26速度有关的测量值,作为时间的函数的主轴电机26加速度或减速度,或者例如在预定时间周期内主轴电机26的转数。因此,本发明的范围不应限于上述特定实施方式,而只应由以下权利要求以及等效实施方式限定。