CN101162510A - 用户可替换单元及用于识别故障的用户可替换单元的方法 - Google Patents

用户可替换单元及用于识别故障的用户可替换单元的方法 Download PDF

Info

Publication number
CN101162510A
CN101162510A CNA2007101382732A CN200710138273A CN101162510A CN 101162510 A CN101162510 A CN 101162510A CN A2007101382732 A CNA2007101382732 A CN A2007101382732A CN 200710138273 A CN200710138273 A CN 200710138273A CN 101162510 A CN101162510 A CN 101162510A
Authority
CN
China
Prior art keywords
fault
replaceable
subelement
cru
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007101382732A
Other languages
English (en)
Inventor
格雷格·S.·卢卡斯
罗伯特·A.·库博
安德鲁·E.·塞德尔
约翰·C.·埃利奥特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101162510A publication Critical patent/CN101162510A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]
    • G06F11/0724Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU] in a multiprocessor or a multi-core unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Marketing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

提供一种射频识别器(RFID)有源/无源标签以在较高层的CRU之内识别故障子CRU以及位置。当基础刀片上或子CRU之一内出现差错时,嵌入式处理器将故障信息写到RFID。RFID标签还可包含识别刀片的子CRU的位置的数据。因此,当出现故障时,RFID可报告故障部件以及故障子CRU的位置。子CRU还可包括嵌入式处理器和RFID标签。当发起维修动作以修理或替换刀片时,可由RFID阅读器来读取RFID标签。RFID阅读器装置可随后向操作者呈现故障信息,该故障信息包括故障子CRU的标识和其它相关信息。RFID阅读器装置还可向服务器计算机请求相关信息。

Description

用户可替换单元及用于识别故障的用户可替换单元的方法
技术领域
本申请总的来说涉及改进的数据处理系统和方法。更具体地说,本申请针对一种在较高层的CRU之内识别故障子CRU以及位置的射频识别器有源/无源标签。
背景技术
在某些系统中,服务器的集合与服务器系统互连,共享诸如在
Figure A20071013827300051
系统中的高速组织拓扑。“BladeCenter”是国际商用机器公司在美国其它国家和/或二者中的商标。
Figure A20071013827300052
系统是在单个机箱中容纳多个服务器模块(“刀片(blade)”)的服务器体系结构。刀片服务器广泛用于数据中心以节约空间并改进系统管理。独立安装或安装在机架上的机箱提供电源。每个刀片可具有它自己的CPU、存储器和硬盘。刀片服务器通常提供它们自己的管理系统,并且可包括网络或存储交换机。
系统中,将每个刀片看作用户可替换单元(CRU)。每个刀片还可具有子CRU。因此,当刀片出故障时,该故障可能是由于基础刀片本身或一个或多个子CRU上的故障导致的。当故障出现时,刀片的嵌入式处理器声明故障指示器。如果故障是由于子CRU,则处理器识别该CRU并将所述信息保存到非易失性存储器。
为了能够在刀片被去除时识别故障子CRU,刀片实现诸如超电容器(超电容)或硬币电池的电压源,以便向各个指示器和按钮供电。用户去除要维修的刀片以确定哪个子CRU出现故障。在当前的方法中,用户按下每个按钮并查找各个点亮的指示器。如果指示器点亮,则相应的子CRU被识别为故障部件。用户可随后替换该识别的子CRU。如果指示器没有点亮,则用户可推断该刀片出现故障。
这种实现具有几个缺点。电池或超电容、按钮和指示器成本较高并占用昂贵的卡的实际状态。此外,用于问题确定的手动步骤在时间上是密集的。此外,由于操作者必须确定并定位故障子CRU,所以手动处理容易出现人为差错。
发明内容
所示实施例考虑现有技术的缺点,并提供一种在较高层的CRU之内识别故障子CRU以及位置的射频识别器有源/无源标签。当在基础刀片上或子CRU之一内出现差错时,嵌入式处理器将故障信息写到RFID。RFID标签还可包含识别刀片的子CRU的位置(诸如(x,y)坐标或插槽标识符)的数据。因此,当出现故障时,RFID可报告故障部件(基础刀片本身还是子CRU)以及故障子CRU的位置。或者,子CRU还可包括嵌入式处理器和RFID标签。
当发起维修动作以修理或替换刀片时,将刀片去除并断开电源。在这一点上,RFID标签可将它的运转状态从有源部件转变为可由RFID阅读器读取的无源标签。RFID阅读器扫描RFID标签,并接收故障信息和其它信息,诸如子CRU插槽的位置。RFID阅读器装置可随后向操作者呈现包括故障子CRU的标识的故障信息。
RFID阅读器装置可存储与刀片和子CRU相关的其它信息。例如,RFID阅读器装置可存储刀片的布局图或用于从刀片去除故障子CRU的指令。RFID阅读器装置随后可在修理或替换时间向操作者呈现相关的信息。RFID阅读器装置还可向服务器计算机请求相关的信息,所述服务器计算机可存储关于刀片布局、刀片图、用于去除子CRU的指令、故障的可能原因等的最新信息。
在一示出的实施例中,计算机程序产品包括具有计算机可读程序的计算机可用介质。在计算装置上执行时,计算机可用程序促使计算装置使用射频识别器阅读器装置来扫描用户可替换单元之内的至少一个射频识别器以查找故障信息,从所述至少一个射频识别器接收故障信息,基于所述故障信息识别故障的用户可替换单元或用户可替换子单元,并向操作者呈现对故障的用户可替换单元或用户可替换子单元的识别。
在一示例性实施例中,计算机可读程序还促使计算装置从所述至少一个射频识别器接收故障的用户可替换单元或用户可替换子单元的位置,并向操作者呈现故障的用户可替换单元或用户可替换子单元的位置。
在另一示例性实施例中,呈现故障的用户可替换单元或用户可替换子单元的位置的步骤包括:显示用户可替换单元的布局图。
在另一示例性实施例中,计算机可读程序还促使计算装置向服务器请求与故障的用户可替换单元或用户可替换子单元相关的其它信息,从服务器接收所请求的其它信息,并向操作者呈现与故障的用户可替换单元或用户可替换子单元相关的所述其它信息。在另一示例性实施例中,与故障的用户可替换单元或用户可替换子单元相关的所述其它信息包括用于去除故障的用户可替换子单元的指令。
在另一示例性实施例中,扫描用户可替换单元之内的至少一个射频识别器以查找故障信息的步骤包括:扫描连接到用户可替换单元的用户可替换子单元的射频识别器。
在另一所示的实施例中,用户可替换单元包括:嵌入式处理器、至少一个用户可替换子单元和具有存储器的射频识别器。当用户可替换单元或所述至少一个用户可替换子单元之一中出现差错时,嵌入式处理器将故障信息写到射频识别器的存储器。
在一示例性实施例中,响应于用户可替换单元的断电,射频识别器转变到无源模式。在另一示例性实施例中,响应于射频识别器阅读器装置的活动,射频识别器将故障信息发送到射频识别器阅读器装置。在另一示例性实施例中,响应于故障信息的接收,射频识别器阅读器装置向操作者呈现对故障的用户可替换单元或用户可替换子单元的识别。
在另一示例性实施例中,所述至少一个用户可替换子单元内的给定用户可替换子单元包括嵌入式处理器和具有存储器的射频识别器。在另一示例性实施例中,当给定用户可替换子单元中出现差错时,所述给定用户可替换子单元的嵌入式处理器将故障信息写到给定用户可替换子单元的射频识别器的存储器。
在另一示出的实施例中,提供一种用于识别故障的用户可替换单元的方法。所述方法包括:使用射频识别器阅读器装置来扫描用户可替换单元之内的至少一个射频识别器以查找故障信息,从所述至少一个射频识别器接收故障信息,基于所述故障信息识别故障的用户可替换单元或用户可替换子单元,并向操作者呈现对故障的用户可替换单元或用户可替换子单元的识别。
在另一示例性实施例中,所述方法可执行一个或多个以上关于计算机可读程序描述的操作。
在另一所示的实施例中,提供一种用于提供故障的用户可替换单元信息服务的方法。所述方法包括:从射频识别器阅读装置接收对与故障的用户可替换单元或用户可替换子单元相关的信息的请求,从数据库检索所请求的信息,将检索的与故障的用户可替换单元或用户可替换子单元相关的信息返回给进行请求的射频识别器阅读装置。
在一示例性实施例中,与故障的用户可替换单元或用户可替换子单元相关的信息包括用于去除故障的用户可替换子单元的指令。
在另一示例性实施例中,与故障的用户可替换单元或用户可替换子单元相关的信息包括故障的用户可替换单元的布局图。
根据以下对本发明示例性实施例的详细描述,将描述本发明的这些和其它特征和优点,或者本发明的这些和其它特征和优点将对于本领域的普通技术人员变得清楚。
附图说明
通过参照以下结合附图对所示实施例的详细描述,将最佳地理解本发明以及本发明的优选使用模式和其它目的和优点,其中:
图1示出可实现所示实施例的各方面的示例性刀片服务器系统的图示;
图2A示出根据所示实施例的刀片配置;
图2B示出根据所示实施例的RFID阅读器配置;
图3示出根据所示实施例的具有带RFID标签的子CRU的RFID阅读器配置;
图4示出根据示例性实施例的显示故障零件的识别应用的示例屏幕;
图5示出根据示例性实施例的简单RFID装置;
图6是示出根据所示实施例的CRU或子CRU中的嵌入式处理器的操作的流程图;
图7是示出根据所示实施例的RFID阅读装置的操作的流程图;以及
图8是示出根据所示实施例的故障的CRU信息服务的操作的流程图。
具体实施方式
现在参照附图,特别是图1,提供数据处理环境的示例性示图,其中,可实现本发明的所示实施例。应理解:图1仅是示例性的,而不在于声明或表示任何对于可实现本发明各方面或实施例的环境的限制。在不脱离本发明的精神和范围的情况下,可对所示的环境进行许多修改。
现参照附图,图1示出可实现所示实施例各方面的示例性刀片服务器系统的图示。刀片服务器系统100可包括多个刀片服务器102,所述刀片服务器102均具有相应的子卡104。在示出的示例中,刀片服务器系统包括14个刀片服务器,然而,根据实现的情况可包括更多或更少的刀片插槽。服务器刀片可以是处理器刀片、存储器刀片等。
例如,交换模块1 112和交换模块2 114提供到以太网的连接。交换模块3和交换模块4充当交换模块,并提供到以太网、光纤通道(FC)、SAS等的连接。刀片服务器102和子卡104通过低速结构(fabric)146(在该示例中为用于14个刀片服务器的14深度)连接到交换模块112-114。
高速交换模块1 122和高速交换模块2 124提供到InfiniBand(IB)、以太网等的连接。高速交换模块3 126和高速交换模块4 128提供到IB、以太网或串行连接小型计算机系统接口(串行连接SCSI或SAS)。
刀片服务器102和子卡104经由高速结构142连接到高速交换模块122-128。在该示例中,这些高速结构为用于14个刀片服务器的14深度。
刀片服务器系统100还包括管理模块110。管理模块110执行各种对于刀片服务器系统100的管理功能,诸如监视系统及其相关的刀片服务器102、子卡104、交换模块112-118、122-128等。通过管理结构148将刀片服务器系统100的部件连接到管理模块110。管理模块110还有助于识别故障的用户可替换单元(CRU)以进行维修动作。
本领域的普通技术人员将认识到:图1中的硬件可取决于实现的情况而变化。除图1所示的硬件之外,还可使用其它内部硬件或外围装置(诸如风扇、电源等),或者,可使用其它内部硬件或外围装置(诸如风扇、电源等)来替换图1所示的硬件。此外,在不脱离所示实施例的精神和范围的情况下,可将所示实施例的处理应用于除上述刀片服务器系统之外的数据处理系统。
图2A示出根据上述实施例的刀片配置。刀片220和刀片230被连接到底板210。例如,如图1所示,经由高速结构、低速结构和/或管理结构,可通过底板210将刀片220和刀片230连接到管理模块、交换模块等。刀片220和刀片230可以是处理器刀片、存储器刀片、其它类型的balde或它们的组合。
刀片220和刀片230是用户可替换单元(CRU)。也就是说,用户可在不借助于厂商的情况下去除并替换刀片220或刀片230。刀片220包括嵌入式处理器225和子CRU 222、224、226。刀片230包括嵌入式处理器235和子CRU 232、234。作为示例,子CRU 222、224、226、232和234可以是处理器模块、存储器模块、硬盘驱动器、子卡、其它可去除模块或它们的组合。
根据所示实施例,刀片220还包括射频识别器(RFID)标签228,刀片230包括RFID标签238。RFID标签也称为“电子标签”、“应答器”或“编码板”,其由附加到天线的RFID芯片组成。随着当前的传输速度在千赫、兆赫和千兆赫之间变动,RFID标签可以是电池供电(有源)或从来自阅读器的RF波提取它们的电源(无源)。
如同条形码,RFID标签可识别物品。然而,不同于必须靠近条形码扫描器以及处于瞄准线以进行读取的条形码,RFID标签不需要扫描线,并且可嵌入物品之内。取决于标签和应用的类型,可在变化的距离范围读取RFID标签。RFID标签具有许多用途,诸如识别人员、零售产品、材料装箱、图书馆书本、甚至家畜。
“无源”标签没有电源,而是使用来自阅读器的电磁波来激励芯片并回送(反向散射)数据。“有源”标签具有电池,并且可主动将数据发送到阅读器。“半无源”标签也称为“半有源”标签,将无源反向散射与电池组合,所述电池允许装置蜂鸣、闪烁或执行某些操作。
在所示示例中,可分别将RFID标签228、238焊接到刀片220和230的母板,或者以某些其它的方式将所述RFID标签228、238耦合到刀片。RFID标签228、238可用于存储关于刀片或子CRU的操作的信息。写到RFID的故障信息可包括一般信息(诸如子CRU的零件号码或序列号)和故障信息(诸如故障概要、故障类型、故障的时间戳等)。
例如,当基础刀片(诸如刀片220)上或子CRU之一(诸如子CRU 226)内出现差错时,嵌入式处理器225将故障信息写到RFID228。类似地,嵌入式处理器235将故障信息写到RFID 238。RFID标签228、238还可包含识别刀片的子CRU位置的数据,诸如,(x,y)坐标或插槽标识符。因此,当出现故障时,RFID可报告故障部件(是基础刀片本身还是子CRU)以及故障子CRU的位置。
图2B示出根据所示实施例的RFID阅读器配置。当发起维修动作以修理或替换刀片时,将刀片220去除并断开电源。在这一点上,RFID标签228将它的运转状态从有源部件转变为可由RFID阅读器读取的无源标签。在所示示例中,RFID阅读器250被连接到笔记本计算机260,作为PCMCIA或等同卡。然而,在替换实施例中,RFID阅读器250可以是单机装置,或者可被连接到桌上型计算机、手持装置等。
RFID阅读器250扫描RFID标签228,笔记本计算机260接收故障信息和其它信息,例如子CRU插槽的位置。笔记本计算机260可随后向操作者呈现故障信息,所述故障信息包括对故障子CRU的识别及其位置。
笔记本计算机260可存储与刀片220和子CRU 222、224、226相关的其它信息。例如,笔记本计算机260可存储刀片220的图或用于从刀片去除故障子CRU的指令。笔记本计算机260可随后在修理或替换时向操作者呈现相关信息。
在替换实施例中,笔记本计算机260可向服务器计算机270请求相关信息。例如,笔记本计算机260可将请求发送到服务器计算机270,其中,所述请求识别刀片和故障子CRU。服务器270提供对数据库272中的CRU和子CRU的访问。服务器计算机270可随后发送关于刀片布局、刀片图、用于去除子CRU的指令、故障的可能原因等的最新信息。
服务器270可通过响应于来自配备有RFID阅读器的装置的请求提供故障信息和相关信息来提供服务。操作者可扫描来自刀片内的RFID标签的故障信息。所述装置随后可请求服务器270以获得更详细的关于刀片或故障子CRU的故障信息和其它相关信息。通过这种方式,服务器270可提供关于用户的刀片服务器系统中的CRU的最新近的详细信息。
不同于条形码,在所示示例中,RFID可存储动态内容,特别是可从父CRU继承的内容。RFID还可保留有助于故障分析和相关后勤的数据。在对于刀片服务器系统的应用中,如所示示例,当物理上去除CRU以及CRU不再具有电源时,RFID可仍旧工作在无源模式下,以允许对故障单元的诊判和识别。故障数据可保留在故障CRU中,这允许在零件被替换之后进行进一步的故障分析。
此外,RFID标签被唯一寻址并且彼此不干扰。在相同步骤中,可扫描所有子CRU并对其进行故障评估。此外,由于电子机箱采用电磁干扰(EMI)抑制以满足联邦通信委员会(FCC)的要求,可从抑制罩去除CRU用于将被扫描的RFID信号。因此,利用所示实施例,用户可去除诸如刀片的CRU以访问RFID标签。多数CRU或子CRU没有单独封闭在附加的EMI抑制结构中。
图3示出根据所示实施例的具有带RFID标签的子CRU的RFID阅读器配置。刀片320是用户可替换单元(CRU)。也就是说,用户可在不借助于厂商的情况下去除并替换刀片320。刀片320包括嵌入式处理器325和子CRU 322、324、326。作为示例,子CRU 322、324和326可以是处理器模块、存储器模块、硬盘驱动器、子卡、其它可去除模块或它们的组合。
根据所示实施例,刀片320还包括射频识别器(RFID)标签328。此外,子CRU 322包括嵌入式处理器362和RFID标签372,子CRU324包括嵌入式处理器364和RFID标签374,子CRU 326包括嵌入式处理器366和RFID标签376。在所示示例中,可将RFID标签焊接到刀片卡或子CRU卡,或者以某些其它的方式将所述RFID标签耦合到所述卡。RFID标签328、372、374、376可用于存储关于刀片或子CRU的操作的信息。
例如,当基础刀片320上或子CRU之一(诸如子CRU 326)内出现差错时,嵌入式处理器将故障信息写到RFID。例如,如果刀片320上出现差错,则嵌入式处理器325将故障信息写到RFID标签328。如果在子CRU 326中出现差错,则嵌入式处理器366将故障信息写到RFID标签376,并还将所述故障通知给嵌入式处理器325。RFID标签328还可包含识别刀片的子CRU位置的数据,诸如,(x,y)坐标或插槽标识符。因此,当出现故障时,RFID可报告故障部件(是基础刀片本身还是子CRU)以及故障子CRU的位置。
当发起维修动作以修理或替换刀片时,将刀片320去除并断开电源。在这一点上,RFID标签328、372、374和376可将它们的运转状态从有源部件转变为可由RFID阅读器350读取的无源标签。作为将RFID标签置于每个子CRU中的另一优点,对于故障去除子CRU连同完全存储在RFID标签上的故障信息。客户还可将子CRU返回厂商,该厂商可随后分析子CRU或整修该零件。用户或厂商可随后分析故障信息以确定故障模式、故障的原因等。
图2A、图2B和图3示出具有多个子CRU的刀片。然而,所示实施例的各方面可应用于具有任何数量子CRU的任何CRU。此外,一个或多个子CRU还可具有子CRU。
图4示出根据示例性实施例的显示故障零件的识别应用的示例屏幕。窗口400包括显示区域410。在扫描刀片和/或子CRU的RFID标签之后,故障零件识别应用在显示区域410中呈现故障信息。故障零件信息包括对故障零件的识别。
在所示示例中,故障零件信息包括图412,其呈现刀片布局。图412还包括故障子CRU的突出显示414。此外,故障零件识别应用还可呈现相关信息,诸如去除指令416。
图5示出根据示例性实施例的简单RFID装置。RFID 500包括通过天线506进行通信的发送器502和接收器504。控制器从接收器504接收信息并通过发送器502发送信息。可将标识信息存储在存储器512中,作为示例,存储器512可以是静态存储器,诸如可编程只读存储器(PROM)。
当通过接收器504进行轮询时,控制器510通过发送器502发送来自存储器512的标识信息。RFID 500当通过刀片或子CRU被连接到电源时,还可操作于有源模式下。在有源模式下,刀片或子CRU的嵌入式处理器可直接或通过控制器510来访问存储器512。
图6是示出根据所示实施例的CRU或子CRU中的嵌入式处理器的操作的流程图。应理解:可通过计算机程序指令来实现流程图中的每个框,以及流程图中框的组合。可将这些计算机程序指令提供给处理器或其它可编程数据处理设备以产生机器,从而在处理器或其它可编程数据处理设备上执行的指令创建用于实现在流程图的框或若干框中指定的功能的装置。还可将这些计算机程序指令存储在计算机可读存储器或存储介质中,所述计算机可读存储器或存储介质可指导处理器或其它可编程数据处理设备以特定方式工作,从而存储在计算机可读存储器或存储介质中的指令生成制造的产品,其包括实现在流程图中的框或若干框中指定的功能的指令装置。
因此,流程图的框支持用于执行指定的功能的装置的组合、用于执行指定的功能的步骤的组合以及用于执行指定的功能的程序指令装置。还应理解:可通过用于执行指定的功能或步骤的专用的基于硬件的计算机系统或者通过专用硬件和计算机指令的组合来实现流程图中的每个框以及流程图中框的组合。
参照图6,操作开始,CRU或子CRU的嵌入式处理器确定是否存在退出条件(框602)。例如,退出条件可存在于断电时(诸如当去除刀片以进行修理或替换时)。如果存在退出条件,则操作结束。
如果在框602中不存在退出条件,则嵌入式处理器进行故障监视(框604)并确定是否出现故障(块606)。如果不存在故障,则操作返回框602以确定是否存在退出条件。
如果在框606中出现故障,则嵌入式处理器将故障信息存储在CRU或子CRU的RFID标签的存储器中(框608)。然后,操作返回框602以确定是否存在退出条件。尽管没有在图6中示出,但是如果零件是子CRU,则嵌入式处理器可向父CRU通知故障。
图7是示出根据所示实施例的RFID阅读装置的操作的流程图。操作开始,在带RFID标签的子CRU的情况下,RFID阅读装置扫描CRU中的RFID标签或标签(框702)。RFID阅读装置基于从RFID标签读取的故障信息来识别故障CRU或子CRU(框704)。RFID阅读装置随后从本地存储器或从服务器或服务检索关于CRU布局的信息(框706)。RFID阅读装置检索关于故障CRU或子CRU的信息(框708)。接着,RFID阅读装置向操作者呈现识别并定位故障CRU或子CRU的信息以及关于故障CRU或子CRU的其它相关信息(框710)。然后,操作停止。
图8是示出根据所示实施例的故障CRU信息服务的操作的流程图。操作开始,服务确定是否存在退出条件(框802)。例如,退出条件可存在于提供服务的服务器断电的情况下。如果存在退出条件,则操作结束。
如果不存在退出条件,则服务确定是否从RFID阅读装置接收到请求(框804)。如果没有接收到请求,则操作返回框802以确定是否存在退出条件。
如果在框804从RFID阅读装置接收到请求,则服务将故障信息和其它相关信息返回给请求装置(框806)。然后,操作返回框802以确定是否存在退出条件。服务可基于所述请求中的识别信息从存储器检索所述信息,作为示例,所述请求可包括CRU的标识、故障CRU或子CRU的标识、故障子CRU在CRU上的位置等。作为示例,相关信息可包括:CRU布局图、关于如何防止故障的指令、用于去除故障子CRU的指令等。
因此,所示实施例通过提供一种在较高层的CRU之内识别故障子CRU以及位置的射频识别器有源/无源标签来解决现有技术的缺点。当在基础刀片上或子CRU之一内出现差错时,嵌入式处理器将故障信息写到RFID。RFID标签还可包含识别刀片的子CRU的位置(诸如(x,y)坐标或插槽标识符)的数据。因此,当出现故障时,RFID可报告故障部件(是基础刀片本身还是子CRU)以及故障子CRU的位置。或者,子CRU还可包括嵌入式处理器和RFID标签。
当发起维修动作以修理或替换刀片时,将刀片去除并断开电源。在这一点上,RFID标签可将它的运转状态从有源部件转变为可由RFID阅读器读取的无源标签。RFID阅读器扫描RFID标签,并接收故障信息和其它信息,诸如子CRU插槽的位置。RFID阅读器装置可随后向操作者呈现包括故障子CRU的标识的故障信息。
RFID阅读器装置可存储与刀片和子CRU相关的其它信息。例如,RFID阅读器装置可存储刀片的布局图或用于从刀片去除故障子CRU的指令。RFID阅读器装置随后可在修理或替换时向操作者呈现相关的信息。RFID阅读器装置还可向服务器计算机请求相关的信息,所述服务器计算机可存储关于刀片布局、刀片图、用于去除子CRU的指令、故障的可能原因等的最新信息。
应认识到,所示实施例可采取以下形式:全硬件实施例、全软件实施例或包含硬件元件和软件元件两者的实施例。在一示例性实施例中,以软件来实现所示实施例的机制,所述软件包括但不受限于固件、驻留软件、微代码等。
此外,所示实施例可采取可从计算机可用或计算机可读介质访问的计算机程序产品的形式,其中,所述计算机可用或计算机可读介质提供通过或结合计算机或任何指令执行系统使用的程序代码。为了该描述的目的,计算机可用或计算机可读介质可以是任何设备,所述设备可包含、存储、传递、传播或传输所述程序,以便通过或结合指令执行系统、设备或装置来使用。
所述介质可以是电、磁、光、电磁、红外或半导体系统(或设备或装置)或传播介质。计算机可读介质的示例包括:半导体或固态存储器、磁带、可拆卸计算机盘、随机存取存储器(RAM)、只读存储器(ROM)、刚性磁盘和光盘。光盘的当前示例包括:压缩盘-只读存储器(CD-ROM)、压缩盘-读/写(CD-R/W)和DVD。
适合存储和/或执行程序代码的数据处理系统将包括至少一个经由系统总线直接或间接耦合到存储器元件的处理器。存储器元件可包括在程序代码的实际执行期间部署的本地存储器、海量存储器以及高速缓冲存储器,所述高速缓冲存储器提供对至少某些程序代码的临时存储,以便减少在执行期间必须从海量存储器检索代码的次数。
可通过直接方式或通过干预I/O控制器的方式将输入/输出或I/O装置(包括但不受限于键盘、显示器、打印装置等)耦合到系统。网络适配器还可被耦合到系统,以通过介入专用或公共网络使得数据处理系统耦合到其它数据处理系统或远程打印机或存储装置。调制解调器、线缆调制解调器和以太网卡仅是当前可用的几种类型的网络适配器。
提供对本发明的描述的目的在于示例和描述,而不是排它的或将本发明限制于所公开的形式。许多修改和变型对于本领域的普通技术人员是清楚的。选择并描述所述实施例,以便最好地解释本发明的原理、实际应用,并使得本领域的普通技术人员能够理解本发明可以通过适合所预计的特定用途的各种修改来用于各种实施例。

Claims (14)

1.一种用户可替换单元,包括:
嵌入式处理器;
至少一个用户可替换子单元;以及
具有存储器的射频识别器,
其中,当用户可替换单元或所述至少一个用户可替换子单元之一中出现差错时,嵌入式处理器将故障信息写到射频识别器的存储器。
2.如权利要求1所述的用户可替换单元,其中,响应于用户可替换单元的断电,射频识别器转变到无源模式。
3.如权利要求2所述的用户可替换单元,其中,响应于射频识别器阅读器装置的活动,射频识别器将故障信息发送到射频识别器阅读器装置。
4.如权利要求3所述的用户可替换单元,其中,响应于故障信息的接收,射频识别器阅读器装置向操作者呈现对故障的用户可替换单元或用户可替换子单元的识别。
5.如权利要求1所述的用户可替换单元,其中,所述至少一个用户可替换子单元内的给定用户可替换子单元包括嵌入式处理器和具有存储器的射频识别器。
6.如权利要求5所述的用户可替换单元,其中,当给定用户可替换子单元中出现差错时,所述给定用户可替换子单元的嵌入式处理器将故障信息写到给定用户可替换子单元的射频识别器的存储器。
7.一种用于识别故障的用户可替换单元的方法,所述方法包括:
使用射频识别器阅读器装置来扫描用户可替换单元之内的至少一个射频识别器以查找故障信息;
从所述至少一个射频识别器接收故障信息;
基于所述故障信息识别故障的用户可替换单元或用户可替换子单元;以及
向操作者呈现对故障的用户可替换单元或用户可替换子单元的识别。
8.如权利要求7所述的方法,还包括:
从所述至少一个射频识别器接收故障的用户可替换单元或用户可替换子单元的位置;以及
向操作者呈现故障的用户可替换单元或用户可替换子单元的位置。
9.如权利要求8所述的方法,其中,呈现故障的用户可替换单元或用户可替换子单元的位置的步骤包括:显示用户可替换单元的布局图。
10.如权利要求7所述的方法,还包括:
向服务器请求与故障的用户可替换单元或用户可替换子单元相关的其它信息;
从服务器接收所请求的其它信息;以及
向操作者呈现与故障的用户可替换单元或用户可替换子单元相关的其它信息。
11.如权利要求10所述的方法,其中,与故障的用户可替换单元或用户可替换子单元相关的其它信息包括:用于去除故障的用户可替换子单元的指令。
12.一种用于提供故障的用户可替换单元信息服务的方法,所述方法包括:
从射频识别器阅读装置接收对与故障的用户可替换单元或用户可替换子单元相关的信息的请求;
从数据库检索所请求的信息;以及
将检索的与故障的用户可替换单元或用户可替换子单元相关的信息返回给进行请求的射频识别器阅读装置。
13.如权利要求12所述的方法,其中,与故障的用户可替换单元或用户可替换子单元相关的信息包括:用于去除故障的用户可替换子单元的指令。
14.如权利要求12所述的方法,其中,与故障的用户可替换单元或用户可替换子单元相关的信息包括:故障的用户可替换单元的布局图。
CNA2007101382732A 2006-09-15 2007-07-31 用户可替换单元及用于识别故障的用户可替换单元的方法 Pending CN101162510A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/532,398 2006-09-15
US11/532,398 US7627788B2 (en) 2006-09-15 2006-09-15 RFID active/passive tag identifying failed sub-CRU and location within higher level CRU

Publications (1)

Publication Number Publication Date
CN101162510A true CN101162510A (zh) 2008-04-16

Family

ID=39297431

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007101382732A Pending CN101162510A (zh) 2006-09-15 2007-07-31 用户可替换单元及用于识别故障的用户可替换单元的方法

Country Status (2)

Country Link
US (1) US7627788B2 (zh)
CN (1) CN101162510A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106921447A (zh) * 2015-12-28 2017-07-04 航天信息股份有限公司 检测多天线馈电网络的方法
CN110471376A (zh) * 2019-07-10 2019-11-19 深圳市乾行达科技有限公司 一种工业现场故障检测方法及设备
WO2021046791A1 (en) * 2019-09-12 2021-03-18 Leica Microsystems Ltd., Shanghai Blade holder system based on radio frequency identification technology and controlling method thereof

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100325490A1 (en) * 2009-06-22 2010-12-23 Anvin H Peter System and method to view crash dump information using a 2-d barcode
US8484510B2 (en) * 2009-12-15 2013-07-09 Symantec Corporation Enhanced cluster failover management
JP5601222B2 (ja) * 2011-01-26 2014-10-08 日本電気株式会社 電子機器のラックマウントシステム及び電子機器の監視方法並びにラックマウント型電子機器
US10877430B2 (en) 2016-10-11 2020-12-29 Hp Indigo B.V. Tracking removable components using sectors
TWI643060B (zh) * 2017-04-21 2018-12-01 精英電腦股份有限公司 自動化影像監測方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4803592A (en) 1986-06-24 1989-02-07 International Business Machines Corporation Power control and fault isolation indicator
DE69228986T2 (de) 1991-02-05 1999-08-12 Storage Technology Corp., Louisville, Col. Durch hierarchisch verteilte wissenbasierte maschine ausgelöste wartungs-vorrichtung und -verfahren
JP4402783B2 (ja) 1999-11-16 2010-01-20 クリエイションカード株式会社 遊技媒体貸出装置およびメンテナンスシステム
US7230520B2 (en) * 2004-05-03 2007-06-12 Dell Products L.P. Method and apparatus for RF access to system ID and fault information
US7454657B2 (en) 2004-09-02 2008-11-18 International Business Machines Corporation Method for self-diagnosing remote I/O enclosures with enhanced FRU callouts
US20060082444A1 (en) 2004-10-19 2006-04-20 Alysis Interactive Corporation Management system for enhanced RFID system performance
US7568122B2 (en) * 2005-03-16 2009-07-28 Dot Hill Systems Corporation Method and apparatus for identifying a faulty component on a multiple component field replaceable unit

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106921447A (zh) * 2015-12-28 2017-07-04 航天信息股份有限公司 检测多天线馈电网络的方法
CN110471376A (zh) * 2019-07-10 2019-11-19 深圳市乾行达科技有限公司 一种工业现场故障检测方法及设备
WO2021046791A1 (en) * 2019-09-12 2021-03-18 Leica Microsystems Ltd., Shanghai Blade holder system based on radio frequency identification technology and controlling method thereof

Also Published As

Publication number Publication date
US20080126886A1 (en) 2008-05-29
US7627788B2 (en) 2009-12-01

Similar Documents

Publication Publication Date Title
CN101162510A (zh) 用户可替换单元及用于识别故障的用户可替换单元的方法
CN106484070B (zh) 通过信息存储共享的队列电源管理
JP4389215B2 (ja) 構成装置監視システム及び構成装置監視方法
US8171142B2 (en) Data center inventory management using smart racks
US7818561B2 (en) Sending service data to an RFID tag while an attached computer system is powered off
US7504945B2 (en) Method and system for tracking and monitoring status of data storage subsystem components
US7486180B2 (en) Method and system for updating status of data storage subsystem components
KR20080049619A (ko) 접속 위치와 케이블의 식별
CN105164736A (zh) 便捷式数据收集系统和方法
US20160070629A1 (en) Mobile device and chassis with contactless tags to diagnose hardware and software faults
US8280930B1 (en) Obtaining configuration information from host devices which store data into and load data from a data storage array
CN114897117A (zh) 一种基于rfid的资产设备定位管理系统及方法
CN111309553B (zh) 一种监控存储Jbod的方法、系统、设备及介质
CN209992995U (zh) 银行pc服务器管控系统
WO2009112326A1 (en) Method, system and apparatus for determining the power supply requirements of a data processing system
US20080307197A1 (en) System and Method for Persistent Hardware System Serial Numbers
US8443210B2 (en) Power management module enforcing computer power capping by reading power cap information from nameplate having both machine readable module and human readable designation for providing such information
CN202939639U (zh) 基于rfid的仓库管理系统
US20180285607A1 (en) Tracking of assets
CN114372551A (zh) 服务器定位系统、方法及计算机可读存储介质
KR20120123373A (ko) Rfid를 이용한 선반 내 물품 위치 확인 방법 및 시스템
US20220156543A1 (en) Management method of test fixtures applied to test procedure
JP2012238253A (ja) ラック実装機器の位置情報管理システム
CN210924623U (zh) 一种配网抢修车随车工具管理装置
CN114154597B (zh) 基于无线射频辨识的备品管理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20080416