CN1313930C - 虚拟层系统中的故障跟踪的方法和设备 - Google Patents

虚拟层系统中的故障跟踪的方法和设备 Download PDF

Info

Publication number
CN1313930C
CN1313930C CNB031436072A CN03143607A CN1313930C CN 1313930 C CN1313930 C CN 1313930C CN B031436072 A CNB031436072 A CN B031436072A CN 03143607 A CN03143607 A CN 03143607A CN 1313930 C CN1313930 C CN 1313930C
Authority
CN
China
Prior art keywords
mistake
host computer
error
subclauses
error tracking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB031436072A
Other languages
English (en)
Other versions
CN1503130A (zh
Inventor
彼得·J·迪肯
卡洛斯·F·芬特
威廉·J·斯凯尔斯
巴里·D·怀特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1503130A publication Critical patent/CN1503130A/zh
Application granted granted Critical
Publication of CN1313930C publication Critical patent/CN1313930C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0775Content or structure details of the error report, e.g. specific table structure, specific error fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Abstract

在堆栈系统中,通过检测用户应用界面上的错误,将一个或多个主机系统的用户应用界面上检测的错误与虚拟层以下的堆栈层上的根原因错误联系在一起;识别较低堆栈层上的相关的根原因错误(root cause error);为错误建立错误跟踪条目;将出错日志识别符与错误跟踪条目联系在一起;使组合出错日志识别符与错误跟踪条目成为错误识别符,该错误识别符在所述堆栈系统中的多个主机系统之内是唯一的;以及当由于根原因错误导致所述服务必定失败时,向一个或多个主机系统的用户应用界面上的任何服务的请求者传送错误识别符。

Description

虚拟层系统中的故障跟踪的方法和设备
技术领域
本发明涉及错误跟踪,及具体地说,涉及到在主机应用和装置间具有虚拟层的环境中的错误跟踪。
背景技术
故障检测和隔离的问题--跟踪复杂系统中的问题直到它的根原因--是非常重要的。在一些环境中,没有任何简单的错误报告信息,但是在许多企业级的环境中,对收集和记录所检测到的故障投入许多精力。在容错系统中,如此的信息对确保连续容错是关键的。在缺乏有效的检测和修复机制中,容错系统将简单地掩饰问题直到进一步错误引起故障。
当问题发生时,它的影响通常是很难预测的。例如,在存储控制器子系统中,从磁盘驱动器到主机应用的路径或“堆栈”中有许多组件。很难将实际检测和记录的错误与由应用或用户主机系统所知道的效果联系起来。
当在同一时间产生许多错误时,确定这些错误中的哪一个引起具体的应用失败是特别困难的。强制地修复所有报告的错误可能使其工作,但是基于这些影响业务最重要的应用的错误的配置的优先权来修复将是较有效的花费,以及对于系统用户将有大的价值。
缺乏任何可跟踪性也减少了以解决用户或系统碰到的任何特殊问题而修复正确的错误的自信。
具有RAID阵列、诸如快速拷贝(Flash Copy)和高速缓冲存储器(cache)的先进的现有系统已经对自顶向下分析增加了相当大的混乱(在系统中跟踪从应用到组件的错误)。花大量的时间和知识来选择引起故障的根原因错误。
随着虚拟层在许多系统中的引进,问题越来越严重。虚拟不仅间接的增加另外的层,而且在基本的现实子系统中,许多虚拟配置容许动态的移动数据,甚至使系统已经更难于来执行精确的故障跟踪。
例如,已经从美国专利5,974,544得之,使用便宜的磁盘的冗余阵列的存储系统中的RAID控制器层上维护逻辑缺陷列表。然而,使用与其它外围装置相连的如此的阵列多个的系统,特别是当与其它外围装置相连的多个如此阵列形成存储区网络(SAN)的一部分时,引入具有诸如虚拟特征的软件层,使得更难于从错误的外部表现跟踪到错误的根原因。
因此,存在减轻这个问题的方法、系统或计算机程序的需要,最好以客户花最少的金钱、处理资源和时间来减轻所述问题。
发明内容
因此,在第一方面,本发明提供一种用于将一个或多个主机系统的用户应用界面上检测的错误与虚拟层以下的堆栈层上的根原因错误联系在一起的堆栈系统的方法,该方法包括下列步骤:在用户应用界面上检测错误;在较低的堆栈层上识别相关的根原因错误;为所述的错误建立错误跟踪条目;将出错日志识别符加到所述错误跟踪条目;使所述组合的出错日志识别符与错误跟踪条目成为错误识别符,该错误识别符在所述堆栈系统中的多个主机系统之内是唯一的;当由于根原因错误导致所述服务必定失败时,向一个或多个主机系统的用户应用界面上的任何服务的请求者传送错误识别符。
最好,使所述组合的出错日志识别符与错误跟踪条目成为所述堆栈系统中的多个主机系统之内的唯一错误识别符的步骤包括:使错误跟踪条目和出错日志识别符与整数值组合以形成所述多个主机系统内的唯一错误识别符。
最好,在较低堆栈层上的所述根原因错误是在所述堆栈系统的外围装置中。
最好,所述外围装置是存储装置。
最好,堆栈系统包括存储区网络。
在第二方面,本发明提供一种用于将一个或多个主机系统的用户应用界面上检测的错误与虚拟层以下的堆栈层上的根原因错误联系在一起的堆栈系统的设备,该设备包括:错误检测器,用于检测用户界面上的错误;诊断组件,用于识别较低堆栈层上的相关的根原因错误;跟踪组件,用于建立所述错误的错误跟踪条目;识别组件,用于使出错日志识别器与所述错误跟踪条目联系在一起;广域系统识别组件,用于使所述组合的出错日志识别符与错误跟踪条目成为错误识别符,该错误识别符在所述堆栈系统中的多个主机系统之内是唯一的。和通信组件,用于当由于根原因错误导致所述服务必定失败时,向一个或多个主机系统的用户应用界面上的任何服务的请求者传送错误识别符。
最好,用于使所述组合的出错日志识别符与错误跟踪条目成为在所述堆栈系统中的多个主机系统之内的唯一错误识别符的广域系统识别组件包括:使错误跟踪条目和出错日志识别符与整数值组合以形成所述多个主机系统内的唯一错误识别符的组件。
最好,在较低堆栈层上的所述根原因错误是在所述堆栈系统的外围装置中。
最好,所述外围装置是存储装置。
最好,堆栈系统包括存储区网络。
使用唯一错误识别符的根原因信息标记错误的虚拟存储子系统中的故障隔离的本发明优选实施例。对于单个故障,这个提供了能够快速地诊断系统中由单个故障引起的多个错误的优势。在另外的高的可获得的系统中,这个加速了诊断过程和减少了发生故障的时间
附图说明
参考附图,本发明的优选实施例将仅用示例的方式来描述,其中:
图1示出了示例的虚拟子系统组件堆栈;
图2示出了根据本发明优选实施例的出错日志的示例。
具体实施方式
本发明的优选实施例以采用诸如已存在于许多企业级的环境中的传统的出错日志(170)开始。该出错日志用来记录由系统中的组件检测到的故障。有一些典型的连接外部世界的组件,例如,网络和驱动器层,它们首先检测,然后处理该错误。
唯一识别符(210)被加到现有的传统的出错日志条目,这可以通过对每个条目使用大的(如,32比特)整数来实现。当由日志的识别符限定复制时,识别以后可能引起I/O服务或其它动作失败的具体事件。该出错曰志包含详述所检测的故障(220)的补充信息,足以容许用户或服务个人来修复根原因故障。
然后,唯一识别符被用作对任何由于错误必定导致失败的服务请求(如,I/O请求)的响应的一部分。该请求的请求者的请求在收到针对该请求失败的响应时判断它自己的服务或请求的哪一个必定是失败的。依次,请求者破坏自己的请求,再重新引用它最初收到的、识别这些失败的原因的唯一识别符。
这样,引起失败的事件的识别通过失败请求链,直到它到达每个请求的始发者。然后该始发者有要求为每个检测的失败来精确地判断哪个错误事件必须被修复、分派修复过程和确保最关键的应用首先被修复的信息,此外,对需矫正的错误已被修复、避免时间的拖延和不成功恢复的相关花费有较高的自信度。
在本发明的最优选的实施例中,传送请求的组件是软件堆栈(100)中的层,执行诸如管理RAID控制器(110)、虚拟(120)、快速拷贝(130)、高速缓冲存储器(140)、远端拷贝(150)和连接到主机系统(160)的功能。本发明的优选实施例的方法容许经由该系统向堆栈以下直到存储控制器的边缘可跟踪。
作为最初的失败事件的结果,软件堆栈中的每个组件可能自己发生错误。例如,来自应用服务(190)的写操作可以作为故障被返回到SCSI后端,即,写入因物理存储器的一些原因而失败。这产生被记录的错误和被返回到发生错误的组件的唯一识别符。该失败的写入随同唯一识别(210)符返回到上一层。它们返回直到堆栈。在每一层上写入可以在那个组件内导致失败,例如,如果快速拷贝对照写入失败的磁盘是有效的,该快速拷贝操作将暂停执行,并发生错误。这个新错误本身被分配唯一识别符,它用唯一识别符或根原因(230)来标记,由下面的组件传递。同样的情况可以在软件堆栈中的每一层中发生。最终,最初的错误作为SCSI感测数据的一部分返回到要求写入的应用服务器。
然后,用户可以将失败的写入操作与不能写入的物理磁盘,以及不在软件堆栈内的操作和功能相联系,如上面所描述的快速拷贝。
应该理解上述方法将典型地以运行于一个或多个处理器(未显示)上的软件实施,并且该软件可以作为携带在任何诸如计算机的磁盘和光盘这样的合适的数据载体(也未显示)的计算机程序单元而被提供。同样地,数据的传输信道可以包括所有描述的存储媒介以及信号运送媒介,例如有线或无线信号媒介。
本发明可以合适地被具体表达为计算机所用的计算机程序产品。这样一种实现可以包括固定在诸如计算机可读媒介磁盘、CD-ROM、ROM或硬盘的有形的媒介上的一系列计算机可读指令,或者通过调制解调器或其它接口装置,在包括但不限于光或模拟的通信线的有形的媒介上或包括但不限于微波、红外线或其它传输技术的无形的无线技术上可传输到计算机系统的一系列计算机可读指令。这里,该计算机可读指令系列实施先前所描述的全部或部的功能。
本领域熟练技术人员应该理解,如此的计算机可读指令能够以为许多计算机结构和操作系统所用的许多程序语言来编写。而且,如此的指令可以用目前或未来的包括但不限于半导体、磁的或光的任何存储器技术来存储,或者如此的指令可以用目前或未来的包括但不限于光、红外线或其它传输技术的任何通信技术来传输。期望如此的带有打印的或电子的文档的计算机程序产品可以作为可移动的媒介被分发,例如,用计算机系统预装载压缩包裹(shrink-wrapped)的软件,例如,装在系统ROM或固定的磁盘上,或从服务器或网络上的电子公告牌分发,例如,通过因特网或万维网传送。
本领域普通的技术人员可知,对上述实施例做出各种各样的修改是显而易见的。

Claims (10)

1.一种在堆栈系统中将一个或多个主机系统的用户应用界面上检测的错误与虚拟层下的堆栈层上的根原因错误联系在一起的方法,包括以下步骤:
在用户应用界面上检测错误;
在较低的堆栈层上识别相关的根原因错误;
为所述的错误建立错误跟踪条目;
将出错日志识别符加到所述错误跟踪条目;
使所述组合出错日志识别符与错误跟踪条目成为错误识别符,该错误识别符在所述堆栈系统中的多个主机系统之内是唯一的;和
当由于根原因错误导致所述服务必定失败时,向一个或多个主机系统的用户应用界面上的任何服务的请求者传送错误识别符。
2.如权利要求1的所述方法,其中使所述组合的出错日志识别符与所述错误跟踪条目成为在所述堆栈系统中的多个主机系统之内的唯一错误识别符的步骤包括:
使错误跟踪条目和出错日志识别符与整数值组合以形成在所述多个主机系统内是唯一的错误识别符。
3.如权利要求1的所述方法,其中在较低的堆栈层上的根原因错误是在所述堆栈系统的外围装置中。
4.如权利要求3的所述方法,其中所述外围装置是存储装置。
5.如权利要求1的所述方法,其中所述堆栈系统包括存储区网络。
6.一种用于将一个或多个主机系统的用户应用界面上检测的错误与虚拟层以下的堆栈层上的根原因错误联系在一起的设备包括:
错误检测器,用于检测用户界面上的错误;
诊断组件,用于识别较低堆栈层上的相关的根原因错误;
跟踪组件,用于建立所述错误的错误跟踪条目;
识别组件,用于将出错日志识别器与所述错误跟踪条目联系在一起;
广域系统识别组件,使所述组合的出错日志识别符与错误跟踪条目成为错误识别符,该错误识别符在所述堆栈系统中的多个主机系统之内是唯一的;和
通信组件,用于当由于根原因错误导致所述服务必定失败时,向一个或多个主机系统的用户应用界面上的任何服务的请求者传送错误识别符。
7.如权利要求6的所述设备,其中广域系统识别组件包括:
用于将错误跟踪条目和出错日志识别符与整数值组合以形成在所述多个主机系统内是唯一的错误识别符的组件。
8.如权利要求6的所述设备,其中在较低的堆栈层上的根原因错误是在所述堆栈系统的外围装置中。
9.如权利要求6的所述设备,其中所述外围装置是存储装置。
10.如权利要求6的所述设备,其中所述堆栈系统包括存储区网络。
CNB031436072A 2002-11-22 2003-07-25 虚拟层系统中的故障跟踪的方法和设备 Expired - Fee Related CN1313930C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0227250.8 2002-11-22
GB0227250A GB2395578A (en) 2002-11-22 2002-11-22 Fault tracing in systems with virtualization layers

Publications (2)

Publication Number Publication Date
CN1503130A CN1503130A (zh) 2004-06-09
CN1313930C true CN1313930C (zh) 2007-05-02

Family

ID=9948311

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB031436072A Expired - Fee Related CN1313930C (zh) 2002-11-22 2003-07-25 虚拟层系统中的故障跟踪的方法和设备

Country Status (5)

Country Link
US (1) US7210071B2 (zh)
CN (1) CN1313930C (zh)
GB (1) GB2395578A (zh)
SG (1) SG123569A1 (zh)
TW (1) TWI257041B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2395578A (en) * 2002-11-22 2004-05-26 Ibm Fault tracing in systems with virtualization layers
US7424530B2 (en) * 2004-05-06 2008-09-09 International Business Machines Corporation Method for visualizing results of root cause analysis on transaction performance data
US20070027999A1 (en) * 2005-07-29 2007-02-01 Allen James P Method for coordinated error tracking and reporting in distributed storage systems
CN100383750C (zh) * 2006-06-07 2008-04-23 中国科学院计算技术研究所 一种面向大规模计算系统的高可信日志系统实现方法
US7676702B2 (en) * 2006-08-14 2010-03-09 International Business Machines Corporation Preemptive data protection for copy services in storage systems and applications
US7882393B2 (en) * 2007-03-28 2011-02-01 International Business Machines Corporation In-band problem log data collection between a host system and a storage system
US7779308B2 (en) * 2007-06-21 2010-08-17 International Business Machines Corporation Error processing across multiple initiator network
US7975262B2 (en) * 2007-08-16 2011-07-05 Microsoft Corporation Error tracing with context history
US8407673B2 (en) * 2007-11-27 2013-03-26 International Business Machines Corporation Trace log rule parsing
US7984332B2 (en) * 2008-11-17 2011-07-19 Microsoft Corporation Distributed system checker
US9639446B2 (en) * 2009-12-21 2017-05-02 International Business Machines Corporation Trace monitoring
US8813039B2 (en) * 2010-04-14 2014-08-19 International Business Machines Corporation Method and system for software defect reporting
US8806005B2 (en) 2011-09-12 2014-08-12 Microsoft Corporation Cross-machine event log correlation
CN102681935A (zh) * 2012-04-21 2012-09-19 北京迈凯互动网络科技有限公司 移动应用测试方法和系统
CN102902599B (zh) 2012-09-17 2016-08-24 华为技术有限公司 虚拟机内部故障处理方法、装置及系统
US9304902B2 (en) 2013-03-15 2016-04-05 Saratoga Speed, Inc. Network storage system using flash storage
US9672180B1 (en) 2014-08-06 2017-06-06 Sanmina Corporation Cache memory management system and method
US10545811B2 (en) 2017-01-11 2020-01-28 International Business Machines Corporation Automatic root cause analysis for web applications
US10210062B2 (en) * 2017-06-08 2019-02-19 International Business Machines Corporation Data storage system comprising an array of drives
US11669386B1 (en) * 2019-10-08 2023-06-06 Pure Storage, Inc. Managing an application's resource stack
US11321160B2 (en) * 2019-11-01 2022-05-03 Splunk Inc. In a microservices-based application, mapping distributed error stacks across multiple dimensions
US11301312B1 (en) * 2021-01-06 2022-04-12 Vmware, Inc. Error logging during system boot and shutdown
US11868206B2 (en) * 2021-05-11 2024-01-09 Sap Se Automated mass message processing
US11829230B2 (en) * 2021-09-23 2023-11-28 International Business Machines Corporation Globally unique error codes for knowledge document indexing in software systems
US20240012708A1 (en) * 2022-07-06 2024-01-11 Dell Products L.P. Real-time sense data querying

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000017756A1 (fr) * 1998-09-18 2000-03-30 Matsushita Electric Industrial Co., Ltd. Processeur de signaux
WO2000023896A1 (en) * 1998-10-20 2000-04-27 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus with memory access history storage
CN1336588A (zh) * 2000-08-02 2002-02-20 国际商业机器公司 用动态可重构测试电路来跟踪硬件状态的方法和装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US83371A (en) * 1868-10-27 Improved screw-tap
JPH01128879A (ja) * 1987-11-14 1989-05-22 Toshiba Corp 携帯可能媒体
GB2276255A (en) * 1993-02-17 1994-09-21 Andor Int Ltd Track buffer with embedded error data
US5974568A (en) * 1995-11-17 1999-10-26 Mci Communications Corporation Hierarchical error reporting system
JP3286205B2 (ja) * 1997-04-08 2002-05-27 東芝デジタルメディアエンジニアリング株式会社 データ伝送システム、誤り訂正装置、誤り訂正方法及びdvd再生装置
US6182244B1 (en) * 1997-09-10 2001-01-30 International Business Machines Corporation System and method for automatically initiating a tracing facility and dynamically changing the levels of tracing currently active
US6397244B1 (en) * 1998-02-05 2002-05-28 Hitachi, Ltd. Distributed data processing system and error analysis information saving method appropriate therefor
US6907605B1 (en) * 1998-05-18 2005-06-14 International Business Machines Corporation Method and apparatus for providing for notification of task termination
JP2000194743A (ja) * 1998-12-28 2000-07-14 Nec Ic Microcomput Syst Ltd 階層レイアウトパタ―ン検証装置
US6539501B1 (en) * 1999-12-16 2003-03-25 International Business Machines Corporation Method, system, and program for logging statements to monitor execution of a program
US6701459B2 (en) * 2000-12-27 2004-03-02 Egurkha Pte Ltd Root-cause approach to problem diagnosis in data networks
US7031981B1 (en) * 2001-12-21 2006-04-18 Unisys Corporation Tool supporting system log file reporting
US7512954B2 (en) * 2002-07-29 2009-03-31 Oracle International Corporation Method and mechanism for debugging a series of related events within a computer system
GB2395578A (en) * 2002-11-22 2004-05-26 Ibm Fault tracing in systems with virtualization layers
US20040260787A1 (en) * 2003-06-19 2004-12-23 Nokia Corporation URL-format links in log records
US20050086664A1 (en) * 2003-10-01 2005-04-21 Sundaresan Sankar R. Method and apparatus for transaction tracking in a web presentation architecture
US7343521B2 (en) * 2004-05-28 2008-03-11 International Business Machines Corporation Method and apparatus to preserve trace data

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000017756A1 (fr) * 1998-09-18 2000-03-30 Matsushita Electric Industrial Co., Ltd. Processeur de signaux
WO2000023896A1 (en) * 1998-10-20 2000-04-27 Matsushita Electric Industrial Co., Ltd. Signal processing apparatus with memory access history storage
CN1336588A (zh) * 2000-08-02 2002-02-20 国际商业机器公司 用动态可重构测试电路来跟踪硬件状态的方法和装置

Also Published As

Publication number Publication date
GB2395578A (en) 2004-05-26
US7210071B2 (en) 2007-04-24
GB0227250D0 (en) 2002-12-31
SG123569A1 (en) 2006-07-26
CN1503130A (zh) 2004-06-09
TW200424837A (en) 2004-11-16
TWI257041B (en) 2006-06-21
US20040153833A1 (en) 2004-08-05

Similar Documents

Publication Publication Date Title
CN1313930C (zh) 虚拟层系统中的故障跟踪的方法和设备
US7237141B2 (en) Method for recovering data from a redundant storage object
KR101758544B1 (ko) 비휘발성 메모리 시스템에서의 동기 미러링
US9208038B2 (en) Detection of logical corruption in persistent storage and automatic recovery therefrom
JP4916033B2 (ja) データ格納方法、データ・ストレージ・システムおよびプログラム(ストレージ・システムにおけるデータ完全性の検証)(著作権および商標登録表示本特許文書の開示の一部は、著作権保護を受ける内容を含む。本所有権者は、特許文書または特許開示書のいずれか一つによるファクシミリ複写物には、複写物が特許商標庁の特許ファイルまたは記録として世に出現している限り異論はないが、他の場合に全ての著作権は完全に留保する。)(本明細書で参照するある種のマークについては、出願人またはその譲受人と提携しまたは提携しない第三者の、慣習法上の、または登録された商標である可能性がある。これらのマークを使用するのは、例示によって実施可能な開示を提供するためであり、そのようなマークに関連するもののみに本発明の範囲を制限するように解釈されるべきではない。)
US10025666B2 (en) RAID surveyor
US7975171B2 (en) Automated file recovery based on subsystem error detection results
US20070027999A1 (en) Method for coordinated error tracking and reporting in distributed storage systems
US8347151B2 (en) Error tracking method and system
US7761660B1 (en) Identifying suspect disks
CN109656895B (zh) 分布式存储系统、数据写入方法、装置和存储介质
US7870441B2 (en) Determining an underlying cause for errors detected in a data processing system
US20060004839A1 (en) Method and system for data processing with data replication for the same
US7797577B2 (en) Reassigning storage volumes from a failed processing system to a surviving processing system
US20210165767A1 (en) Barriers for Dependent Operations among Sharded Data Stores
US7849355B2 (en) Distributed object sharing system and method thereof
CN1882919A (zh) 自动复制功能选择的系统、设备和方法
US8543864B2 (en) Apparatus and method of performing error recovering process in asymmetric clustering file system
US6912686B1 (en) Apparatus and methods for detecting errors in data
US7921324B2 (en) Providing file system availability during local path failure of a non-server node
US8140800B2 (en) Storage apparatus
US20210208969A1 (en) Dropped write error detection
US11217324B2 (en) Validating data in storage systems
JP2005122409A (ja) 仮想化レイヤを有するシステムにおける故障追跡のための方法、装置及びコンピュータ・プログラム
US20040268082A1 (en) Method and system for parcel-based data mapping

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070502

Termination date: 20200725