CN101158918A - 用于跟踪文件的软错误收集的方法和系统 - Google Patents

用于跟踪文件的软错误收集的方法和系统 Download PDF

Info

Publication number
CN101158918A
CN101158918A CN200710163069.6A CN200710163069A CN101158918A CN 101158918 A CN101158918 A CN 101158918A CN 200710163069 A CN200710163069 A CN 200710163069A CN 101158918 A CN101158918 A CN 101158918A
Authority
CN
China
Prior art keywords
trace file
error
data processing
processing equipment
obtains
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200710163069.6A
Other languages
English (en)
Inventor
A·拜
J·G·M·加维兰
K·V·恩戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101158918A publication Critical patent/CN101158918A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种跟踪文件收集系统,用于实施对与数据处理设备相关联的一个或多个跟踪文件的软错误进行收集的跟踪文件收集方法。该方法包括从该数据处理设备周期性地获取错误日志,比较两个或更多个获取的错误日志;以及基于两个或更多个获取的错误日志的比较指示了该数据处理设备内发生一个或多个软错误,从该数据处理设备获取跟踪文件。

Description

用于跟踪文件的软错误收集的方法和系统
技术领域
本发明一般涉及与具有错误日志的任一类型数据处理设备(例如,自动化数据库)相关联的跟踪文件的收集。本发明尤其涉及在数据处理设备内出现软错误条件下收集与数据处理设备相关的跟踪文件。
背景技术
自动化数据库中的某些错误进行时可能不被发现,比如,举例来说,get/put(得到/设置)命令可能在成功之前需要重试,get/put命令在存取器上的失败导致在另一个存取器上的成功切换,或者其记录清单中检测到匹配驱动系列号的库。这些“软”错误是无法检测的,因为它们不会引起主机工作失败。尽管软错误可以发布在操作面板上或者指示为SNMP陷阱(trap),目前的跟踪文件收集技术还不能对软错误的出现进行响应,导致在软错误发生时跟踪文件可能不正常或被覆盖,特别是在具有有限跟踪文件空间的库中。另外,如果库的跟踪文件在更晚的时候收集,那么该跟踪文件将不包含实际错误,因为软错误可能已经被调试了。
一些已知的解决方案可以是增大库中用于跟踪文件的尺寸空间,向库中增加专用于跟踪文件的硬盘驱动器,或者当任何类型的错误发生时迅速传递(flash)一个跟踪文件。不过,这些方案的缺点是在物理上增大跟踪文件的尺寸空间,仅对于更加新的或可扩展的数据库有帮助,并不适用于不能在物理上增大尺寸的已有数据库,逻辑上的增大尺寸将减小“其他的尺寸”的尺寸空间,并且在空间和文件管理方面对于每个错误迅速传递跟踪文件是不切实际的。
发明内容
本发明提供了一种新的独特的跟踪文件收集系统,用于与数据处理设备相关的一个或多个跟踪文件的软错误收集。
本发明的一种形式是计算机可读介质,用于具体实现可由处理器执行的计算机可读指令的程序,从而执行与该数据处理设备相关的跟踪文件的软错误收集的操作。这些操作包括从该数据处理设备周期性地获取错误日志,比较两个或更多个获取的错误日志,以及基于该两个或更多个获取的错误日志的比较指示了该数据处理设备内发生一个或多个软错误,从该数据处理设备获取跟踪文件。
本发明的第二种形式是一种跟踪文件收集系统,包括:处理器;以及存储器,其存储该处理器可操作的指令,用于与数据处理设备相关联的跟踪文件的软错误收集。执行该指令以用于:从该数据处理设备周期性地获取错误日志,比较两个或更多个获取的错误日志,以及基于两个或更多个获取的错误日志的比较指示了该数据处理设备内发生一个或多个软错误,从该数据处理设备获取跟踪文件。
本发明的第三种形式是一种用于与数据处理设备相关联的跟踪文件的软错误收集的方法。该方法包括:从该数据处理设备周期性地获取错误日志,比较两个或更多个获取的错误日志,以及基于两个或更多个获取的错误日志的比较指示了该数据处理设备内发生一个或多个软错误,从该数据处理设备获取跟踪文件。
前述形式和其他的形式以及本发明的目的和优点将通过下面结合附图的本发明各种实施例的详细说明变得更加清楚。详细的说明和附图仅仅对本发明起示意性作用,而不是限制作用,本发明的范围由所附的权利要求及其等同物来限定。
附图说明
图1示出了根据本发明的跟踪文件收集器的一般实施例;
图2示出了根据本发明的代表跟踪文件收集方法的一般实施例的流程图;
图3示出了根据图2所示的跟踪文件收集方法由图1所示的跟踪文件收集器执行的示例性的跟踪文件收集;
图4示出了根据本发明的图1所示的跟踪文件收集器的一个实施例;
图5示出了根据本发明的代表图3所示的跟踪文件收集方法的一个实施例的流程图;
图6示出了根据图5所示的跟踪文件收集方法由图4所示的跟踪文件收集器对错误日志的示例性分析;以及
图7示出了根据图5所示的跟踪文件收集方法由图4所示的跟踪文件收集器执行的示例性的跟踪文件收集。
具体实施方式
图1示出了本发明的跟踪文件收集器20,其在结构上配置成收集数据处理设备10的Y个跟踪文件TF,其中Y≥0,条件是数据处理设备10的软错误包含在从数据处理设备10获取的X个错误日志EL,其中X≥2。具体地,跟踪文件收集器20实现图2所示的流程30所代表的本发明的跟踪文件收集方法。
参考图2,流程30中的阶段S32包括跟踪文件收集器20从数据处理设备10周期性地获取错误日志。例如,如图3所示,由跟踪文件收集器20在t=0时从数据处理设备10获取初始的错误日志EL(0),其后是当三(3)个不同收集等待周期CWP1-CWP3到期时,由跟踪文件收集器20从数据处理设备10获取错误日志EL(1)-EL(3)。
通过由跟踪文件收集器20每次在收集等待周期到期之后从数据处理设备1 0获取错误日志,跟踪文件收集器20在流程30的阶段S34期间比较两个或更多个获取的错误日志,从而在流程30的阶段S36期间从数据处理设备10有条件地获取跟踪文件。例如,如图3所示,在收集等待周期CWP1到期时,执行阶段S34包括将错误日志EL(0)与EL(1)进行比较,从而基于错误日志EL(0)与EL(1)的比较无法指示数据处理设备10中发生了软错误,跟踪文件收集器20决定不从数据处理设备10获取当前的跟踪文件。在进一步的例子中,在收集等待周期CWP2到期时,执行阶段S34包括将错误日志EL(0)和/或EL(1)与EL(2)进行比较,从而基于错误日志EL(0)和/或EL(1)与EL(2)的比较指示在数据处理设备10中发生了软错误SE1,跟踪文件收集器20决定从数据处理设备10获取当前的跟踪文件TF1。同样作为示例,在收集等待周期CWP3到期时,执行阶段S34包括将错误日志EL(0)、EL(1)和/或EL(2)与EL(3)进行比较,从而基于错误日志EL(0)、EL(1)和/或EL(2)与EL(3)的比较指示数据处理设备10中发生了软错误SE2,跟踪文件收集器20决定从数据处理设备10获取当前的跟踪文件TF2。
实际上,本发明关于实现图2所示的跟踪文件收集方法的方式不强加任何限制或任何约束。尽管如此,为了进一步示出和理解本发明的发明原理,图4示出了一个示例性以太网40,用于实现如图5中的流程70表示的本发明的跟踪文件收集方法。
特别地,图4示出了以太网40,其使得应用服务器50、数据库服务器51、web服务器52、自动化磁带库53和跟踪文件管理服务器54相互连接。自动化磁带库53存储工作站(未示出)生成的数据,该工作站连接到以太网40以便使用服务器50-52。跟踪文件收集器60以软件模块的形式安装在跟踪文件管理服务器54的存储器中,以便跟踪文件管理服务器54的处理器执行流程70,如在跟踪文件收集器60中实现的那样。为了便于理解跟踪文件服务器60,现在将在获取四(4)个库错误日志LEL(0)-LEL(3)的上下文中对流程70进行描述。
参考图5,流程70的阶段S72包括服务器54从库53中获取库错误日志LEL(0)和库跟踪文件LTF(0)。获取库错误日志LEL(0)用作初始基础,以便从库53有条件地获取另外的跟踪文件,将在后面描述。获取库跟踪文件LTF(0)用于识别当服务器54初始启动时库10中的任何软错误,服务器54初始启动可以是在库53启动之后。如果库跟踪文件LTF(0)包含任何软错误,那么库跟踪文件LTF(0)存储在唯一的跟踪文件目录里,如果库跟踪文件LTF(0)不包含任何软错误,那么库跟踪文件LTF(0)可以存储在唯一的跟踪文件目录里。这种情况下,如图6所示的库错误日志LEL(0)不包含任何软错误,但是库跟踪文件LTF(0)存储在如图7所示的跟踪文件管理目录100的跟踪文件获取目录(“TFRD”)101里。
流程70的阶段S74包括服务器54分析库错误日志LEL(0)并在如图6所示的库错误表90中存储其错误条目。考虑到库错误日志LEL(0)是从库53获取的初始错误日志,此后服务器54进行到流程70的阶段S76,等待收集等待周期CWP1(例如,5分钟)的到期。当收集等待周期CWP 1到期时,在阶段S74期间服务器54从库53获取库错误日志LEL(1),由此服务器54分析库错误日志LEL(1)并在如图6所示的库错误表90中存储其错误条目。
考虑到库错误日志LEL(1)是从库53获取的另外的错误日志,服务器54进行到流程70的阶段S78,以识别库错误日志LEL(0)和LEL(1)的每个软错误条目,由此在流程70的阶段S80期间确定在从库53获取库错误日志LEL(0)与LEL(1)之间,库53中是否有任何新的软错误发生。这种情况下,在从库53获取库错误日志LEL(0)与LEL(1)之间,库53中发生零(0)个软错误,因此服务器54进行到阶段S76,以等待收集等待周期CWP2(例如,5分钟)的到期。当收集等待周期CWP2到期时,服务器54在阶段S74期间从库53获取库错误日志LEL(2),由此服务器54分析库错误日志LEL(2)并在如图6所示的库错误表90中存储其错误条目。
考虑到库错误日志LEL(2)是从库53获取的另外的错误日志,服务器54进行到阶段S78,以识别库错误日志LEL(1)和LEL(2)的每个软错误条目,由此在阶段S80期间确定在从库53获取库错误日志LEL(1)与LEL(2)之间,库53中是否有任何新的软错误发生。这种情况下,在从库53获取库错误日志LEL(1)与LEL(2)之间,库53中发生一(1)个软错误SE1,因此服务器54进行到流程70的阶段S82,以获取库跟踪文件LTF(1)并将库跟踪文件LTF(1)存储在如图7所示的跟踪文件管理目录100下的跟踪文件获取目录(“TFRD”)102里,然后进入阶段S76,以等待收集等待周期CWP3(例如,5分钟)的到期。当收集等待周期CWP3到期时,服务器54在阶段S74期间从库53获取库错误日志LEL(3),由此服务器54分析库错误日志LEL(3)并在如图6所示的库错误表90中存储其错误条目。
考虑到库错误日志LEL(3)是从库53获取的另外的错误日志,服务器54进行到阶段S78,以识别库错误日志LEL(2)和LEL(3)的每个软错误条目,由此在阶段S 80期间确定在从库53获取库错误日志LEL(2)与LEL(3)之间,库53中是否有任何新的软错误发生。这种情况下,在从库53获取库错误日志LEL(2)与LEL(3)之间,库53中发生一(1)个软错误SE2,因此服务器54进行到阶段S82,以获取库跟踪文件LTF(2)并将存储库跟踪文件LTF(2)存储在如图7所示的跟踪文件管理目录100下的跟踪文件获取目录(“TFRD”)103里。在这点上,如果流程70由于库53中发生硬错误或者一些其他可能的原因而被服务器50终止,那么三(3)个库跟踪文件LTF(0)-LTF(2)将方便地存储在服务器50中以便于调试。
参考图1-7,本领域普通技术人员可以理解本发明多方面的益处和优点,其包括但不限于,在以无中断方式向数据处理设备获取错误日志期间,历史性地收集包括每个发生在数据处理设备中的软错误的跟踪文件;消除了在数据处理设备中更新或安装软件代码的需要,其中该数据处理设备先前配置成允许外部设备获取错误日志和跟踪文件;以及在以太网服务器或工作站中能够简单地安装本发明的跟踪文件收集器。
此处所用的术语“处理器”广泛地定义为一个或多个任意类型的处理单元,用于执行所有算术和逻辑操作,并且用于解码和执行所有与促进本发明各种跟踪文件收集方法的跟踪文件收集系统的实现相关的指令。此外,此处所用的术语“存储器”广泛地定义为包括位于本发明跟踪文件收集系统中的任意类型的计算机可读介质形式的所有存储空间,尤其是实现处理器可执行的机器可读指令程序的计算机可读介质。
参考图5,关于收集等待周期的基础,本发明不强加任何限制或任何约束。如结合图7的描述,收集等待周期可以是基于时间的周期,例如固定或可变的时间周期。可选地或并存地,收集等待周期可以是基于事件的周期,例如,本领域技术人员可以理解,关于指示用于触发获取下一个错误日志的预定活动级别的活动阈值,比较由获取的另外的日志文件所指示的库的活动级别。
再次参考图5,可以借助于过滤器的应用来实现阶段80,以便根据跟踪文件收集策略仅过滤出那些在阶段S82期间需要或认为必须用来触发获取下一个错误日志的软错误条目。例如,如果库有多个分区,并且跟踪文件收集策略指定这些分区中的一个特定分区的软错误作为在阶段S82期间获取下一个错误日志的触发器,那么过滤器将被设计成使得来自该特定分区的软错误条目通过并阻止来自其他分区的软错误条目。同样作为例子,跟踪文件收集策略可以指定必须由过滤器阻止与已知不论何种原因从库中丢失的硬件相关的软错误。
此外,跟踪文件收集技术领域的普通技术人员可以参照此处所述的本发明的发明原理开发本发明的其他实施例。因此,前面说明书中所用的术语和表达方式在此处仅用作描述性术语不是用来限制,并且不旨在使用这些术语和表达方式排除所示或所说明的特征或其部分的等同物,应该认识到本发明的范围仅由所附权利要求来限定。

Claims (14)

1.一种跟踪文件收集系统,包括:
处理器;以及
存储器,其存储所述处理器可操作的指令,用于与数据处理设备相关联的至少一个跟踪文件的软错误收集,执行所述指令以用于:
从所述数据处理设备周期性地获取错误日志;
比较至少两个获取的错误日志;以及
基于所述至少两个获取的错误日志的比较指示了所述数据处理设备内发生至少一个软错误,从所述数据处理设备获取所述至少一个跟踪文件。
2.如权利要求1所述的跟踪文件收集系统,其中所述数据处理设备是自动化磁带库。
3.如权利要求1所述的跟踪文件收集系统,其中进一步执行所述指令以用于:
将每个获取的错误日志存储在错误日志表中。
4.如权利要求1所述的跟踪文件收集系统,其中所述比较至少两个获取的错误日志包括:
识别当前获取的错误日志中的、未在先前获取的错误日志中出现的每个软错误条目。
5.如权利要求4所述的跟踪文件收集系统,其中所述比较至少两个获取的错误日志进一步包括:
将过滤器应用于每个识别的软错误条目。
6.如权利要求5所述的跟踪文件收集系统,其中响应于至少一个识别的软错误条目通过所述过滤器,获取跟踪文件。
7.如权利要求1所述的跟踪文件收集系统,其中进一步执行所述指令以用于:
将每个获取的跟踪文件存储在唯一的文件目录里。
8.一种跟踪文件收集方法,用于与数据处理设备相关联的至少一个跟踪文件的软错误收集,所述方法包括:
从所述数据处理设备周期性地获取错误日志;
比较至少两个获取的错误日志;以及
基于所述至少两个获取的错误日志的比较指示了所述数据处理设备内发生至少一个软错误,从所述数据处理设备获取所述至少一个跟踪文件。
9.如权利要求8所述的跟踪文件收集方法,其中所述数据处理设备是自动化磁带库。
10.如权利要求8所述的跟踪文件收集方法,进一步包括:
将每个获取的错误日志存储在错误日志表中。
11.如权利要求8所述的跟踪文件收集方法,其中所述比较至少两个获取的错误日志包括:
识别当前获取的错误日志中的、未在之前获取的错误日志中出现的每个软错误条目。
12.如权利要求11所述的跟踪文件收集方法,其中所述比较至少两个获取的错误日志进一步包括:
将过滤器应用于每个识别的软错误条目。
13.如权利要求12所述的跟踪文件收集方法,其中响应于至少一个识别的软错误条目通过所述过滤器,获取跟踪文件。
14.如权利要求8所述的跟踪文件收集方法,进一步包括:
将每个获取的跟踪文件存储在唯一的文件目录里。
CN200710163069.6A 2006-10-06 2007-09-29 用于跟踪文件的软错误收集的方法和系统 Pending CN101158918A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/539,521 2006-10-06
US11/539,521 US20080086515A1 (en) 2006-10-06 2006-10-06 Method and System for a Soft Error Collection of Trace Files

Publications (1)

Publication Number Publication Date
CN101158918A true CN101158918A (zh) 2008-04-09

Family

ID=39275800

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710163069.6A Pending CN101158918A (zh) 2006-10-06 2007-09-29 用于跟踪文件的软错误收集的方法和系统

Country Status (2)

Country Link
US (1) US20080086515A1 (zh)
CN (1) CN101158918A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012114343A1 (en) * 2011-02-24 2012-08-30 Hewlett-Packard Development Company, L.P. System and method for error reporting in a network
CN103678123A (zh) * 2013-11-29 2014-03-26 西安空间无线电技术研究所 一种适用于处理器系统单粒子软错误脆弱点识别方法

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8407520B2 (en) * 2010-04-23 2013-03-26 Ebay Inc. System and method for definition, creation, management, transmission, and monitoring of errors in SOA environment
US9419921B1 (en) 2011-01-13 2016-08-16 Google Inc. Network address translation for virtual machines
US8533343B1 (en) 2011-01-13 2013-09-10 Google Inc. Virtual network pairs
US9135037B1 (en) 2011-01-13 2015-09-15 Google Inc. Virtual network protocol
US8862743B1 (en) 2011-01-13 2014-10-14 Google Inc. Resource management
US9619662B1 (en) 2011-01-13 2017-04-11 Google Inc. Virtual network pairs
US8874888B1 (en) 2011-01-13 2014-10-28 Google Inc. Managed boot in a cloud system
US8745329B2 (en) 2011-01-20 2014-06-03 Google Inc. Storing data across a plurality of storage nodes
US8812586B1 (en) 2011-02-15 2014-08-19 Google Inc. Correlating status information generated in a computer network
US9237087B1 (en) 2011-03-16 2016-01-12 Google Inc. Virtual machine name resolution
US8261295B1 (en) 2011-03-16 2012-09-04 Google Inc. High-level language for specifying configurations of cloud-based deployments
US8533796B1 (en) 2011-03-16 2013-09-10 Google Inc. Providing application programs with access to secured resources
US9063818B1 (en) 2011-03-16 2015-06-23 Google Inc. Automated software updating based on prior activity
US9176759B1 (en) 2011-03-16 2015-11-03 Google Inc. Monitoring and automatically managing applications
US10228959B1 (en) 2011-06-02 2019-03-12 Google Llc Virtual network for virtual machine communication and migration
US9075979B1 (en) 2011-08-11 2015-07-07 Google Inc. Authentication based on proximity to mobile device
US8966198B1 (en) 2011-09-01 2015-02-24 Google Inc. Providing snapshots of virtual storage devices
US9069616B2 (en) 2011-09-23 2015-06-30 Google Inc. Bandwidth throttling of virtual disks
US8276140B1 (en) 2011-11-14 2012-09-25 Google Inc. Adjustable virtual network performance
US8958293B1 (en) 2011-12-06 2015-02-17 Google Inc. Transparent load-balancing for cloud computing services
US9178698B1 (en) 2011-12-21 2015-11-03 Google Inc. Dynamic key management
US8800009B1 (en) 2011-12-30 2014-08-05 Google Inc. Virtual machine service access
US8983860B1 (en) 2012-01-30 2015-03-17 Google Inc. Advertising auction system
US9672052B1 (en) 2012-02-16 2017-06-06 Google Inc. Secure inter-process communication
US8996887B2 (en) 2012-02-24 2015-03-31 Google Inc. Log structured volume encryption for virtual machines
US8677449B1 (en) 2012-03-19 2014-03-18 Google Inc. Exposing data to virtual machines
US9069806B2 (en) 2012-03-27 2015-06-30 Google Inc. Virtual block devices
US8909939B1 (en) 2012-04-04 2014-12-09 Google Inc. Distribution of cryptographic host keys in a cloud computing environment
US9430255B1 (en) 2013-03-15 2016-08-30 Google Inc. Updating virtual machine generated metadata to a distribution service for sharing and backup
CN106598764B (zh) * 2015-10-14 2019-12-03 北京国双科技有限公司 异常处理方法和装置
US10223192B2 (en) * 2016-08-31 2019-03-05 International Business Machines Corporation Automated data storage library snapshot for host detected errors
US10698615B2 (en) 2016-08-31 2020-06-30 International Business Machines Corporation Trigger event detection for automatic log collection in an automated data storage library
US10114708B2 (en) 2016-08-31 2018-10-30 International Business Machines Corporation Automatic log collection for an automated data storage library
US10802932B2 (en) * 2017-12-04 2020-10-13 Nxp Usa, Inc. Data processing system having lockstep operation

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5758062A (en) * 1996-04-30 1998-05-26 Oracle Corporation Method and apparatus for regression testing of application logic
FR2751448B1 (fr) * 1996-07-17 1999-01-15 Bull Sa Procede de surveillance en temps reel d'un systeme informatique pour son administration et l'aide a sa maintenance en phase d'exploitation
US6119246A (en) * 1997-03-31 2000-09-12 International Business Machines Corporation Error collection coordination for software-readable and non-software readable fault isolation registers in a computer system
US6539501B1 (en) * 1999-12-16 2003-03-25 International Business Machines Corporation Method, system, and program for logging statements to monitor execution of a program
US7089536B2 (en) * 2000-05-31 2006-08-08 Kabushiki Kaisha Toshiba Computer system and method for aiding log base debugging
US6732125B1 (en) * 2000-09-08 2004-05-04 Storage Technology Corporation Self archiving log structured volume with intrinsic data protection
US6708297B1 (en) * 2000-12-29 2004-03-16 Emc Corporation Method and system for monitoring errors on field replaceable units
US6751753B2 (en) * 2001-02-27 2004-06-15 Sun Microsystems, Inc. Method, system, and program for monitoring system components
US6701464B2 (en) * 2001-03-01 2004-03-02 International Business Machines Corporation Method and system for reporting error logs within a logical partition environment
WO2003009140A2 (en) * 2001-07-20 2003-01-30 Altaworks Corporation System and method for adaptive threshold determination for performance metrics
US6993748B2 (en) * 2001-10-26 2006-01-31 Capital One Financial Corporation Systems and methods for table driven automation testing of software programs
US7010782B2 (en) * 2002-04-04 2006-03-07 Sapphire Infotech, Inc. Interactive automatic-test GUI for testing devices and equipment using shell-level, CLI, and SNMP commands
US7103810B2 (en) * 2002-04-18 2006-09-05 International Business Machines Corporation System for the tracking of errors in a communication network enabling users to selectively bypass system error logs and make real-time responses to detected errors
US20030237022A1 (en) * 2002-06-21 2003-12-25 Thayer Jennifer J. System and mehod for providing a service log for processor-based devices
US7055071B2 (en) * 2003-01-09 2006-05-30 International Business Machines Corporation Method and apparatus for reporting error logs in a logical environment
US7114099B2 (en) * 2003-01-31 2006-09-26 American Megatrends, Inc. Method, system, and apparatus for utilizing device-specific diagnostic settings within a standard management platform
US7676445B2 (en) * 2003-08-20 2010-03-09 International Business Machines Corporation Apparatus, system and method for developing failure prediction software
US7529824B2 (en) * 2003-10-14 2009-05-05 International Business Machines Corporation Method for selecting a service binding protocol in a service-oriented architecture
US7475387B2 (en) * 2005-01-04 2009-01-06 International Business Machines Corporation Problem determination using system run-time behavior analysis
US20060195731A1 (en) * 2005-02-17 2006-08-31 International Business Machines Corporation First failure data capture based on threshold violation
US7506203B2 (en) * 2005-11-10 2009-03-17 International Business Machines Corporation Extracting log and trace buffers in the event of system crashes

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012114343A1 (en) * 2011-02-24 2012-08-30 Hewlett-Packard Development Company, L.P. System and method for error reporting in a network
US9141462B2 (en) 2011-02-24 2015-09-22 Hewlett-Packard Development Company, L.P. System and method for error reporting in a network
CN103678123A (zh) * 2013-11-29 2014-03-26 西安空间无线电技术研究所 一种适用于处理器系统单粒子软错误脆弱点识别方法
CN103678123B (zh) * 2013-11-29 2016-08-17 西安空间无线电技术研究所 一种适用于处理器系统单粒子软错误脆弱点识别方法

Also Published As

Publication number Publication date
US20080086515A1 (en) 2008-04-10

Similar Documents

Publication Publication Date Title
CN101158918A (zh) 用于跟踪文件的软错误收集的方法和系统
CN101067822B (zh) 用于元数据的分级存储管理的方法和系统
CN101589592B (zh) 多协议可移动存储设备
US8285679B2 (en) Creating a buffer point-in-time copy relationship for a point-in-time copy function executed to create a point-in-time copy relationship
CN101208665B (zh) 处理层级式数据的方法和系统
US8239854B2 (en) Bookmark and configuration file for installation sequence
CN107301115A (zh) 应用程序异常监控和恢复方法及设备
US20130332771A1 (en) Methods and apparatus for virtual machine recovery
CA2716085A1 (en) Incremental implementation of undo/redo support in legacy applications
CN109871290B (zh) 应用于Java的调用堆栈追踪方法、装置和存储介质
CN105573859A (zh) 一种数据库的数据恢复方法和设备
US20140068325A1 (en) Test case result processing
CN105359109A (zh) 基于次计算机中的存储器错误移动主计算机中的对象
CN102947804A (zh) 当追踪数据处理系统时的键配置
Chen et al. CoFI: Consistency-guided fault injection for cloud systems
CN100478911C (zh) 管理线程异常的防护方法
CN111314158A (zh) 大数据平台监控方法、装置及设备、介质
CN101086717B (zh) 存储瞬态信息的系统和方法
CN112783749A (zh) 一种静态代码扫描优化方法、装置、电子设备和存储介质
WO2016153377A1 (en) Smart logging of trace data for storage systems
CN102640117B (zh) 从循序存取备份存档中有效恢复数据
US8516466B2 (en) Optimization of automated system-managed storage operations
US7082442B2 (en) Method and system for resolving disarrangement in database
CN105830067A (zh) 一种文件信息处理方法、装置及文件处理设备、系统
CN113542398B (zh) 分布式集群系统的管控方法、装置、介质和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080409