CN1783018A - 用于在操作环境之间关联数据的方法、系统和程序产品 - Google Patents

用于在操作环境之间关联数据的方法、系统和程序产品 Download PDF

Info

Publication number
CN1783018A
CN1783018A CN200510124676.2A CN200510124676A CN1783018A CN 1783018 A CN1783018 A CN 1783018A CN 200510124676 A CN200510124676 A CN 200510124676A CN 1783018 A CN1783018 A CN 1783018A
Authority
CN
China
Prior art keywords
data set
key
operating environment
environment
master
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200510124676.2A
Other languages
English (en)
Other versions
CN100357895C (zh
Inventor
斯蒂芬·J·马丁
迈克尔·J·米耶勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1783018A publication Critical patent/CN1783018A/zh
Application granted granted Critical
Publication of CN100357895C publication Critical patent/CN100357895C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0778Dumping, i.e. gathering error/state information after a fault for later diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis

Abstract

提供一种用于具有多个独立操作环境的计算环境的数据关联技术。所述技术包括:通过第一操作环境使第一密钥与响应于识别计算环境内事件而获得的数据组相关联;通过第二操作环境获得关联第一密钥的数据组,并使第二密钥与该数据组相关联;并且,使用关联第一密钥和第二密钥的数据组来匹配第一操作环境或第二操作环境响应于所述事件而获得的至少一个其它数据组。至少一个其它数据组只与第一密钥或第二密钥相关联。在一个实施方案中,事件是在网络接口适配器中的致命事件。

Description

用于在操作环境之间 关联数据的方法、系统和程序产品
技术领域
本发明涉及一种改进的处理系统,并更具体地涉及用于在计算环境的独立操作环境之间关联异步获得的数据的方法、系统和程序产品。
背景技术
逻辑分区允许在单个物理机器或中央处理器复合系统(CPC)内建立多个系统图象。每个系统图象能象独立计算机系统一样进行操作。即,每个逻辑分区可独立重置,一开始加载对于每个逻辑分区可能不同的操作系统,并且以使用不同输入/输出(I/O)装置的不同软件程序进行操作。
逻辑分区计算系统的实例例如在以下专利中描述,所述专利为:Guyette等人于1996年1月14日提交的美国专利4564903,题目为“分区微处理器编程系统”;Bean等人于1989年6月27日提交的美国专利4843541,题目为“数据处理系统的逻辑资源分区”;以及Kubala于1996年10月8日提交的美国专利5564040,题目为“用于在逻辑分区硬件机器内提供服务器功能的方法和设备”,上述每一个专利的全部内容在本文引作参考。
发明内容
在一个实例中,计算环境可包括一个或多个具有独立服务处理器的中央处理复合系统,所述独立服务处理器用于计算环境内的配置和错误处理职责。在此种有多个操作环境的环境内,为了正确地诊断某些事件,可能需要多个数据组。响应于诸如致命错误事件的事件,在计算环境内可收集和储存每组数据。因而,需要一种把例如由主操作环境和服务处理器获得的单独数据组关联在一起的技术,在一个实施例中,所述主操作环境和服务处理器不直接通信,而是只通过支持主操作环境的固件层进行通信。
通过提供一种在计算环境的独立操作环境之间关联数据的方法,克服现有技术中的缺点,并且提供另外的优点。所述方法包括:识别事件;响应于所述事件的识别,通过第一操作环境使第一密钥与响应于所述事件而获得的数据组相关联;通过第二操作环境获得关联第一密钥的数据组,并且,使第二密钥与该数据组相关联;以及,使用关联第一密钥和第二密钥的数据组来匹配第一操作环境或第二操作环境响应于所述事件而获得的至少一个其它数据组,其中,至少一个其它数据组只与第一密钥或第二密钥相关联。
在进一步的方面中,通过第一操作环境和第二操作环境中的至少一个异步地获得所述数据组与至少一个其它数据组。计算环境可包括网络接口适配器,并且,第一操作环境可以是用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境。在此计算环境内,假设服务处理器与支持主操作环境的计算环境固件层通信。另外,作为一个实例,事件可包括在网络接口适配器中接收或识别的故障事件。
在本文中还描述与以上概述方法相应的系统和计算机程序产品,并对它们要求保护。
进一步地,通过本发明的技术实现另外的特征和优点。本发明的其它实施例和方面在本文详细描述,并且被认为是所要求保护发明的一部分。
附图说明
在作为说明书结论的权利要求中具体指出,并明确要求保护被认为是本发明的主题。从以下结合附图的详细描述中,本发明前述的和其它的目的、特征和优点将变得清楚,在附图中:
图1描述根据本发明一个方面的包括并使用数据关联能力的计算环境的一个实施例;
图2为根据本发明一个方面的包括并使用本发明数据关联能力的计算环境的更详细实施例,并且,示出在网络接口适配器中接收致命事件,并向计算环境的服务处理器和使用网络接口适配器的主操作环境的适配器错误记录和恢复守护程序发送其通知;
图3描述根据本发明一个方面的图2所示计算环境,示出服务提供者在计算环境的固件层上记录响应于所述事件而获得的数据组,并且,主操作环境的适配器错误记录和恢复守护程序产生和保存响应于所述事件的另一数据组(即快照文件);
图4描述根据本发明一个方面的图2和3所示计算环境,示出服务提供者最初使第一密钥与第二计算环境用第二密钥随后获得和标记的转储数据组相关联,并接着保存为转储文件;
图5描述根据本发明一个方面的图2-4所示计算环境,示出从固件检索记录的数据组,并利用诊断处理来关联记录数据、快照文件和转储文件;以及
图6为根据本发明一个方面的诊断处理的一个实施例的流程图,所述诊断处理用于关联记录数据、快照文件和转储文件。
具体实施方式
现在参照附图,其中,在不同图中使用的相同标号指示相同或相似的部件。尽管在本文结合致命错误或致命事件进行描述,但本领域中技术人员应该理解,提出的数据关联概念可应用于必须在不直接通信的操作环境之间关联异步产生的多个数据组的其它活动事件。
在图1中描述本发明的包括并使用数据关联能力的计算环境的一个实施例,总体上用100代表。计算环境100例如基于InternationalBusiness Machines Corporation,Armonk,New York提供的eServerpSeries 690系统。在IBM出版号SA38-0588,2004年2月,以“IBMeServer pSeries 690用户指南”为题目的IBM出版物中描述pSeries690,此出版物的全部内容在本文引作参考。
计算环境100例如包括中央处理器复合系统(CPC)102,其中,CPC 102具有一个或多个中央处理器106(如CP1-CP4)、一个或多个分区108(如逻辑分区(LP1-LP4))、以及至少一个逻辑分区管理器110,以下逐一描述。
中央处理器106是分配给逻辑分区的物理处理器资源。具体地,每个逻辑分区108具有一个或多个逻辑处理器(为清晰起见,不单独示出),每个逻辑处理器代表分配给该分区的物理处理器106的全部或一部分。特定分区108的逻辑处理器可以是专用于该分区的逻辑处理器(从而,为该分区保留下面的逻辑处理器106)或与另一分区共享的逻辑处理器(从而,下面的处理器资源有可能用于另一分区)。
在示出的具体实例中,每个逻辑分区LP1-LP4作为具有驻留操作系统112的单独系统(可与每个逻辑分区不同)以及一个或多个应用程序114。在一个实施例中,操作系统112为由InternationalBusiness Machines Corporation提供的AIX 5LTM,OS/390TM或MVS/ESATM操作系统、或为LINUX操作系统。
逻辑分区108由逻辑分区管理器110管理,其中,逻辑分区管理器110由在处理器106上运行的代码实现。逻辑分区108(LP1-LP4)和逻辑分区管理器110每一个都包括一个或多个驻留在与中央处理器相关联的中央存储器的各个部分中的程序。逻辑分区管理器110的一个实例是PR/SM。
在有多个操作环境的计算环境中,为了正确地诊断某些类型的事件,需要多个数据组。例如,响应于诸如致命错误事件或其它故障的事件,在主操作环境(如逻辑分区)上异步地收集和储存数据组。通过计算环境的服务处理器,可从网络接口适配器获得一数据组,同时,通过主操作环境响应于所述事件可获得一个或多个其它数据组。在本文提出一种把这些数据组关联在一起的技术。此技术使用计算环境的服务处理器所提供的现有信息而实施,并且假设服务处理器不与主操作环境直接通信。公布的解决方案使用与不同数据组相关的唯一密钥来关联所述数据组。
图2描述计算环境200的一个实施例,其中,包括核心空间212和用户空间214的主操作环境210通过固件层220与网络接口适配器230通信。作为一个实例,固件层220包括管理程序层或域,所述管理程序层或域是拥有CPC硬件的软件的特权层。服务处理器240在计算环境200内例如提供配置和错误处理职责。在一个实施例中,有用于计算环境200的单个服务处理器240,同时,主操作环境210可包括计算环境的多个逻辑分区中的一个分区。假设处理器240具有它自己的操作系统,所述操作系统包括与主操作环境210不同的操作环境。
如图2所示,假设在网络接口适配器230中接收致命事件(1)。这导致适配器登记错误,并且,响应于此事件,适配器的硬件逻辑向在拥有适配器的主操作环境210的核心空间212中运行的装置驱动器程序211发送中断信号(2)。另外,从网络接口适配器向服务处理器240传送注意信号(3),向服务处理器通知致命事件。响应于此注意信号,服务处理器240从网络接口适配器230上的寄存器收到或读出(4)数据组。在一个实例中,服务处理器读出的数据包含在事件发生时适配器上寄存器组的值。这些寄存器的内容规定服务处理器所采取的措施。此组数据不能在别处得到。再者,假设该事件是致命事件,服务处理器使第一密钥(key1)与获得的数据组相关联,其中,第一密钥例如为文件名。与此数据检索相称地,装置驱动器211向在主操作环境210的用户空间214中运行的适配器错误记录和恢复守护程序213发送错误信号(5)。假设此守护程序213包括可靠守护程序。
如图3所示,服务提供者240向计算环境200的固件层220转发(6)与第一密钥关联的数据组,用于登记错误记录221,主操作环境210随后从错误记录221收集数据(参见图5)。与此异步地,适配器错误记录和恢复守护程序213例如从装置驱动器211和IP接口层300收集另一数据组(7)。此数据组(7)可以是当前操作系统环境的快照数据组,并且例如可包括在事件接收时的运行进程清单、以及诸如所安装软件、网络接口数据等的通用数据。第二密钥(key2)通过适配器错误记录和恢复守护程序213与此数据组(7)相关联,并且储存(8)在主操作环境210的文件系统310中。此时,有服务处理器响应于保存在固件层的错误记录221中的事件而收集的与服务处理器分配的第一密钥相关联的一个数据组、以及适配器错误记录和恢复守护程序213响应于所述事件而储存在文件系统310中的另一数据组,其中,另一数据组与守护程序213分配的第二密钥相关联。
图4描述响应于所述事件的又一数据组的产生。此数据组称作转储数据组或转储文件。由指令(9)网络接口适配器230逻辑的服务处理器240启动动作,转储其内部数据,并使key1与转储数据组相关联。接着,适配器230把与key1相关联的此组内部数据转储(10)到固件层存储器220中。在一个实施例中,转储数据组包括:微代码修订、硬件错误登记值、微代码状态数据、硬件跟踪阵列数据以及微代码跟踪数据。服务处理器240监视适配器的转储进程,并且,在进程完成时,向主操作环境210的核心空间212内的装置驱动器实例211发送中断信号(11)。接着,装置驱动器211向适配器错误记录和恢复守护程序213发送在固件层220的存储器222中可得到转储数据组的信号(12)。可靠守护程序213访问核心空间212,从固件层220的存储器222收集转储数据组,使key2与此转储数据组相关联,并且,在文件系统310中储存关联key2的转储数据组,作为转储文件。守护程序213知道用key2标记转储数据组,因为从守护程序213的角度看,从装置驱动器接收致命事件通知到守护程序看到可得到转储数据组时,有同步的事件序列。因而,守护程序知道使该转储数据组与前面的致命事件相关联,并且使用与快照数据组中所用key2相同的key2。也就是说,在致命事件之后,计算环境假设网络接口适配器将向主操作环境提供转储数据组。
如图5所示,随后,通过在主操作环境的核心空间212中运行的错误守护程序500而提取由服务处理器240产生的并保存在错误记录221中的登记数据组。这通过访问固件层以确定是否登记任何新的数据而实现。假设该事件是致命事件,错误守护程序500调用(15)诊断处理510来评估登记数据组、快照数据组和转储数据组,并使三个数据组相关联(16)。
图6为根据本发明的一方面的使用各个数据组的有关key1和key2与数据组相关联的诊断处理的一个实施例的流程图。此关联处理从输入错误记录项或序列号而开始600,并且,一开始确定检索的错误记录项是否为与适配器相关的错误610。如果“不是”,就退出处理615。通过观察错误记录入口,诊断例程可确定该项是否由网络接口适配器产生的。如果这样,处理就确定适配器是否属于当前的逻辑分区620。在具有多个LPAR的一个计算环境实施例中,假设所有的错误记录项指向所有的LPAR。只有拥有所讨论网络接口适配器的主操作环境或LPAR才需要处理该信息。如果适配器属于另一LPAR,就退出特定操作环境的诊断处理625。
假设错误记录项是与适配器相关的错误并且该适配器是当前操作环境所拥有的,那么,所述处理就分析错误记录项中的数据,并且,保存包括key1的分析数据630。接着,使用预设命名约定的处理获得保存在当前操作环境的文件系统中的所有转储文件的清单640,并且,打开转储文件并确定key1是否与在清单上任何转储文件中发现的密钥相匹配650。如果“不是”,就退出诊断处理655,因为不能获得关联。假设使用key1来匹配转储文件或转储数据组,诊断处理就从转储文件名中提取key2 660。接着,所述处理例如在其文件名中寻找也具有与其关联的key2的快照文件或快照数据组670。快照文件可以在当前操作环境内与转储文件不同的目录结构中。此时,诊断处理已经使用key1和key2关联错误记录数据、快照文件和转储文件,并且,在退出685之前把关联数据写到文件系统680中。
作为实例,key1包括服务处理器建立的事件时间戳。key2包括主操作环境在初始化时建立的值,并且是对主操作环境所用每个适配器唯一的值。例如,在初始化时,key2可被建立为以秒为单位的UNIX时间加上网络接口适配器的逻辑适配器编号,即,(((int)time_now.tv_sec)<8&0x7fffffff)+(minor_number<<8)。这将确保大量的每个适配器唯一的key2值。key2值可转换为十六进制数字串,并且,如以上所述解释的,可用作快照文件名和转储文件名的一部分。
本发明一个或多个方面的性能可通过软件、固件、硬件或它们的一些组合来实现。
本发明的一个或多个方面可包括在例如具有计算机可用介质的产品(如一个或多个计算机程序产品)中。例如,在介质中具有计算机可读程序代码装置或逻辑(如,指令、代码、命令等),以提供和提高本发明的性能。所述产品可包括在计算机系统的一部分中,或者单独销售。
另外,可提供可由实施至少一个指令程序的机器读取的至少一种程序存储装置,其中,所述至少一个指令程序可由该机器执行,以执行本发明的性能。
在此描述的流程图仅仅是实例。只要不偏离本发明的精神,就可对在本文描述的这些图或步骤(或操作)作出许多变化。例如,所述步骤以不同的次序执行,或者可增加、删除或修改步骤。所有这些变化被认为所要求保护发明的一部分。
尽管已经在本文详细描绘和描述优选实施例,但相关领域中技术人员应该明白,只要不偏离本发明的精神,就可作出各种修改、增加和替换等,因此,这些修改、增加和替换等被认为在后附权利要求所定义的本发明范围内。

Claims (29)

1.一种在计算环境的独立操作环境之间关联数据的方法,所述方法包括:
识别事件;
响应于所述事件的识别,通过第一操作环境使第一密钥与响应于所述事件而获得的数据组相关联;
通过第二操作环境获得关联第一密钥的数据组,并且,使第二密钥与该数据组相关联;以及,
使用关联第一密钥和第二密钥的数据组来匹配第一操作环境或第二操作环境响应于所述事件而获得的至少一个其它数据组,其中,至少一个其它数据组只与第一密钥或第二密钥相关联。
2.如权利要求1所述的方法,其中,通过第一操作环境和第二操作环境中的至少一个异步地获得所述数据组和至少一个其它数据组。
3.如权利要求1所述的方法,其中,使第一密钥与所述数据组相关联包括在所述数据组中嵌入第一密钥,并且其中,使第二密钥与具有嵌入第一密钥的数据组相关联包括用包含第二密钥的文件名来标记具有嵌入第一密钥的数据组。
4.如权利要求1所述的方法,其中,所述数据组包括转储数据组,并且,第一操作环境启动,通过第二操作环境获得转储数据组,并且其中,从外部的第一操作环境和外部的第二操作环境获得转储数据组的数据。
5.如权利要求4所述的方法,其中,从网络接口适配器获得转储数据组的数据,并且其中,第一操作环境包括用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境。
6.如权利要求5所述的方法,其中,事件包括在网络接口适配器接收或识别的故障事件。
7.如权利要求1所述的方法,其中,至少一个其它数据组包括至少两个其它数据组,第一其它数据组只与第一密钥相关联,第二其它数据组只与第二密钥相关联,并且其中,通过第一操作环境获得第一其它数据组,并且通过第二操作环境获得第二其它数据组,第一操作环境向第二操作环境提供第一其它数据组,并且其中,第二操作环境使用关联第一密钥和第二密钥的数据组来匹配所述数据组、第一其它数据组和第二其它数据组。
8.如权利要求7所述的方法,其中,计算环境包括网络接口适配器,第一操作环境包括用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境,服务处理器与支持主操作环境的计算环境固件层通信,并且其中,第一其它数据组通过服务处理器提供给固件层,并且通过主操作环境从固件层获得第一其它数据组,并且其中,所述数据组与第二其它数据组储存在与主操作环境相关的文件系统中。
9.如权利要求8所述的方法,进一步包括通过主操作环境分析所述数据组,以获得第一密钥和第二密钥,并且使用第一密钥和第二密钥来匹配所述数据组、第一其它数据组和第二其它数据组。
10.一种用于在计算环境的独立操作环境之间关联数据的系统,所述系统包括:
通过第一操作环境使第一密钥与响应于识别计算环境内事件而获得的数据组相关联的装置;
通过第二操作环境获得关联第一密钥的数据组并使第二密钥与该数据组相关联的装置;以及
使用关联第一密钥和第二密钥的数据组来匹配第一操作环境或第二操作环境响应于所述事件而获得的至少一个其它数据组的装置,其中,至少一个其它数据组只与第一密钥或第二密钥相关联。
11.如权利要求10所述的系统,其中,通过第一操作环境和第二操作环境中的至少一个异步地获得所述数据组和至少一个其它数据组。
12.如权利要求10所述的系统,其中,使第一密钥与所述数据组相关联的装置包括在所述数据组中嵌入第一密钥的装置,并且其中,使第二密钥与具有嵌入第一密钥的数据组相关联的装置包括用包含第二密钥的文件名来标记具有嵌入第一密钥的数据组的装置。
13.如权利要求10所述的系统,其中,所述数据组包括转储数据组,并且,第一操作环境启动通过第二操作环境获得转储数据组的装置,并且其中,从外部的第一操作环境和外部的第二操作环境获得转储数据组的数据。
14.如权利要求13所述的系统,其中,从网络接口适配器获得转储数据组的数据,并且其中,第一操作环境包括用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境。
15.如权利要求14所述的系统,其中,事件包括在网络接口适配器接收或识别的故障事件。
16.如权利要求10所述的系统,其中,至少一个其它数据组包括至少两个其它数据组,第一其它数据组只与第一密钥相关联,第二其它数据组只与第二密钥相关联,并且其中,通过第一操作环境获得第一其它数据组,并且通过第二操作环境获得第二其它数据组,第一操作环境向第二操作环境提供第一其它数据组,并且其中,第二操作环境使用关联第一密钥和第二密钥的数据组来匹配所述数据组、第一其它数据组和第二其它数据组。
17.如权利要求16所述的系统,其中,计算环境包括网络接口适配器,第一操作环境包括用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境,服务处理器与支持主操作环境的计算环境固件层通信,并且其中,第一其它数据组通过服务处理器提供给固件层,并且通过主操作环境从固件层获得第一其它数据组,并且其中,所述数据组与第二其它数据组储存在与主操作环境相关的文件系统中。
18.如权利要求17所述的系统,进一步包括以下装置,所述装置通过主操作环境分析所述数据组,以获得第一密钥和第二密钥,并且使用第一密钥和第二密钥来匹配所述数据组、第一其它数据组和第二其它数据组。
19.一种系统,包括:
计算环境的第一操作环境,第一操作环境适于使第一密钥与响应于识别计算环境内事件而获得的数据组相关联;
计算环境的第二操作环境,第二操作环境适于获得响应于所述事件的关联第一密钥的数据组,并且,使第二密钥与该数据组相关联;以及
其中,第一操作环境和第二操作环境中的一个适于使用关联第一密钥和第二密钥的数据组来匹配第一操作环境或第二操作环境响应于所述事件而获得的至少一个其它数据组,其中,至少一个其它数据组只与第一密钥或第二密钥相关联。
20.如权利要求19所述的系统,其中,计算环境包括网络接口适配器,第一操作环境包括用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境,服务处理器与支持主操作环境的计算环境固件层通信,并且其中,通过服务处理器和主操作环境中的至少一个异步地获得所述数据组和至少一个其它数据组。
21.至少一个程序存储装置,可由实施至少一个指令程序的机器读取,其中,所述至少一个指令程序可由所述机器执行,以执行在计算环境的独立操作环境之间关联数据的方法,所述方法包括:
识别事件;
响应于所述事件的识别,通过第一操作环境使第一密钥与响应于所述事件而获得的数据组相关联;
通过第二操作环境获得关联第一密钥的数据组,并且,使第二密钥与该数据组相关联;以及,
使用关联第一密钥和第二密钥的数据组来匹配第一操作环境或第二操作环境响应于所述事件而获得的至少一个其它数据组,其中,至少一个其它数据组只与第一密钥或第二密钥相关联。
22.如权利要求21所述的至少一个程序存储装置,其中,通过第一操作环境和第二操作环境中的至少一个异步地获得所述数据组和至少一个其它数据组。
23.如权利要求21所述的至少一个程序存储装置,其中,使第一密钥与所述数据组相关联包括在所述数据组中嵌入第一密钥,并且其中,使第二密钥与具有嵌入第一密钥的数据组相关联包括用包含第二密钥的文件名来标记具有嵌入第一密钥的数据组。
24.如权利要求21所述的至少一个程序存储装置,其中,所述数据组包括转储数据组,并且,第一操作环境启动通过第二操作环境获得转储数据组,并且其中,从外部的第一操作环境和外部的第二操作环境获得转储数据组的数据。
25.如权利要求24所述的至少一个程序存储装置,其中,从网络接口适配器获得转储数据组的数据,并且其中,第一操作环境包括用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境。
26.如权利要求25所述的至少一个程序存储装置,其中,事件包括在网络接口适配器接收或识别的故障事件。
27.如权利要求21所述的至少一个程序存储装置,其中,至少一个其它数据组包括至少两个其它数据组,第一其它数据组只与第一密钥相关联,第二其它数据组只与第二密钥相关联,并且其中,通过第一操作环境获得第一其它数据组,通过第二操作环境获得第二其它数据组,第一操作环境向第二操作环境提供第一其它数据组,并且其中,第二操作环境使用关联第一密钥和第二密钥的数据组来匹配所述数据组、第一其它数据组和第二其它数据组。
28.如权利要求27所述的至少一个程序存储装置,其中,计算环境包括网络接口适配器,第一操作环境包括用于计算环境的服务处理器,并且,第二操作环境包括使用网络接口适配器的主操作环境,服务处理器与支持主操作环境的计算环境固件层通信,并且其中,第一其它数据组通过服务处理器提供给固件层,并且通过主操作环境从固件层获得第一其它数据组,并且其中,所述数据组与第二其它数据组储存在与主操作环境相关的文件系统中。
29.如权利要求28所述的至少一个程序存储装置,进一步包括通过主操作环境分析所述数据组,以获得第一密钥和第二密钥,并且使用第一密钥和第二密钥来匹配所述数据组、第一其它数据组和第二其它数据组。
CNB2005101246762A 2004-11-29 2005-11-14 用于在操作环境之间关联数据的方法、系统和程序产品 Expired - Fee Related CN100357895C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/998,889 2004-11-29
US10/998,889 US7188346B2 (en) 2004-11-29 2004-11-29 Method, system and program product for correlating data between operating environments

Publications (2)

Publication Number Publication Date
CN1783018A true CN1783018A (zh) 2006-06-07
CN100357895C CN100357895C (zh) 2007-12-26

Family

ID=36585603

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101246762A Expired - Fee Related CN100357895C (zh) 2004-11-29 2005-11-14 用于在操作环境之间关联数据的方法、系统和程序产品

Country Status (2)

Country Link
US (1) US7188346B2 (zh)
CN (1) CN100357895C (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236705A (zh) * 2010-05-06 2011-11-09 甲骨文国际公司 数据库重放的细粒度同步
CN102906707A (zh) * 2010-06-23 2013-01-30 国际商业机器公司 管理与硬件事件关联的处理

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7844999B1 (en) * 2005-03-01 2010-11-30 Arcsight, Inc. Message parsing in a network security system
US7774657B1 (en) 2005-09-29 2010-08-10 Symantec Corporation Automatically estimating correlation between hardware or software changes and problem events
US8862551B2 (en) 2005-12-29 2014-10-14 Nextlabs, Inc. Detecting behavioral patterns and anomalies using activity data
US9407662B2 (en) 2005-12-29 2016-08-02 Nextlabs, Inc. Analyzing activity data of an information management system
US8209747B2 (en) * 2006-01-03 2012-06-26 Cisco Technology, Inc. Methods and systems for correlating rules with corresponding event log entries
WO2008018055A2 (en) * 2006-08-09 2008-02-14 Neocleus Ltd Extranet security
US7685460B1 (en) * 2006-09-28 2010-03-23 Emc Corporation Multiple concurrent restore using same user interface
US7788520B2 (en) * 2007-09-14 2010-08-31 International Business Machines Corporation Administering a system dump on a redundant node controller in a computer system
US8474037B2 (en) 2008-01-07 2013-06-25 Intel Corporation Stateless attestation system
US8914684B2 (en) * 2009-05-26 2014-12-16 Vmware, Inc. Method and system for throttling log messages for multiple entities
US8108724B2 (en) * 2009-12-17 2012-01-31 Hewlett-Packard Development Company, L.P. Field replaceable unit failure determination
US9342352B2 (en) 2010-06-23 2016-05-17 International Business Machines Corporation Guest access to address spaces of adapter
US9195623B2 (en) 2010-06-23 2015-11-24 International Business Machines Corporation Multiple address spaces per adapter with address translation
US8566480B2 (en) 2010-06-23 2013-10-22 International Business Machines Corporation Load instruction for communicating with adapters
US8478922B2 (en) 2010-06-23 2013-07-02 International Business Machines Corporation Controlling a rate at which adapter interruption requests are processed
US8626970B2 (en) 2010-06-23 2014-01-07 International Business Machines Corporation Controlling access by a configuration to an adapter function
US8504754B2 (en) 2010-06-23 2013-08-06 International Business Machines Corporation Identification of types of sources of adapter interruptions
US8505032B2 (en) 2010-06-23 2013-08-06 International Business Machines Corporation Operating system notification of actions to be taken responsive to adapter events
US8549182B2 (en) 2010-06-23 2013-10-01 International Business Machines Corporation Store/store block instructions for communicating with adapters
US8621112B2 (en) 2010-06-23 2013-12-31 International Business Machines Corporation Discovery by operating system of information relating to adapter functions accessible to the operating system
US8572635B2 (en) 2010-06-23 2013-10-29 International Business Machines Corporation Converting a message signaled interruption into an I/O adapter event notification
US8650335B2 (en) 2010-06-23 2014-02-11 International Business Machines Corporation Measurement facility for adapter functions
US8639858B2 (en) 2010-06-23 2014-01-28 International Business Machines Corporation Resizing address spaces concurrent to accessing the address spaces
US8635430B2 (en) 2010-06-23 2014-01-21 International Business Machines Corporation Translation of input/output addresses to memory addresses
US8650337B2 (en) 2010-06-23 2014-02-11 International Business Machines Corporation Runtime determination of translation formats for adapter functions
US8615645B2 (en) 2010-06-23 2013-12-24 International Business Machines Corporation Controlling the selectively setting of operational parameters for an adapter
US9213661B2 (en) 2010-06-23 2015-12-15 International Business Machines Corporation Enable/disable adapters of a computing environment
US8468284B2 (en) 2010-06-23 2013-06-18 International Business Machines Corporation Converting a message signaled interruption into an I/O adapter event notification to a guest operating system
TWI518680B (zh) * 2013-09-12 2016-01-21 群暉科技股份有限公司 維護電腦系統之檔案系統的方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5111384A (en) * 1990-02-16 1992-05-05 Bull Hn Information Systems Inc. System for performing dump analysis
US5220567A (en) 1991-12-26 1993-06-15 Amdahl Corporation Signature detecting method and apparatus for isolating source of correctable errors
US5463768A (en) * 1994-03-17 1995-10-31 General Electric Company Method and system for analyzing error logs for diagnostics
US5533123A (en) * 1994-06-28 1996-07-02 National Semiconductor Corporation Programmable distributed personal security
US5712972A (en) * 1995-06-07 1998-01-27 Sony Corporation Identification of faults in data paths and functional units of a central processing unit by a systematic execution of test instructions
US6119246A (en) * 1997-03-31 2000-09-12 International Business Machines Corporation Error collection coordination for software-readable and non-software readable fault isolation registers in a computer system
US6697935B1 (en) * 1997-10-23 2004-02-24 International Business Machines Corporation Method and apparatus for selecting thread switch events in a multithreaded processor
FR2789502B1 (fr) * 1999-02-08 2001-08-10 Bull Sa Procede et outil d'analyse et de localisation de pannes materielles dans une machine informatique
US6721795B1 (en) * 1999-04-26 2004-04-13 America Online, Inc. Data transfer server
US6351494B1 (en) 1999-09-24 2002-02-26 Sony Corporation Classified adaptive error recovery method and apparatus
US6636981B1 (en) 2000-01-06 2003-10-21 International Business Machines Corporation Method and system for end-to-end problem determination and fault isolation for storage area networks
GB2366631B (en) * 2000-03-04 2004-10-20 Ericsson Telefon Ab L M Communication node, communication network and method of recovering from a temporary failure of a node
US6910160B2 (en) * 2002-01-10 2005-06-21 International Business Machines Corporation System, method, and computer program product for preserving trace data after partition crash in logically partitioned systems
US7451302B2 (en) * 2004-03-10 2008-11-11 Hewlett-Packard Development Company, L.P. System and method for managing configuration data for a multi-cell computer system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236705A (zh) * 2010-05-06 2011-11-09 甲骨文国际公司 数据库重放的细粒度同步
CN102236705B (zh) * 2010-05-06 2016-07-13 甲骨文国际公司 数据库重放的细粒度同步
CN102906707A (zh) * 2010-06-23 2013-01-30 国际商业机器公司 管理与硬件事件关联的处理
CN102906707B (zh) * 2010-06-23 2016-08-03 国际商业机器公司 管理与硬件事件关联的处理

Also Published As

Publication number Publication date
CN100357895C (zh) 2007-12-26
US20060130071A1 (en) 2006-06-15
US7188346B2 (en) 2007-03-06

Similar Documents

Publication Publication Date Title
CN100357895C (zh) 用于在操作环境之间关联数据的方法、系统和程序产品
CN1229725C (zh) 提供对多个快照提供方的公共协调和管理的方法和系统
Cohen et al. Capturing, indexing, clustering, and retrieving system history
Vishwanath et al. Characterizing cloud computing hardware reliability
US8140565B2 (en) Autonomic information management system (IMS) mainframe database pointer error diagnostic data extraction
CN100375013C (zh) 用于在分布式企业应用中进行问题确定的方法和系统
US7096315B2 (en) Method for analyzing performance information
US20050278299A1 (en) Data back up method and its programs
US8578337B2 (en) Method and system for quality assurance subscription service
US20060225073A1 (en) Computer system, log collection method and computer program product
US20030061541A1 (en) Method and apparatus for analyzing performance of data processing system
CN107015872A (zh) 监控数据的处理方法及装置
CN111046011B (zh) 日志收集方法、系统、装置、电子设备及可读存储介质
CN102597962A (zh) 用于虚拟计算环境中的故障管理的方法和系统
WO2003025780A1 (en) System and method for journal recovery for multinode environments
WO2014024055A1 (en) Image instance mapping
US20080208931A1 (en) Method and system for continuous availability subscription service
Lee et al. Measurement-based evaluation of operating system fault tolerance
CN109947730A (zh) 元数据恢复方法、装置、分布式文件系统及可读存储介质
US7428658B2 (en) Checking storage reconfiguration
CN110321067A (zh) 估计和管理存储设备退化的系统和方法
US7457991B1 (en) Method for scanning windows event logs on a cellular multi-processor (CMP) server
US6530041B1 (en) Troubleshooting apparatus troubleshooting method and recording medium recorded with troubleshooting program in network computing environment
Sahoo et al. Providing persistent and consistent resources through event log analysis and predictions for large-scale computing systems
CN114238324A (zh) 用于主机站点的检查方法及装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071226

Termination date: 20151114

EXPY Termination of patent right or utility model