CN101290595A - 在异步环境下探查系统管理程序任务的系统和方法 - Google Patents

在异步环境下探查系统管理程序任务的系统和方法 Download PDF

Info

Publication number
CN101290595A
CN101290595A CN200810092221.0A CN200810092221A CN101290595A CN 101290595 A CN101290595 A CN 101290595A CN 200810092221 A CN200810092221 A CN 200810092221A CN 101290595 A CN101290595 A CN 101290595A
Authority
CN
China
Prior art keywords
data
task
request
subregion
timer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200810092221.0A
Other languages
English (en)
Other versions
CN101290595B (zh
Inventor
克里斯托弗·H·奥斯汀
詹姆斯·A·林德曼
加里·L·鲁泽克
戴维·A·拉森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101290595A publication Critical patent/CN101290595A/zh
Application granted granted Critical
Publication of CN101290595B publication Critical patent/CN101290595B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种在异步环境下探测系统管理程序任务的系统、方法以及计算机可用介质。根据本发明实施例,分区固件将对数据的请求发送到系统管理程序。当系统管理程序接收到该对数据的请求时,系统管理程序返回标识被分配来处理该请求的任务的任务ID。分区固件记录该任务ID和时间戳,该时间戳指示系统管理程序接收到该请求的时间。设置定时器以测量自请求的分区固件接收到该任务ID开始度过的时间量。如果在已经度过了由定时器测量的预定时间段之后,系统管理程序还没有向分区固件提供所请求的数据,则分区固件询问与该任务ID相关联的任务的状态。如果该任务仍在运行,则分区固件将分区的控制返回到操作系统。

Description

在异步环境下探查系统管理程序任务的系统和方法
技术领域
本发明一般涉及数据处理系统领域,并且具体地涉及一种用于管理数据处理系统中的进程的改进的系统及方法。
背景技术
数据处理系统内的逻辑分区(LPAR)功能允许在单个数据处理系统平台上同时运行单个操作系统(OS)的多个副本或多个不同种类的操作系统。将操作系统映像在其中运行的分区被分配该平台资源的一个不重叠的子集。这些资源包括一个或多个构造上不同的处理器,该一个或多个处理器具有它们的中断管理区(interrupt management area)、系统存储器区(regions of systemmemory)、以及输入/输出(I/O)适配器总线槽。由该平台固件到操作系统映像来表示分区资源。
保护在该平台内运行的每个不同的操作系统或操作系统映像免受每个其它的不同操作系统或操作系统映像的影响,使得一个逻辑分区中的软件错误不能影响任何其它分区的正确操作。通过将一组不相交的(disjoint)平台资源分配为由每个操作系统映像直接管理、以及通过提供用于确保给定的操作系统映像不能控制没有被分配给该给定的操作系统映像的任何资源的机制,来提供该保护。此外,防止操作系统的所分配的资源的控制中的软件错误影响任何其它映像的资源。因此,每个操作系统映像(或每个不同的操作系统)直接控制该平台内的不同组的可分配资源。
对于LPAR数据处理系统中的硬件资源,在各个分区之间不能共享这些资源,这些分区它们本身是不相交的并且每个分区看上去是单机计算机。这些资源可以包括例如输入/输出(I/O)适配器、双列直插内存模块(DIMM)、非易失性随机存取存储器(NVRAM)以及硬盘驱动器。可以引导和关闭该LPAR数据处理系统内的每个分区,而无需必须重启(power-cycle)整个系统。
在LPAR数据处理系统中,不同分区包括分区固件,该分区固件与分区中的操作系统相结合地使用。如本领域所公知的,LPAR数据处理系统还使得分区固件能够同时运行多线程。分区固件可以在不引起中断和OS定时器问题的情况下执行通常需要延长的执行时间的任务。当OS请求任务时,固件首先运行一小层分区固件代码。该分区固件代码向系统管理程序(hypervisor)发出调用(call)/事件以执行所请求的任务。该系统管理程序(也已知为“虚拟机监视器”)通过充当多个分区之间的仲裁器(arbitrator)而使得多个操作系统能够同时在一个数据处理系统上运行。在已经请求了事件之后,分区固件代码向OS返回“繁忙(BUSY)”状态。由于“繁忙”状态,该OS识别出该固件尚未完成收集所请求的数据,并且该OS再次询问该固件。
继续进行对分区固件的持续询问,直到该系统管理程序已经完成异步事件(这里也称为“系统管理程序任务”)。一旦完成,该系统管理程序就将所请求的数据放置到分区固件的存储器区中,并且将控制返回到分区固件代码以供进一步的数据精化(refinement)。
本领域技术人员将理解:通常被认为给OS收集数据的系统管理程序任务是这样失败的,即,该系统管理程序任务不能响应分区固件询问。在OS持续地询问分区固件时,该分区固件代码持续地向OS返回“繁忙”状态。如果负责服务该对数据的请求的系统管理程序任务已经停止操作,则该持续的询问不仅导致整个系统的性能变差而且也导致挂起进程。
如本领域中公知的,对于该持续询问问题的一种解决方案是实施定时器,该定时器在预定时间段之后过期。一旦定时器过期,OS可以舍弃(fail)尚未被满足的任何请求。然而,利用定时器在确定用于设定定时器的正确时段方面引入困难。如果将该时段设置为短时间段,则OS可以舍弃仍在工作以恢复数据但尚未完成恢复数据的系统管理程序任务。如果将该定时器时段设置为较长的时间段,则OS可以防止新请求启动。因此,需要一种在数据处理系统中在异步环境下探查系统管理程序任务的系统和方法。
发明内容
本发明包括一种在异步环境下探查系统管理程序任务的系统、方法以及计算机可用介质。根据本发明实施例,将数据处理系统实施为逻辑分区的(LPAR)数据处理系统。LPAR数据处理系统包括在多个分区中同时运行的多个不同种类的操作系统或同一操作系统的多个实例。该多个分区还包括提供可以被操作系统调用的功能的对应分区固件。在该数据处理系统中还包括用于服务来自该分区固件的请求的系统管理程序。
该分区固件将对数据的请求发送到该系统管理程序。当该系统管理程序接收到对数据的请求时,该系统管理程序返回标识被分配来处理该请求的任务的任务ID和时间戳,该时间戳指示该系统管理程序接收到该请求的时间。设置定时器以测量从请求分区固件接收到任务ID开始度过的时间量。如果在已经度过了由定时器测量的预定时间段之后该系统管理程序还没有给该分区固件提供所请求的数据,则该分区固件询问与该任务ID相关联的任务的状态。如果该任务仍在运行,则该分区固件将分区的控制返回到操作系统,并且该分区固件复位定时器。如果任务没有运行,则丢弃该任务并且该系统管理程序执行错误处理以丢弃该任务。
在下面详细撰写的描述中,本发明上面的以及其它的目的、特征和优点将变得明显。
附图说明
在所附权利要求书中提出被认为是本发明特性的新特征。然而,参考结合附图阅读的示例实施例的以下详细描述,将更好地理解本发明本身、以及优选使用方式、以及另外的目的和优点,在附图中:
图1是图示在其中可以实施本发明的优选实施例的示例数据处理系统的方框图;
图2是在其中可以实施本发明的优选实施例的示例逻辑系统的方框图;以及
图3是描述根据本发明实施例的用于在异步环境下探查系统管理程序任务的示例方法的高级逻辑流程图。
具体实施方式
本发明包括一种在异步环境下探查任务的系统及方法。根据本发明实施例,将数据处理系统实施为逻辑分区的(LPAR)数据处理系统。LPAR数据处理系统包括在多个分区中同时运行的多个不同种类的操作系统或同一操作系统(OS)的多个实例。该多个分区还包括提供可以被操作系统调用的功能的对应分区固件。在该数据处理系统中还包括用于服务来自每个分区固件的请求的系统管理程序。
OS需要来自固件的信息。OS向对应的分区固件发出请求。分区固件向系统管理程序发送对数据的请求。当该系统管理程序接收到对数据的请求时,该系统管理程序返回标识被分配用来处理该请求的任务的任务ID。分区固件记录任务ID和时间戳,该时间戳指示该系统管理程序接收到该请求的时间。设置定时器来测量从该系统管理程序接收到该请求开始度过的时间量。该分区固件将控制返回到OS并指示“繁忙”。OS将重复对分区固件的请求。如果在已经度过由定时器测量的预定时间段之后该系统管理程序尚未给分区固件提供所请求的数据,则该分区固件询问与该任务ID相关联的任务的状态。如果该任务仍在运行,则该分区固件将分区的控制返回到操作系统并指示“繁忙”。如果任务没有运行,则丢弃任务并且该分区固件执行错误处理以丢弃该任务。
现在参考附图,并且具体地参考图1,描述在其中可以实施本发明实施例的数据处理系统的框图。数据处理系统100可以是包括连接到系统总线106的处理器101、102、103和104的集合的对称多处理器(SMP)系统。例如,数据处理系统100可以是被实施为网络内的服务器的IBM eServer(纽约阿芒克的国际商业机器公司的产品)。可替换地,可以采用单个处理器系统。存储器控制器/高速缓冲存储器108也连接到系统总线106,该存储器控制器/高速缓冲存储器108提供到本地存储器160-163的集合的接口。I/O总线桥110连接到系统总线106并且提供到I/O总线112的接口。如所描述的可以集成存储器控制器/高速缓冲存储器108和I/O总线桥110。
数据处理系统100是逻辑分区的(LPAR)数据处理系统。因此,数据处理系统100可以具有同时运行的多个不同种类的操作系统(或者单个操作系统的多个实例)。这些多个操作系统中的每一个可以在其中执行任何数目的软件程序。将数据处理系统100逻辑分区使得将不同的PCI I/O适配器120-121、128-129、136、图形适配器148、硬盘适配器149、主机处理器101-104中的每一个以及本地存储器160-163中的每一个分配给三个分区之一。例如,可以将处理器101、本地存储器160以及I/O适配器120、128和129分配给第一逻辑分区;可以将处理器102-103、本地存储器161以及PCI I/O适配器121和136分配给第二逻辑分区;以及可以将处理器104、本地存储器162-163、图形适配器148以及硬盘适配器149分配给第三逻辑分区。
将在数据处理系统100内执行的每个操作系统分配给不同的逻辑分区。因此,在数据处理系统100内执行的每个操作系统仅可以访问位于其逻辑分区内的那些I/O单元。例如,高级交互执行(AIX)操作系统的一个实例可以在分区P1内执行,AIX操作系统的第二实例(图像)可以在分区P2内执行,以及
Figure A20081009222100081
操作系统可以在逻辑分区P3内执行。是华盛顿雷德蒙的微软公司的产品和商标。本领域技术人员将理解本发明不限于数据处理系统100中分区的数目为三,而是可以包括任何数目的分区。
来自I/O总线112的外设部件互联(PCI)主机桥130、114、122和140经由PCI总线115、118、119、123、126、127、131、133、141、144和145耦接到I/O插槽170-176。I/O插槽170-176为PCI I/O适配器120、121、128、129、136、图形适配器148以及硬盘适配器149提供接口。硬盘适配器149将硬盘150耦接到I/O总线112。
可以使用市场上可得到的各种计算机系统来实施数据处理系统100。例如,可以使用可从国际商业机器公司得到的IBM eServer iSeries模块840系统来实施数据处理系统100。这样的系统在执行AIX或Linux操作系统的同时可以支持逻辑分区。
本领域普通技术人员将理解图1中描述的硬件可以变化。例如,除了所描述的硬件之外或者替代所描述的硬件,也可以使用诸如光盘驱动器之类的其它外设。所描述的例子不意味着暗示对于本发明的结构上的限制。
现在参照图2,描述其中可以实施本发明的示例逻辑分区的平台的方框图。可以利用例如图1中的数据处理系统100来实施逻辑分区的平台200中的硬件。逻辑分区的平台200包括:分区硬件230,操作系统(OS)202、204、206和208,以及分区管理固件(这里也被称为系统管理程序210)。OS 202、204、206和208可以是在平台200上同时运行的单个操作系统的多个副本或者多个不同种类的操作系统。可以利用AIX或Linux来实施这些OS,AIX或Linux被设计来与系统管理程序进行接口。OS 202、204、206和208分别位于分区203、205、207和209中。
另外,这些分区203、205、207和209还分别包括分区固件(PFW)211、213、215和217。分区固件211、213、215和/或217提供可以被该分区中的操作系统调用的功能。当具体呈现分区203、205、207和209时,分区固件的拷贝被系统管理程序的分区管理器加载到每个分区中。与这些分区相关联的或者被分配给这些分区的处理器然后被分派到分区存储器以执行该分区固件。
分区硬件230包括多个处理器232-238、多个系统存储器单元240-246、多个输入/输出(I/O)适配器248-262以及存储单元270。分区硬件230还包括服务处理器290,其可以被用来提供各种服务,诸如分区中错误的处理。处理器232-238、存储器单元240-246、NVRAM存储298以及I/O适配器248-262中的每一个都可以被分配给逻辑分区的平台200内的多个分区之一,每个分区对应于操作系统202、204、206和208之一。
分区管理固件(系统管理程序)210执行多个功能并且服务于分区203、205、207和209以创建并执行逻辑分区的平台200的分区。系统管理程序210是与底层硬件相同的固件实施的虚拟机。系统管理程序软件可从国际商业机器公司得到。固件是存储在存储器芯片中的“软件”,该存储器芯片在没有电力供应的情况下保存内容,诸如例如只读存储器(ROM)、可编程ROM(PROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)以及非易失性随机存取存储器(非易失性RAM)。因此,系统管理程序210通过虚拟逻辑分区的平台200的所有硬件资源而允许同时执行独立的OS映像202、204、206和208。
可以通过诸如控制台(console)264之类的硬件管理控制台来控制不同分区的操作。控制台264是独立的数据处理系统,系统管理员可以从该独立的数据处理系统执行包括向不同分区重新分配资源的各种功能。
图3是描述根据本发明优选实施例的用于在数据处理系统中在异步环境下探察任务的示例方法的高级逻辑流程图。处理在步骤300开始,并且进行到步骤304,其示出了特定的分区固件(例如,图2的分区固件211、213、215和217)确定系统管理程序210是否已经成功地启动了所请求的任务。如果确定是,处理进行到步骤314,如这里更详细讨论的。
如果系统管理程序210尚未成功地启动所请求的任务,则处理进行到步骤306,其示出了分区固件向系统管理程序210发出对数据的请求。处理进行到步骤308,其示出了系统管理程序210将任务ID代码发送回分区固件。任务ID代码标识被分配来服务该对数据的请求的任务。处理进行到步骤310,其示出了:在接收到任务ID代码时,分区固件记录任务ID代码和时间戳。
步骤314示出了分区固件确定是否可从系统管理程序210得到所请求的数据。如果可得到所请求的数据,则分区固件处理所请求的数据,如步骤316中所示。然后,分区固件将其自身状态设置为“成功(SUCCESS)”(步骤318),并且将分区的控制返回操作系统(例如,操作系统202、204、206和208),如步骤324所示的。处理进行到步骤325,其示出分区固件复位定时器以用于来自分区固件对系统管理程序210的另一询问。处理进行到步骤326,其示出分区固件确定是否将其自身状态设置为“繁忙”。如果该状态没有被设置为“繁忙(BUSY)”,则该处理结束,如步骤326所示。如果该状态被设置为“繁忙”,则该处理返回步骤304,并且进入循环方式(iterative fashion)。
返回步骤314,如果不能从系统管理程序210得到所请求的数据,则处理进行到步骤320,其示出分区固件对定时器进行增计数以明了自在分区固件从系统管理程序210接收到任务ID开始度过的时间。处理进行到步骤322,其示出分区固件确定定时器是否已经达到预定的定时器阈值。如本领域技术人员公知的,该预定的阈值可以被设置为任何适当的值。例如,在本发明的实施例中,将预定的定时器阈值设置为500毫秒,这是因为在该时间内OS可以向分区固件询问满足原请求的数据。
如果在步骤322尚未达到该定时器阈值,则处理进行到步骤336,其示出分区固件将该任务的状态设置为“繁忙”。然后,处理进行到步骤324,其示出分区固件将分区的控制返回到相关联的操作系统。
如果在步骤322已经达到该定时器阈值,则处理进行到步骤328,其示出分区固件利用该请求的任务ID向系统管理程序210发出调用。处理进行到步骤330,其示出系统管理程序210确定该特定分区是否有权询问具有该特定的任务ID的任务。如果没有,则处理进行到步骤338。
如果在步骤330该特定分区有权询问具有该特定的任务ID的任务,则处理进行到步骤332,其示出系统管理程序210将该请求的状态返回给该分区固件。如果在步骤334该任务仍在运行,如在步骤334所确定的,该分区固件将该任务的状态设置为“繁忙”,如在步骤334和336所示的。然后处理进行到步骤324。如果在步骤334该任务没有运行,则处理进行到步骤338,其示出系统管理程序210丢弃该任务并执行错误处理。然后,该处理进行到步骤324。
步骤324示出了分区固件将分区的控制返回到与该分区固件相关联的操作系统。例如,如果分区固件217正向系统管理程序210发送对数据的请求,则分区固件217将分区的控制返回到操作系统208。处理从步骤324进行到步骤325,其示出该分区固件复位定时器以用于来自该分区固件的对系统管理程序210的另一询问。处理进行到步骤326,其示出该分区固件检查以查看该数据请求的状态是否仍是“繁忙”。如果是,则处理返回步骤300。如果在步骤326该数据请求的状态不是“繁忙”,则处理在步骤327结束。基本上,如果数据请求的状态不是“繁忙”,则该分区固件假设已经满足该请求或者已经丢弃该请求,如在步骤338中所示的。
如所讨论的,本发明包括一种用于在异步环境下探察任务的系统和方法。根据本发明的实施例,数据处理系统被实施为逻辑分区(LPAR)的数据处理系统。该LPAR数据处理系统包括在多个分区上同时运行的多个不同种类的操作系统或同一操作系统的多个实例。该多个分区还包括对应的分区固件,其提供可以被所述多个操作系统调用的功能。在该数据处理系统中还包括用于服务于来自该分区固件的请求的系统管理程序。
该分区固件向该系统管理程序发送对数据的请求。当该系统管理程序接收到该对数据的请求时,该系统管理程序返回标识被分配来处理该请求的任务的任务ID。分区固件记录该任务ID和指示该系统管理程序接收到该请求的时间的时间戳。该分区固件设置定时器以测量从请求分区固件接收到任务ID开始度过的时间量。如果在已经度过由该定时器测量的预定的时间段之后,该系统管理程序还没有给该分区固件提供所请求的数据,则该分区固件询问与该任务ID相关联的任务的状态。如果该任务仍在运行,则该分区固件将该分区的控制返回到该操作系统。如果该任务没有运行,则丢弃该任务并且该系统管理程序执行错误处理以丢弃该任务。
应该理解可以以包括程序产品的计算机可用介质来替换地实施本发明的至少一些方面。定义本发明中的功能的程序可以经由多种信号承载介质被传递到数据存储系统或者计算机系统,所述多种信号承载介质包括但不限于:不可写的存储介质(例如CD-ROM);可写的存储介质(例如硬盘驱动器、读/写CD-ROM、光学介质);诸如但不限于随机存取存储器(RAM)的系统存储器;以及诸如计算机和电话网络的包括以太网、因特网、无线网络等网络系统的通信介质。因此,应该理解这样的信号承载介质在传送或编码本发明中的直接方法起作用的计算机可读指令时表示本发明的替换实施例。另外,应该理解本发明可以通过具有以这里描述的硬件、软件、或软件和硬件的组合或它们的等效物的形式的部件的系统来实施。
尽管已经参考优选实施例具体地示出并描述了本发明,但是本领域技术人员应该理解在不偏离本发明的精神和范围的情况下可以在其中作出各种形式上和细节上的改变。

Claims (10)

1.一种计算机可实施的方法,包括:
从逻辑分区的数据处理系统中的分区向系统管理程序发送数据请求;
从所述系统管理程序接收数据请求标识和时间戳;
设置定时器以确定自从所述系统管理程序接收到所述时间戳开始度过的时间段的长度;
如果尚未满足所述数据请求,则对所述定时器进行增计数;
如果所述定时器已经达到预定的阈值,则询问所述系统管理程序以确定所述数据请求的状态;以及
如果处理所述数据请求的任务没有运行,则丢弃所述任务并执行错误处理。
2.如权利要求1所述的方法,还包括:
如果处理所述数据请求的所述任务仍在运行,则将所述任务的状态标记为“繁忙”。
3.如权利要求1所述的方法,还包括:
如果已经满足了所述数据请求,则处理与所述数据请求相对应的数据;以及
将所述任务的状态标记为“成功”。
4.如权利要求1所述的方法,还包括:
将所述分区的控制返回到在所述分区内执行的操作系统。
5.如权利要求1所述的方法,还包括:
确定所述分区是否有权确定所述任务的所述状态。
6.一种数据处理系统,包括:
至少一个处理器;
耦接到所述至少一个处理器的数据总线;
包含计算机程序代码的计算机可用介质,所述计算机可用介质耦接到所述数据总线,所述计算机程序代码包括可由所述处理器执行的指令并且所述指令被配置为:
将来自所述数据处理系统中的分区的数据请求发送到系统管理程序;
从所述系统管理程序接收数据请求标识和时间戳;
将定时器设置为确定自从所述系统管理程序接收到所述时间戳开始度过的时间段的长度;
如果尚未满足所述数据请求,则对所述定时器进行增计数;
如果所述定时器已经到达预定的阈值,则询问所述系统管理程序以确定所述数据请求的状态;以及
如果处理所述数据请求的任务没有运行,则丢弃所述任务并执行错误处理。
7.如权利要求6所述的数据处理系统,其中所述指令还被配置为:
如果处理所述数据请求的所述任务仍在运行,则将所述任务的状态标记为“繁忙”。
8.如权利要求6所述的数据处理系统,其中所述指令还被配置为:
如果已经满足所述数据请求,则处理与所述数据请求相对应的数据;以及
将所述任务的状态标记为“成功”。
9.如权利要求6所述的数据处理系统,其中所述指令还被配置为:
将所述分区的控制返回到在所述分区内执行的操作系统。
10.如权利要求6所述的数据处理系统,其中所述指令还被配置为:
确定所述分区是否有权确定所述任务的所述状态。
CN200810092221.0A 2007-04-17 2008-04-17 在异步环境下探查系统管理程序任务的系统和方法 Active CN101290595B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/736,027 2007-04-17
US11/736,027 US8209683B2 (en) 2007-04-17 2007-04-17 System and method for probing hypervisor tasks in an asynchronous environment

Publications (2)

Publication Number Publication Date
CN101290595A true CN101290595A (zh) 2008-10-22
CN101290595B CN101290595B (zh) 2011-04-20

Family

ID=39873388

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200810092221.0A Active CN101290595B (zh) 2007-04-17 2008-04-17 在异步环境下探查系统管理程序任务的系统和方法

Country Status (2)

Country Link
US (1) US8209683B2 (zh)
CN (1) CN101290595B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419699A (zh) * 2008-12-04 2009-04-29 中国工商银行股份有限公司 一种银行保证金数据动态监控方法及装置
CN104346240A (zh) * 2013-08-05 2015-02-11 国际商业机器公司 用于在迁移操作期间利用多个存储器池的方法和装置

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2531917B1 (en) * 2010-02-04 2019-11-27 Telefonaktiebolaget LM Ericsson (publ) Network performance monitor for virtual machines
US9038176B2 (en) 2011-03-31 2015-05-19 Mcafee, Inc. System and method for below-operating system trapping and securing loading of code into memory
US9317690B2 (en) * 2011-03-28 2016-04-19 Mcafee, Inc. System and method for firmware based anti-malware security
US9459898B2 (en) * 2011-10-06 2016-10-04 Hitachi, Ltd. Virtual server processing control method, system, and virtual server processing control management server
JP5719316B2 (ja) * 2012-01-05 2015-05-13 株式会社日立製作所 計算機システム及び障害処理方法
US10169137B2 (en) 2015-11-18 2019-01-01 International Business Machines Corporation Dynamically detecting and interrupting excessive execution time
US20190243673A1 (en) * 2018-02-06 2019-08-08 Nutanix, Inc. System and method for timing out guest operating system requests from hypervisor level

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5220674A (en) * 1987-07-17 1993-06-15 Digital Equipment Corporation Local area print server for requesting and storing required resource data and forwarding printer status message to selected destination
CN100485605C (zh) * 2001-09-24 2009-05-06 中兴通讯股份有限公司 一种多任务实时操作系统的实现方法
US6880021B2 (en) * 2001-09-28 2005-04-12 International Business Machines Corporation Intelligent interrupt with hypervisor collaboration
CN1235142C (zh) * 2002-08-20 2006-01-04 华为技术有限公司 嵌入式软件任务死循环监控方法
US7328438B2 (en) 2003-03-27 2008-02-05 International Business Machines Corporation Deallocation of computer data in a multithreaded computer
US7376948B2 (en) * 2003-04-24 2008-05-20 International Business Machines Corporation Selective generation of an asynchronous notification for a partition management operation in a logically-partitioned computer
US7325163B2 (en) 2005-01-04 2008-01-29 International Business Machines Corporation Error monitoring of partitions in a computer system using supervisor partitions
CN1811719A (zh) 2006-02-22 2006-08-02 福建师范大学 一种单线程微处理器的死锁检测与干预方法
US7636800B2 (en) * 2006-06-27 2009-12-22 International Business Machines Corporation Method and system for memory address translation and pinning

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419699A (zh) * 2008-12-04 2009-04-29 中国工商银行股份有限公司 一种银行保证金数据动态监控方法及装置
CN101419699B (zh) * 2008-12-04 2015-11-11 中国工商银行股份有限公司 一种银行保证金数据动态监控方法及装置
CN104346240A (zh) * 2013-08-05 2015-02-11 国际商业机器公司 用于在迁移操作期间利用多个存储器池的方法和装置
CN104346240B (zh) * 2013-08-05 2018-03-30 国际商业机器公司 用于在迁移操作期间利用多个存储器池的方法和装置

Also Published As

Publication number Publication date
US20080263288A1 (en) 2008-10-23
CN101290595B (zh) 2011-04-20
US8209683B2 (en) 2012-06-26

Similar Documents

Publication Publication Date Title
CN101290595B (zh) 在异步环境下探查系统管理程序任务的系统和方法
CN100495375C (zh) 用于选择性地停止dma操作的方法、设备和系统
US8291430B2 (en) Optimizing system performance using spare cores in a virtualized environment
EP3143501B1 (en) Mechanism for performing rolling updates with data unavailability check in a networked virtualization environment for storage management
CN101410813B (zh) 在存储器迁移期间停止dma操作的计算机实现的方法、设备和计算机程序产品
JP3962393B2 (ja) グローバル・エラーを報告するための論理分割データ処理システム
US10423451B2 (en) Opportunistically scheduling and adjusting time slices
CN102365626B (zh) 用于虚拟机的虚拟非一致存储器体系结构
JP4181554B2 (ja) 論理区画化データ処理システムでの電力消費を削減する方法」と補正する。
US8271989B2 (en) Method and apparatus for virtual processor dispatching to a partition based on shared memory pages
CN100524223C (zh) 基于pmi和smi的调度执行框架中用于并发处理程序执行的方法
US8108196B2 (en) System for yielding to a processor
US8745441B2 (en) Processor replacement
US8051254B2 (en) Application migration and power consumption optimization in partitioned computer system
US20040221193A1 (en) Transparent replacement of a failing processor
CN101221540B (zh) 用于减少存储器访问时延的方法和设备以及数据处理系统
US6625638B1 (en) Management of a logical partition that supports different types of processors
US20090006733A1 (en) Drive Resources in Storage Library Behind Virtual Library
US10331581B2 (en) Virtual channel and resource assignment
US20040158833A1 (en) Operating-system-independent modular programming method for robust just-in-time response to multiple asynchronous data streams
US11182252B2 (en) High availability state machine and recovery
US8230117B2 (en) Techniques for write-after-write ordering in a coherency managed processor system that employs a command pipeline
US7536422B2 (en) Method for process substitution on a database management system
CN111381969B (zh) 一种分布式软件的管理方法及其系统
US20240160354A1 (en) Node cache migration

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant