CN101361046B - 远程复原无响应计算系统 - Google Patents

远程复原无响应计算系统 Download PDF

Info

Publication number
CN101361046B
CN101361046B CN200780001757.0A CN200780001757A CN101361046B CN 101361046 B CN101361046 B CN 101361046B CN 200780001757 A CN200780001757 A CN 200780001757A CN 101361046 B CN101361046 B CN 101361046B
Authority
CN
China
Prior art keywords
remote server
memory segment
module
storer
reserved memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200780001757.0A
Other languages
English (en)
Other versions
CN101361046A (zh
Inventor
A·K·阿拉姆
V·巴尔苏克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qindarui company
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101361046A publication Critical patent/CN101361046A/zh
Application granted granted Critical
Publication of CN101361046B publication Critical patent/CN101361046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/40Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass for recovering from a failure of a protocol instance or entity, e.g. service redundancy protocols, protocol state redundancy or protocol service redirection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Telephonic Communication Services (AREA)

Abstract

提供了一种用于复原由于存储器限制的原因未响应的远程服务器的方法。所述方法包括:提供连接于网络通信信道的远程服务器;将保留存储器段程序钉住所述远程服务器中的存储器,以便当存储器限制出现时控制在所述远程服务器的存储器中分配的保留存储器段。所述方法进一步包括:持续地运行所述保留存储器段程序以监听用于释放被分配的所述保留存储器段的请求包;响应于所接收的所述请求包,释放所述远程服务器的所述存储器中的所述保留存储器段;以及当所述保留存储器段被释放时在所述远程服务器处执行用于复原所述远程服务器的任意校正动作。

Description

远程复原无响应计算系统
技术领域
本发明涉及一种用于远程复原(restore)无响应计算系统的装置、方法和程序产品。更具体地,本发明涉及一种用于远程复原无响应计算系统的装置、方法和程序产品,所述计算系统正在经历存储器限制同时不是必须执行电源复位或者必须重新引导计算系统。
背景技术
在当今的商业环境中,组织和/或公司使用很多种分布式计算系统在应用程序之间进行通信,所述应用程序在多个工作站和/或服务器上被托管。此外,最近的趋势已经看出,在公司和/或组织中使用的服务器数量在稳定增长。因而,许多分布式计算系统使用附加类型的服务器,这些服务器执行特定功能,并且位于公司和/或组织中的不同位置,而不是位于一个中央位置。尽管置于这些服务器上的数据被看成对于公司很关键,但是仍然缺少下述装置,所述装置用于当来自单个服务站点的这些服务器被分布在不同位置时,确保这些服务器的正常操作。因而,存在对于简化用于维持这些服务器的正常操作的过程的需要,而与此同时控制关联于所述维持的任何成本。
发明内容
本发明提供了如权利要求1所要求保护的一种用于复原由于存储器限制的原因未响应的远程服务器的方法、以及相应的系统和计算机程序。
附图说明
被并入并组成本说明书的一部分的附图图示了本发明的实施例,并且连同其描述一起用于解释本发明的原理:
图1图示了根据本发明实施例的用于远程复原无响应计算系统的装置的网络配置。
图2是图示了根据本发明实施例的被配置用于复原远程服务器的远程服务器的一实施例的框图。
图3是描述了根据本发明实施例的用于远程复原无响应计算系统的方法的流程图图示。
图4是描述了根据本发明实施例的用于远程复原无响应计算系统的方法的流程图图示。
图5是图示了根据本发明实施例的用于测试对于形象化或商业规则的改变的计算机程序产品的示意性系统框图。
具体实施方式
本领域技术人员将理解,可以对本发明做出多种修改和变体,而不会脱离本发明的精神和范围。因此,意图是本发明覆盖了本发明的修改和变体,如果它们来自于所附权利要求及其等价物的范围之内的话。现在将详细地参考本发明的优选实施例。
在一实施例中,本发明提供了一种用于复原由于存储器限制的原因未响应的远程计算或计算机系统的装置或系统。所述装置包括:网络通信信道;连接于网络通信信道的远程计算系统,所述远程计算系统已经在存储器中分配了保留存储器段;保留存储器段程序,其被钉住(pin to)所述远程计算系统的存储器并在所述远程计算系统上持续运行,所述保留存储器段程序被配置用于控制在远程计算系统的存储器中分配的保留存储器段;以及连接于网络通信信道的控制计算系统,其被配置用于在网络通信信道上发送请求到远程计算系统,以便当存储器限制出现时使用保留存储器段程序释放保留存储器段,从而控制服务器能够管理用于复原远程计算系统的一个或多个校正动作。在优选实施例中,所述请求包括TCP/IP包。优选地,保留存储器段程序被进一步配置用于在网络通信信道上监听预定的TCP/IP端口以发现请求,以及被进一步配置用于在网络通信信道上接收请求。此外,优选地,保留存储器段程序被配置用于验证所接收的TCP/IP包,以及标识所接收的TCP/IP包。此外,优选地,保留存储器段程序被进一步配置用于检查所述TCP/IP包是否对应于在远程计算系统上可以允许的操作。优选地,控制计算系统被进一步配置用于基于对远程计算系统由于存储器限制的原因未响应的确定而发送请求,以及发送用于包括释放保留存储器段的TCP/IP包的请求到远程计算系统。在优选实施例中,所述装置进一步包括:运行在远程计算系统上的自动恢复程序,其被配置用于周期性地检查所述远程计算系统上的存储器以便检测存储器限制,以及当检测到存储器限制时请求保留存储器段程序被释放。优选地,自动恢复程序被进一步配置用于当保留存储器段被释放之时在远程计算系统处执行一个或多个校正动作。
如此处所使用的,术语“远程计算系统”或“远程计算机系统”或“远程服务器”指代经由网络连接访问的远程计算设备(优选地是远程服务器)。此外,术语“控制计算系统”或“控制服务器”指代远程计算设备(优选地是远程控制服务器),其被配置用于控制远程计算系统或服务器上的过程。此外,术语“保留存储器段”指代计算系统(优选地是远程服务器)上的一块存储器,其中所述一块存储器被分配或保留给远程服务器。此外,如此处所使用的,术语“保留存储器段程序”或“段程序”或“已钉住程序”指代在远程服务器上运行的大小很小的程序或代码,其被钉住远程服务器的存储器。
现在参考图1,图1图示了根据本发明实施例的用于复原由于存储器限制的原因未响应的远程计算机系统(优选地是远程服务器)的装置或系统100的一实施例。图1的装置或系统100包括使用计算设备102和104(优选地是独立的工作站102和104)的应用用户,所述计算设备102和104经由网络通信信道140与系统100中的其它计算系统通信。在一实施例中,系统100包括计算系统108、110和112(优选地是代理服务器),其与应用用户102和104分离,并经由具有某种安全应用访问端口的防火墙106而受保护。此外,系统100包括计算系统118、120和122(优选地是应用服务器118、120和122),其可以由应用用户102和/或104经由网络通信信道140访问。优选地,系统包括负载均衡服务器群集114和116,其保护系统100不会过载。在优选实施例中,负载均衡服务器群集充当针对网络请求的流量系统,以及接受用户请求并将请求分发到不是很忙的服务器。此外,系统100包括执行多种功能的其它计算系统(优选地是服务器群集124、126、128、130和132)。在一实施例中,服务器包括数据库服务器124、消息传送服务器126、认证服务器128、批处理服务器130以及报告服务器132。优选地,服务器108、110、112、118、120、122、124、126、128、130和132中的每个都彼此连接,并且经由网络通信信道140连接到应用用户102和104。在优选实施例中,服务器108、110、112、118、120、122、124、126、128、130和132中的任意一个可以被配置为控制服务器。优选地,作为控制服务器的服务器的配置由系统管理员执行。例如,如果服务器120被配置为控制服务器,则耦合于远程服务器或计算系统108、110、112、118、122、124、126、128、130和132中的每个的控制服务器120可以通过网络140提供对远程服务器108、110、112、118、122、124、126、128、130和132中的任意一个的远程复原。在优选实施例中,所述控制可以通过位于站102和/或104的用户输入来指示。如将针对图2更加详细描述的那样,图1的系统的配置可被用于:通过在网络140上在控制服务器和远程服务器之间发送消息,而执行从控制服务器到远程服务器的、用于执行某种特定动作的请求,诸如请求释放位于远程服务器200的保留存储器段,所述配置将针对图2被进一步解释。
转到图2,标号200示出了被配置用于例如当出现存储器限制时复原远程服务器的远程服务器200的实施例,所述远程服务器200例如如图1中所示的应用服务器(118、120或122)。图2示出了远程服务器200的实施例。优选地,远程服务器200包括中央处理单元(CPU)208、本地存储设备202、用户接口204、网络接口206、包括操作系统211的存储器210、以及保留存储器段程序组件212。CPU 208通常被配置用于执行远程服务器200中的操作。在一实施例中,用户接口204被配置用于允许用户与远程服务器200交互,包括允许来自用户的输入数据和命令以及将输入数据传送给用户。在一实施例中,网络接口206被配置用于便利于在图1中所示的系统100的通信信道140上进行远程服务器200的网络通信。在一实施例中,本地存储器210被配置用于存储操作系统211以及可被用于复原远程服务器以及用于采取任意校正动作或操作的若干数据和元数据文件。在可替换实施例中,一些或所有的这些数据和元数据文件可被复制到本地存储设备202。在另外的实施例中,一个或所有的这些数据和元数据文件可以被专门存储在本地存储设备202中而不会存储在存储器210中。在另一实施例中,一个或所有的这些数据和元数据文件可以被存储在系统100的分布式存储装置中。
此外,在一实施例中,远程服务器优选地包括保留存储器段程序组件212,其包括若干模块,所述模块包括:分配模块214、监听模块216、接收模块218、认证模块220、以及释放段模块222。远程服务器上的保留存储器段程序组件被提供有包含多个模块的逻辑单元,所述模块被配置用于功能性地执行释放位于远程服务器的保留存储器段的必要步骤,以便例如当存储器限制出现时复原远程服务器。保留存储器段程序组件212的目的是实现将存储器的保留存储器段分配给远程存储器、以及当远程服务器正经历存储器溢出的情况时控制在存储器内分配的保留存储器段的多种方法。在优选实施例中,分配模块214将远程服务器中的存储器的保留存储器段分配给远程服务器。在优选实施例中,监听模块216监听并等待预定端口上的请求释放保留存储器段的包。在优选实施例中,接收模块218接收预定端口上的请求释放保留存储器段的包。在优选实施例中,认证模块220验证所接收的包,并标识所接收的包中进行的请求的类型。在优选实施例中,当具有请求的包已经被认证之时,释放保留存储器段模块222释放保留存储器段。
此处上述的保留存储器段程序212的功能单元已经被标为模块,以便更具体地强调它们的实现独立性。例如,模块可以被实现为包括定制VLSI电路或门阵列的硬件电路、现有的半导体(诸如逻辑芯片、晶体管)、或其它分离的组件。模块还可以用可编程硬件设备实现,所述可编程硬件设备诸如场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等等。模块还可以用软件实现,所述软件用于由多种类型的处理器所执行。已标识的可执行代码模块或组件例如可以包括一个或多个物理或逻辑的计算机指令块,其例如可以被组织成对象、过程或功能。然而,已标识模块的可执行代码不需要在物理上在一起,而是可以包括存储在不同位置的相异的指令,所述指令当在逻辑上连接到一起时包括所述模块并实现针对该模块的所述目的。此外,可执行代码的模块可以是单个指令或许多指令,并且甚至可以被分布在若干不同的代码段上、不同的程序之间、以及若干存储器设备上。类似地,操作数据在此可以在模块中被标识和示出,并且可以体现为任意适当的形式并用任意适当类型的数据结构来组织。操作数据可以被收集作为单个数据集,或者可以被分布在不同位置上,包括分布在不同存储设备上、相异的存储器设备上,并且可以至少部分地仅仅作为系统或网络上的电子信号而存在。此外,模块还可以被实现为软件和一个或多个硬件设备的组合。例如,模块可以体现为存储在存储器设备上的软件可执行代码的组合。在另一示例中,模块可以是对一组操作数据进行操作的处理器的组合。进一步地,模块可以用经由传输电路进行传送的电子信号的组合来实现。
当远程服务器200发生存储器溢出210时,优选地,操作系统211开始暂停(halt)在远程服务器200上运行的、需要附加存储器的程序/过程,并且较大的程序趋向于被首先终止。如果在远程服务器200上运行的程序/过程未被钉住(pin to)存储器210(通常都是这样),则该程序/过程与其它程序竞争存储器210。如果程序/过程被钉住存储器210,则该程序/过程具有被分配给它的固有的存储器,并且其它程序/过程不可使用该固有的存储器。为了确保远程服务器200继续能够被用户102或104所访问,在远程服务器200上提供保留存储器段程序212。保留存储器段程序212是在远程服务器200上运行的很小的程序,并且被钉住存储器210。保留存储器段程序212优选地需要极少的存储器210,并且在优选实施例中,保留存储器段程序212仅使用10MB至100MB的存储器210,从而当远程服务器被挂起(hang)或冻结(freeze)时,存在足够的可供系统管理员用于远程登录到远程服务器的存储器210。不过,取决于在远程服务器上可用的实际存储器,保留存储器段程序212的大小可以不同,并且优选地应该是足以用于执行复原动作的一个可配置大小。不过,如所指示的,本发明并不意味着被限制于特定大小。在优选实施例中,保留存储器段程序212响应于调用(诸如请求,优选地是TCP/IP请求),如此处下文描述的。
在另一实施例中,本发明提供了一种用于复原由于存储器限制的原因未响应的远程服务器的方法。所述方法包括:提供连接于网络通信信道的远程服务器,将保留存储器段程序钉住远程服务器中的存储器,以便当存储器限制出现时控制在远程服务器的存储器中所分配的保留存储器段。优选地,所述钉住步骤包括:分配远程服务器的存储器中的保留存储器段。所述方法进一步包括:持续地运行保留存储器段程序以监听用于释放被分配的保留存储器段的请求包,响应于所接收的请求包释放远程服务器的存储器中的保留存储器段,以及当保留存储器段被释放时在远程服务器处执行用于复原远程服务器的任意校正动作。优选地,所述持续地运行的步骤包括:在网络通信信道上监听预定的TCP/IP端口以发现请求包,以及在网络通信信道上接收请求包。优选地,所述释放步骤包括:验证所接收的请求包,标识所接收的请求包,以及检查所接收的请求包是否对应于在远程服务器上可以允许的操作。在优选实施例中,所述执行步骤进一步包括:周期性地检查远程服务器上的存储器以检测存储器限制,以及当检测到存储器限制时发送用于释放保留存储器段的请求包。此外,优选地,所述执行步骤包括:在远程服务器上运行自动恢复程序,以便当保留存储区段被释放时在远程服务器处执行任意校正动作。
现在参考图3和4,其描述了用于复原由于存储器限制的原因未响应的远程计算系统的方法。转到图3,用于复原远程计算系统(优选地是远程服务器)的方法300在步骤302开始,并且在步骤304保留存储器段程序或代码(在此下文中也被称为“段程序”)被钉住存储器。优选地,段程序的大小很小,并且被钉住存储器,从而该程序常驻在存储器中。此外,段程序被标记为不可移动的,从而其它程序不能与段程序交换空间,并且向段程序给出了较高的运行优先级。此外,保留存储器段被段程序所预定,并且不可用于任何其它目的。优选地,当段程序最早一次开始时,段程序在步骤306保留或分配一块存储器,所述一块存储器在此被称为保留存储器段。在优选实施例中,保留存储器段很小,以及使用极少的存储器,并且依赖于系统的实现,保留存储器段的大小例如可以典型地包括30兆字节(MB)至100MB之间的范围,从而当远程服务器被冻结时,存在足够的可供系统管理员用于远程登录到远程服务器的存储器。不过,取决于在远程服务器上可用的实际存储器,保留存储器段的大小可以不同。可替换地,保留存储器段可以由除了保留存储器段程序之外的另一程序所创建。例如,保留存储器段可以由另一程序或由已钉住的段程序在其初期预先创建,如图3和4所描述的。不过,如果保留存储器段不是由段程序所创建,则需要一种机制,以便提供在保留存储器段上的已钉住段程序控制,以便释放该存储器。
一旦段程序已经分配了保留存储器段,则段程序在步骤308开始在端口上(优选地是在预定的TCP端口上)进行监听以发现任意请求包,并在步骤310等待TCP端口上的任意请求包。优选地,一个包包括被用于指定特定动作的请求TCP/IP包,所述特定动作将由段程序在远程服务器处执行。于是,当作为出现存储器溢出的结果而导致远程服务器挂起或变为冻结或未响应之时,尽管远程服务器的操作系统无法开始任何新的过程,但是远程服务器并未完全停用,并且假如段程序被钉住存储器的话则段程序继续在远程服务器上运行。此外,保留存储器段程序在预定端口上进行监听以发现任意通信。再次参考图3,在图3的右侧,控制服务器在步骤324开始,并且在步骤326确定远程服务器是否存储器溢出。优选地,控制服务器是经由网络连接被连接到远程服务器的另一服务器。如果控制服务器确定远程服务器在326并未存储器溢出,则所述过程在328结束。不过,如果控制服务器在步骤326确定远程服务器出现存储器溢出,则在步骤330做出在远程服务器上释放保留存储器段的决定。优选地,释放保留存储器段的决定可以由系统管理员手动做出或者由自动过程(例如在远程服务器上运行的自动恢复程序)做出,所述自动过程进行检查以发现远程服务器是否具有存储器限制,并且如果检测到存储器限制则做出需要在远程服务器处执行远程操作(诸如释放保留存储器段)的决定。释放保留存储器段的远程操作创建了用于其它动作的机会,所述动作可以被采取以便恢复远程服务器。例如,控制服务器可以检测到远程服务器被挂起。如果远程服务器未响应于服务请求(诸如用户无法登录)、服务器未响应(服务器仍然在工作并运行,但是由于缺少存储器而拒绝其它请求,诸如尝试开始任意新程序)、服务器被监视工具报告为停机等等,则将远程服务器假定为被挂起或冻结。在任一这样的情形中,系统管理员做出服务器停机并且需要远程操作的决定。不过,本领域技术人员将认识到,即使服务器未被挂起,也可以使用远程操作。作为决定的结果,在步骤332,一个包(优选地是TCP/IP包)在预定的TCP端口上被发送,所述包具有用于释放保留存储器段的请求。由于远程服务器在步骤308正在预定的TCP端口上进行监听,并且在步骤310等待任意包,因此当控制服务器发送包之时,远程服务器能够在步骤312在TCP端口上接收请求释放保留存储器段的包。远程服务器在步骤314执行请求验证,以检查请求是否有效。远程服务器在步骤316进一步标识请求类型。此外,远程服务器在步骤318确定在请求中指定的操作或动作(即,释放保留存储器段)对于请求者(具体而言是控制服务器)来说是否被允许。如果远程服务器确定控制服务器未被授权或未被允许请求释放保留存储器段的操作或动作,则远程服务器不执行所请求的操作或动作,而是返回到在TCP端口上等待另一包。另一方面,如果远程服务器确定控制服务器被授权或被允许请求释放保留存储器段,则远程服务器执行所请求的操作或动作。作为认证过程的结果,远程服务器在步骤320释放保留存储器段,由此结束所述过程。优选地,远程服务器基于所使用的平台使用某种系统调用来释放保留存储器段。如上所述,远程段程序需要极少的存储器,其被设计用于当由请求者(例如控制服务器)进行请求时执行释放保留存储器段。假设段程序被钉住存储器,则段程序在已冻结的远程服务器中仍旧可执行。段程序监听远程服务器上的TCP/IP端口。从而,当远程服务器变成已冻结或无响应时,控制服务器能够经由网络连接将请求TCP包发送到已挂起的远程服务器。例如,释放保留存储器段允许系统管理员经由telnet或SSH进行远程登录,以及执行校正动作,诸如结束导致存储器限制或消耗的过程/应用或者增加交换空间大小。
转到图4,标号400概述了根据本发明实施例的、用于复原由于存储器限制的原因未响应的计算系统(优选地是远程服务器)的可替换方法。用于复原远程服务器的方法400在步骤402开始,并且在步骤404保留存储器段程序或代码被钉住远程服务器中的存储器。段程序在步骤406分配远程服务器的存储器中的保留存储器段。段程序在步骤408开始在预定的TCP端口上进行监听以发现任意请求包(优选地是TCP/IP包)。在远程位置,请求者(诸如控制服务器)在424开始,并周期性地(优选地以预定的时间间隔并在远程服务器上)执行存储器可用性检查。在可替换实施例中,已钉住的段程序包括自动触发器,以启动以预定的时间间隔在远程服务器上对于存储器可用性检查的执行。请求者在步骤428确定是否存在可用的存储器。如果请求者在步骤428确定存储器可用,则请求者返回执行周期性存储器可用性检查的步骤426。不过,如果请求者确定存储器不可用,即,存在存储器限制,例如,远程服务器未响应,则请求者在步骤430在预定的TCP端口上发送一个包到远程服务器,优选地,所述包是具有用于释放保留存储器段的请求的TCP/IP包。远程服务器在步骤412在预定的TCP端口上接收具有用于释放保留存储器段的请求的包。远程服务器在步骤414执行请求验证,以及在步骤416标识请求类型。此外,在步骤418,远程服务器确定请求者是否被允许或授权请求在所接收的请求中的操作或动作(即,释放保留存储器段)。如果远程服务器确定请求者未被授权或未被允许请求释放保留存储器段的操作或动作,则远程服务器不执行所请求的操作或动作,而是返回到在TCP端口上等待另一包。不过,如果远程服务器确定请求者被授权或被允许请求释放保留存储器段的操作或动作,则远程服务器执行所请求的操作或动作,并且在步骤420释放保留存储器段。请求者在步骤432进行检查以发现保留存储器段是否已经被释放。如果请求者确定保留存储器段尚未被释放,则请求者在进行检查以发现保留存储器段是否已经被释放之前等待预定的时间间隔。不过,如果请求者确定保留存储器段已经被释放,则请求者启动用于复原或者解除冻结远程服务器所必需的校正动作,并且在步骤434结束所述过程。例如,释放保留存储器段允许系统管理员经由telnet或SSH进行远程登录,以及执行校正动作,诸如结束导致存储器消耗的过程/应用或者增加交换空间大小。从而,请求者(例如控制服务器)可以标识“存储器溢出”的情形,并且可以在释放保留存储器段之时自动启动用于修复无响应服务器的问题所必需的任何校正动作。例如,控制服务器可以启动自动恢复程序在远程服务器上的运行,以复原远程服务器,如果是被这样进行配置的话。
在再一实施例中,本发明提供了一种用于复原由于存储器限制的原因未响应的远程服务器的计算机程序产品。所述计算机程序产品包括:计算机可读媒体,用于分配驻留于远程服务器上的存储器的保留存储器段的第一程序指令,用于将保留存储器段程序钉住驻留于远程服务器上的存储器的第二程序指令,用于持续地运行被钉住的保留存储器段程序以便当存储器限制出现时监听请求包的第三程序指令,用于响应于当存储器限制出现在远程服务器上时所接收的请求包而释放保留存储器段的第四程序指令。所述计算机程序产品进一步包括:用于周期性检查驻留于远程服务器上的存储器以发现存储器限制、以及如果发现存储器限制则发送请求包到远程服务器的第五程序指令。优选地,第一、第二、第三、第四和第五程序指令中的每个都存储在所述媒体上。在优选实施例中,第三程序指令进一步包括:用于监听预定的TCP/IP端口以发现请求包、以及用于接收包括用于释放保留存储器段的TCP/IP包的请求包的指令。优选地,第四程序指令进一步包括:用于验证所接收的请求TCP/IP包以及用于标识所接收的TCP/IP包的指令。此外,优选地,第四程序指令进一步包括:用于检查所接收的请求TCP/IP包是否对应于在远程服务器上可以允许的操作的指令。优选地,第五程序指令进一步包括:用于在释放保留存储器段之时在远程服务器处执行校正动作的指令。
在优选实施例中,所述计算机可读媒体包括计算机存储媒体和网络媒体。优选地,所述计算机可读媒体包括半导体存储器、磁盘、磁带、致密盘(CD)、只读存储器(ROM)、和/或数字视频盘(DVD),并且网络媒体包括网络上的传输设备,诸如线缆、路由器、交换机和/或网络适配器卡。从而,本发明还可以以计算机程序代码的形式体现,例如,所述计算机程序代码或者被存储在存储媒体中、被加载到计算机中和/或由计算机执行,或者在某种传输媒体上传输,诸如在电配线或成缆上传输、通过光纤、或经由电磁辐射传输,其中,当所述计算机程序代码被加载到计算机中并由计算机执行时,该计算机成为用于实施本发明的装置。当在通用微处理器上实现时,所述计算机程序代码段配置该微处理器来创建特定的逻辑电路。本领域技术人员将理解,需要由系统的处理器执行的一组可编程代码,用于执行上述的发明系统和方法的过程步骤。
优选地,所述计算机程序产品采用可从计算机可用或计算机可读媒体访问的形式,所述媒体提供由计算机或任何指令执行系统使用、或与计算机或任何指令执行系统相结合使用的程序代码或指令。出于本说明书的目的,计算机可用或计算机可读媒体可以是可包含、存储、传送、传播或传输代码或指令的任何装置,所述代码或指令用于由指令执行系统、装置或设备使用或与指令执行系统、装置或设备相结合使用。优选地,所述媒体可以包括:电子的、磁的、光的、电磁的、红外的、或半导体系统(或装置或设备)、或传播媒体。更具体地,计算机可读媒体可以包括:半导体或固态存储器、磁带、可移动计算机磁盘、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘和光盘。此外,光盘的示例包括只读存储器致密盘(CD-ROM)、读/写致密盘(CD-R/W)或数字多功能/视频盘(DVD)。此外,优选地,网络媒体可以包括网络上的传输设备,诸如线缆、路由器、交换机和/或网络适配器卡。
参考图5,标号500是图示了一种用于复原由于存储器限制的原因未响应的远程服务器的计算机程序产品的示意性系统框图。如所述,系统500包括计算机基础设施502,其意在表示在安全环境(即,对于该环境强制实施访问控制)中维护的任意类型的计算机体系结构。计算机基础设施502仅表示用于实现本发明的多种类型的计算机基础设施。如所示,基础设施502包括计算系统504,其典型地表示服务器等等(优选地是远程服务器),并且进一步包括计算系统530、540、542和544。不过,应该理解,尽管未示出,但其它硬件和软件组件(例如附加的计算机系统、路由器、防火墙等等)可以被包括在基础设施502中。一般而言,位于控制服务器530的用户或系统管理员与基础设施502通过接口连接,用于复原由于存储器限制的原因未响应的远程服务器。此外,一个或多个其它用户或系统管理员(图5中未示出)可以与基础设施502通过接口连接,以复原由于存储器限制的原因未响应的远程服务器。可替换地,系统管理员530可以是服务提供者,其向客户机(诸如客户机540、542和544)提供服务,其中系统管理员530可以与基础设施502通过接口连接,以优选地通过提供安全环境的基础设施502来提供用于复原由于存储器限制的原因未响应的远程服务器的服务。更为优选地,服务提供者530基于收费或预定而将服务提供给客户机。一般而言,各个参与方530、540、542和544可以直接访问基础设施502,或者经由在计算机化的设备(例如个人计算机、膝上型计算机、手持设备等等)上加载的接口(例如Web浏览器)在网络上访问基础设施502。在后一情形中,网络可以是任意类型的网络,诸如因特网、局域网(LAN)、广域网(WAN)、虚拟专用网(VPN)等等。在任一情形中,与基础设施502的通信可以经由直接硬连线的连接(例如串行端口)或经由可寻址连接发生,所述可寻址连接可以使用有线线路和/或无线传输方法的任意组合。此外,可以使用传统的网络连接,诸如令牌环、以太网、WiFi或其它传统的通信标准。此外,可以由传统的基于TCP/IP套接字的协议来提供连接。
计算系统或远程服务器504被示出包括处理单元(CPU)506、存储器512、总线510、以及输入/输出(I/O)接口508。此外,计算系统504被示出与外部I/O设备/资源524和存储系统522进行通信。一般而言,处理单元506执行计算机程序代码或脚本,诸如保留存储器段程序514以及自动恢复程序518,它们优选地被存储在存储器512中,以及可替换地可以被存储在外部存储系统522中。当执行计算机程序代码时,处理单元506可以读取来自存储器512、存储系统522和/或I/O接口508的数据和/或将数据写到存储器512、存储系统522和/或I/O接口508。存储器512进一步包括保留存储器段516,其通过在认证之时执行保留存储器段程序514来释放。总线510提供计算系统504中的每个组件之间的通信链路。外部设备524可以包括使得用户能够与计算系统504相交互的任意设备(例如键盘、点击设备、显示器等)、和/或使得计算系统504能够与一个或多个其它计算设备相通信的任意设备(例如网卡、调制解调器等)。此外,计算系统504仅代表可以包括多种硬件组合的多种可能的计算机系统。在此程度,在其它实施例中,计算系统504可以包括:任意专用计算制品,其包括用于执行特定功能的硬件和/或计算机程序代码;任意计算制品,其包括专用和通用的硬件/软件的组合;等等。在每一情形中,程序代码和硬件可以分别使用标准编程和工程技术来创建。例如,处理单元506可以包括单个处理单元,或者被分布在位于一个或多个位置的一个或多个处理单元上,例如在客户机和服务器上。类似地,远程服务器504上的存储器512和/或存储系统522可以包括驻留在一个或多个物理位置的多种类型的数据存储和/或传输媒体的任意组合。此外,I/O接口508可以包括用于与一个或多个外部设备524交换信息的任意系统。此外,可以理解,一个或多个附加的组件(例如系统软件、数学协处理单元等——图5中未示出)可以被包括在计算系统504中。此外,如果计算系统504包括手持设备等,则可以理解,一个或多个外部设备(例如显示器)可以被包含在计算系统中,并且不是被示出为在计算系统504的外部。存储系统522可以是在本发明下能够提供对于信息的存储的任意类型的数据库系统。在此程度,存储系统522可以包括一个或多个存储设备,诸如磁盘驱动器或光盘驱动器。在另一实施例中,存储系统522包括被分布于例如局域网(LAN)、广域网(WAN)或存储区域网(SAN)(未示出)上的数据。尽管未示出,但附加的组件(诸如高速缓冲存储器、通信系统、系统软件等)可以被并入计算系统504中。
从而,本发明还可以以计算机程序代码的形式体现,例如,所述计算机程序代码或者被存储在存储媒体中、被加载到计算机中和/或由计算机执行,或者在某种传输媒体上传输,诸如在电配线或成缆上、通过光纤、或经由电磁辐射传输,其中,当所述计算机程序代码被加载到计算机中并由计算机执行时,该计算机成为用于实施本发明的装置。当在通用微处理器上实现时,所述计算机程序代码段配置该微处理器来创建特定的逻辑电路。本领域技术人员将理解,需要由系统的处理器执行的一组可编程代码,用于执行上述的发明系统和方法的过程步骤。
已经出于说明和描述的目的呈现了对本发明的特定实施例的前述描述。它们并非意在穷举或将本发明限制于所公开的形式,并且根据上述讲授很明显,许多修改和变体都是可能的。所选择和描述的实施例用来最好地解释本发明的原理及其实践应用,从而使得本领域普通技术人员能够最好地使用本发明以及具有适于预期的特定使用的多种修改的多种实施例。本发明的范围由附加于此的权利要求及其等同物所限定。

Claims (12)

1.一种用于复原由于存储器限制的原因未响应的远程服务器的方法,所述方法包括以下步骤:
提供连接于网络通信信道的远程服务器;
将保留存储器段程序钉住所述远程服务器中的存储器,以便当存储器限制出现时控制在所述远程服务器的存储器中分配的保留存储器段,从而,作为所述钉住的结果,所述保留存储器段程序常驻于存储器中,并被标记为不可移动的,从而其它程序不能与所述保留存储器段程序交换空间;
持续地运行所述保留存储器段程序以监听用于释放被分配的所述保留存储器段的请求包;
响应于所接收的所述请求包,释放所述远程服务器的所述存储器中的所述保留存储器段;以及
当所述保留存储器段被释放时在所述远程服务器处执行用于复原所述远程服务器的任意校正动作。
2.根据权利要求1所述的方法,其中所述钉住步骤包括以下步骤:
在所述远程服务器的所述存储器中分配所述保留存储器段。
3.根据权利要求2所述的方法,其中所述持续地运行的步骤包括以下步骤:
在所述网络通信信道上监听预定的TCP/IP端口以发现所述请求包;以及
在所述网络通信信道上接收所述请求包。
4.根据权利要求3所述的方法,其中所述释放步骤包括以下步骤:
验证所接收的所述请求包;
标识所接收的所述请求包;以及
检查所接收的所述请求包是否对应于在所述远程服务器上可以允许的操作。
5.根据权利要求4所述的方法,其中所述执行步骤进一步包括以下步骤:
周期性地检查所述远程服务器上的所述存储器,以便检测所述存储器限制;以及
当检测到所述存储器限制时发送用于释放所述保留存储器段的所述请求包。
6.根据权利要求5所述的方法,其中所述执行步骤进一步包括以下步骤:
在所述远程服务器上运行自动恢复程序,以便当所述保留存储器段被释放时在所述远程服务器处执行所述任意校正动作。
7.一种用于复原由于存储器限制的原因未响应的远程服务器的装置,所述装置包括以下模块:
配置为提供连接于网络通信信道的远程服务器的模块;
配置为将保留存储器段程序钉住所述远程服务器中的存储器的模块,以便当存储器限制出现时控制在所述远程服务器的存储器中分配的保留存储器段,从而,作为所述钉住的结果,所述保留存储器段程序常驻于存储器中,并被标记为不可移动的,从而其它程序不能与所述保留存储器段程序交换空间;
配置为持续地运行所述保留存储器段程序以监听用于释放被分配的所述保留存储器段的请求包的模块;
配置为响应于所接收的所述请求包,释放所述远程服务器的所述存储器中的所述保留存储器段的模块;以及
配置为当所述保留存储器段被释放时在所述远程服务器处执行用于复原所述远程服务器的任意校正动作的模块。
8.根据权利要求7所述的装置,其中所述配置为将保留存储器段程序钉住所述远程服务器中的存储器的模块包括:
配置为在所述远程服务器的所述存储器中分配所述保留存储器段的模块。
9.根据权利要求8所述的装置,其中所述配置为持续地运行所述保留存储器段程序以监听用于释放被分配的所述保留存储器段的请求包的模块包括:
配置为在所述网络通信信道上监听预定的TCP/IP端口以发现所述请求包的模块;以及
配置为在所述网络通信信道上接收所述请求包的模块。
10.根据权利要求9所述的装置,其中所述配置为响应于所接收的所述请求包,释放所述远程服务器的所述存储器中的所述保留存储器段的模块包括:
配置为验证所接收的所述请求包的模块;
配置为标识所接收的所述请求包的模块;以及
配置为检查所接收的所述请求包是否对应于在所述远程服务器上可以允许的操作的模块。
11.根据权利要求10所述的装置,其中所述配置为当所述保留存储器段被释放时在所述远程服务器处执行用于复原所述远程服务器的任意校正动作的模块进一步包括:
配置为周期性地检查所述远程服务器上的所述存储器,以便检测所述存储器限制的模块;以及
配置为当检测到所述存储器限制时发送用于释放所述保留存储器段的所述请求包的模块。
12.根据权利要求11所述的装置,其中所述配置为当所述保留存储器段被释放时在所述远程服务器处执行用于复原所述远程服务器的任意校正动作的模块进一步包括:
配置为在所述远程服务器上运行自动恢复程序,以便当所述保留存储器段被释放时在所述远程服务器处执行所述任意校正动作的模块。
CN200780001757.0A 2006-01-12 2007-01-04 远程复原无响应计算系统 Active CN101361046B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/331,699 US8055725B2 (en) 2006-01-12 2006-01-12 Method, apparatus and program product for remotely restoring a non-responsive computing system
US11/331,699 2006-01-12
PCT/EP2007/050079 WO2007080145A1 (en) 2006-01-12 2007-01-04 Remotely restoring a non-responsive computing system

Publications (2)

Publication Number Publication Date
CN101361046A CN101361046A (zh) 2009-02-04
CN101361046B true CN101361046B (zh) 2013-08-14

Family

ID=38233993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780001757.0A Active CN101361046B (zh) 2006-01-12 2007-01-04 远程复原无响应计算系统

Country Status (5)

Country Link
US (1) US8055725B2 (zh)
EP (1) EP1971918A1 (zh)
JP (1) JP4636629B2 (zh)
CN (1) CN101361046B (zh)
WO (1) WO2007080145A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1981245A1 (en) * 2007-04-13 2008-10-15 Liconic Ag Method and product for controlling laboratory equipment
US9016541B2 (en) 2008-05-09 2015-04-28 Covidien Lp Varying tissue compression with an anvil configuration
US8984266B2 (en) 2010-12-29 2015-03-17 Brocade Communications Systems, Inc. Techniques for stopping rolling reboots
US20120173713A1 (en) * 2010-12-30 2012-07-05 Brocade Communication Systems, Inc. Resources monitoring and recovery
US8650538B2 (en) * 2012-05-01 2014-02-11 Concurix Corporation Meta garbage collection for functional code
US8726255B2 (en) 2012-05-01 2014-05-13 Concurix Corporation Recompiling with generic to specific replacement
US8595743B2 (en) 2012-05-01 2013-11-26 Concurix Corporation Network aware process scheduling
US9417935B2 (en) 2012-05-01 2016-08-16 Microsoft Technology Licensing, Llc Many-core process scheduling to maximize cache usage
US9047196B2 (en) 2012-06-19 2015-06-02 Concurix Corporation Usage aware NUMA process scheduling
US8700838B2 (en) 2012-06-19 2014-04-15 Concurix Corporation Allocating heaps in NUMA systems
US8707326B2 (en) 2012-07-17 2014-04-22 Concurix Corporation Pattern matching process scheduler in message passing environment
US9575813B2 (en) 2012-07-17 2017-02-21 Microsoft Technology Licensing, Llc Pattern matching process scheduler with upstream optimization
US9043788B2 (en) 2012-08-10 2015-05-26 Concurix Corporation Experiment manager for manycore systems
US8656135B2 (en) 2012-11-08 2014-02-18 Concurix Corporation Optimized memory configuration deployed prior to execution
US8607018B2 (en) 2012-11-08 2013-12-10 Concurix Corporation Memory usage configuration based on observations
US8656134B2 (en) 2012-11-08 2014-02-18 Concurix Corporation Optimized memory configuration deployed on executing code
US9665474B2 (en) 2013-03-15 2017-05-30 Microsoft Technology Licensing, Llc Relationships derived from trace data
CN110609855B (zh) * 2018-05-29 2021-06-04 北京三快在线科技有限公司 查询处理和查询率阈值的确定方法及分布式查询系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1124377A (zh) * 1995-12-21 1996-06-12 沈阳工业高等专科学校工矿备件公司 微型计算机硬盘信息保护技术及装置
CN1201187A (zh) * 1997-05-12 1998-12-09 国际商业机器公司 用于客户/服务器计算的方法和计算机程序产品
US6226725B1 (en) * 1998-04-21 2001-05-01 Ibm Method and system in a data processing system for the dedication of memory storage locations
US6237024B1 (en) * 1998-03-20 2001-05-22 Sun Microsystem, Inc. Method and apparatus for the suspension and continuation of remote processes
US6480972B1 (en) * 1999-02-24 2002-11-12 International Business Machines Corporation Data processing system and method for permitting a server to remotely perform diagnostics on a malfunctioning client computer system

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4949248A (en) * 1988-07-15 1990-08-14 Caro Marshall A System for shared remote access of multiple application programs executing in one or more computers
JP2508598B2 (ja) 1993-07-07 1996-06-19 日本電気株式会社 通信網の遠隔電源制御装置
CN1286010C (zh) * 1994-04-05 2006-11-22 英特尔公司 监视与控制网络中的程序的方法与装置
JP3832517B2 (ja) 1996-07-05 2006-10-11 セイコーエプソン株式会社 ロボット用コントローラ及びその制御方法
US5909547A (en) 1996-10-24 1999-06-01 Lucent Technologies Inc. Method for shared memory management in network nodes
US6151688A (en) 1997-02-21 2000-11-21 Novell, Inc. Resource management in a clustered computer system
US6202160B1 (en) 1997-05-13 2001-03-13 Micron Electronics, Inc. System for independent powering of a computer system
US6163849A (en) 1997-05-13 2000-12-19 Micron Electronics, Inc. Method of powering up or powering down a server to a maintenance state
US6330690B1 (en) 1997-05-13 2001-12-11 Micron Electronics, Inc. Method of resetting a server
US6138150A (en) 1997-09-03 2000-10-24 International Business Machines Corporation Method for remotely controlling computer resources via the internet with a web browser
US6182089B1 (en) 1997-09-23 2001-01-30 Silicon Graphics, Inc. Method, system and computer program product for dynamically allocating large memory pages of different sizes
JPH11282724A (ja) 1998-03-30 1999-10-15 Hitachi Ltd ネットワーク管理システム
JP2000010822A (ja) 1998-06-25 2000-01-14 Yokogawa Electric Corp 分散オブジェクトのダウン検出装置
US7100071B2 (en) 1998-07-16 2006-08-29 Hewlett-Packard Development Company, L.P. System and method for allocating fail-over memory
JP2000148629A (ja) 1998-11-17 2000-05-30 Tietech Co Ltd 無人顧客応対システムにおけるサ―バクラッシュの遠隔地への通報及びリセット方式
US6611915B1 (en) 1999-05-27 2003-08-26 International Business Machines Corporation Selective loading of client operating system in a computer network
US6871286B1 (en) 1999-07-29 2005-03-22 Hewlett-Packard Development Company, L.P. Method and apparatus for resetting passwords in a computer system
US6651190B1 (en) 2000-03-14 2003-11-18 A. Worley Independent remote computer maintenance device
US6629227B1 (en) * 2000-05-04 2003-09-30 Scientific-Atlanta, Inc. System and method for a communication terminal to manage memory and maintain a current application version for multiple applications
WO2002033552A2 (en) 2000-10-15 2002-04-25 Sonicblue Incorporated Fail safe recovery
US6697033B1 (en) 2000-11-28 2004-02-24 Ati International Srl Method and system for changing a display device on a computer system during operation thereof
US7039682B2 (en) 2000-12-15 2006-05-02 International Business Machines Corporation Extension of the BOOTP protocol towards automatic reconfiguration
TW539946B (en) 2001-08-07 2003-07-01 Solid State System Company Ltd Window-based flash memory storage system, and the management method and the access method thereof
JP2003177945A (ja) 2001-12-12 2003-06-27 Hitachi Ltd 計算機管理方法及びその実施システム並びにその処理プログラム
US6915420B2 (en) 2003-01-06 2005-07-05 John Alan Hensley Method for creating and protecting a back-up operating system within existing storage that is not hidden during operation
US20040141461A1 (en) 2003-01-22 2004-07-22 Zimmer Vincent J. Remote reset using a one-time pad
US7383264B2 (en) 2003-03-27 2008-06-03 Hitachi, Ltd. Data control method for duplicating data between computer systems
US7452274B2 (en) 2003-03-31 2008-11-18 Cantor Index, Llc System and method for betting on-the-board or off-the-board in an event
EP1492006B1 (en) * 2003-06-24 2007-10-10 Research In Motion Limited Detection of out of memory and graceful shutdown
US7424525B2 (en) 2003-06-30 2008-09-09 Microsoft Corporation Managing headless computer systems
GB0318384D0 (en) 2003-08-06 2003-09-10 Ibm A storage controller and a method for recording diagnostic information
US20050060529A1 (en) 2003-09-04 2005-03-17 Chih-Wei Chen Remote reboot method and system for network-linked computer platform
US20050055495A1 (en) 2003-09-05 2005-03-10 Nokia Corporation Memory wear leveling
JP4291664B2 (ja) 2003-10-14 2009-07-08 株式会社日立製作所 通信バッファ予約機能を備えるストレージ装置およびシステム
US7350065B2 (en) 2003-12-15 2008-03-25 International Business Machines Corporation Method, apparatus and program storage device for providing a remote power reset at a remote server through a network connection
JP2005217815A (ja) * 2004-01-30 2005-08-11 Hitachi Ltd パス制御方法
JP4237076B2 (ja) 2004-02-17 2009-03-11 Necパーソナルプロダクツ株式会社 エラー処理システム、エラー対応情報処理装置、情報端末、エラー処理方法、プログラム
GB2418751A (en) * 2004-10-02 2006-04-05 Hewlett Packard Development Co Managing memory across a plurality of partitions
US7779410B2 (en) * 2004-12-17 2010-08-17 Sap Ag Control interfaces for distributed system applications

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1124377A (zh) * 1995-12-21 1996-06-12 沈阳工业高等专科学校工矿备件公司 微型计算机硬盘信息保护技术及装置
CN1201187A (zh) * 1997-05-12 1998-12-09 国际商业机器公司 用于客户/服务器计算的方法和计算机程序产品
US6237024B1 (en) * 1998-03-20 2001-05-22 Sun Microsystem, Inc. Method and apparatus for the suspension and continuation of remote processes
US6226725B1 (en) * 1998-04-21 2001-05-01 Ibm Method and system in a data processing system for the dedication of memory storage locations
US6480972B1 (en) * 1999-02-24 2002-11-12 International Business Machines Corporation Data processing system and method for permitting a server to remotely perform diagnostics on a malfunctioning client computer system

Also Published As

Publication number Publication date
US8055725B2 (en) 2011-11-08
US20070162558A1 (en) 2007-07-12
JP2009523283A (ja) 2009-06-18
CN101361046A (zh) 2009-02-04
JP4636629B2 (ja) 2011-02-23
EP1971918A1 (en) 2008-09-24
WO2007080145A1 (en) 2007-07-19

Similar Documents

Publication Publication Date Title
CN101361046B (zh) 远程复原无响应计算系统
CN111476171B (zh) 分布式对象识别系统、方法及边缘计算设备
US8850141B2 (en) System and method for mirroring data
CN103677967B (zh) 一种数据库的远程数据服务系统及任务调度方法
EP1587278A2 (en) Method and apparatus for a loosely coupled, scalable distributed multimedia streaming system
CN102473157A (zh) 共享i/o环境中的虚拟热插入功能
CN111884878A (zh) 基于区块链的数据监控方法
CN100399284C (zh) 处理结构故障的方法和系统
US20060174085A1 (en) Storage enclosure and method for the automated configuration of a storage enclosure
US11487853B2 (en) Cluster-wise license information replication
US7533295B2 (en) Two node virtual shared disk cluster recovery
CN101535979A (zh) 存储资源装置的管理
US10122602B1 (en) Distributed system infrastructure testing
KR20150124642A (ko) 병렬 연결식 서버시스템의 통신 장애 복구방법
CN108366077B (zh) 裂变式防攻击网络接入系统
JP4864210B2 (ja) 作業グループサーバー実施の方法と装置
US10719120B2 (en) Efficient utilization of spare datacenter capacity
KR102503776B1 (ko) 고밀도 데이터센터 서버를 위한 스마트 캐비닛 및 그 동작 방법
CN116582465A (zh) 链路监控方法、介质、装置和计算设备
KR101883671B1 (ko) 노드 분산 방법 및 이를 수행하는 관리 서버
WO2016003127A1 (ko) 서버/스토리지 관리 시스템
CN110377483B (zh) 服务器监控系统及方法
CN112564968A (zh) 故障处理方法、装置及存储介质
CN111930587B (zh) 告警消息处理方法、装置、存储介质及电子设备
KR100771915B1 (ko) 디지털 보호 계전기 및 통신 이중화 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211110

Address after: USA New York

Patentee after: Qindarui company

Address before: USA New York

Patentee before: International Business Machines