CN102047643A

CN102047643A - 用于在服务器故障的事件中能使客户端应用更快恢复的方法

Info

Publication number: CN102047643A
Application number: CN2009801204319A
Authority: CN
Inventors: 迈克尔·科菲; 曼朱纳思·B·穆图尔
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2008-04-02
Filing date: 2009-03-10
Publication date: 2011-05-04
Anticipated expiration: 2029-03-10
Also published as: WO2009121689A1; KR20100135855A; EP2274898B1; US7971099B2; KR101419579B1; EP2274898A1; CN102047643B; BRPI0911284A2; CA2706579A1; JP5695558B2; JP2011518486A; BRPI0911284B1; CA2706579C; US20090254775A1

Abstract

提供了一种用于通过向客户端应用发送服务器节点的故障的通知而在多节点数据处理系统处于故障转移的条件下时改善恢复时间的系统和方法，所述服务器节点担任运行在客户端节点上的客户端应用的服务器。在本发明中，由担任服务器节点的备用的故障转移节点提供该通知。当客户端应用很长时间内未从服务器接收到响应时，假定所述服务器发生故障并启动重新连接。本发明通过令系统级的软件先行通知客户端应用所述服务器的故障，从而加速由所述客户端应用启动的重新连接。这样使得客户端应用能够更快地恢复。

Description

用于在服务器故障的事件中能使客户端应用更快恢复的方法

技术领域

本发明一般地涉及多节点数据处理系统和方法。更具体地，本发明涉及用于在服务器故障事件中改善恢复时间的系统和方法。更加具体地，本发明涉及这样的系统：与等待基于故障节点的性能的缺失来确定故障不同，故障转移(fallover)节点提供故障通知。如此处以及所附权利要求中所使用的，所述术语“节点”和“服务器”可互换使用，不过，可以理解，服务器可以包括若干节点。

背景技术

在诸如HACMP(高可用性集群管理程序)的集群件(clusterware)应用中，存在很多客户端应用，当主服务器发生故障时，它们足够智能地自动重新连接到备用服务器。可以通过将正在与客户端交互的主服务器的IP(因特网协议)地址动态地移动到备用服务器实现这一点。因此，客户端应用不必响应于服务器故障而被终止和/或重启。集群件的此能力在这里被称为“故障转移”。然而，问题是，一旦主服务器发生故障，所述客户端和服务器之间存在的TCP(传输控制协议)连接需要一段时间来被终止。这主要是因为客户端应用不知道服务器的故障，所以所述客户端应用持续重传，直到所述TCP重传计数器过期(expire)，由此最终终止所述TCP连接。因此，可以看出客户端应用在尝试与备用服务器重新连接之前，花费相当长的时间才意识到所述服务器故障。因此，由上可知，本领域存在克服这里和上面所述的低效和局限的需求。

发明内容

上面描述的延迟可以通过及时地向客户端通知故障事件来避免。所述客户端一旦接收到这个关于服务器故障的通知，则优选地重新连接。本发明优选地提供了用于加速客户端应用与集群内的一个或多个备用服务器重新连接的过程的机制。为了快速终止所述服务器(假定发生故障的节点)与所述客户端之间存在的所有TCP连接，一旦所述服务器发生故障，则所述客户端优选地接收用于该TCP连接的RST(重置分组)。虽然预计此RST分组所来自的节点发生故障，但本发明的方法仍然优选地生成此RST分组。为了达到此目的，一旦故障转移发生，则所述故障转移节点(备用服务器)优选地向所述客户端发送此RST分组。效果上，对于客户端，所述故障转移节点装作故障节点。

按照本发明的一个实施例，一种用于改善故障转移条件下的恢复的方法包括下述步骤：向客户端应用发送服务器节点的故障的通知，所述服务器节点正担任用于在客户端节点上运行的客户端应用的服务器。由担任所述服务器节点的备用的故障转移节点提供此通知。

优选地，所述故障转移节点伪装成所述服务器节点，以发送所述故障的通知。根据优选的实施例，从所述客户端应用接收数据分组。该分组被访问来确定传送信息，且所述传送信息被用于向所述客户端应用发送所述服务器节点的故障的通知。

根据优选的实施例，所述数据分组是当所述客户端应用没有接收到向所述服务器节点的数据分组的原始传送的应答时、已经被所述客户端应用重传的数据分组。在一个实施例中，所述故障转移节点通知所述客户端节点：所述故障转移节点已经替换所述服务器节点。

额外的特征和优势可以通过本发明的技术实现。本发明的其他实施例和方面在此详细说明，并作为要求权利的本发明的一部分。

本发明的各种实施例满足的期望目标在此的详述并不是为了暗示或表明任何或所有所述目标单独地或共同地是本发明最一般的实施例或任何更具体的实施例中的必要特征。

附图说明

下面将参考以下附图并仅以示例的方式说明本发明的优选实施例。

图1是说明使用本发明的基本节点配置环境之间的连接的框图，并且还说明了在本发明的优选实施例的操作中发生的事件的序列；以及

图2是说明本发明的优选实施例的处理中典型地出现的事件的序列的流程图。

具体实施方式

如之前所讨论的，客户端可以利用诸如TCP协议等与服务器通信。如果所述服务器发生故障，所述客户端可能不会注意到故障已经发生。在不存在对客户端发送出的分组的任何应答的情况下，所述客户端将持续重传直到所述TCP重传计数器过期。这可能是相当一段时间之后。因此，期望强行终止并重置所述客户端与服务器之间的连接。所述TCP协议具有重置(RST)选项。当双方正在通信时，如果第一方注意到另一方已经停止了通信，则所述第一方可以发送RST以强制另一方重置所述连接。然而，这里的关键是所述客户端可能在相当一段时间内不会意识到存在问题。当所述客户端最终意识到存在问题时，所述客户端将接着尝试重新连接，并将连接到故障转移节点。

根据优选的实施例，本发明利用监视与所述客户端通信的服务器节点的备用(或故障转移)服务器。当所述故障转移节点注意到所述服务器节点已经发生故障时，所述故障转移节点接管所述服务器节点的地址。此时，所述备用服务器查看所接管的IP地址上的所有流量，以观察是否任何流量是去往(即，寻址到)用于在所述服务器节点上运行的、但已经在具有所述IP地址的备用节点上重启的应用。如果它发现了任何这样的流量，则“伪装”成所述服务器节点。

然而，所述故障转移节点不知道所述服务器节点持有的连接。所述故障转移节点不知道谁持有它们或它们持有什么类型的连接。因此，所述故障转移节点需要能够推断出所述服务器节点与谁连接，并随后“鼓励”(利用RST选项)这样的客户端与所述故障转移节点连接。自然地，这对于认为它们正重新连接到所述服务器节点的客户端来说是透明的。

为了使该方案可行，所述客户端必须相信RST分组来自所述服务器节点。在TCP连接中，每一个分组具有一个序列号和“ACK”号，其保证了所述数据在传送的结束时在接收器上被适当地排序。在任一时间点，如果TCP接收到具有不正确的序列号或ACK号的分组，则它立即丢弃该分组。所以，对于任意能够在两个其他应用“B”和“C”之间存在的TCP连接上发送分组的应用“A”，应用“A”必须确定在TCP序列中将要发送给所述客户端的下一个分组的序列号、ACK号以及TCP头信息。

相似地，对于能够向所述客户端发送RST(重置)分组的备用服务器(故障转移节点)，其必须确定用于该RST分组的适当的TCP头信息。在TCP连接中，当所述通信方中任一方在没有通过发送FIN分组(其被用在TCP中以指示传送的结束)或RST分组来终止所述连接就停止运行时，另一方开始再次重传所述旧的分组。

在优选的实施例中，所述故障转移节点已经接管了所述服务器的地址。因此，一旦所述故障转移节点从故障节点获得(通过激活)IP地址，所述故障转移节点接收到一些来自所述客户端的重传分组。所述备用服务器(故障转移节点)利用它刚从所述客户端接收到的重传分组获得所述序列中的下一个分组的TCP头信息。此TCP头信息使所述备用服务器能够确定例如所述RST分组应该使用什么序列号以及所述RST分组应该被发送到哪里。

利用原始IP套接字，任何应用都能够制作分组并在两个不同的应用之间存在的TCP连接上发送它。该新制作的分组对于接收器表现为真正的分组，因为它认为那是它的对等应用发送的。在本发明中，诸如HACMP的集群件利用原始IP套接字制作RST分组并将其发送到客户端。此RST分组立即断开旧的TCP连接，由此客户端能够快速地再次重新连接。

在本发明中，不需要改变现有的客户端应用或TCP栈本身。不论所述TCP连接是由TCP连接超时还是RST分组终止，所述客户端应用都将其视为意外的终止并尝试重新连接。

图1根据优选的实施例说明了本发明的使用中的事件或情况的序列。具体地，圆圈里的“1”指示了正与服务器节点200通信的客户端节点100的初始状态。圆圈里的“2”指示了服务器节点200发生故障以及存在向故障转移节点300的故障转移的事件。圆圈里的“3”指示了故障转移节点300向客户端节点100传达服务器节点200出现故障并正接管通信功能的事件。圆圈里的“4”指示了客户端节点100现在连接到故障转移节点300的最终状态。所说明的处理避免了在客户端节点100上运行的应用必须等待节点200的故障的指示的必要，由于应用级软件典型地不知道节点故障，所以所述故障指示需要较长的时间才会到达。以系统级速度和优先级运行的故障转移处理出现得快得多，且该事实与TCP连接的协议结构一起，允许向基于服务器应用的客户端快得多的通知。

图2说明了本发明的处理中发生的事件的典型序列。所述处理由服务器节点200的故障触发(步骤101)。系统级软件以相对快速的方式检测到此故障并向故障转移(或备用)节点300提供故障转移(步骤102)。故障转移节点300接着向客户端节点100提供通知(步骤103)。客户端节点100接着终止到节点200的连接(步骤104)。

本发明还包括用于执行这里详述的处理的机器可读指令形式的软件。此外，本发明包括具有部署在其存储器内的用于实施所详述的处理的指令的数据处理系统。

虽然这里已经根据某些优选的实施例详细地说明了本发明，但本领域的技术人员可以对其做很多修改和改变。相应地，所附权利要求意在覆盖所有落在本发明的精神和范围内的修改和改变。

Claims

1.一种用于在故障转移条件下改善恢复的方法，所述方法包括以下步骤：

将担任在客户端节点上运行的客户端应用的服务器的服务器节点的故障的通知发送至所述客户端应用，由担任所述服务器节点的备用的故障转移节点提供所述通知。

2.如权利要求1所述的方法，还包括终止与所述服务器节点的连接的步骤。

3.如权利要求1或2所述的方法，还包括在所述故障转移节点上激活原本与所述服务器节点相关联的IP地址的步骤。

4.如权利要求3所述的方法，还包括在所述故障转移节点上接收在所述客户端节点上重传的分组的步骤。

5.如权利要求4所述的方法，还包括在所述故障转移节点上获得TCP头信息的步骤。

6.如权利要求5所述的方法，其中所述头信息包括分组序列号。

7.如权利要求5或6所述的方法，还包括在所述故障转移节点上构建重置分组的步骤。

8.如权利要求7所述的方法，其中所述重置分组的构建使用原始套接字。

9.如权利要求7或8所述的方法，还包括将所述重置分组传送到运行在所述客户端节点上的所述应用。

10.如权利要求7、8或9所述的方法，还包括终止从所述客户端节点到所述服务器节点的连接的步骤。

11.如权利要求10所述的方法，还包括所述应用尝试重新连接的步骤。

12.如前面任一权利要求所述的方法，其中所述服务器节点和所述客户端节点通过传输控制协议通信。

13.如前面任一权利要求所述的方法，其中所述故障转移节点通知在所述客户端节点上运行的应用：所述服务器节点发生故障。

14.如权利要求13所述的方法，其中所述故障转移节点可操作来通知所述客户端节点：所述故障转移节点已经替代所述服务器节点。

15.如前面任一权利要求所述的方法，其中所述方法由所述服务器节点的故障触发。

16.如前面任一权利要求所述的方法，其中比通过传输控制协议连接所提供的通知更早地提供所述通知。

17.如前面任一权利要求所述的方法，其中所述故障转移节点伪装成所述服务器节点，以发送所述故障的通知，所述方法包括：

接收来自所述客户端应用的数据分组；以及

访问所述数据分组，以确定传送信息，其中发送故障的通知的步骤包括：

使用所述传送信息，以向所述客户端应用发送所述服务器节点的故障的通知。

18.如权利要求17所述的方法，其中所述数据分组是当所述客户端应用没有接收到向所述服务器节点的数据分组的原始传送的应答时、已经被所述客户端应用重传的数据分组。

19.一种包括至少三个节点的多节点数据处理系统，其在存储器中包含程序指令，所述程序指令用于：所述节点将担任在客户端节点上运行的客户端应用的服务器的服务器节点的故障的通知发送至所述客户端节点，由担任所述服务器节点的备用的故障转移节点提供所述通知。

20.如权利要求19所述的系统，还包括用于终止与所述服务器节点的连接的单元。

21.如权利要求19或20所述的系统，还包括用于在所述故障转移节点上激活原本与所述服务器节点相关联的IP地址的单元。

22.如权利要求21所述的系统，还包括用于在所述故障转移节点上接收在所述客户端节点上重传的分组的单元。

23.如权利要求22所述的系统，还包括用于在所述故障转移节点上获得TCP头信息的单元。

24.如权利要求23所述的系统，其中所述头信息包括分组序列号。

25.如权利要求23或24所述的系统，还包括用于在所述故障转移节点上构建重置分组的单元。

26.如权利要求25所述的系统，其中所述重置分组的构建使用原始套接字。

27.如权利要求25或26所述的系统，还包括用于将所述重置分组传送到运行在所述客户端节点上的应用的单元。

28.如权利要求25、26或27所述的系统，还包括用于终止从所述客户端节点到所述服务器节点的连接的单元。

29.如权利要求28所述的系统，还包括用于由所述应用尝试重新连接的单元。

30.如权利要求19至29中任一项所述的系统，其中所述服务器节点和所述客户端节点通过传输控制协议通信。

31.如权利要求19至29中任一项所述的系统，其中所述故障转移节点通知运行在所述客户端节点上的应用：所述服务器节点已经发生故障。

32.如权利要求31所述的系统，其中所述故障转移节点包括用于通知所述客户端节点所述故障转移节点已经替代所述服务器节点的单元。

33.如权利要求19至32中的任一项所述的系统，其中所述方法由所述服务器节点的故障触发。

34.如权利要求19至33中的任一项所述的系统，其中比通过传输控制协议连接所提供的通知更早地提供所述通知。

35.如权利要求19至34中的任一项所述的系统，其中所述故障转移节点伪装成所述服务器节点，以发送所述故障的通知，所述系统包括：

用于接收来自所述客户端应用的数据分组的单元；以及

用于访问所述数据分组以确定传送信息的单元，其中用于发送故障的通知的单元包括：

用于使用所述传送信息以向所述客户端应用发送所述服务器节点的故障的通知的单元。

36.如权利要求35所述的系统，其中所述数据分组是当所述客户端应用没有接收到向所述服务器节点的数据分组的原始传送的应答时、已经被所述客户端应用重传的数据分组。

37.如前面任一权利要求所述的系统，其中所述服务器节点和运行在所述客户端节点上的所述应用初始通过传输控制协议连接连接。

38.一种其上包含指令的机器可读介质，所述指令用于将担任在客户端节点上运行的客户端应用的服务器的服务器节点的故障的通知发送至所述客户端节点，由担任所述服务器节点的备用的故障转移节点提供所述通知。

39.如权利要求38所述的机器可读介质，其中所述服务器节点和在所述客户端节点上运行的应用初始通过传输控制协议连接连接。

40.如权利要求38或39所述的机器可读介质，其中所述故障转移节点伪装成所述服务器节点，以发送所述故障的通知，所述机器可读介质包括：

用于接收来自所述客户端应用的数据分组的指令；以及

用于访问所述数据分组以确定传送信息的指令，其中用于发送故障的通知的指令包括：

用于使用所述传送信息以向所述客户端应用发送所述服务器节点的故障的通知的指令。

41.如权利要求40所述的机器可读介质，其中所述数据分组是当所述客户端应用没有接收到向所述服务器节点的数据分组的原始传送的应答时、已经被所述客户端应用重传的数据分组。

42.一种包含程序代码单元的计算机程序，当所述程序在计算机上运行时，所述程序代码单元被适配来执行权利要求1至18中的任一项所述的方法。