CN101593136B

CN101593136B - 使得计算机具有高可用性的方法和计算机系统

Info

Publication number: CN101593136B
Application number: CN200810098727.2A
Authority: CN
Inventors: 张剑鸣; 黄剑; 向哲; 金凌; 夏寅贲
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 2008-05-30
Filing date: 2008-05-30
Publication date: 2012-05-02
Anticipated expiration: 2028-05-30
Also published as: CN101593136A; US20090300414A1; US8020041B2

Abstract

本发明提供了一种利用计算机获得高可用性的方法及其计算机系统，该系统包括：至少两个计算机，包括主计算机和仆计算机，并且每个计算机包含有虚拟机容器；在所述虚拟机容器上运行的虚拟机；使得这所述虚拟机容器执行虚拟机同步操作的通信信道，其中所述虚拟机容器的虚拟机同步操作通过虚拟机执行I/O指令来触发。

Description

使得计算机具有高可用性的方法和计算机系统

技术领域

本发明涉及一种容错计算机系统，具体而言，本发明涉及一种如何使得计算机具有高可用性的方法和计算机系统。

背景技术

通常，计算机系统经常会由于各种原因导致各种故障，使得用户不能及时地完成相关的工作。计算机系统的这种故障被称为不可用性。本领域的技术人员一直在为克服计算机系统的各种情况的不可用性进行努力，以便使得计算机系统具有较高的可用性，或者说使得计算机系统在使用过程中具有高可靠性以及低故障率。

为此，本领域中常用的方法就是为执行任务的主计算机配备一台备用计算机。主计算机执行用户所请求的任务并将其所执行的各种操作告知备用计算机，以便在主计算机出现故障时，备用计算机能够接管主计算机所需提供的服务。这样，提供给用户的服务不会因为主计算机的硬件故障而中断。但是，这种容错解决方案通常需要在两台计算机中安装特定的计算机硬件或者需要修改计算机的操作系统，这为那些不需要面对容错问题的用户增加了不必要的成本。为此，一种现有技术提出了在两台物理机上构建多个虚拟机，两台物理机上的虚拟机互为备份，通过虚拟机监视器获取虚拟机的I/O操作，并通过硬件支持的RR(恢复)寄存器记录指令执行的数量，从而执行操作的备份。在其中一个物理机的故障消除后，RR寄存器清零，使得主虚拟机与备份虚拟机进行同步。尽管这种方案解决了用户在成本以及操作程序的更新和修改方面的问题，但是其同步的速度并不能令用户满意。

另一种现有的容错计算机系统是通过在两台物理机中构建主虚拟机以及仆虚拟机，利用两个虚拟机之间的同步进行双机热备，从而实现容错的目的。其中，虚拟机之间通过同步操作来实现虚拟机的同步。这种现有技术要求仆虚拟机复制主虚拟机的所有操作，即虚拟机之间频繁地处于同步触发状态，这使主虚拟机在实现虚拟机同步方面花费太多资源(CPU等)，相应地减少了主计算机执行主要任务所需要的资源，影响了主计算机的主要性能。

本发明的目的就是提供一种解决上述现有技术中技术问题的途径。具体而言，本发明目的是提供一种使得计算机具有高可用性的系统以及方法。

发明内容

总体而言，本发明提供了一种使得计算机具有高可用性的方法，该方法包括：提供具有主虚拟机容器的主计算机以及具有仆虚拟机容器的仆计算机；在所述主虚拟机容器和仆虚拟机容器上分别运行主虚拟机和仆虚拟机；以及通过主计算机和仆计算机之间的通信信道，以I/O指令作为要被发送的指令的边界从主虚拟机向仆虚拟机发送所述指令，使得所述主虚拟机和仆虚拟机同步。

相应地，本发明提供了一种使得计算机具有高可用性的计算机系统，该系统包括：具有主虚拟机容器的主计算机和具有仆虚拟机容器的仆计算机、分别在所述主虚拟机容器和仆虚拟机容器上运行的主虚拟机和仆虚拟机、主计算机和仆计算机之间的通信信道，其中所述主虚拟机通过所述通信信道，以I/O指令作为要被发送的指令的边界向所述仆虚拟机发送所述指令，使得所述主虚拟机和仆虚拟机同步。

根据本发明的另一个方面，提供了一种计算机，包括虚拟机容器以及在所述虚拟机容器上运行的虚拟机，所述虚拟机包括：指令队列、主存以及日志存储器，其中，虚拟机将主存中的命令加载到其指令队列，执行指令队列中的各种指令以及将数据写入主存，并将指令队列中的各种命令以日志存储指令的形式写入虚拟机的日志存储器中，其中所述虚拟机用指令队列中的I/O指令作为处理边界来触发与另一台计算机的虚拟机同步操作。

附图说明

下面参照附图仅作为示例详细描述本发明的实施例，其中：

图1所示的是根据本发明一个实施例的计算机系统架构的示意图；

图2所示的是根据本发明一个实施例的计算机系统的软件配置的示意图；

图3是根据本发明一个实施例的使得至少两台计算机之间同步的方法的流程图。

具体实施方式

下面结合说明书附图对本发明进行详细的描述。

计算机系统的高可用性意味着即使在其中一个计算机存在故障时该计算机系统也能够连续地进行操作。本发明就提供了一种具有高可用性的计算机系统。图1所示的是一种具有高可用性的计算机系统的实施例。如图1所示，计算机系统由至少两台物理机(计算机)构成，其中一台作为主物理机1，另一台作为仆物理机6。这两台物理机例如通过服务器11或其他类似的通信信道彼此进行数据通信。服务器11还包括SAN存储器。每个物理机中都包含有一个虚拟机容器。主物理机上的虚拟机容器为主虚拟机容器2，仆物理机上的虚拟机容器为仆虚拟机容器7。每个虚拟机容器都有各自的主存3、8以及日志存储器4、9。两个虚拟机容器上的虚拟机上运行着相同的操作系统以及相同的应用程序。虚拟机在运行应用程序的过程中将各种指令运行的结果存储起来，并且将应用程序的操作的日志(journal)存储在日志存储器4、9中。虚拟机执行排列在各自指令队列5、10中的指令，并将执行的结果写入主存。根据本发明，虚拟机的行为分为两种，即存储器(或寄存器)读/写操作以及I/O操作(例如盘I/O)。根据本发明，计算机系统的主虚拟机通过指令队列中的I/O操作来触发主虚拟机和仆虚拟机之间的同步操作，也就是，本发明通过I/O操作的发生来触发同步操作。主虚拟机在执行指令队列5中的指令过程的同时，将两个相邻的同步点(I/O指令)之间各种命令以日志存储指令的形式保存在主虚拟机容器的日志存储器4中。在主虚拟机执行指令队列5中的指令的过程中，如果遇到I/O操作指令(同步点)时，将存储器日志存储器中存储的日志存储指令传输给仆虚拟机容器的日志存储器9，也就是，将日志存储器4的内容拷贝到日志存储器9中，供仆虚拟机执行。通过这种方式，两台虚拟机之间的同步能够高效快速地实现。

图2是所示的是根据本发明的计算机系统的软件配置的示意图。如图2所示，物理机1和6分别包括各自的CPU、存储器以及输入输出装置的硬件集成13和15，操作系统14和16分别运行在相应的硬件集成上。虚拟机容器2和7分别运行在相应的操作系统14和16上。虚拟机容器2和7彼此进行同步。每个虚拟机容器上分别运行一个或多个应用程序17和18，每个虚拟机容器都占用一定的CPU空间。

下面，对两台物理机中的虚拟机的同步操作过程进行详细的描述。在正常状态下，只有一个虚拟机容器为客户提供服务。主计算机通过客户IO信道与客户进行交流。主虚拟机容器以及仆虚拟机容器使得用于两个处理器的CPU状态、主存、存储器存取、时钟以及中断请求处于同步状态。仆虚拟机容器保持存储器和IO配置的复本(replica)。仆虚拟机容器能够被动地存取客户IO信道。两个虚拟机容器的同步包括：CPU和主存状态以及存储器存取的同步、时钟同步、中断请求的同步以及批同步。CPU和主存状态以及存储器存取的同步，就是当两个虚拟机容器的CPU在相同的状态语境内从相同程序中的相同程序计数器开始运行时，对于运算和逻辑指令，它们在每个指令之后需要产生完全相同的状态类型，并且以相同的方式存取该存储器。时钟同步就是尽管运算和逻辑执行必须是相同的，但是当时间漂移(shift)时执行时间会不同。因此，当一个CPU到达一个点以便提取当前时间戳(stamp)时，它必须等待其对应的CPU一起到达该点。随后这一对同步虚拟机容器在时间戳方面达成一致，并且将以相同的值将其报告给两个处理器。中断请求的同步就是当两个虚拟机容器打算对其虚拟处理器发出一个中断(例如盘存取完全中断)时，其必须等待其对应虚拟机容器也发出这种中断。随后该同步虚拟机容器对在中断点达成一致，并且分别将中断发送给两个处理器。为了改进性能，通过同时使得一组存取同步来实现存储器不匹配检测。为了降低通信有效载荷的量，他们能够使用特征代码(例如，CRC，MD5)来验证彼此是否匹配，这就是批同步。

返回参见图1，在虚拟机容器2和7的指令队列中基于应用程序的运行而排列了各种等待执行的指令。本发明将虚拟机容器的行为分为两种，即存储器(或寄存器)读/写操作以及I/O操作(例如盘I/O)。主虚拟机容器维持计算机的主存以及日志存储器并且向主存中加载各种指令。在指令队列中排列各种存储器读/写指令以及I/O指令，并且本发明虚拟机容器利用I/O指令作为处理边界(transaction boundary)，即从前一条I/O指令到下一条I/O指令作为一个处理，也就是进行一次同步处理。在该处理过程中，主虚拟机容器执行诸如存储器写指令，以便将数据写入主存，并将该存储器读/写指令以日志存储指令的形式写入日志存储器4中。该主虚拟机从前一条I/O指令开始一直执行指令队列中的各种指令直到遇到后一条I/O指令为止。此时，主虚拟机执行该I/O指令，并将两条相邻的I/O指令之间的存储在日志存储器4中的日志存储指令拷贝到仆虚拟机容器的日志存储器9中。接着，仆虚拟机容器执行日志存储器9中的日志存储指令，以便将数据写入其主存中。通过上述过程，两台物理机之间实现正常的同步操作。

当主物理机出现故障或崩溃时，也就是当不匹配发生时或者主虚拟机进行不正确操作时，仆虚拟机容器将接管与客户的通信信道，独自运行而不与主虚拟机同步，并且向系统管理员发出通知。此时，仆虚拟机容器将起到幸存者的作用。通过比较程序计数器、CPU状态以及存储器存取，同步的虚拟机容器能够检测到主物理机出现了故障或崩溃等异常情况。检测的手段可以采用本领域常规的手段。当主虚拟机容器被修复后，仆虚拟机将CPU和主存状态、存储器存取、时钟以及中断表迁移到修复后的主虚拟机容器。此时，幸存者变成了主虚拟机容器，而修复虚拟机容器变成了仆虚拟机容器。

图3所示的是根据本发明的使得两台计算机之间同步的方法的流程图。开始，在步骤S31启动物理机1和6并运行相关的应用程序。在步骤S32处，主虚拟机从主存中加载关于应用程序运行的各种指令到指令队列。在步骤S33，主虚拟机开始执行各种指令(或命令)，包括I/O指令，并将执行指令的结果数据写入主存。在步骤S34处，将所执行的指令以日志存储指令的形式写入日志存储器中。在步骤S35处，判断所执行的指令是否为I/O指令。如果判断结果为“否”，则主虚拟机的进程返回到步骤S33，以继续执行指令队列中的下一条指令。如果判断结果为“是”，则主虚拟机的进程前进到步骤S36。在步骤S36处，主虚拟机将所执行的I/O指令与在该I/O指令之前的一条I/O指令之间的、存储在主虚拟机的日志存储中的日志存储指令发送到仆虚拟机容器的日志存储器中。随后，主虚拟机在执行完步骤S36之后，返回到步骤S32以重复上述步骤。而仆虚拟机在步骤S37处执行存储在其日志存储器中的日志存储指令，并将运行的数据写入其主存中。通过上述步骤的反复进行，实现主虚拟机容器和仆虚拟机容器之间的各种同步。

本发明的描述是为了示例说明的目的而提供的，而不旨在是彻底无遗漏的，或者局限于所公开的实施例。很多修改和变更对于本领域的普通技术人员将是清楚的。选择这些实施例是为了说明本发明的原理及其实际应用，并且使得本领域的其他普通技术人员能够理解本发明，以便实现可能适于其他预期用途的具有各种修改的各种实施例。

Claims

1.一种使得计算机具有高可用性的方法，该方法包括：提供具有主虚拟机容器的主计算机以及具有仆虚拟机容器的仆计算机；在所述主虚拟机容器和仆虚拟机容器上分别运行主虚拟机和仆虚拟机；以及通过主计算机和仆计算机之间的通信信道，以I/O指令作为要被发送的指令的边界从主虚拟机向仆虚拟机发送所述指令，使得所述主虚拟机和仆虚拟机同步。

2.如权利要求1所述的方法，其中，所述使得所述主虚拟机和仆虚拟机同步包括使得主虚拟机和仆虚拟机的CPU寄存器状态及主存同步。

3.如权利要求1或2所述的方法，其还包括：主虚拟机从其主存中将指令加载到其指令队列，执行指令队列中的各种指令以及将数据写入主存，并将各种指令以日志存储指令的形式写入主虚拟机中日志存储器中。

4.如权利要求3所述的方法，其中，所述以I/O指令作为要被发送的指令的边界从主虚拟机向仆虚拟机发送所述指令包括：在遇到一条I/O指令后将在所述一条I/O指令和紧接于所述一条I/O指令之前的一条I/O指令之间的、存储在日志存储器中的日志存储指令发送到仆虚拟机的日志存储器。

5.如前权利要求4所述的方法，还包括：仆虚拟机执行其日志存储器中的日志存储指令，以便仆虚拟机的CPU寄存器状态及主存与主虚拟机的同步。

6.一种使得计算机具有高可用性的计算机系统，该系统包括：具有主虚拟机容器的主计算机和具有仆虚拟机容器的仆计算机、分别在所述主虚拟机容器和仆虚拟机容器上运行的主虚拟机和仆虚拟机、主计算机和仆计算机之间的通信信道，其中所述主虚拟机通过所述通信信道，以I/O指令作为要被发送的指令的边界向所述仆虚拟机发送所述指令，使得所述主虚拟机和仆虚拟机同步。

7.如权利要求6所述的计算机系统，其中，所述使得主虚拟机与仆虚拟机同步包括使得主虚拟机和仆虚拟机的CPU寄存器状态及主存同步。

8.如权利要求6或7所述的计算机系统，所述主虚拟机和仆虚拟机都包括：指令队列、主存以及日志存储器，其中，主虚拟机将主存中的命令加载到其指令队列，执行指令队列中的各种指令以及将数据写入主存，并将对应于指令队列中的各种命令以日志存储指令的形式保存在主虚拟机的日志存储器中。

9.如权利要求8所述的计算机系统，其中，所述主虚拟机在遇到一条I/O指令后，将在所述一条I/O指令和紧接于所述一条I/O指令之前的另一条I/O指令之间的、存储在主虚拟机的日志存储器中的日志存储指令发送到仆虚拟机的日志存储器。

10.如前权利要求9所述的计算机系统，还包括：仆虚拟机执行其日志存储器中的日志存储指令，使得仆虚拟机的CPU寄存器状态及主存与主虚拟机同步。

11.一种计算机，包括虚拟机容器以及在所述虚拟机容器上运行的虚拟机，所述虚拟机包括：指令队列、主存以及日志存储器，其中，虚拟机将主存中的命令加载到其指令队列，执行指令队列中的各种指令以及将数据写入主存，并将指令队列中的各种命令以日志存储指令的形式写入虚拟机的日志存储器中，其中所述虚拟机使用指令队列中的I/O指令作为处理边界来触发与另一台计算机的虚拟机同步操作。

12.如权利要求11所述的计算机，所述同步操作包括，所述虚拟机在遇到一条I/O指令后，将在所述一条I/O指令和紧接于所述一条I/O指令之前的另一条I/O指令之间的、存储在日志存储器中的日志存储指令，通过与另一台计算机之间的通信信道，发送到所述另一台计算机的虚拟机的日志存储器，供所述另一台计算机的虚拟机执行。