CN1160638C

CN1160638C - 多计算机系统及其控制方法

Info

Publication number: CN1160638C
Application number: CNB98103988XA
Authority: CN
Inventors: 齐藤雅彦; 仁; 武和秀仁; 一; 黑泽宪一; 弘; 宫崎义弘; 则; 金子茂则
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1997-01-17
Filing date: 1998-01-13
Publication date: 2004-08-04
Anticipated expiration: 2018-01-13
Also published as: US6138248A; CN1188935A; TW454128B; JP3537281B2; JPH10207855A

Abstract

本发明提供多计算机系统及其控制方法。计算机和后备计算机通过SVP(115)交换周期报告信号传输。当没有来自主机的周期报告信号传输时，后备计算机询问主机的状态，如果一个位置发生故障，则通过SVP(115)复位主机并继续进行处理。当出现永久性损坏时，SVP(115)连续地复位主机并控制共用盘单元的MOS开关以便把SCSI从主机隔离开并继续进行主机的处理。

Description

多计算机系统及其控制方法

技术领域

本发明一般涉及由主机和后备计算机组成的多计算机系统，并特别涉及装设有用来由主机和后备计算机作为外部存储器装置的共用盘单元的多计算机系统。

背景技术

一般来说，当对于某些应用，例如铁路管理，工厂的操作或公共供电系统的控制，对其性能劣于大型计算机的个人计算机有高可靠性的要求时，就要使用多计算机系统。在较好的容错系统中多计算机系统使用后备的或副个人计算机，其中当在主机中已经出现某种崩溃或者操作故障时，后备计算机可接过由主机进行的处理。

以这种方式使用个人计算机的多计算机系统的某些例子是Novell公司(USA)的Netware SFT III系统和康柏公司(Compaq Company)(USA)的后备恢复服务器(Standby Recovery Server)。

在Netware SFT III系统中，主机和后备计算机都以与光纤网络链接的扩展端口连接到一扩展端口。两计算机的扩展端口借助于光纤网络彼此协同地工作，以便周期地把主机的存储器复制到后备或者副计算机。进而，每一计算机监视着另一计算机，使得如果来自主机的信号被切断，则后备或者副计算机将通过使用从主机复制的数据而接过来处理。

在这种Netware SFT III系统中，来自主机盘单元的数据内容复制到后备或者副计算机的盘单元，使得主机和后备计算机不共享共用盘单元。

上述的后备恢复服务器一般使用称为“冷后备”的方法。这种冷后备系统不同于诸如Netware SFT III的(热后备)系统在于，后备计算机不能立即从主机接过处理。

在后备恢复服务器中，主机进行处理，同时后备计算机的OS(操作系统)处于后备状态。

在主机和后备或副计算机之间转移数据是由主机和后备计算机两者使用的共用盘单元进行的。

在后备恢复服务器中，后备计算机处于等同于备用的状态，并且不能被启动，而共用盘单元只能由一个计算机使用，这使得出现崩溃时主机将被停止。

更具体来说，两台计算机相互彼此监视，并当来自主机的信号被切断时，后备(或副)计算机首先把共用盘单元的I/O(输入/输出)从主机切换到后备计算机。然后，后备计算机加载OS(操作系统)并向共用盘单元安装文件系统。最后，后备计算机加载并运行原来由主机进行的处理所需的应用程序。在这种方式中，当主机中发生操作故障时，后备恢复系统通过从主机到后备计算机切换共用盘单元的输入/输出来转移数据。

在多计算机系统中相互监视的技术在日本专利延迟公开No.Sho 58-214952中列出。还知道一种技术，其中多个服务处理器彼此相互发送周期信号指示正确的操作，并在主机不再发送指示操作正确的信号时，从次级服务处理器中选择另一主服务处理器。

又在日本专利延迟公开No.Hei-4-2483中获知与其说是一种容错系统，不如说是以并行设置多个处理器进行处理的多处理器系统。在其中所提出的技术中，当处理器中发生操作故障时，事先选择的一个处理器用作为控制处理器并监视每一处理器的状态。还描述了当发生错误时用来使处理器复位的技术。

在以上有关Netware SFT III中，由于需要从主机向后备计算机复制内容，必须在扩展端口之间提供大容量的传输通路。因而，在Netware SFT III中使用光纤作为主机和后备计算机之间的扩展端口之间的传输通路。然而，诸如使用大容量光纤作为传输通路的方法将引起多计算机这类系统的成本大大上升。

另一方面，在上述有关后备恢复服务器中，使用共用盘单元从主机向后备计算机转移数据，于是不需要在Netware SFT III中所使用的大容量传输通路。

然而，为了在后备恢复服务器中主机操作故障时后备计算机能够使用共用盘单元，必须在后备计算机中安装一个文件系统。这里，为了使用诸如Windows NT或者Windows 95这类典型的个人计算机操作系统，必须重新启动操作系统以便安装这一文件系统。

因而，在备用恢复服务器中后备计算机处于仍然没有加载OS(操作系统)的备用状态。当在主机中出现崩溃或操作故障时，加载这一OS并且共用盘单元连接到文件系统。然而在这种方法中，从故障发生的时刻到后备计算机能够接过处理任务需要几分钟的时间。

而且，这些计算机故障随不同恢复的可能性而可能有不同的情形和严重程度，诸如电源误差，热失控，风扇故障或奇偶错误，等等。于是，多计算机系统的设计应当考虑这些故障的程度和适当的对策。

发明内容

于是就以上问题来说，本发明的目的是要提供一种低成本的多计算机系统，该系统能够在发生高速故障时接过计算机的处理任务。

本发明提供一种由多个计算机及所述多个计算机共享的共用盘单元组成的多计算机系统，当作为安装在主系统中的计算机的主计算机中发生故障时，该主计算机所进行的处理由作为安装在后备系统中的计算机的后备计算机执行，在该系统中，每一计算机的处理器独立地进行操作，并且每一计算机装有相互之间通过传输路径连接的功能扩展板，通过所述传输路径选择地向安装在发生故障的计算机之外的其它计算机中的功能扩展板发送单一复位请求或者连续复位请求，以及所述各功能扩展板通过所述传输路径从安装在其它计算机中的功能扩展板收到单一复位请求时，对装有该相应功能扩展板的计算机复位一定时期后取消复位；并在通过所述传输路径从安装在其它计算机的功能扩展板收到连续复位请求时，进行连续复位。

本发明提供一种多计算机系统控制方法，其中该多计算机系统由第一计算机、第二计算机和由所述第一计算机及所述第二计算机共享的共用盘单元组成，当第一计算机和第二计算机之中作为主系统中的主机的一个计算机发生故障时，作为后备计算机的另一计算机接替执行主机的处理；所述多计算机系统控制方法包括以下步骤：安装在主系统中的第一计算机中，运行来自共用外部存储器装置的集成有文件系统的一个操作系统，并使用所述共用外部存储器装置运行用于工作任务处理的应用程序；且在安装在后备系统中的第二计算机中运行所述共用外部存储器装置集成有文件系统的操作系统，以及运行用于监视第一计算机状态的程序，同时在使用所述共用外部存储器装置并保持这种状态的同时加载用于执行工作任务处理的应用程序；当第二计算机的控制程序检测到第一计算机中的故障时，所述控制程序中规定的处理使第一计算机复位，设置第一计算机为后备计算机，而第二计算机为主机，于是启动第二计算机并运行所述应用程序。

为了实现以上目的，本发明例如由包括第一计算机，第二计算机和供所述第一计算机和所述第二计算机共用外部存储器装置组成，并在设置在主系统中的计算机发生故障时，由所述计算机进行的处理能够由安装在后备系统中的计算机执行，并且对于所述多计算机系统的操作方法的特征在于：在安装到主系统中的第一计算机中，执行来自共用盘单元的结合了文件系统的操作系统和使用所述外部存储器装置进行工作任务处理的应用程序，并且安装在后备系统中的第二计算机运行结合了所述共用盘单元的文件系统的操作系统及用来监视第一计算机状态的程序，并在使用所述共用外部存储器装置的同时加载用来执行工作任务处理的应用程序，且保持这一状态；

当第二计算机的控制程序检测到第一计算机中的故障时，在所述控制程序中一个特定的处理使第一计算机复位，置第一计算机为后备计算机，且第二计算机为主机，然后第二计算机启动并运行所述应用程序。

在这种操作方法中，不需要使用光纤之类昂贵的传输通路，并且在发生故障之后不启动后备计算机，这种方法中的多计算机系统能够可使用共用盘单元高速向后备系统转移处理。

本发明的多计算机系统还具有当计算机中发生错误或者操作故障时根据故障状态进行处理的目的。

为了达到以上目的，本发明例如由包含多个计算机的多计算机系统，由所述多计算机共享的共用外部盘单元组成，并当安装在主系统中的主机中发生操作故障时，主机所进行的处理由安装在后备系统中的后备计算机执行，且所述多计算机系统的特征在于：

每一计算机对所述计算机的处理自主地进行操作，并装有按传输路径方式交替连接的功能扩展板，

并且所述功能扩展板具有：

复位请求装置，用于通过所述传输路径选择地向安装在发生故障的计算机之外的计算机中的功能扩展板发送单一复位请求或者连续复位请求，以及

复位装置，当通过传输路径从安装在另一计算机中的功能扩展板接收到单一复位请求时，该复位装置对装有所述功能扩展板的计算机瞬时地复位或者取消复位；并在通过所述传输路径从安装在另一计算机的功能扩展板接收到连续复位请求时，进行连续复位。

于是在这种多计算机系统中，单一复位请求是对于一计算机中的一个故障发出的，而连续复位是对永久性故障执行的。这样，复位能够根据已经发生的问题的延续程度进行。

本发明的另一目的是要在计算机中发生故障时有助于替换共用盘单元。

为了达到以上目的，本发明例如由包含多个计算机的多计算机系统、由所述多计算机共享的共用外部盘单元组成，并当安装在主系统中的主机中发生操作故障时，主机所进行的处理由安装在后备系统中的后备计算机执行，且所述多计算机系统的特征在于：

一个报告装置，用于监视共用盘单元的状态并向所述计算机报告被监视的共用盘单元状态，

取消装置，用于响应从计算机接收的命令取消共用盘单元与所述计算机之间的电连接。

在这种多计算机系统中，共用盘可在共用盘单元与系统供电独立的状态下无需使整个系统停止而被更换。

附图说明

图1是表示本发明实施例的冗余型系统结构的框图。

图2是表示安装在计算机中的SVP板的配置的框图。

图3是表示对于扩展板接口处理顺序的流程图。

图4是表示安装在计算机中的SVP板的网络控制处理器的处理顺序流程图。

图5是表示信息存储器存储内容的图示。

图6是表示共用盘单元内部MOS开关切换方式的表格。

图7是表示一个计算机发生故障的系统和起作用的计算机系统的配置的图示。

图8是表示安装在共用盘系统中的SVP板的配置的框图。

图9是表示安装在共用盘系统中的SVP板的网络控制处理器的处理顺序流程图。

图10是表示控制程序内部配置的图示。

图11是表示盘超高速缓存器操作例子的图示。

图12是表示报告信号处理任务传输的处理顺序的流程图。

图13是表示对于执行接收处理任务的处理顺序的流程图。

图14是表示对于执行故障处理任务的处理顺序的流程图。

图15是表示通过高可靠性控制网络途径传输的信息列表的表格。

具体实施方式

以下参照附图说明本发明的多计算机系统的一个实施例。

图1是表示本发明实施例的冗余型系统结构的框图。

如图中所示，该实施例的多计算机系统具有连接到一个共用盘单元的两个计算机。然而，这种系统还可能使用三个或更多的计算机。

图1中，标号100和101分别表示主机和后备计算机。然而后备计算机可能起主机的作用，而主机可能起后备计算机的作用。

计算机100和101装有中央处理单元(CPU)110，主存储单元111及输入输出装置(I/O)112，它们都连接到CPU总线120。

输入输出装置(I/O)112通常连接到盘单元113及扩展板总线121。

扩展板总线121连接到用于连接用来扩展计算机功能的扩展板的一个插槽。本实施例中，计算机100和101装有SCSI(小型计算机接口)板114，以太网板116，以及SVP(监控处理器)板作为扩展板。

计算机100和101中的以太网板连接到以太网103，并通过网络连接用于与其它计算机通信，等等。本实施例中，以太网103控制着工厂1000并被连接到多个控制器1010。

而且，计算机100和101的SCSI板114通过SCSI电缆160和161的方式连接到共用盘单元102。

计算机100和101中的SVP板115连接到高可靠性控制网络104。计算机100和101中的SVP板104板一般具有以下功能。

首先，存储计算机操作状态。更具体来说，是存储有关计算机出错状态的数据，诸如内部温度，风扇工作和停止，以及存储器奇偶性错误的历史。

第二，根据来自控制程序的请求通过高可靠性控制网络的方式向各个SVP板传送信息。

最后，当信息从其它SVP板传来时，根据其类型执行以下处理。

(1)在收到信号请求命令信息时，向被连接的计算机输出一次的请求信号。

(2)在收到连续请求命令信号时，向被连接的计算机连续输出请求信号。

(3)在收到状态请求命令时，向进行请求的SVP板发出关于存储的计算机状态的报告。

(4)当收到除了以上的信息时，向控制程序报告其现在的信息。

在共用盘单元102内部，盘驱动器单元140执行符合作为共用盘单元102的记录介质的SCSI标准的数据的输入和输出。每一计算机中SVP板141是相同的。在共用盘单元102内，装有MOS开关150到153及终结电阻器154和155。

共用盘单元102的SVP板141一般具有以下功能。

首先，当在盘单元内出现诸如盘单元内部温度不正常或风扇停止等错误或故障时，这一故障被报告给计算机中的SVP板。

第二，当从计算机SVP板收到盘切换命令时，盘单元内部的MOS开关根据特定的开关模式被设置为导通或断开。

在本发明的一个冗余系统中，当主机100和后备计算机101正常工作时，OS 130，应用程序135和控制程序131加载到主机100的主存储器单元111，并然后运行所述程序和应用程序。

另一方面，在后备计算机101中，OS 130，诸如Windows NT，Windows 95或MS-DOS及控制程序131加载到主存储器单元111并运行。而且在后备计算机101中，应用程序135加载到主存储器单元111但不运行。

应用程序135和控制程序131在计算机100和101中的OS 130上运行。

应用程序135是设计用来进行冗余系统中的处理的程序。例如，对通过以太网103从控制器1010发送的数据进行处理和记录。

控制程序与SVP115配合用来在SVP冗余系统中的主机和后备计算机之间进行改变。

这里，当MOS开关150和153导通并且MOS开关151及152断开时，主机100和后备计算机101的OS 130启动。设置两个计算机的每一个OS130识别共用盘单元102为文件系统的一部分。这里使用的SCSI是总线型接口，并且必须在这一总线两端安装终结电阻器。在MOS开关150和153导通且MOS开关151和152断开的当前状态，主机中SCSI板114内的终结电阻器，及后备计算机中SCSI板114内的终结电阻器发挥作用以便两端终结SCSI总线，并且共用盘单元内部的终结电阻器154和155对SCSI总线隔离。

以下，将详细说明每一部分。

图2表示计算机100和101的SVP板的内部配置。

如图中所示，SVP板115由以下部件构成：用来处理CPU通路输入和输出的扩展通路接口170，用来以高可靠性控制网络104的方式处理信息的网络控制处理器171，用来存储由网络控制处理器171运行的程序的存储器175，用来转换网络信息和电信号的传输接口172，作为消息和关于状态信息的临时存储缓存器的消息存储的存储器173，用来检测电源启动并发出SVP板复位信号的电源电压检测器174。

此外，SVP板的操作可广泛地分类为复位，监视计算机状态，发送控制消息，及接收控制消息。以下将详细说明这些操作的每一种。

在复位操作中，SVP板115独立于它所连接到的各个计算机而工作，即使当计算机由于故障而被复位时也是如此，这种故障状态必须存储到存储器中。于是，SVP板115的复位本身是与计算机的复位分开来进行的。因而SVP板装有电源电压检测器174用来监视通过扩展板总线121的插口提供的电源电压。这一电源电压检测器174检测电源电压的上升或启动，并然后从信号线183和184输出复位信号以表示结果。这些信号线183和184在每一部分向扩展板总线接口发出输出，清除存储器为零，清除状态信息并复位网络。

另外，在计算机监视操作中，SVP板具有通过信号线181存储计算机状态信息，监视计算机电源差错，风扇工作/停止及温度差错并在消息存储存储器173中存储该结果。在本实施例中，计算机100和101本身设有检测诸如计算机电源差错，风扇操作/停止和温度差错故障的功能。检测的结果通过对扩展总线121的插口报告给SVP板115。

以下将说明发送控制消息的操作。控制程序131通过扩展板总线121向扩展板总线接口170发送消息传输请求。扩展板总线接口170在消息存储存储器173中暂时存储要发送的消息。然后，扩展板总线接口170通知网络控制处理器171消息已经到达。被通知了消息的网络控制处理器171从消息存储存储器173抽取要传输的消息，把消息传送到传输接口172并通过高可靠性控制网络向高可靠性网络控制网络104上的其它SVP板传输该消息。

这里，在消息存储存储器173中暂时复制数据的原因在于，高可靠性控制网络和扩展板总线的数据传输速度常常是不同的，于是消息存储存储器173是用作为缓存器以解决不同的传输速度。

最后，将说明接收控制消息的操作。通过信号线185从高可靠性网络发送到传输接口172的控制消息由网络控制处理器171接收。

网络控制处理器171根据收到的消息进行如下的处理。

首先，如果消息是自动复位命令，则网络控制处理器171通过复位信号线182发送复位信号以便使计算机复位。

第二，如果消息是状态核实命令，则网络控制处理器171抽取存储在消息存储存储器173中的计算状态信息并作为状态报告命令向最初发出状态核实命令的SVP板发送这一信息。

最后，如果收到的不是以上的控制消息(由计算机中的控制程序进行的控制消息需求处理)，这种消息存储在消息存储存储器173中。然后存储在消息存储存储器173中的这些消息由信号线181应来自计算机的控制程序131的请求在任何时刻读出。

以下将给出由扩展板总线接口170以及网络处理器171进行的处理以便获得以下操作的详细说明。

由扩展板总线接口170进行的处理顺序示于图3中。扩展板总线接口170在收到来自计算机(扩展板总线)的输入/输出请求时开始处理。换言之，在收到三种信号之一时取消请求待命(状态)191：来自信号线183的复位信号，来自信号线181的读出信号或写信号。

当收到以上信号时，请求类型判断请求的类型，并在判断出请求为在电源上升(启动)的复位信号时，进行内部寄存器和电路的复位(处理193)。

当信号为来自信号线181的读出信号时，从其它SVP板到达的控制消息必须报告给计算机控制程序131。于是，抽取(处理194)存储在消息存储存储器中的控制消息并通过信号线181发送到扩展板总线121。

当信号是来自信号线181的写信号时，这一写信号被识别为计算机状态报告(电源差错，风扇工作/停止等等)或控制消息传输(处理196)。如果被判断为计算机状态报告，则所述状态存储到消息存储存储器中(处理197)。如果判断为控制消息传输，则所述控制消息暂时存储在消息存储存储器中(处理198)并发送到网络控制处理器170(处理199)。

另外，由网络控制处理器171进行的处理顺序示于图4中。在图中所示网络控制处理器的操作中，当由于一事件的发生而收到复位信号，来自扩展板通路接口的开始请求，或来自传输接口的任何消息时，消除事件备用状态(处理201)且操作进到下一个操作。换言之，当在事件备用201中出现任何事件时，在处理202中识别事件的类型。正如同扩展板通路接口那样，当电源启动期间施加复位信号时，通信处理被复位并放弃所有到达的消息(处理203)。

然而，当事件发生时，如果出现来自扩展板通路接口的启动请求，换言之即控制消息传输请求，则要传输的控制消息是从消息存储存储器的读出(处理204)，并且该控制消息向传输接口发送(处理205)。

而且，来自传输接口接收消息事件的发生指示来自其它SVP板的控制消息已经到达。这种情形下，根据控制消息的类型尔后执行的处理类型有所不同。

换言之，处理206判断控制消息的类型，并如果发现为自动复位命令，则通过信号线182向计算机发送一复位信号(处理207)。这一自动复位命令可以由以下两种类型之一组成：单一复位命令或连续复位命令。在接收到单一复位命令时，向计算机一次发送复位信号(复位脉冲)。单一复位是通过瞬时置扩展板通路121复位线为低电平而进行的。

然而，在收到连续复位命令时，向计算机连续地发送复位信号。通过保持扩展板通路121复位线为低电平而到达这种连续复位。这样连接到接收连续复位命令的SVP板的计算机能够保持复位状态(刚启动之后的状态)，并使该计算机与系统有效的隔离。这种情形下，在SVP板上的独立处理能够在这种状态下继续。在一些计算机中，可通过置复位线为高电平而达到复位。

当收到的控制消息为状态核实命令时，从信息存储存储器获得计算机状态信息(处理208)，并作为状态报告消息向发出该控制消息的SVP板发送。

当控制消息必须借助于控制程序处理时，收到的消息直接存储在消息存储存储器173中(处理210)。

消息存储存储器173的配置如图5所示。供传输消息、接收消息及计算机的状态信息作为数据存储在消息存储存储器173中，如图中所示。

更具体来说，在消息存储存储器173内提供了传输消息后备脉冲串220，接收消息后备脉冲串221及计算机状态表222。传输和或接收消息脉冲串分别作为供传输的控制消息和供接收的控制消息存储在一个FIFO(先入先出)系统中。例如，计算机状态，电源故障，风扇工作/停止，温度故障和电池出错存储在计算机状态表222内。现在已经说明了安装在计算机100和101中的SVP板。

以下说明安装在共用盘单元102中的SVP 141板。

如同以上有关部分那样，当主计算机100和后备计算机101功能正常时，共用盘102连接到计算机100和101两者。

就该冗余系统中的高可靠性目标来看，在主机损坏或者停止时不仅后备(或者从属)计算机101接过主机的角色，而且必须能够支持从系统中去除发生故障的计算机100并向系统连接新的计算机(重新形成冗余系统)。工作正常的后备计算机101这时最好不会停止。

MOS开关150到153及终结电阻器154及155装设在共用盘单元内，并当两个计算机之一从系统中去除时，MOS开关起作用为SCSI装置提供终结负载。

这里，MOS开关150到153的切换模式如图6所示。如前面相关部分那样，当两个计算机工作正常时，“a”中所示的MOS开关150，153均为导通。当这些MOS开关150、153为导通时，计算机100和101通过SCSI电缆160和161分别连接到盘驱动器140。同时，通过置MOS开关151和152断开，消除了盘驱动器140和终结电阻器154、155之间的电连接，使得与三个SCSI装置的连接：计算机100的SCSI板，盘驱动器140和计算机101的SCSI板，在装置的两端终结。

这里，当计算机101发生故障时，为了恢复操作，后备计算机101从系统隔离，并当试图连接到另一计算机时，终结SCSI板本身从计算机101隔离。这时，在去除计算机101之前，如图6c所示，MOS开关150和152现在导通，且MOS开关152和153现在断开。这一处理把图1中所示的电路变为等价于图7所示的电路。即，由SCSI电缆160连接的SCSI板114和SCSI接口驱动器140分别终结在装置的两端，并可参照SCSI盘驱动器140确定计算机100工作是否正常。反之，当计算机100发生故障时，MOS开关151和153如图6b所示导通，并且MOS开关150和152断开。这一动作允许参照盘驱动器140以便判断计算机101工作是否正常。

当共用盘单元102本身发生故障时，如图6d所示MOS开关150到153全部断开，并然后如果共用盘单元102已经从系统隔离，则盘驱动器可被替换，同时对系统中的电信号隔离。

以上所述功能应用在安装在共用盘单元102中的SVP板141中，详细说明如下。

安装在共用盘单元102中的SVP板141如图8中所示。SVP板141连接到高可靠性控制网络104，并与计算机SVP板相互交换消息。传输接口230转换网络电信号243为控制消息，并向网络控制处理器231发送这些控制消息。进而，从网络控制处理器231发送的控制消息被转换为电信号并通过高可靠性控制网络传输。

这里，如图所示，SVP板141与连接到计算机的SVP板115不同，它没有消息存储存储器。其原因在于，共用盘单元在短时间内不会连续发送和接收控制消息。

再次申明，由网络控制处理器231处理的控制消息基本为以下两类。一类是盘报告消息(发送)，其中当信号线24报告盘状态有变化时，这一变化作为控制消息报告给计算机的SVP板。

另一类型为盘切换消息(接收)，其中计算机的SVP板115发送控制消息使得盘单元内部的MOS开关150到153导通或者断开。当收到这一控制消息时，请求MOS切换控制电路232根据控制消息规定的模式(图6的任何模式)改变MOS开关150到153。然后MOS开关控制电路232根据请求的切换模式设置信号线244到247的输出连接到每一MOS开关的门电路。

SVP板114还有电源电压检测器233，与SVP板115同样连接到计算机。这一电源电压检测器233检测供给盘单元的电压240并发出复位信号241。这一复位信号初始化或者复位网络控制处理器231。

由SVP板141使用的传输接口230可以与连接到计算机的SVP板115内部的传输接口172相同。此外，网络控制处理器231也可以与连接到计算机的SVP板115的网络控制处理器171相同，然而由于要处理的控制消息不同，即使使用物理上相同的处理器，存储在存储器234中用来运行网络控制处理器231的程序将是不同的。

图9表示共用盘单元102内的SVP板141上网络处理器231的处理顺序。

在网络控制处理器231从事件备用状态251进到下一个操作的事件中，有从信号线241接收复位信号，盘状态信号242中的状态改变，或从传输接口230接收盘选择命令消息。当这些消息任何之一出现时，在处理器252中识别事件的类型。

被识别的事件是这样一个事件，其中电源电压检测器检测到电源上升(启动)并发送复位信号，执行诸如通信复位并放弃先前接收的消息，并复位SVP板状态(处理253)。

事件的类型作为信号线242的变化被传送。当盘单元内部的状态发生变化时，例如，盘单元内的电源发生故障，风扇工作/停止，温度故障或盘驱动器硬件出错，则网络控制处理器231识别由事件指示的状态变化的内容并作为盘状态变化，向计算机的SVP板115报告这样识别出的内容(处理254)。然而在本实施例中，盘驱动器140本身设有识别功能以便能够检测诸如共用盘单元102内部的电源故障，风扇工作/停止，或温度故障等问题，并且检测的结果通过信号线242报告给SVP板141。

当作为从计算机SVP板传输的盘切换命令消息接收发生的事件时，请求MOS开关控制电路232(处理255)与由盘切换命令消息所规定的模式(图6a到d)相一致地控制MOS开关ON/OFF的切换。

以下，说明通过使用SVP板115和141用来进行主机和后备计算机切换的控制程序131。

由控制程序131执行的主机任务由以下三种类型组成。

在第一类型中，周期地通过SVP板发送(输入检验)报告信号以便报告计算机工作正常。

在第二类型中，从SVP板115周期地接收控制消息并进行处理。例如，如果所述控制消息为(输入检验)报告信号，则得知从其发出控制消息的计算机的存在。又例如，如果消息是盘状态报告消息，则通过SVP板115向共用盘单元102发送所需的盘切换命令。

在第三类型中，如果(输入检验)报告信号在规定的时间内没有从其它计算机收到，则判断该计算机已经发生故障并自动被复位及进行盘切换。如果这一其它的故障计算机就是主机，则主要的操作转移到后备计算机。进而，当切换到用于主操作的后备计算机时，放弃在主存储单元111中从共用盘单元102读出的数据以便保持数据的一致性。

以下，详细说明控制程序。控制程序131的内部结构如图10所示。控制程序131由对应于刚才描述的三个任务类型的三个任务260到262组成。(输入检验)报告传输任务260的作用是通过SVP板115向其它计算机报告这一计算机本身工作正常。因而以固定的时间间隔从SVP板请求(输入检验)报告消息270的传输。接收处理任务261具有这一工作或者接收(输入检验)由其它计算机中的SVP 115板传输的报告信号，以及接收由共用盘单元102的SVP板141传输的盘状态报告消息271。正如同(输入检验)报告传输处理任务260那样，接收处理任务261在固定的时间间隔启动，并抽取存储在SVP板115内部的消息存储存储器173中的控制消息。

当经过规定的时间量之后来自其它计算机的(输入检验)报告消息还没有到达时，接收处理任务261判断该其它计算机已经发生故障并请求自动复位该计算机以及修复处理任务262的盘切换。而且当收到盘状态报告消息时，共用盘单元102中已经出错(或者故障之后的复位)，以便发出盘切换命令276，并在盘单元内部改变MOS开关的通/断状态。

以下说明修复处理任务262的操作。

首先，当响应发生故障的计算机而发送(处理273)自动复位命令时，如果需要就发送一个计算机状态检验，以便检验计算机并询问计算机出故障的状态。这时，如果判断故障在一个位置诸如由于奇偶性错误所至，则选择单一复位命令。如果发现故障是严重的或者在一个位置持续出现，则选择连续复位命令作为自动复位命令。

第二，当作为连续复位命令发送自动复位命令时，以故障计算机从系统中隔离为预先条件而发送盘切换消息。这一盘切换消息规定了盘切换模式，使得计算机本身和共用盘单元102在SCSI连接的两端相互终结。因而即使故障的计算机从系统隔离并且工作的计算机必要时能够参照共用盘单元，也不存在持续的影响。

第三，OS 130的主要部分通过275安装用于把盘单元102的内容复制到主存储单元111的盘高速缓存263，以便通过在盘高速缓存263中进行正常盘的参照而改进处理效率。就在把主要操作从发生故障的主机转移到后备计算机之前，修复处理任务262使得盘高速缓存263不起作用。盘高速缓存263通常由OS 130控制，于是通过OS 130作出处理请求273并然后使得盘高速缓存263不起作用。

进行以上第三步骤处理的原因在于，共用盘单元102的内容还作为盘高速缓存在连接到共用盘单元102的计算机的主存储装置中被复制。于是如果主机中的共用盘单元的内容改变，并如果对应的数据还在后备计算机中的盘高速缓存263中处理，则当主操作转移到后备计算机时，将不幸不能参照或使用共用盘单元102中的变化了的数据内容，而使用的却是盘高速缓存(复制)中的没有改变的数据。例如图11中所示，在包括计算机100、101和共用盘单元102的系统中，计算机100是主机，计算机101是后备计算机。对于共用盘单元102中的数据单元290，盘的高速缓存263出现在主机而盘高速缓存291出现在后备计算机。这里，应用程序280在主机100操作期间进行处理，而共用盘单元102中的数据290被再写入(300)。这时，计算机100出故障而计算机101现在变为主机。对应于共用盘单元102的数据290的先前的数据出现在计算机101的盘高速缓存291中，于是需要时就参照这一对应的数据(301)。然而，在处理300中重新写入的数据不出现在盘高速缓存291的情形下，在处理301中参照的数据是老的不正确的数据。

因而，为了防止参照不正确的数据，后备计算机在从故障主机接过处理之前要认定盘高速缓存的内容是不正确的。

以下将详细说明所述控制程序131的(输入检验)报告传输任务260，接收任务261和修复任务262的处理。

图12表示执行(输入检验)报告传输任务260的处理顺序。如图所示，在这一处理中只向其它计算机作出周期(输入检验)报告。换言之，通过SVP板向其它计算机发送输入检验报告信号(处理311)，然后对于预先设定的时间量转移到后备状态(处理312)，并然后重复该顺序。

以下说明图13所示的接收任务261的处理顺序。在接收任务261中，按间隔接收输入检验报告信号和盘状态报告。

换言之，首先检验盘状态消息的接收(处理322)，并在处理323判断盘状态报告是否实际上已经到达。当盘状态消息表示共用盘单元已经发生故障时，则发送盘切换命令(通过SVP板115)以便改变共用盘单元102内所有的MOS开关150-153为OFF状态(以图6的模式“d”设置)。当盘状态报告表示发生故障的共用盘单元102已经复位时，盘切换命令相反地发送(处理324)以便改变MOS开关150-153为共用盘单元102的正确操作设置(图6的“a”，“b”或“c”的模式设置)。

然后进行输入检验报告信号的接收处理325，但是当这一输入检验报告在规定的时间内在接收任务261中没有收到时。“报告待命计数”用作为控制变量启动修复任务262。事先设置“报告待命计数”为N次(处理321)事先作为复位处理的一部分。

在(输入检验)报告信号的接收处理325中，对于输入检验报告信号是否已经从其它计算机到达作出检验(处理326)。如果输入检验报告信号已经到达，则再次进行N计数的复位(处理327)并且顺序返回处理322。然而，如果在处理326中输入报告信号没有到达，则“报告待命计数”中的数值减少一个单位(处理329)并然后作出对这一变量数值的检验(处理330)。如果检验表明“报告待命计数”中的数值为零，则在对于“N×出现报告信号间隔”中允许的时间内还没有从其它计算机收到(输入检验)报告信号，于是然后启动修复任务(处理331)。当发现在处理327中检验的数值为非零时，则顺序处于待命状态达规定的时间(处理328)并然后顺序返回处理322。

设置N数值为二(2)或者更大允许响应诸如高可靠性控制网络中一个位置的错误。此外，如图1所示，当主机100和后备计算机102由两个网络(以太网和高可靠性控制网络)链接时，如果两个网络都设置用来传输(输入检验)报告信号，则一个网络将能够耐受通信误差。然而，在诸如以太网一般使用网络中，从高可靠性方面而言进行自动复位命令和盘切换消息的处理是不适当的，因而这些控制消息最好只是在高可靠性控制网络上使用。

以下说明图14所示修复任务262的处理顺序。

首先，在处理341中，向发生故障的计算机的SVP 115板先发送检验发生故障的计算机状态的命令，并然后收到关于发生故障的计算机状态的报告(处理342)。

然后，通过处理343和这时决定的复位方法确定计算机中的故障程度。如果故障限制在计算机中一个位置并且计算机可能能够恢复正常操作，则发送单一复位信号(处理344)并试图重新启动。然而如果出故障的计算机具有永久性的损坏或损坏的位置反复出现，则发送连续的复位命令(处理345)并把出故障的计算机从系统隔离开以防止不良作用的扩散。

进而，当命令连续复位时，则然后发出盘切换命令(命令对于MOS开关150-153设置图6b或者6c的模式)(处理346)，并把共用盘单元102从出故障的计算机隔离开。因而即使出故障的计算机已经从系统去除，但共用盘单元需要时仍能够被正常地参照。

也能够省略处理341到344并总是对出故障的计算机使用连续复位方法。

另外，当主机为出故障的计算机而其它计算机为处于待命的后备(或从属)计算机时，后备计算机必须接过来而作为主机，并且由主机进行的处理必须被接续。，于是首先必须判断后备计算机是否处于待命状态(处理347)并当处于待命状态时，使得盘高速缓存无效(处理348)，然后事先加载到主存储单元111的应用程序135运行，并且后备计算机转变为主操作计算机角色(处理349)。

前面已经对执行备份任务252的处理进行了说明，然而在OS 130不提供使盘高速缓存无效的系统服务的情形下，则可以进行图14的处理350-353(使盘高速缓存无效)而不是同一图14中的处理348。

换言之，首先锁定共用盘单元102本身(处理350)以便禁止由不是控制程序131的其它程序参照该盘。然后通过数字逻辑删除(或解除)共用盘单元102的电连接(处理351)。这一处理中，对应于共用盘单元102的盘高速缓存的内容被认定为无效。这时，通过处理352中的数字逻辑重新形成(或安装)到共用盘单元的连接，并最后解开共用盘单元102并解除控制程序131对它的所有权(处理353)。

OS具有以下特征。

第一个特征在于，即使盘单元已经被解除，当程序试图参照盘单元时，将自动地被安装。

第二个特征在于，无需对盘单元的控制而能够进行解除。

这样，能够省略任何350到353的处理。例如，在具有第一特征的OS中，能够省略处理352，并对于具有第二特征的OS，能够省略处理350和353。

以上的说明解释了本发明的冗余系统的一个例子。图15表示通过高可靠性网络104传输的消息的总和。在图15中示出消息类型，传输源，最后的接收者及处理细节。

本实施例中，控制程序也可作为OS的一部分提供。

在以上所述的实施例中，可使用廉价的个人计算机构成高可靠性多计算机系统。这一多计算机系统由SVP板，高可靠性控制网络和控制程序组成，然而应用程序不必由这些系统要素所限制。于是，与传统技术同样的应用程序也可使用。

而且，通过允许对共用盘单元数据的访问，可由多计算机系统内的计算机复制主存储器以便能够配置极为低廉的系统，并能够在主系统和后备系统之间进行高速切换。

又当计算机故障已经发生时，能够对一个位置发生的故障进行单一复位，并然后试图重新启动；或者对于永久型的故障可进行连续复位，使得能够根据发生了使失效的主要故障的计算机的故障程度进行处理。

又另外，把出故障的设备对系统电隔离允许不使系统停止而能够替换掉出故障的设备。

Claims

1.一种由多个计算机及所述多个计算机共享的共用盘单元组成的多计算机系统，当作为安装在主系统中的计算机的主计算机中发生故障时，该主计算机所进行的处理由作为安装在后备系统中的计算机的后备计算机执行，在该多计算机系统中，

每一计算机的处理器独立地进行操作，并且每一计算机装有相互之间通过传输路径连接的功能扩展板，通过所述传输路径选择地向安装在发生故障的计算机之外的其它计算机中的功能扩展板发送单一复位请求或者连续复位请求，以及

所述各功能扩展板通过所述传输路径从安装在其它计算机中的功能扩展板收到单一复位请求时，对装有该相应功能扩展板的计算机复位一定时期后取消复位；并在通过所述传输路径从安装在其它计算机的功能扩展板收到连续复位请求时，进行连续复位。

2.根据权利要求1的多计算机系统，其中所述多个计算机具有：

控制装置，用于操纵所述多个计算机的处理，并且

所述功能扩展板装有：

通知装置，用来监视装有所述功能扩展板的其它计算机，并通过所述传输路径通知其它功能扩展板关于正在被监视的计算机的状态，

报告装置，用于向装有所述功能扩展板的计算机的控制装置报告从其它计算机收到的该其它计算机的状态，并当在其它计算机中发生故障时，

根据来自功能扩展板报告的其它计算机的计算机状态，所述控制装置或者选择单一复位请求或者选择连续复位请求，并把复位请求传送给功能扩展板，

复位请求装置，当出现故障时，该复位请求装置向装有功能扩展板的其它计算机发送从所述控制装置传送的单一复位请求或者连续复位请求。

3.根据权利要求1的多计算机系统，每一计算机分别具有所述共用盘单元使用的盘高速缓存，并且

当在主计算机中发生故障时，在从主计算机接过处理之前，所述后备计算机使盘高速缓存的内容无效。

4.根据权利要求3的多计算机系统，其中还包括无效化装置，通过暂时取消或者不设置所述共用盘单元的逻辑连接，而使得盘高速缓存内容无效。

5.根据权利要求1的多计算机系统，其中

所述共用盘单元具有该共用盘单元用的功能扩展板；

所述共用盘单元用的功能扩展板监视所述共用盘单元的状态，并将被监视的共用盘单元的状态通知所述计算机，以及

响应计算机接收的指令解除共用盘单元与所述各计算机之间的电连接。

6.根据权利要求1的多计算机系统，其中

当检验到其它计算机故障时，所述各计算机向所述共用盘单元发出命令，以解除与其它相应的计算机之间的电连接，并且

所述共用盘单元具有

共用盘单元用的功能扩展板，用于取消各计算机之间的每一个电连接的开关，以及

所述共用盘单元用的功能扩展板响应来自所述计算机的命令控制所述开关，解除与出故障的计算机之间的电连接。

7.根据权利要求1的多计算机系统，由第一计算机、第二计算机和由所述第一计算机及所述第二计算机共享的共用盘单元组成，当第一计算机和第二计算机之中作为主系统中的主计算机的计算机发生故障时，作为后备系统中的后备计算机的另一计算机接替执行主计算机的处理；该系统中，

所述第一计算机和共用盘单元及所述第二计算机借助于一总线型传输路径在一个数字回路中被连接，其顺序为第一计算机，共用盘单元和第二计算机，

所述第一计算机和所述第二计算机，用于当在另一个计算机中检测出故障时向所述共用盘单元发出命令以便切断与该另一计算机的电连接，且所述共用盘单元包括：

用于切断与第一计算机电连接的第一开关，

用于切断与第二计算机电连接的第二开关，

用于终结所述传输路径的一个终结电阻器，

用于连接到所述终结电阻器而不是第一计算机的传输路径的第三开关，

用于连接到所述终结电阻器而不是第二计算机的传输路径的第四开关，

响应来自所述第一计算机或所述第二计算机的命令，控制所述第一开关或第二开关，电切断与所述出故障的计算机之间的传输路径；以及控制所述第三开关或所述第四开关替换被切断的传输路径形成与所述终结电阻器的电连接。

8.一种多计算机系统控制方法，其中该多计算机系统由第一计算机、第二计算机和由所述第一计算机及所述第二计算机共享的共用盘单元组成，当第一计算机和第二计算机之中作为主系统中的主计算机的一个计算机发生故障时，作为后备计算机的另一计算机接替执行主计算机的处理；所述多计算机系统控制方法包括以下步骤：

安装在主系统中的第一计算机中，

运行来自共用外部存储器装置的集成有文件系统的一个操作系统，并使用所述共用外部存储器装置运行用于工作任务处理的应用程序；且

在安装在后备系统中的第二计算机中

运行所述共用外部存储器装置集成有文件系统的操作系统，以及运行用于监视第一计算机状态的程序，同时

在使用所述共用外部存储器装置并保持这种状态的同时加载用于执行工作任务处理的应用程序；

当第二计算机的控制程序检测到第一计算机中的故障时，

所述控制程序中规定的处理使第一计算机复位，

设置第一计算机为后备计算机，而第二计算机为主计算机，于是

启动第二计算机并运行所述应用程序。