WO2016082443A1

WO2016082443A1 - 集群仲裁方法和多集群配合系统

Info

Publication number: WO2016082443A1
Application number: PCT/CN2015/077092
Authority: WO
Inventors: 陈晓丽; 曾敬勇
Original assignee: 华为技术有限公司
Priority date: 2014-11-27
Filing date: 2015-04-21
Publication date: 2016-06-02
Also published as: US20170270015A1; EP3214865B1; EP3461065B1; CN104469699A; EP3461065A1; EP3214865A4; EP3214865A1; CN104469699B

Abstract

本发明实施例公开了一种集群仲裁方法和多集群配合系统。本发明实施例方法包括：检测第一组集群或第二组集群中是否有故障发生，其中所述第一组集群包括第一集群的一部分和第二集群的一部分，所述第二组集群包括所述第一集群的另一部分和所述第二集群的另一部分，所述第一集群和所述第二集群互相配合；当检测到有故障发生时，所述第一组集群和第二组集群分别确定各自的抢占代表，所述第一组集群的抢占代表和所述第二组集群的抢占代表分别执行以下步骤：确定所在的组集群内是否有故障发生；若没有，则对仲裁设备进行抢占，其中根据预置仲裁机制对所述仲裁设备抢占成功的抢占代表所在的组集群存活。本发明能够降低出现业务访问中断的概率。

Description

集群仲裁方法和多集群配合系统

技术领域

本发明涉及移动通信领域，尤其涉及一种集群仲裁方法和多集群配合系统。

背景技术

双活数据中心是指两个数据中心都处于运行状态，可以同时承担业务，提高数据中心的整体服务能力和系统资源利用率。两个数据中心互为备份，当其中一个数据中心故障时，数据零丢失，业务能自动切换到另一数据中心。

双活数据中心通常由存储层、网络层和应用层组成。双活数据中心中部署着几个集群，其中每一个集群的一部分位于其中一个数据中心一侧，每一个集群的另一部分位于另一个数据中心一侧，每个数据中心的各子集群相互配合工作。

然而，双活数据中每一个集群的仲裁机制不同，当出现故障时，每一个集群采用各自的仲裁机制进行仲裁，导致每一个集群的仲裁结果不一定一致，即可能出现部分集群位于其中一个数据中心内的子集群存活，部分集群位于另一个数据中心内的子集群存活，进而概率性的出现整个业务访问中断的情况。

发明内容

本发明实施例提供了一种集群仲裁方法，能够降低出现业务访问中断的概率。

本发明实施例第一方面提供一种集群仲裁方法，包括：

检测第一组集群或第二组集群中是否有故障发生，其中所述第一组集群包括第一集群的一部分和第二集群的一部分，所述第二组集群包括所述第一集群的另一部分和所述第二集群的另一部分，所述第一集群和所述第二集群互相配合；

当检测到有故障发生时，所述第一组集群和第二组集群分别确定各自的抢占代表，所述第一组集群的抢占代表和所述第二组集群的抢占代表分别执+ 行以下步骤：

确定所在的组集群内是否有故障发生；

若没有，则对仲裁设备进行抢占，其中根据预置仲裁机制对所述仲裁设备抢占成功的抢占代表所在的组集群存活。

结合本发明实施例的第一方面，本发明实施例的第一方面的第一种实现方式中，所述第一组集群的抢占代表和所述第二组集群的抢占代表还分别执行以下步骤：

若确定所在的组集群内有故障发生，则检测预置时间内对方组集群是否对仲裁设备进行抢占，若没有，则所述第一集群采用第一预置机制对所述仲裁设备进行抢占；所述第二集群采用第二预置机制对所述仲裁设备进行抢占。

结合本发明实施例的第一方面，本发明实施例的第一方面的第二种实现方式中，所述确定所在的组集群内是否有故障发生之后还包括：

当所述第一组集群的抢占代表和所述第二组集群的抢占代表分别确定所在的组集群内没有故障发生时，所述第一组集群的抢占代表和所述第二组集群的抢占代表均对仲裁设备进行抢占，且预置所述第二组集群的抢占代表进行退让。

结合本发明实施例的第一方面的第二种实现方式，本发明实施例的第一方面的第三种实现方式中，所述预置仲裁机制为最先抢占到所述仲裁设备的抢占代表对所述仲裁设备抢占成功；

预置所述第二组集群的抢占代表进行退让具体包括：

预置所述第二组集群的抢占代表在确定所在的组集群内没有故障发生后间隔预置时间再对所述仲裁设备进行抢占。

结合本发明实施例的第一方面，本发明实施例的第一方面的第四种实现方式中，所述第一组集群和第二组集群位于双活数据中心内，其中所述第一组集群位于其中一个数据中心内，所述第二组集群位于另一个数据中心内。

本发明实施例第二方面提供一种多集群配合系统，包括：

第一组集群、第二组集群和仲裁设备，其中第一组集群包括第一集群的一部分和第二集群的一部分，所述第二组集群包括所述第一集群的另一部分和所述第二集群的另一部分，所述第一集群和所述第二集群互相配合，所述仲裁设备内设有预置仲裁机制；

所述第一组集群和第二组集群分别用于当检测到第一组集群和第二组集群内有故障发生时，确定各自的抢占代表；

所述第一组集群的抢占代表和所述第二组集群的抢占代表分别用于确定所在的组集群内是否有故障发生；若没有，则对所述仲裁设备进行抢占，其中根据所述预置仲裁机制对所述仲裁设备抢占成功的抢占代表所在的组集群存活。

结合本发明实施例的第二方面，本发明实施例的第二方面的第一种实现方式中，所述仲裁设备内还设有第一预置机制和第二预置机制；

所述第一组集群的抢占代表和所述第二组集群的抢占代表还分别用于当确定所在的组集群内有故障发生时，检测预置时间内对方组集群是否对仲裁设备进行抢占；若没有，则所述第一集群采用所述第一预置机制对所述仲裁设备进行抢占，所述第二集群采所述用第二预置机制对所述仲裁设备进行抢占。

结合本发明实施例的第二方面，本发明实施例的第二方面的第二种实现方式中，所述第二组集群的抢占代表还用于当所述第一组集群的抢占代表和所述第二组集群的抢占代表分别确定所在的组集群内没有故障发生，且所述第一组集群的抢占代表和所述第二组集群的抢占代表均对仲裁设备进行抢占时进行退让。

结合本发明实施例的第二方面的第二种实现方式，本发明实施例的第二方面的第三种实现方式中，所述预置仲裁机制为最先抢占到所述仲裁设备的抢占代表对所述仲裁设备抢占成功；

所述第二组集群的抢占代表具体用于在确定所在的组集群内没有故障发生后间隔预置时间再对所述仲裁设备进行抢占。

结合本发明实施例的第二方面，本发明实施例的第二方面的第四种实现方式中，所述多集群配合系统为双活数据中心，其中所述第一组集群位于其中一个数据中心内，所述第二组集群位于另一个数据中心内。

从以上技术方案可以看出，本发明实施例具有以下优点：

本发明实施例中，当出现故障时，由于第一组集群和第二组集群分别确定各自的抢占代表去抢占仲裁设备中的仲裁设备，而抢占成功的那组集群中的所有子集群存活，进而保证在出现故障时不同集群的仲裁结果一致，使得存活的组集群能够继续提供服务。

附图说明

图1为本发明的集群仲裁方法的一个实施例的流程图；

图2为本发明的多集群配合系统的一个实施例的结构示意图。

具体实施方式

本发明实施例提供了一种集群仲裁方法和多集群配合系统，用于降低出现业务访问中断的概率。

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、系统、产品或设备固有的其它步骤或单元。

请参阅图1，本发明的一个实施例中集群仲裁方法包括：

101、检测第一组集群和第二组集群中是否有故障发生，其中所述第一组集群包括第一集群的一部分和第二集群的一部分，所述第二组集群包括所述第一集群的另一部分和所述第二集群的另一部分，所述第一集群和所述第二集群互相配合。

本实施例中，第一集群中部分节点设于第一组集群中，另一部分节点设于第二组集群中，该两部分节点分别形成第一集群的两个子集群。第二集群中部分节点设于第一组集群中，另一部分节点设于第二组集群中，该两部分节点分别形成第二集群的两个子集群。第一集群和第二集群互相配合工作，且第一组集群和第二组集群同时承担业务，并互为备份。

具体举例来说，第一组集群和第二组集群为双活数据中心，该两个数据中心的存储层各部署一台VIS6600T，该两台VIS6600T组成一个VIS集群，为该两个数据中心主机业务同时提供读写服务。该两个数据中心的应用层部署有Oracle RAC集群，其中该Oracle RAC集群的部分节点设置在其中一个数据中心，另一部分节点设置在另一个数据中心。

需注意的时，第一组集群和第二组集群中的集群并不限于第一集群和第二集群，还可以包括其他集群。例如，第一组集群和第二组集群中还包括第三集群，其中第三集群的部分节点设于第一组集群中，另一部分节点设于第二组集群中。

第一集群在第一组集群内的子集群和第二集群在第一组集群内的子集群互相通信。同样的，第一集群在第二组集群内的子集群和第二集群在第二组集群内的子集群互相通信。且第一集群在第一组集群中的子集群和在第二组集群中的子集群定时通过集群IP心跳链路获取对方的运营情况，以及第二集群在第一组集群中的子集群和在第二组集群中的子集群定时通过集群IP心跳链路获取对方的运营情况。

当其中一个组集群中某个集群故障时，该组集群中其他集群无法与该集群通信，那么该组集群中的各集群可确定本组集群内有故障发生。而在另一个组集群中与该故障集群通信的集群无法获取到该故障集群的运营情况时，可确定该故障集群发生故障，并将该集群故障的消息发送至本组集群中的其他集群。

或者，当集群IP心跳链路故障时，导致第一集群在第一组集群中的子集群和在第二组集群中的子集群不能获取到对方的运营情况时，或者导致第二集群在第一组集群中的子集群和在第二组集群中的子集群不能获取到对方的运用情况时，也可确定第一组集群和第二组集群中有故障发生。

102、当检测到有故障发生时，所述第一组集群和第二组集群分别确定各自的抢占代表，所述第一组集群的抢占代表和所述第二组集群的抢占代表分别执行步骤103。

当确定有故障发生时，第一组集群和第二组集群根据预先设置好的机制来确定各自的抢占代表。该抢占代表用于代表所在的组集群去抢占仲裁设备，而抢占到仲裁设备的抢占代表所在的组集群中所有集群能够存活，继续提供服务，另一个组集群中的各子集群均停止提供服务。

确定抢占代表的机制可以有多种。例如，可以预先设置好将节点号最小的节点选为抢占代表，或者将启动时间最晚的节点作为抢占代表等等，在此不作限制。或者，抢占代表也可以不是组集群中的一个节点，而是多个节点或者一个子集群等等，在此不作限制。

第一组集群和第二组集群确定抢占代表的机制可以一样，也可以不一样，在此不作限制。第一组集群和第二组集群分别确定出各自的抢占代表后，该两个抢占代表分别执行步骤103。

103、确定所在的组集群内是否有故障发生，若没有，则对仲裁设备进行抢占，其中根据预置仲裁机制对所述仲裁设备抢占成功的抢占代表所在的组集群存活。

由于对仲裁设备抢占成功的抢占代表所在的组集群中所有的子集群将全部存活继续提供服务，而一个组集群内的各子集群是相互配合工作的，因此若该组集群内有故障发生导致部分子集群不能提供服务，也会导致业务中断。因此，抢占代表在对仲裁设备进行抢占之前，均确定所在的组集群内是否有故障发生。

抢占代表在确认所在组集群内没有故障之后，再根据预置仲裁机制对仲裁设备进行抢占。预置仲裁机制有多种，此为现有技术，在此不作赘述。对仲裁设备抢占成功的抢占代表所在的组集群将继续存活，而另一个组集群则“自杀”，停止提供业务服务。

若抢占代表发现所在的组集群内有故障发生，那么退出抢占行为。

本发明实施例中，当出现故障时，由于第一组集群和第二组集群分别确定各自的抢占代表去抢占仲裁设备，而抢占成功的那组集群中的所有子集群存活，进而保证在出现故障时不同集群的仲裁结果一致，使得存活的组集群能够继续提供服务。

然而，虽然概率较小，但仍有可能出现两个抢占代表均发现所在的组集群内有故障发生而都没有参与抢占行为的情况。因此，优选的，本发明的集群仲裁方法中的步骤102中，所述第一组集群的抢占代表和所述第二组集群的抢占代表分别还执行步骤104。

104、若确定所在的组集群内有故障发生，则检测预置时间内对方组集群是否对仲裁设备抢占成功，若没有，则所述第一集群采用第一预置机制对所述仲裁设备进行抢占；所述第二集群采用第二预置机制对所述仲裁设备进行抢占。

每一个组集群的抢占代表在确定所在的组集群内有故障发生时，在退出抢占行为的同时，还检测预置时间内对方组集群的抢占代表是否对仲裁设备抢占成功。若没有，则表示两个组集群中均有故障发生。因此，所述第一组集群内的第一集群和所述第二组集群内的第一集群采用第一预置机制对所述仲裁设备进行抢占；所述第一组集群内的第二集群和所述第二组集群内的第二集群采用第二预置机制对所述仲裁设备进行抢占。其中，该第一预置机制和第二预置机制分别是第一集群和第二集群原有的仲裁机制，该第一预置机制和第二预置机制可以相同也可以不同。

这样，即使在第一组集群或者第二组集群在无法全部存活的情况下，各集群仍能够尽最大努力保证业务连续。

本实施例中，在出现链路故障或者其他故障，而且第一组集群中的各子集群和第二组集群中的各子集群仍能够分别继续存活的情况下，第一组集群和第二组集群中将由哪个组集群继续提供服务，哪个组集群将“自杀”而停止服务，是决定于哪个组集群的抢占代表对仲裁设备抢占成功。

实际运用中，还可以预先设置在这种情况下由哪个组集群优先存活。例如，可以预先设置第一组集群优先存活，那么在第一组集群的抢占代表和所述第二组集群的抢占代表均对仲裁设备进行抢占时，所述第二组集群的抢占代表进行退让，以确保第一组集群的抢占代表能够成功抢占仲裁设备。

具体举例来说，预置仲裁机制为时间上最先抢占到仲裁设备的为抢占到仲裁设备，那么两个抢占代表队仲裁设备进行抢占时，预先设定第二组集群的抢占代表在确定所在的组集群中没有故障发生后，等待预置时间，然后再去抢占仲裁设备。这样，可以确保第一组集群中的抢占代表最先抢占到仲裁设备。

为便于理解，下面以一个实际应用场景对本发明实施例的集群仲裁方法进行描述。

在双活数据中心中的存储层中，数据中心1和数据中心2分别部署一台VIS6600T，该两台VIS6600T组成一个VIS集群。在双活数据中心中的应用层中设有Oracle RAC集群，其中该Oracle RAC集群的部分节点设于数据中心1处，另一部分节点设于数据中心2处。该两个数据中心的虚拟机服务器还构成一个虚拟机集群，以及该两个数据中心各自的核心交换机构成一个核心交换机集群。双活数据中心内还设有仲裁设备。

双活数据中心的两个数据中心之间采用集群IP心跳链路和FC数据传输网络来传递控制信息、配置信息和数据同步。

双活数据中心预先设置好数据中心1中的VIS集群、Oracle RAC集群、虚拟机集群和核心交换机归属于Group1，数据中心2中的VIS集群、Oracle RAC集群、虚拟机集群和核心交换机归属于Group2。

当集群IP心跳链路出现故障时，数据中心1和2分别将各自中节点号最小的节点选为抢占代表。数据中心1和2的抢占代表分别确定各自所在的数据中心内各集群中是否有故障发生，若其中一个数据中心内的各集群中有故障发生，而另一个数据中心内的各集群中没有故障发生，则没有故障发生的数据中心的抢占代表对仲裁设备进行抢占，且抢占成功。

若两个数据中心内的各集群均没有故障发生，则该两个数据中心的抢占代表中最先抢占到仲裁设备的一个抢占成功，该抢占成功的抢占代表所在的数据中心中各集群继续存活，以使该数据中心继续提供业务服务，而另一个数据中心中的各集群“自杀”，全部停止提供业务服务。

若两个数据中心的抢占代表分别检测到各自所在的数据中心内的各集群中发生故障时，每一个抢占代表还检测预置时间内对方组集群的抢占代表是否对仲裁设备抢占成功，再确定对方没有抢占成功时，该两个数据中心中的VIS集群、Oracle RAC集群、虚拟机集群和核心交换机集群分别采用各自集群原有的仲裁机制对仲裁设备进行抢占。

上面对本发明实施例中的集群仲裁方法进行了描述，下面对本发明实施例中的多集群配合系统进行描述，请参阅图2，本发明实施例中多集群配合系统200包括：

第一组集群201、第二组集群202和仲裁设备203，其中第一组集群201包括第一集群的一部分211和第二集群的一部分221，所述第二组集群202包括所述第一集群的另一部分212和所述第二集群的另一部分222，所述第一集群和所述第二集群互相配合，所述仲裁设备203内设有预置仲裁机制。

所述第一组集群201和第二组集群202分别用于当检测到第一组集群201和第二组集群202内有故障发生时，确定各自的抢占代表；

所述第一组集群201的抢占代表和所述第二组集群202的抢占代表分别用于确定所在的组集群内是否有故障发生；若没有，则对所述仲裁设备203进行抢占，其中根据所述预置仲裁机制对所述仲裁设备抢占成功的抢占代表所在的组集群存活。

优选的，所述仲裁设备203内还设有第一预置机制和第二预置机制；

所述第一组集群201的抢占代表和所述第二组集群202的抢占代表还分别用于当确定所在的组集群内有故障发生时，检测预置时间内对方组集群是否对仲裁设备进行抢占；若没有，则所述第一集群采用所述第一预置机制对所述仲裁设备进行抢占，所述第二集群22采所述用第二预置机制对所述仲裁设备进行抢占。

优选的，所述第二组集群202的抢占代表还用于当所述第一组集群201的抢占代表和所述第二组集群202的抢占代表均对仲裁设备进行抢占时进行退让。

优选的，所述预置仲裁机制为最先抢占到所述仲裁设备的抢占代表对所述仲裁设备抢占成功；所述第二组集群202的抢占代表用于在确定所在的组集群内没有故障发生后间隔预置时间再对所述仲裁设备进行抢占。

优选的，所述多集群配合系统为双活数据中心，其中所述第一组集群位于其中一个数据中心内，所述第二组集群位于另一个数据中心内。

为便于理解，下面以一个实际应用场景对本发明实施例的多集群配合系统进行描述。

本实施例中，多集群配合系统为双活数据中心。在双活数据中心中的存储层中，数据中心1和数据中心2分别部署一台VIS6600T，该两台VIS6600T组成一个VIS集群。在双活数据中心中的应用层中设有Oracle RAC集群，其中该Oracle RAC集群的部分节点设于数据中心1处，另一部分节点设于数据中心2处。该两个数据中心的虚拟机服务器还构成一个虚拟机集群，以及该两个数据中心各自的核心交换机构成一个核心交换机集群。双活数据中心内还设有仲裁设备。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

一种集群仲裁方法，其特征在于，包括：

检测第一组集群或第二组集群中是否有故障发生，其中所述第一组集群包括第一集群的一部分和第二集群的一部分，所述第二组集群包括所述第一集群的另一部分和所述第二集群的另一部分，所述第一集群和所述第二集群互相配合；

当检测到有故障发生时，所述第一组集群和第二组集群分别确定各自的抢占代表，所述第一组集群的抢占代表和所述第二组集群的抢占代表分别执行以下步骤：

确定所在的组集群内是否有故障发生；

若没有，则对仲裁设备进行抢占，其中根据预置仲裁机制对所述仲裁设备抢占成功的抢占代表所在的组集群存活。
根据权利要求1所示的集群仲裁方法，其特征在于，所述第一组集群的抢占代表和所述第二组集群的抢占代表还分别执行以下步骤：

若确定所在的组集群内有故障发生，则检测预置时间内对方组集群是否对仲裁设备进行抢占，若没有，则所述第一集群采用第一预置机制对所述仲裁设备进行抢占；所述第二集群采用第二预置机制对所述仲裁设备进行抢占。
根据权利要求1所示的集群仲裁方法，其特征在于，所述确定所在的组集群内是否有故障发生之后还包括：

当所述第一组集群的抢占代表和所述第二组集群的抢占代表分别确定所在的组集群内没有故障发生时，所述第一组集群的抢占代表和所述第二组集群的抢占代表均对仲裁设备进行抢占，且预置所述第二组集群的抢占代表进行退让。
根据权利要求3所示的集群仲裁方法，其特征在于，所述预置仲裁机制为最先抢占到所述仲裁设备的抢占代表对所述仲裁设备抢占成功；

所述预置所述第二组集群的抢占代表进行退让具体包括：

预置所述第二组集群的抢占代表在确定所在的组集群内没有故障发生后间隔预置时间再对所述仲裁设备进行抢占。
根据权利要求1所述的集群仲裁方法，其特征在于，所述第一组集群和第二组集群位于双活数据中心内，其中所述第一组集群位于其中一个数据中心内，所述第二组集群位于另一个数据中心内。
一种多集群配合系统，其特征在于，包括：

第一组集群、第二组集群和仲裁设备，其中第一组集群包括第一集群的一部分和第二集群的一部分，所述第二组集群包括所述第一集群的另一部分和所述第二集群的另一部分，所述第一集群和所述第二集群互相配合，所述仲裁设备内设有预置仲裁机制；

所述第一组集群和第二组集群分别用于当检测到第一组集群和第二组集群内有故障发生时，确定各自的抢占代表；

所述第一组集群的抢占代表和所述第二组集群的抢占代表分别用于确定所在的组集群内是否有故障发生；若没有，则对所述仲裁设备进行抢占，其中根据所述预置仲裁机制对所述仲裁设备抢占成功的抢占代表所在的组集群存活。
根据权利要求6所述的多集群配合系统，其特征在于，

所述仲裁设备内还设有第一预置机制和第二预置机制；

所述第一组集群的抢占代表和所述第二组集群的抢占代表还分别用于当确定所在的组集群内有故障发生时，检测预置时间内对方组集群是否对仲裁设备进行抢占；若没有，则所述第一集群采用所述第一预置机制对所述仲裁设备进行抢占，所述第二集群采所述用第二预置机制对所述仲裁设备进行抢占。
根据权利要求6所述的多集群配合系统，其特征在于，

所述第二组集群的抢占代表还用于当所述第一组集群的抢占代表和所述第二组集群的抢占代表分别确定所在的组集群内没有故障发生，且所述第一组集群的抢占代表和所述第二组集群的抢占代表均对仲裁设备进行抢占时进行退让。
根据权利要求8所述的多集群配合系统，其特征在于，所述预置仲裁机制为最先抢占到所述仲裁设备的抢占代表对所述仲裁设备抢占成功；

所述第二组集群的抢占代表具体用于在确定所在的组集群内没有故障发生后间隔预置时间再对所述仲裁设备进行抢占。
根据权利要求6所述的多集群配合系统，其特征在于，

所述多集群配合系统为双活数据中心，其中所述第一组集群位于其中一个数据中心内，所述第二组集群位于另一个数据中心内。