CN108055159A - 一种集群节点操作同步方法及装置 - Google Patents
一种集群节点操作同步方法及装置 Download PDFInfo
- Publication number
- CN108055159A CN108055159A CN201711396483.1A CN201711396483A CN108055159A CN 108055159 A CN108055159 A CN 108055159A CN 201711396483 A CN201711396483 A CN 201711396483A CN 108055159 A CN108055159 A CN 108055159A
- Authority
- CN
- China
- Prior art keywords
- node
- operational order
- shutdown
- normal
- clustered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/084—Configuration by using pre-existing information, e.g. using templates or copying from other elements
- H04L41/0846—Configuration by using pre-existing information, e.g. using templates or copying from other elements based on copy from other elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0659—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
- H04L41/0661—Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities by reconfiguring faulty entities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1095—Replication or mirroring of data, e.g. scheduling or transport for data synchronisation between network nodes
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Supply And Distribution Of Alternating Current (AREA)
Abstract
本发明公开了一种集群节点操作同步方法及装置,在主机停机期间,管理节点判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;管理节点向正常节点发送操作指令,并保存停机节点停机期间对应的操作指令;当检测到该停机节点恢复正常,则管理节点将操作指令发送至停机节点。本发明所提供的集群节点操作同步方法及装置,在部分节点停机的情况下,管理节点只向正常节点下发操作,并将停机的主机与操作保存起来,等待主机启动后再下发。这样既满足了节点停机期间整个管理系统的可用性,又保证了节点启动后服务的一致性。
Description
技术领域
本发明涉及服务器集群技术领域,特别是涉及一种集群节点操作同步方法及装置。
背景技术
部署服务器集群,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益。所以许多大的网络服务器都是以集群的方式提供服务,集群主机对外提供一致的服务,所以集群管理中,很多操作都是对集群中所有主机一齐进行的。但是在集群中一个主机意外宕机或计划性停机维护的情况下,管理节点的操作不能顺利下发到这个主机,这样就会导致以下问题:如果集群保持强一致性,就必须等待宕机的主机启动之后才能配置集群,那么在这个主机宕机期间,集群管理系统不可用。如果集群不下发到这个宕机的主机,那么等到这个主机启动后,对外提供的服务就可能与集群中其他主机不一致。
发明内容
本发明的目的是提供一种集群节点操作同步方法及装置,以解决现有集群中主机出现意外宕机或计划性停机维护的情况下,出现系统不可用或服务不一致的情况。
为解决上述技术问题,本发明提供一种集群节点操作同步方法,包括:
在主机停机期间,管理节点判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;
所述管理节点向所述正常节点发送操作指令,并保存所述停机节点停机期间对应的操作指令;
当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点。
可选地,所述当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点包括:
根据所述停机节点对应的标识信息,查询对应节点在停机期间对应的操作指令,其中,所述操作指令按照操作顺序进行存储;
所述管理节点向所述停机节点按照所述操作顺序逐条发送所述操作指令。
可选地,所述标识信息为ID信息。
可选地,所述操作指令包括命令指令和/或配置指令。
本发明还提供了一种集群节点操作同步装置,应用于管理节点,包括:
判断模块,用于在主机停机期间,判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;
操作指令保存模块,用于向所述正常节点发送操作指令,并保存所述停机节点停机期间对应的操作指令;
操作指令发送模块,用于当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点。
可选地,所述操作指令发送模块包括:
查询单元,用于根据所述停机节点对应的标识信息,查询对应节点在停机期间对应的操作指令,其中,所述操作指令按照操作顺序进行存储;
发送单元,用于向所述停机节点按照所述操作顺序逐条发送所述操作指令。
可选地,所述标识信息为ID信息。
可选地,所述操作指令包括命令指令和/或配置指令。
本发明所提供的集群节点操作同步方法及装置,在主机停机期间,管理节点判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;管理节点向正常节点发送操作指令,并保存停机节点停机期间对应的操作指令;当检测到该停机节点恢复正常,则管理节点将操作指令发送至停机节点。本发明所提供的集群节点操作同步方法及装置,在部分节点停机的情况下,管理节点只向正常节点下发操作,并将停机的主机与操作保存起来,等待主机启动后再下发。这样既满足了节点停机期间整个管理系统的可用性,又保证了节点启动后服务的一致性。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的集群节点操作同步方法的一种具体实施方式的流程图;
图2为本发明所提供的集群节点操作同步方法的另一种具体实施方式的流程图;
图3为本发明实施例提供的集群节点操作同步装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所提供的集群节点操作同步方法的一种具体实施方式的流程图如图1所示,该方法包括:
步骤S101:在主机停机期间,管理节点判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;
步骤S102:所述管理节点向所述正常节点发送操作指令,并保存所述停机节点停机期间对应的操作指令;
步骤S103:当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点。
参照图2,本发明实施例中当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点可以具体包括:
步骤S1031:根据所述停机节点对应的标识信息,查询对应节点在停机期间对应的操作指令,其中,所述操作指令按照操作顺序进行存储;
步骤S1032:所述管理节点向所述停机节点按照所述操作顺序逐条发送所述操作指令。
其中,标识信息可以为节点的ID信息。
需要指出的是,本申请实施例中操作指令可以包括命令指令和/或配置指令。
本发明所提供的集群节点操作同步方法,在主机停机期间,管理节点判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;管理节点向正常节点发送操作指令,并保存停机节点停机期间对应的操作指令;当检测到该停机节点恢复正常,则管理节点将操作指令发送至停机节点。本发明所提供的集群节点操作同步方法及装置,在部分节点停机的情况下,管理节点只向正常节点下发操作,并将停机的主机与操作保存起来,等待主机启动后再下发。这样既满足了节点停机期间整个管理系统的可用性,又保证了节点启动后服务的一致性。
下面对本发明所提供的集群节点操作同步方法的另一种具体实施方式进行进一步详细阐述。在本实施例中,主机停机期间,管理节点下发操作主要包含以下几个步骤:识别正常节点和停机节点、向正常节点下发操作、将停机节点ID和此次操作保存起来。检测到停机节点启动后,同步操作主要包括以下步骤:查询出该节点相应的停机期间操作;向该节点逐条顺序下发操作。本发明将节点停机期间的操作按顺序保存,等待节点起来之后再同步,以此保证节点宕机期间系统的可用性和节点重启后系统服务的一致性。
下面对本发明实施例提供的集群节点操作同步装置进行介绍,下文描述的集群节点操作同步装置与上文描述的集群节点操作同步方法可相互对应参照。
图3为本发明实施例提供的集群节点操作同步装置的结构框图,参照图3 集群节点操作同步装置可以包括:
判断模块100,用于在主机停机期间,判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;
操作指令保存模块200,用于向所述正常节点发送操作指令,并保存所述停机节点停机期间对应的操作指令;
操作指令发送模块300,用于当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点。
作为一种具体实施方式,本发明所提供的集群节点操作同步装置中,所述操作指令发送模块可以具体包括:
查询单元,用于根据所述停机节点对应的标识信息,查询对应节点在停机期间对应的操作指令,其中,所述操作指令按照操作顺序进行存储;
发送单元,用于向所述停机节点按照所述操作顺序逐条发送所述操作指令。
其中,所述标识信息为ID信息。
可选地,本发明所提供的集群节点操作同步装置中,所述操作指令包括命令指令和/或配置指令。
本实施例的集群节点操作同步装置用于实现前述的集群节点操作同步方法,因此集群节点操作同步装置中的具体实施方式可见前文中的集群节点操作同步方法的实施例部分,例如,判断模块100,操作指令保存模块200,操作指令发送模块300,分别用于实现上述集群节点操作同步方法中步骤S101, S102,S103,所以,其具体实施方式可以参照相应的各个部分实施例的描述,在此不再赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器 (RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的集群节点操作同步方法以及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (8)
1.一种集群节点操作同步方法,其特征在于,包括:
在主机停机期间,管理节点判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;
所述管理节点向所述正常节点发送操作指令,并保存所述停机节点停机期间对应的操作指令;
当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点。
2.如权利要求1所述的集群节点操作同步方法,其特征在于,所述当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点包括:
根据所述停机节点对应的标识信息,查询对应节点在停机期间对应的操作指令,其中,所述操作指令按照操作顺序进行存储;
所述管理节点向所述停机节点按照所述操作顺序逐条发送所述操作指令。
3.如权利要求2所述的集群节点操作同步方法,其特征在于,所述标识信息为ID信息。
4.如权利要求1至3任一项所述的集群节点操作同步方法,其特征在于,所述操作指令包括命令指令和/或配置指令。
5.一种集群节点操作同步装置,应用于管理节点,其特征在于,包括:
判断模块,用于在主机停机期间,判断集群中的各个节点是否正常工作,以识别出正常节点和停机节点;
操作指令保存模块,用于向所述正常节点发送操作指令,并保存所述停机节点停机期间对应的操作指令;
操作指令发送模块,用于当检测到所述停机节点恢复正常,则所述管理节点将所述操作指令发送至所述停机节点。
6.如权利要求5所述的集群节点操作同步装置,其特征在于,所述操作指令发送模块包括:
查询单元,用于根据所述停机节点对应的标识信息,查询对应节点在停机期间对应的操作指令,其中,所述操作指令按照操作顺序进行存储;
发送单元,用于向所述停机节点按照所述操作顺序逐条发送所述操作指令。
7.如权利要求6所述的集群节点操作同步装置,其特征在于,所述标识信息为ID信息。
8.如权利要求5至7任一项所述的集群节点操作同步装置,其特征在于,所述操作指令包括命令指令和/或配置指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711396483.1A CN108055159A (zh) | 2017-12-21 | 2017-12-21 | 一种集群节点操作同步方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711396483.1A CN108055159A (zh) | 2017-12-21 | 2017-12-21 | 一种集群节点操作同步方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108055159A true CN108055159A (zh) | 2018-05-18 |
Family
ID=62131346
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711396483.1A Pending CN108055159A (zh) | 2017-12-21 | 2017-12-21 | 一种集群节点操作同步方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108055159A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109710586A (zh) * | 2018-12-28 | 2019-05-03 | 北京谷数科技有限公司 | 一种集群节点配置文件同步方法及装置 |
CN110839068A (zh) * | 2019-11-04 | 2020-02-25 | 安超云软件有限公司 | 业务请求处理方法、装置、电子设备及可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159889A (zh) * | 2007-11-09 | 2008-04-09 | 中国移动通信集团广东有限公司 | 一种业务运营支撑备用系统 |
CN102833273A (zh) * | 2011-06-13 | 2012-12-19 | 中兴通讯股份有限公司 | 临时故障时的数据修复方法及分布式缓存系统 |
CN107038088A (zh) * | 2016-09-28 | 2017-08-11 | 阿里巴巴集团控股有限公司 | 一种数据恢复方法和装置 |
US20170249167A1 (en) * | 2016-02-26 | 2017-08-31 | Kabushiki Kaisha Toshiba | Memory device, and information-processing device |
-
2017
- 2017-12-21 CN CN201711396483.1A patent/CN108055159A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101159889A (zh) * | 2007-11-09 | 2008-04-09 | 中国移动通信集团广东有限公司 | 一种业务运营支撑备用系统 |
CN102833273A (zh) * | 2011-06-13 | 2012-12-19 | 中兴通讯股份有限公司 | 临时故障时的数据修复方法及分布式缓存系统 |
US20170249167A1 (en) * | 2016-02-26 | 2017-08-31 | Kabushiki Kaisha Toshiba | Memory device, and information-processing device |
CN107038088A (zh) * | 2016-09-28 | 2017-08-11 | 阿里巴巴集团控股有限公司 | 一种数据恢复方法和装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109710586A (zh) * | 2018-12-28 | 2019-05-03 | 北京谷数科技有限公司 | 一种集群节点配置文件同步方法及装置 |
CN110839068A (zh) * | 2019-11-04 | 2020-02-25 | 安超云软件有限公司 | 业务请求处理方法、装置、电子设备及可读存储介质 |
CN110839068B (zh) * | 2019-11-04 | 2022-02-18 | 安超云软件有限公司 | 业务请求处理方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10509680B2 (en) | Methods, systems and apparatus to perform a workflow in a software defined data center | |
CN101206581B (zh) | 用于使用外部存储设备引导的系统和方法 | |
EP2871553B1 (en) | Systems and methods for protecting virtualized assets | |
US9207929B2 (en) | Integrated system and firmware update method | |
CN106201566B (zh) | 利博伟特软件热升级方法及设备 | |
CN111625401A (zh) | 基于集群文件系统的数据备份方法、装置及可读存储介质 | |
US8245233B2 (en) | Selection of a redundant controller based on resource view | |
CN105337780B (zh) | 一种服务器节点配置方法及物理节点 | |
CN110633175B (zh) | 基于微服务的多机房数据处理方法、电子设备及存储介质 | |
US10229010B2 (en) | Methods for preserving state across a failure and devices thereof | |
CN107656705B (zh) | 一种计算机存储介质和一种数据迁移方法、装置及系统 | |
US20150293719A1 (en) | Storage Space Processing Method and Apparatus, and Non-Volatile Computer Readable Storage Medium | |
US10860375B1 (en) | Singleton coordination in an actor-based system | |
EP3633494A1 (en) | Graceful out-of-band power control of remotely-managed computer systems | |
CN106502797A (zh) | 一种集群系统及集群系统的部署方法 | |
CN105357042A (zh) | 一种高可用集群系统及其主节点和从节点 | |
CN103973470A (zh) | 用于无共享集群的集群管理方法和设备 | |
CN103324582A (zh) | 一种内存迁移方法、装置及设备 | |
CN109271172A (zh) | 一种swarm集群的宿主机性能扩展方法及装置 | |
CN117130730A (zh) | 面向联邦Kubernetes集群的元数据管理方法 | |
CN108055159A (zh) | 一种集群节点操作同步方法及装置 | |
CN107623705B (zh) | 基于视频云存储系统的存储模式升级方法、装置和系统 | |
CN108984602B (zh) | 一种数据库控制方法和数据库系统 | |
JP2008310591A (ja) | クラスタシステム、計算機、および障害回復方法 | |
CN109032765A (zh) | 一种虚拟机双机热备部署方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180518 |
|
RJ01 | Rejection of invention patent application after publication |