CN113938382A - 基于pacemaker的集群管理方法、系统及存储介质 - Google Patents

基于pacemaker的集群管理方法、系统及存储介质 Download PDF

Info

Publication number
CN113938382A
CN113938382A CN202111203810.3A CN202111203810A CN113938382A CN 113938382 A CN113938382 A CN 113938382A CN 202111203810 A CN202111203810 A CN 202111203810A CN 113938382 A CN113938382 A CN 113938382A
Authority
CN
China
Prior art keywords
node
cluster
placemaker
management
service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111203810.3A
Other languages
English (en)
Other versions
CN113938382B (zh
Inventor
巩立新
何枭
邵欢
彭勇
申锟铠
刘文清
杨涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Qilin Xin'an Technology Co Ltd
Original Assignee
Hunan Qilin Xin'an Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Qilin Xin'an Technology Co Ltd filed Critical Hunan Qilin Xin'an Technology Co Ltd
Priority to CN202111203810.3A priority Critical patent/CN113938382B/zh
Publication of CN113938382A publication Critical patent/CN113938382A/zh
Application granted granted Critical
Publication of CN113938382B publication Critical patent/CN113938382B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0813Configuration setting characterised by the conditions triggering a change of settings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/02Network architectures or network communication protocols for network security for separating internal from external traffic, e.g. firewalls
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer And Data Communications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于pacemaker的集群管理方法、系统及计算机可读存储介质。支持通过web页面创建pacemaker集群、集群添加节点和删除节点、启动和停止集群节点服务、修改指定节点信息,pacemaker集群管理仅需在任意一个节点的web页面进行管理操作,web后端通过ansible等服务器系统远程运维工具远程操作其他节点,能够做到所有节点同时修改。

Description

基于pacemaker的集群管理方法、系统及存储介质
技术领域
本发明涉及计算机安全技术领域,尤其涉及一种基于pacemaker的集群管理方法、系统及计算机可读存储介质。
背景技术
目前基于pacemaker搭建的集群的运维方式主要是运维人员在Linux后台手动操作或者编写脚本操作。部分集群管理功能涉及到的操作步骤较多,手动操作有可能导致误操作。使用执行脚本的方式需要传入复杂的参数,对运维人员IT技术和业务能力要求较高。相比web页面操作,执行脚本的参数解析不够直观,可能导致传递错误参数,影响集群管理的最终结果。
目前pacemaker工具官方只支持基础集群管理命令,部分集群管理功能涉及到的命令数量多且复杂,手动执行操作繁琐,容易漏掉命令或者执行顺序错误,导致集群环境错乱。并且pacemaker工具官方集群管理命令只支持部分集群管理命令,无法完全满足运维人员的集群管理需求。
一般pacemaker集群搭建需要先对每台服务器进行基础网络环境配置,包括IP配置、主机名配置、远程管理卡配置、防火墙配置、路由配置、dns配置等。每台服务器手动配置基础网络环境的工作量很大,浪费人力资源和时间,并且容易发生手误操作,最终导致集群网络环境异常和集群无法正常启动。
现有pacemaker集群的部分管理命令需要依次登录所有服务器节点执行操作命令,为运维人员管理集群带来了很大的不便,导致集群管理过程复杂繁琐,因此容易漏掉个别机器的命令执行,并且集群管理的速度较慢。
有鉴于此,有必要引入一种新的基于pacemaker的集群管理方法,以解决上述技术问题。
发明内容
本发明的主要目的在于提供一种基于pacemaker的集群管理方法、系统及计算机可读存储介质,以解决上述的技术问题。
为实现上述目的,本发明提供的一种基于pacemaker的集群管理方法,包括步骤:
步骤S1,基于服务器系统远程运维工具,选择局域网内任意一个节点的web页面,在所述web页面录入局域网内欲进行集群组建的每台服务器的节点信息;其中,每台所述服务器的节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;
步骤S2,通过firewall-cmd命令配置防火墙规则,所述防火墙规则包括节点间端口可相互访问、外部可访问端口的规则;
步骤S3,通过修改/etc/hostname进行文件主机名配置,然后重启systemd-hostnamed服务使设置生效;
步骤S4,通过ipmitool命令配置所有节点的远程管理卡信息,其中,所述远程管理卡信息信息包括管理IP、子网掩码和网关;
步骤S5,所述web页面访问的当前节点进行pacemaker配置,创建并启动pacemaker集群。
进一步的,所述步骤S5包括:
执行pcs相关命令创建pacemaker集群,然后执行pcs相关命令启动pacemaker集群;
在当前节点增加所有节点的fence设备信息,fence设备IP信息使用远程管理卡配置的管理IP;
使用pcs相关命令配置fence设备信息,所述fence设备信息包括管理IP、账号和密码,其中,fence设备的账号和密码信息无需web前端填写,由后端统一设置固定值;
创建pacemaker集群的所有托管服务,其中,所述托管服务包括用于定时检查业务IP是否可以正常访问心跳检测IP的创建ping资源服务,etcd服务,ldirectord服务,或者自定义的systemd管理服务。
进一步的,还包括在所述pacemaker集群添加新节点的操作,具体包括:
步骤S21,选择局域网内任意一个节点的web页面,在所述web页面录入内欲进行添加的新节点的节点信息;其中,所述新节点的节点信息节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;
步骤S22,更新所述web页面所在的当前节点的防火墙规则,将所述新节点的业务IP加入到集群节点间端口开放IP列表,然后将该节点最新的防火墙规则配置文件同步到其他所有节点,并重新加载防火墙服务使修改生效;
步骤S23,更新主机名配置:通过所述web页面远程设置新节点主机名,更新本机主机名解析文件,增加新节点主机名和业务IP的对应关系,最后同步/etc/hosts文件到其他节点的相同目录下;
步骤S24,通过所述web页面远程通过ipmitool命令设置所述新节点的远程管理卡信息;
步骤S25,在所述web页面所在的当前节点使用pcs相关命令增加新的fence设备信息;
步骤S26,在所述web页面所在的当前节点使用pcs相关命令增加新节点信息至pacemaker集群中。
进一步的,还包括在所述pacemaker集群删除已有节点的操作,具体包括:
步骤S27,选择局域网内任意一个节点的web页面,在所述web页面录入内欲进行删除的已有节点的节点信息;其中,所述欲进行删除的已有节点不是所述web页面所在的当前节点;
步骤S28,在所述web页面所在的当前节点使用pcs相关命令删除欲进行删除的已有节点的fence设备信息;
步骤S29,在所述web页面所在的当前节点使用pcs相关命令从pacemaker集群中删除欲进行删除的已有节点信息。
进一步的,还包括在所述pacemaker集群停止已有节点的操作,具体包括:
步骤S31,选择局域网内任意一个节点的web页面,在所述web页面确定待停止的节点的节点信息;
步骤S32,执行pcs相关命令,将所述pacemaker集群内剩余的节点组成新的集群对外提供服务。
进一步的,还包括在所述pacemaker集群启动已有节点的操作,具体包括步骤:
步骤S33,在被停止的所述节点的web页面确定再次启动功能;
步骤S34,执行pcs相关命令,将被停止的所述节点的节点信息增加至pacemaker集群中。
进一步的,还包括在所述pacemaker集群修改已有节点的操作,具体包括步骤:
步骤S41,选择局域网内任意一个节点的web页面,在所述web页面录入待修改节点的节点信息,所述待修改节点信息包括业务IP、管理IP和主机名信息中的一个或者多个;
步骤S42,执行pcs相关命令停止所述pacemaker集群中全部节点,并完成所有待修改的节点信息的修改后,执行启动所述pacemaker集群中全部节点的命令。
进一步的,所述步骤S42包括:
步骤S421,更新待修改的节点的业务IP,修改待修改的节点的网卡上的业务IP,对所有节点执行更新主机名解析文件,对所有节点执行更新防火墙规则以增加修改后的业务IP到开放IP列表;
步骤S422,修改待修改的节点的远程管理卡的IP地址,更新所述pacemaker集群的fence设备配置信息;
步骤S423,对所有节点执行修改主机名解析文件中主机名信息,更新所述pacemaker集群中待修改节点的主机名,修改待修改节点的主机名信息;
步骤S424,执行启动所述pacemaker集群中全部节点的命令。
本发明还提供一种基于pacemaker的集群管理系统,其特征在于,包括多个服务器,所述服务器上运行有计算机程序,所述计算机程序被执行时,实现如上任一项所述的基于pacemaker的集群管理方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的基于pacemaker的集群管理方法的步骤。
在本发明的技术方案中的通过步骤S1,基于服务器系统远程运维工具,选择局域网内任意一个节点的web页面,在所述web页面录入局域网内欲进行集群组建的每台服务器的节点信息;其中,每台所述服务器的节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;步骤S2,通过firewall-cmd命令配置防火墙规则,所述防火墙规则包括节点间端口可相互访问、外部可访问端口的规则;步骤S3,通过修改/etc/hostname进行文件主机名配置,然后重启systemd-hostnamed服务使设置生效;步骤S4,通过ipmitool命令配置所有节点的远程管理卡信息,其中,所述远程管理卡信息信息包括管理IP、子网掩码和网关;步骤S5,所述web页面访问的当前节点进行pacemaker配置,创建并启动pacemaker集群。pacemaker集群管理仅需在任意一个节点的web页面进行管理操作,web后端通过ansible等服务器系统远程运维工具远程操作其他节点,能够做到所有节点同时修改。本发明方法的集群管理主要功能点包括集群创建、节点启动和停止、节点添加和删除、修改节点配置信息等四种功能。
附图说明
图1为本发明一实施例中的基于pacemaker的集群管理方法的流程图;
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
请参考图1,为实现上述目的,本发明的一实施例中提供的基于pacemaker的集群管理系统及方法。pacemaker集群内服务器的操作系统环境可以为Red Hat EnterpriseLinux 8,集群内服务器台数要求为1台以上,每台服务器至少安装1个网卡和1个远程管理卡,运维人员需要提前连接网线,保证集群所有服务器在一个局域网内,然后将所有服务器开机,等待操作系统和内置的集群管理web系统初始化完成。每台服务器需要在创建pacemaker集群前预先设置业务IP,要求保证业务IP之间可以通过SSH协议相互访问。最后确认使用业务IP可以访问集群管理的web页面,即完成集群管理前的环境准备。
所述基于pacemaker的集群管理方法包括步骤:
步骤S1,基于服务器系统远程运维工具,选择局域网内任意一个节点的web页面,在所述web页面录入局域网内欲进行集群组建的每台服务器的节点信息;其中,每台所述服务器的节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;
步骤S2,通过firewall-cmd命令配置防火墙规则,所述防火墙规则包括节点间端口可相互访问、外部可访问端口的规则;
步骤S3,通过修改/etc/hostname进行文件主机名配置,然后重启systemd-hostnamed服务使设置生效;
步骤S4,通过ipmitool命令配置所有节点的远程管理卡信息,其中,所述远程管理卡信息信息包括管理IP、子网掩码和网关;
步骤S5,所述web页面访问的当前节点进行pacemaker配置,创建并启动pacemaker集群。
进一步的,所述步骤S5包括:
执行pcs相关命令创建pacemaker集群,然后执行pcs相关命令启动pacemaker集群;
在当前节点增加所有节点的fence设备信息,fence设备IP信息使用远程管理卡配置的管理IP;
使用pcs相关命令配置fence设备信息,所述fence设备信息包括管理IP、账号和密码,其中,fence设备的账号和密码信息无需web前端填写,由后端统一设置固定值;
创建pacemaker集群的所有托管服务,其中,所述托管服务包括用于定时检查业务IP是否可以正常访问心跳检测IP的创建ping资源服务,etcd服务,ldirectord服务,或者自定义的systemd管理服务。
在一具体的实施例中,步骤S1~S5包括:防火墙配置集群节点间端口可相互访问使用“firewall-cmd--permanent--ipset=public--add-entry={节点业务IP}”命令操作,其中命令{}处参数需要替换成真实的信息,本文档后面的命令也需要做相应替换,后面不在赘述。防火墙配置端口外部可访问使用“firewall-cmd--permanent--add-port={端口号}/{协议}”命令。远程管理卡配置使用命令包括“ipmitool lan set 1ipaddr{管理IP}”、“ipmitool lan set 1netmask{子网掩码}”和“ipmitool lan set 1defgw ipaddr{网关}”。创建集群使用“pcs cluster setup--force{集群名称}[{主机名}addr={业务IP}]”命令操作,参数支持配置多个节点信息。启动集群使用“pcs cluster start--all”命令操作。增加fence设备使用“pcs stonith create{fence设备名称}fence_ipmilanipaddr={管理IP}login={账号}passwd={密码}”命令操作,fence设备名称的格式为“fence-”和主机名拼接。
进一步的,还包括在所述pacemaker集群添加新节点的操作,具体包括:
步骤S21,选择局域网内任意一个节点的web页面,在所述web页面录入内欲进行添加的新节点的节点信息;其中,所述新节点的节点信息节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;
步骤S22,更新所述web页面所在的当前节点的防火墙规则,将所述新节点的业务IP加入到集群节点间端口开放IP列表,然后将该节点最新的防火墙规则配置文件同步到其他所有节点,并重新加载防火墙服务使修改生效;
步骤S23,更新主机名配置:通过所述web页面远程设置新节点主机名,更新本机主机名解析文件,增加新节点主机名和业务IP的对应关系,最后同步/etc/hosts文件到其他节点的相同目录下;
步骤S24,通过所述web页面远程通过ipmitool命令设置所述新节点的远程管理卡信息;
步骤S25,在所述web页面所在的当前节点使用pcs相关命令增加新的fence设备信息;
步骤S26,在所述web页面所在的当前节点使用pcs相关命令增加新节点信息至pacemaker集群中。
进一步的,还包括在所述pacemaker集群删除已有节点的操作,具体包括:
步骤S27,选择局域网内任意一个节点的web页面,在所述web页面录入内欲进行删除的已有节点的节点信息;其中,所述欲进行删除的已有节点不是所述web页面所在的当前节点;
步骤S28,在所述web页面所在的当前节点使用pcs相关命令删除欲进行删除的已有节点的fence设备信息;
步骤S29,在所述web页面所在的当前节点使用pcs相关命令从pacemaker集群中删除欲进行删除的已有节点信息。
在一具体的示例中,步骤S21~S29包括:同步防火墙规则需要将配置文件/etc/firewalld/zones/public.xml和/etc/firewalld/ipsets/public.xml同步到其他节点相同目录下,然后重新加载其他节点防火墙服务使修改生效。增加新节点使用“pcs clusternode add{新节点主机名}{新节点业务IP地址}”命令操作。删除fence设备使用“pcsresource delete{fence资源名称}--force”命令操作。集群删除节点使用“pcs clusternode delete{待删除节点主机名}--skip-offline--force”命令操作。
进一步的,还包括在所述pacemaker集群停止已有节点的操作,具体包括:
步骤S31,选择局域网内任意一个节点的web页面,在所述web页面确定待停止的节点的节点信息;
步骤S32,执行pcs相关命令,将所述pacemaker集群内剩余的节点组成新的集群对外提供服务。
进一步的,还包括在所述pacemaker集群启动已有节点的操作,具体包括步骤:
步骤S33,在被停止的所述节点的web页面确定再次启动功能;
步骤S34,执行pcs相关命令,将被停止的所述节点的节点信息增加至pacemaker集群中。
具体的,集群节点启动和停止功能。支持通过web页面启动和停止当前节点的集群服务或者所有节点的集群服务。启动和停止操作立即生效,剩余正常启动状态的节点组成一个新集群可以正常对外提供服务。集群停止当前节点功能,会将当前节点从集群中移除,并将当前节点托管的所有服务停止。集群启动当前节点功能,会将当前节点加入集群,并将当前节点托管的所有服务启动。启动和停止功能web后端仅需要执行一个启动或者停止命令即可。
在一具体实例中,所述步骤S31-S34包括:启动集群所有节点使用“pcs clusterstart--all”命令操作,仅启动当前节点使用“pcs cluster start”命令操作。停止集群所有节点使用“pcs cluster stop--all--force”命令操作,仅停止当前节点使用“pcscluster stop--force”命令操作。
进一步的,还包括在所述pacemaker集群修改已有节点的操作,具体包括步骤:
步骤S41,选择局域网内任意一个节点的web页面,在所述web页面录入待修改节点的节点信息,所述待修改节点信息包括业务IP、管理IP和主机名信息中的一个或者多个;
步骤S42,执行pcs相关命令停止所述pacemaker集群中全部节点,并完成所有待修改的节点信息的修改后,执行启动所述pacemaker集群中全部节点的命令。
具体的,修改节点信息。支持通过web页面修改节点业务IP、管理IP和主机名信息,修改可选择修改一项或者同时修改多项信息。修改节点信息功能的web后端流程包括,依次判断是否需要修改指定项,如果需要修改则执行右侧对应步骤,修改完一项之后,按顺序开始进行下一项修改,直至所有信息修改完成。修改节点信息前需要执行集群全部节点停止命令,防止修改节点信息的过程中产生脏数据影响集群正常使用。等待节点信息全部修改完成后,再执行集群全部节点启动命令。
进一步的,所述步骤S42修改节点信息包括:
步骤S421,更新待修改的节点的业务IP,修改待修改的节点的网卡上的业务IP,对所有节点执行更新主机名解析文件,对所有节点执行更新防火墙规则以增加修改后的业务IP到开放IP列表;
步骤S422,修改待修改的节点的远程管理卡的IP地址,更新所述pacemaker集群的fence设备配置信息;
步骤S423,对所有节点执行修改主机名解析文件中主机名信息,更新所述pacemaker集群中待修改节点的主机名,修改待修改节点的主机名信息;
步骤S424,执行启动所述pacemaker集群中全部节点的命令。
在一具体的示例中,步骤S41~S42包括:修改网卡IP使用“nmcli connectionmodify{网卡名称}ipv4.addr{业务IP}/{掩码长度}”命令操作。更新主机名解析文件的方法为替换/etc/hosts里面旧的主机名解析信息,使用“sed-i's/{旧的业务IP}/{新的业务IP}/g'/etc/hosts”命令操作。
更新节点业务IP的方法为使用sed命令将/etc/corosync/corosync.conf配置文件中旧的业务IP替换为新的业务IP,然后执行“pcs cluster sync corosync”命令将corosync服务配置同步到集群所有节点。更新集群中fence设备信息的方法为替换/opt/pacemaker/cib/cib.xml中旧的fence信息,然后使用“cibadmin-x/opt/pacemaker/cib/cib.xml-5”命令生成配置文件的MD5值,存储到/opt/pacemaker/cib/cib.xml.sig文件。
更新集群中节点主机名首先更新/opt/pacemaker/cib/cib.xml中的旧主机名为新主机名,然后使用“cibadmin-x/opt/pacemaker/cib/cib.xml-5”命令生成配置文件的MD5值,存储到/opt/pacemaker/cib/cib.xml.sig文件。然后更新/etc/corosync/corosync.conf配置文件中的主机名信息,执行“pcs cluster sync corosync”命令将corosync服务配置同步到集群所有节点。
本发明技术方案中的通过步骤S1,基于服务器系统远程运维工具,选择局域网内任意一个节点的web页面,在所述web页面录入局域网内欲进行集群组建的每台服务器的节点信息;其中,每台所述服务器的节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;步骤S2,通过firewall-cmd命令配置防火墙规则,所述防火墙规则包括节点间端口可相互访问、外部可访问端口的规则;步骤S3,通过修改/etc/hostname进行文件主机名配置,然后重启systemd-hostnamed服务使设置生效;步骤S4,通过ipmitool命令配置所有节点的远程管理卡信息,其中,所述远程管理卡信息信息包括管理IP、子网掩码和网关;步骤S5,所述web页面访问的当前节点进行pacemaker配置,创建并启动pacemaker集群。pacemaker集群管理仅需在任意一个节点的web页面进行管理操作,web后端通过ansible等服务器系统远程运维工具远程操作其他节点,能够做到所有节点同时修改。本发明方法的集群管理主要功能点包括集群创建、节点启动和停止、节点添加和删除、修改节点配置信息等四种功能。
一、支持通过web页面创建pacemaker集群、集群添加节点和删除节点、启动和停止集群节点服务、修改指定节点信息等四种功能。避免通过Linux后台手动修改可能产生的误操作,并降低运维人员的学习成本,提升集群管理的效率。
二、web后端封装pacemaker相关运维管理命令和配置文件修改动作,将一组运维命令打包成web页面的一个功能。对于pacemaker不支持的集群管理命令,通过底层多个命令实现,扩展pacemaker官方不支持的集群运维管理功能。提升运维人员管理集群效率,解决部分pacemaker集群管理难题。
三、在pacemaker集群基本管理的同时进行集群基础网络管理,包括IP配置、防火墙配置和远程管理卡配置。支持自动化实现集群网络配置,避免手动网络配置可能存在的误操作隐患,保证网络配置的准确性。同时避免逐台登录服务器进行网络配置的繁琐流程,节省网络配置时间。
四、任意选择一个集群节点打开web管理页面,即可对所有集群节点进行管理操作。web后端使用ansible工具执行管理命令,可在集群任意节点使用命令远程操作其他节点,避免登录所有服务器节点管理集群,提升运维人员工作效率。
此外,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
示例性的,计算机可读存储介质的计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
在本说明书的描述中,参考术语“一实施例”、“另一实施例”、“其他实施例”、或“第一实施例~第X实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料、方法步骤或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于pacemaker的集群管理方法,其特征在于,包括步骤:
步骤S1,基于服务器系统远程运维工具,选择局域网内任意一个节点的web页面,在所述web页面录入局域网内欲进行集群组建的每台服务器的节点信息;其中,每台所述服务器的节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;
步骤S2,通过firewall-cmd命令配置防火墙规则,所述防火墙规则包括节点间端口可相互访问、外部可访问端口的规则;
步骤S3,通过修改/etc/hostname进行文件主机名配置,然后重启systemd-hostnamed服务使设置生效;
步骤S4,通过ipmitool命令配置所有节点的远程管理卡信息,其中,所述远程管理卡信息信息包括管理IP、子网掩码和网关;
步骤S5,所述web页面访问的当前节点进行pacemaker配置,创建并启动pacemaker集群。
2.根据权利要求1所述的方法,其特征在于,所述步骤S5包括:
执行pcs相关命令创建pacemaker集群,然后执行pcs相关命令启动pacemaker集群;
在当前节点增加所有节点的fence设备信息,fence设备IP信息使用远程管理卡配置的管理IP;
使用pcs相关命令配置fence设备信息,所述fence设备信息包括管理IP、账号和密码,其中,fence设备的账号和密码信息无需web前端填写,由后端统一设置固定值;
创建pacemaker集群的所有托管服务,其中,所述托管服务包括用于定时检查业务IP是否可以正常访问心跳检测IP的创建ping资源服务,etcd服务,ldirectord服务,或者自定义的systemd管理服务。
3.根据权利要求2所述的方法,其特征在于,还包括在所述pacemaker集群添加新节点的操作,具体包括:
步骤S21,选择局域网内任意一个节点的web页面,在所述web页面录入内欲进行添加的新节点的节点信息;其中,所述新节点的节点信息节点信息包括:主机名、业务IP、业务IP的子网掩码、业务IP的网关、管理IP、管理IP的子网掩码、管理IP的网关和心跳检测IP;
步骤S22,更新所述web页面所在的当前节点的防火墙规则,将所述新节点的业务IP加入到集群节点间端口开放IP列表,然后将该节点最新的防火墙规则配置文件同步到其他所有节点,并重新加载防火墙服务使修改生效;
步骤S23,更新主机名配置:通过所述web页面远程设置新节点主机名,更新本机主机名解析文件,增加新节点主机名和业务IP的对应关系,最后同步/etc/hosts文件到其他节点的相同目录下;
步骤S24,通过所述web页面远程通过ipmitool命令设置所述新节点的远程管理卡信息;
步骤S25,在所述web页面所在的当前节点使用pcs相关命令增加新的fence设备信息;
步骤S26,在所述web页面所在的当前节点使用pcs相关命令增加新节点信息至pacemaker集群中。
4.根据权利要求2所述的方法,其特征在于,还包括在所述pacemaker集群删除已有节点的操作,具体包括:
步骤S27,选择局域网内任意一个节点的web页面,在所述web页面录入内欲进行删除的已有节点的节点信息;其中,所述欲进行删除的已有节点不是所述web页面所在的当前节点;
步骤S28,在所述web页面所在的当前节点使用pcs相关命令删除欲进行删除的已有节点的fence设备信息;
步骤S29,在所述web页面所在的当前节点使用pcs相关命令从pacemaker集群中删除欲进行删除的已有节点信息。
5.根据权利要求1,2所述的方法,其特征在于,还包括在所述pacemaker集群停止已有节点的操作,具体包括:
步骤S31,选择局域网内任意一个节点的web页面,在所述web页面确定待停止的节点的节点信息;
步骤S32,执行pcs相关命令,将所述pacemaker集群内剩余的节点组成新的集群对外提供服务。
6.根据权利要求5所述的方法,其特征在于,还包括在所述pacemaker集群启动已有节点的操作,具体包括步骤:
步骤S33,在被停止的所述节点的web页面确定再次启动功能;
步骤S34,执行pcs相关命令,将被停止的所述节点的节点信息增加至pacemaker集群中。
7.根据权利要求1或2所述的方法创建的pacemaker集群,基于所述集群的管理其特征在于,还包括在所述pacemaker集群修改已有节点的操作,具体包括步骤:
步骤S41,选择局域网内任意一个节点的web页面,在所述web页面录入待修改节点的节点信息,所述待修改节点信息包括业务IP、管理IP和主机名信息中的一个或者多个;
步骤S42,执行pcs相关命令停止所述pacemaker集群中全部节点,并完成所有待修改的节点信息的修改后,执行启动所述pacemaker集群中全部节点的命令。
8.根据权利要求7所述的方法,其特征在于,所述步骤S42包括:
步骤S421,更新待修改的节点的业务IP,修改待修改的节点的网卡上的业务IP,对所有节点执行更新主机名解析文件,对所有节点执行更新防火墙规则以增加修改后的业务IP到开放IP列表;
步骤S422,修改待修改的节点的远程管理卡的IP地址,更新所述pacemaker集群的fence设备配置信息;
步骤S423,对所有节点执行修改主机名解析文件中主机名信息,更新所述pacemaker集群中待修改节点的主机名,修改待修改节点的主机名信息。
9.一种基于pacemaker的集群管理系统,其特征在于,包括多个服务器,所述服务器上运行有计算机程序,所述计算机程序被执行时,实现如权利要求1至8任一项所述的基于pacemaker的集群管理方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的基于pacemaker的集群管理方法的步骤。
CN202111203810.3A 2021-10-15 2021-10-15 基于pacemaker的集群管理方法、系统及存储介质 Active CN113938382B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111203810.3A CN113938382B (zh) 2021-10-15 2021-10-15 基于pacemaker的集群管理方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111203810.3A CN113938382B (zh) 2021-10-15 2021-10-15 基于pacemaker的集群管理方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN113938382A true CN113938382A (zh) 2022-01-14
CN113938382B CN113938382B (zh) 2024-01-23

Family

ID=79279942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111203810.3A Active CN113938382B (zh) 2021-10-15 2021-10-15 基于pacemaker的集群管理方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113938382B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010156A (zh) * 2023-03-24 2023-04-25 摩尔线程智能科技(北京)有限责任公司 异常处理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090292340A1 (en) * 2008-05-22 2009-11-26 William Mass Regulatory Compliant Transmission of Medical Data Employing a Patient Implantable Medical Device and a Generic Network Access Device
WO2017162173A1 (zh) * 2016-03-22 2017-09-28 中兴通讯股份有限公司 云服务器集群建立连接的方法和装置
JP2020087147A (ja) * 2018-11-29 2020-06-04 株式会社リコー 情報処理装置、遠隔機器管理システム、通信方法およびプログラム
CN113347049A (zh) * 2021-08-04 2021-09-03 统信软件技术有限公司 一种服务器集群部署方法、装置、计算设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090292340A1 (en) * 2008-05-22 2009-11-26 William Mass Regulatory Compliant Transmission of Medical Data Employing a Patient Implantable Medical Device and a Generic Network Access Device
WO2017162173A1 (zh) * 2016-03-22 2017-09-28 中兴通讯股份有限公司 云服务器集群建立连接的方法和装置
JP2020087147A (ja) * 2018-11-29 2020-06-04 株式会社リコー 情報処理装置、遠隔機器管理システム、通信方法およびプログラム
CN113347049A (zh) * 2021-08-04 2021-09-03 统信软件技术有限公司 一种服务器集群部署方法、装置、计算设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KENNITH CHANG: "如何在CentOS 7上使用Pacemaker配置NFS服务器集群", Retrieved from the Internet <URL:https://blog.csdn.net/allway2/article/details/103112121?ops_request_misc=&request_id=&biz_id=102&utm_term=pacemaker%20firewall-cmd&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-6-103112121.142^v96^pc_search_result_base7&spm=1018.2226.3001.4187> *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116010156A (zh) * 2023-03-24 2023-04-25 摩尔线程智能科技(北京)有限责任公司 异常处理系统
CN116010156B (zh) * 2023-03-24 2024-06-04 摩尔线程智能科技(北京)有限责任公司 异常处理系统

Also Published As

Publication number Publication date
CN113938382B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
US8601466B2 (en) Software deployment method and system, software deployment server and user server
CN107291525B (zh) 一种部署虚拟机的方法、宿主机及系统
CN112491606B (zh) 一种基于ansible的自动化部署业务系统高可用集群的方法
US8713177B2 (en) Remote management of networked systems using secure modular platform
CN109995594B (zh) 区块链网络资源管理方法、装置及区块链系统
US6026438A (en) Dynamic workstation configuration processor
US8290998B2 (en) Systems and methods for generating cloud computing landscapes
CN107222320A (zh) 云服务器集群建立高可用连接的方法和装置
CN111538625B (zh) 基于Docker技术的Ambari集群部署、数据备份方法及电子设备
US7831959B1 (en) Method and apparatus to manage configuration for multiple file server appliances
US8463758B2 (en) Network registry and file cleaner
US11144292B2 (en) Packaging support system and packaging support method
CN102591679A (zh) 一种集群系统应用软件快速部署方法
CN102567075A (zh) 一种云计算环境中虚拟机上下文设置方法
TW201434300A (zh) 跨越叢集邊界的服務遷移
JP2009514283A (ja) ネットワーク構成
CN110138876A (zh) 任务部署方法、装置、设备及平台
CN115604120B (zh) 一种多云集群资源共享方法、装置、设备及存储介质
CN107766055A (zh) 一种基于GUI模块的客户端Linux系统安装方法
CN110134489A (zh) 应用迁移方法及装置、系统、存储介质、应用上云工具
CN112114746A (zh) 一种分布式存储集群的自动化部署方法
CN113938382B (zh) 基于pacemaker的集群管理方法、系统及存储介质
CN115051846A (zh) 基于超融合平台的k8s集群的部署方法及电子设备
CN116760913B (zh) k8s集群协议转换平台配置下发方法及系统
CN117632507A (zh) 一种冗余数据删除方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant