CN112667353A - 一种解决postgresql高可用节点宕机恢复的方法 - Google Patents

一种解决postgresql高可用节点宕机恢复的方法 Download PDF

Info

Publication number
CN112667353A
CN112667353A CN202011584639.0A CN202011584639A CN112667353A CN 112667353 A CN112667353 A CN 112667353A CN 202011584639 A CN202011584639 A CN 202011584639A CN 112667353 A CN112667353 A CN 112667353A
Authority
CN
China
Prior art keywords
node
postgresql
downtime
cloud database
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011584639.0A
Other languages
English (en)
Inventor
秦贞远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unicloud Technology Co Ltd
Original Assignee
Unicloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unicloud Technology Co Ltd filed Critical Unicloud Technology Co Ltd
Priority to CN202011584639.0A priority Critical patent/CN112667353A/zh
Publication of CN112667353A publication Critical patent/CN112667353A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本发明提供了一种解决postgresql高可用节点宕机恢复的方法,包括:监控节点系统,采用轮询机制对postgresql的节点进行监控;云数据库管理系统,用于负责决策替换节点的功能。本发明所述的解决postgresql高可用节点宕机恢复的方法实现了云数据库postgresql产品节点宕机完全自动化替换节点的功能。

Description

一种解决postgresql高可用节点宕机恢复的方法
技术领域
本发明属于资源管理技术领域,尤其是涉及一种解决postgresql高可用节点宕机恢复的方法。
背景技术
本发明技术方案主要解决现有的云场景postgresql高可用架构下,从节点宕机不可用的问题,postgresql高可用架构一般有两节点,分为主节点、从节点。运行过程中出现节点宕机情况,一般的解决办法只能报警通知人工解决,手工拉起或替换节点。本发明采用一种监控并完全自动化替换节点的方法解决出现的节点宕机问题。
发明内容
有鉴于此,本发明旨在提出一种解决postgresql高可用节点宕机恢复的方法,以解决现有的云场景postgresql高可用架构下,从节点宕机不可用的问题。
为达到上述目的,本发明的技术方案是这样实现的:
一种解决postgresql高可用节点宕机恢复的方法,包括:
监控节点系统,采用轮询机制对postgresql的节点进行监控;
云数据库管理系统,用于负责决策替换节点的功能。
进一步的,所述监控节点系统的执行策略如下:
A1、采用轮询机制,每分钟对集群进行状态监测;
A2、当发现节点连接有问题时,改为每隔30s对节点进行三次重试连接;如果依旧连不上,则通知云数据库系统问题节点,将节点实例ID与ip地址传递给云数据库系统。
进一步的,云数据库系统的执行策略如下:
B1、接收到监控系统的宕机节点通知,通过实例ID和ip查询宕机节点的规格信息;
B2、申请同规格的主机,通过postgresql同版本的镜像拉起虚机,并拷贝主节点的互信认证信息到新的虚机节点;
B3、利用postgresql集群管理工具repmgr,指向主节点ip,通过命令同步克隆主节点所有数据;
B4、与主节点建立主从关系,新节点注册为新从节点;
B5、剔除原从节点,并回收主机。
相对于现有技术,本发明所述的解决postgresql高可用节点宕机恢复的方法具有以下优势:
本发明提供的解决postgresql高可用节点宕机恢复的方法实现了云数据库postgresql产品节点宕机完全自动化替换节点的功能;并且功能架构精简,响应迅速。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为解决postgresql高可用节点宕机恢复的方法原理框图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面将参考附图并结合实施例来详细说明本发明。
本实施例提供了一种解决postgresql高可用节点宕机恢复的方法,共分两部分系统,一部分为监控节点系统,另一部分是云数据库管理系统,监控节点系统采用轮询机制,对postgresql的节点进行监控;云数据库管理系统负责决策替换节点的功能。如图1所示,具体操作如下:
监控节点系统:
1、采用轮询机制,每分钟对集群进行状态监测。
2、当发现节点连接有问题时,改为每隔30s对节点进行三次重试连接。如果依旧连不上,则通知云数据库系统问题节点,将节点实例ID与ip地址传递给云数据库系统。
云数据库系统:
1、接收到监控系统的宕机节点通知,通过实例ID和ip查询宕机节点的规格信息。
2、申请同规格的主机,通过postgresql同版本的镜像拉起虚机,并拷贝主节点的互信认证信息到新的虚机节点。
3、利用postgresql集群管理工具repmgr,指向主节点ip,通过命令同步克隆主节点所有数据。
4、与主节点建立主从关系,新节点注册为新从节点。
5、剔除原从节点,并回收主机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。例如,以上所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。上述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种解决postgresql高可用节点宕机恢复的方法,其特征在于,包括:
监控节点系统,采用轮询机制对postgresql的节点进行监控;
云数据库管理系统,用于负责决策替换节点的功能。
2.根据权利要求1所述的解决postgresql高可用节点宕机恢复的方法,其特征在于,所述监控节点系统的执行策略如下:
A1、采用轮询机制,每分钟对集群进行状态监测;
A2、当发现节点连接有问题时,改为每隔30s对节点进行三次重试连接;如果依旧连不上,则通知云数据库系统问题节点,将节点实例ID与ip地址传递给云数据库系统。
3.根据权利要求1所述的解决postgresql高可用节点宕机恢复的方法,其特征在于:云数据库系统的执行策略如下:
B1、接收到监控系统的宕机节点通知,通过实例ID和ip查询宕机节点的规格信息;
B2、申请同规格的主机,通过postgresql同版本的镜像拉起虚机,并拷贝主节点的互信认证信息到新的虚机节点;
B3、利用postgresql集群管理工具repmgr,指向主节点ip,通过命令同步克隆主节点所有数据;
B4、与主节点建立主从关系,新节点注册为新从节点;
B5、剔除原从节点,并回收主机。
CN202011584639.0A 2020-12-28 2020-12-28 一种解决postgresql高可用节点宕机恢复的方法 Pending CN112667353A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011584639.0A CN112667353A (zh) 2020-12-28 2020-12-28 一种解决postgresql高可用节点宕机恢复的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011584639.0A CN112667353A (zh) 2020-12-28 2020-12-28 一种解决postgresql高可用节点宕机恢复的方法

Publications (1)

Publication Number Publication Date
CN112667353A true CN112667353A (zh) 2021-04-16

Family

ID=75411320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011584639.0A Pending CN112667353A (zh) 2020-12-28 2020-12-28 一种解决postgresql高可用节点宕机恢复的方法

Country Status (1)

Country Link
CN (1) CN112667353A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503965A (zh) * 2014-10-16 2015-04-08 杭州斯凯网络科技有限公司 PostgreSQL高弹性的高可用及负载均衡实现方法
US9934107B1 (en) * 2015-03-30 2018-04-03 EMC IP Holding Company LLC Designating backup nodes and backing up in parallel in a high-availability environment
CN111813856A (zh) * 2020-07-01 2020-10-23 浪潮云信息技术股份公司 一种PostgreSQL高可用性的实现方法
CN112084072A (zh) * 2020-09-11 2020-12-15 重庆紫光华山智安科技有限公司 一种提高PostgreSQL集群容灾能力的方法、系统、介质及终端

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104503965A (zh) * 2014-10-16 2015-04-08 杭州斯凯网络科技有限公司 PostgreSQL高弹性的高可用及负载均衡实现方法
US9934107B1 (en) * 2015-03-30 2018-04-03 EMC IP Holding Company LLC Designating backup nodes and backing up in parallel in a high-availability environment
CN111813856A (zh) * 2020-07-01 2020-10-23 浪潮云信息技术股份公司 一种PostgreSQL高可用性的实现方法
CN112084072A (zh) * 2020-09-11 2020-12-15 重庆紫光华山智安科技有限公司 一种提高PostgreSQL集群容灾能力的方法、系统、介质及终端

Similar Documents

Publication Publication Date Title
CN106331098B (zh) 一种服务器集群系统
US9639588B2 (en) Operation method and apparatus for data storage system
CN103460203B (zh) 群集唯一标识符
JP5625998B2 (ja) 情報処理システム
US8626936B2 (en) Protocol independent server replacement and replication in a storage area network
JP4755548B2 (ja) 運用管理方法、運用管理プログラム、運用管理システムおよび運用管理装置
JP4958673B2 (ja) ストレージシステム及びこれの管理方法
US9880827B2 (en) Managing software version upgrades in a multiple computer system environment
US11888933B2 (en) Cloud service processing method and device, cloud server, cloud service system and storage medium
CN103019889A (zh) 分布式文件系统及其故障处理方法
EP3648405B1 (en) System and method to create a highly available quorum for clustered solutions
CN109739435B (zh) 文件存储和更新方法及装置
CN108572976A (zh) 一种分布式数据库中数据恢复方法、相关设备和系统
CN105701159A (zh) 一种数据同步装置和方法
JP2014026321A (ja) ストレージ装置、情報処理装置、情報処理システム、アクセス制御方法、およびアクセス制御プログラム
CN114138754A (zh) 基于Kubernetes平台的软件部署方法及装置
CN112416969A (zh) 分布式数据库中的并行任务调度系统
CN112100004A (zh) Redis集群节点的管理方法、存储介质
CN111708668A (zh) 集群故障的处理方法、装置及电子设备
US20050197718A1 (en) High reliability system, redundant construction control method, and program
CN112667353A (zh) 一种解决postgresql高可用节点宕机恢复的方法
CN111309515B (zh) 一种容灾控制方法、装置及系统
CN115499300A (zh) 嵌入式设备集群化运行架构、方法及装置
CN113961398A (zh) 业务处理方法、装置、系统、设备、存储介质和产品
CN115589365A (zh) 一种基于Canal的网络拓扑同步方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210416