CN113806140A - 一种基于管理平台上重启redis集群的方法 - Google Patents

一种基于管理平台上重启redis集群的方法 Download PDF

Info

Publication number
CN113806140A
CN113806140A CN202110922356.0A CN202110922356A CN113806140A CN 113806140 A CN113806140 A CN 113806140A CN 202110922356 A CN202110922356 A CN 202110922356A CN 113806140 A CN113806140 A CN 113806140A
Authority
CN
China
Prior art keywords
restarting
cluster
restart
nodes
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110922356.0A
Other languages
English (en)
Other versions
CN113806140B (zh
Inventor
程铖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unicloud Nanjing Digital Technology Co Ltd
Original Assignee
Unicloud Nanjing Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unicloud Nanjing Digital Technology Co Ltd filed Critical Unicloud Nanjing Digital Technology Co Ltd
Priority to CN202110922356.0A priority Critical patent/CN113806140B/zh
Publication of CN113806140A publication Critical patent/CN113806140A/zh
Application granted granted Critical
Publication of CN113806140B publication Critical patent/CN113806140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明涉及数据处理领域,具体涉及一种基于管理平台上重启redis集群的方法,包括:S101用户发出重启集群指令到接口;S102接口对集群中的每一个节点进行检测,若有不正常节点则提示重启异常,并进入步骤S103;若全为正常节点,直接重启;S103用户输入判断指令决定全部重启或者正常重启;S104返回重启成功提示。本发明定义了一套解决云平台上重启redis集群的方式,通过在接口中增加一个“强制重启”的参数,实现了在集群状态不正常的情况下,让用户根据自己的实际情况,来决定是否重启集群,使得用户使用更加方便。

Description

一种基于管理平台上重启redis集群的方法
技术领域
本发明涉及数据处理领域,尤其涉及一种基于管理平台上重启redis集群的方法。
背景技术
现在各大云服务平台的上,会提供售卖redis数据库集群的服务给用户,同时也会提供重启集群的功能。集群是由多台机器组成,重启集群的操作,实际上是重启每一台机器上的redis实例。
在集群中的机器出现故障时,一般的处理方式是只有集群状态都是正常的,才可以重启,如果有一个或者多个机器不正常的就不容许重启,或者重启的时候,只重启正常机器的状态,忽略状态不正常的机器,这样会让用户使用不方便,体验降低。
发明内容
本发明的目的在于提供一种基于管理平台上重启redis集群的方法,旨在解决现有集群重启用户无法进行自主选择的问题。
为实现上述目的,本发明提供了一种基于管理平台上重启redis集群的方法,包括:
S101用户发出重启集群指令到接口;
S102接口对集群中的每一个节点进行检测,若有不正常节点则提示重启异常,并进入步骤S103;若全为正常节点,直接重启;
S103用户输入判断指令决定全部重启或者正常重启;
S104返回重启成功提示。
其中,所述接口对集群中的每一个节点进行检测,若有不正常节点则提示重启异常的具体步骤是:
对集群中的每个节点进行故障检测;
发现不正常节点,返回异常指令;
基于异常指令提示用户重启异常。
其中,所述用户输入判断指令决定全部重启或者正常重启的具体步骤是:
定义强制重启参数,获取判断指令;
基于判断指令决定是否启动强制重启参数,若启动则循环重启每一个节点,若未启动,则重启正常节点。
其中,所述若未启动,则重启正常节点的具体步骤是:
若用户选择不启动强制重启,则循环判断每一个节点状态,区分正常节点和不正常节点;
重启所有正常节点,忽略不正常节点。
其中,所述正常节点为无故障服务器,所述不正常节点为故障服务器。
本发明的一种基于管理平台上重启redis集群的方法,包括:S101用户发出重启集群指令到接口;S102接口对集群中的每一个节点进行检测,若有不正常节点则提示重启异常,并进入步骤S103;若全为正常节点,直接重启;S103用户输入判断指令决定全部重启或者正常重启;S104返回重启成功提示。本发明定义了一套解决云平台上重启redis集群的方式,通过在接口中增加一个“强制重启”的参数。实现了在集群状态不正常的情况下,让用户根据自己的实际情况,来决定是否重启集群,使得用户使用更加方便。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的一种基于管理平台上重启redis集群的方法的流程图;
图2是本发明的若有不正常节点则提示重启异常,并进入步骤S103的流程图;
图3是本发明的用户输入判断指令决定全部重启或者正常重启的流程图;
图4是本发明的所述若未启动,则重启正常节点的流程图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
请参阅图1~图4,本发明提供一种基于管理平台上重启redis集群的方法,包括:
S101用户发出重启集群指令到接口;
用户在UI界面上点击重启集群按钮,UI调用redis中设置的接口,直接对集群进行重启操作。redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set--有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步。
Redis是一个高性能的key-value数据库。redis的出现,很大程度补偿了memcached这类key/value存储的不足,在部分场合可以对关系数据库起到很好的补充作用。它提供了Java,C/C++,C#,PHP,JavaScript,Perl,Object-C,Python,Ruby,Erlang等客户端,使用很方便。[1]
Redis支持主从同步。数据可以从主服务器向任意数量的从服务器上同步,从服务器可以是关联其他从服务器的主服务器。这使得Redis可执行单层树复制。存盘可以有意无意的对数据进行写操作。由于完全实现了发布/订阅机制,使得从数据库在任何地方同步树时,可订阅一个频道并接收主服务器完整的消息发布记录。同步对读取操作的可扩展性和数据冗余很有帮助。
S102接口对集群中的每一个节点进行检测,若有不正常节点则提示重启异常,并进入步骤S103;若全为正常节点,直接重启;
所述正常节点为无故障服务器,所述不正常节点为故障服务器。接口接到请求后,按接口内部逻辑进行处理,如果没有不正常状态的机器,直接重启Redis集群,返回重启成功,本次操作结束,如果有不正常状态的机器,返回修改失败,提示状态不正常。
其中若有不正常节点则提示重启异常,并进入步骤S103的具体方式是:
S201对集群中的每个节点进行故障检测;
集群中的节点尝试去连redis,能连上说明redis是好的,连不上的就是属于故障状态。
S202发现不正常节点,返回异常指令;
当发现不正常节点时,可以返回节点异常的值进行提示。
S203基于异常指令提示用户重启异常。
UI接到“重启失败,提示节点状态不正常”的结果后,向用户弹出提示“当前集群有节点状态不正常,是否强制重启集群”。
S103用户输入判断指令决定全部重启或者正常重启;
具体步骤是:
S301定义强制重启参数,获取判断指令;
用户看到“当前集群有节点状态不正常,是否强制重启集群”的提示后,根据自己的情况,选择强制重启或者取消。
S302基于判断指令决定是否启动强制重启参数,若启动则循环重启每一个节点,若未启动,则重启正常节点。
其中所述若未启动,则重启正常节点的具体步骤是:
S401若用户选择不启动强制重启,则循环判断每一个节点状态,区分正常节点和不正常节点;
为了判断更加准确,此时再次对节点状态进行判断。
S402重启所有正常节点,忽略不正常节点。
S104返回重启成功提示。
UI接到“重启成功”的结果后,给用户提示重启成功,操作结束。
本发明定义了一套解决云平台上重启redis集群的方式,通过在接口中增加一个“强制重启”的参数。实现了在集群状态不正常的情况下,让用户根据自己的实际情况,来决定是否重启集群。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (5)

1.一种基于管理平台上重启redis集群的方法,其特征在于,
包括:S101用户发出重启集群指令到接口;
S102接口对集群中的每一个节点进行检测,若有不正常节点则提示重启异常,并进入步骤S103;若全为正常节点,直接重启;
S103用户输入判断指令决定全部重启或者正常重启;
S104返回重启成功提示。
2.如权利要求1所述的一种基于管理平台上重启redis集群的方法,其特征在于,
所述接口对集群中的每一个节点进行检测,若有不正常节点则提示重启异常的具体步骤是:
对集群中的每个节点进行故障检测;
发现不正常节点,返回异常指令;
基于异常指令提示用户重启异常。
3.如权利要求1所述的一种基于管理平台上重启redis集群的方法,其特征在于,
所述用户输入判断指令决定全部重启或者正常重启的具体步骤是:
定义强制重启参数,获取判断指令;
基于判断指令决定是否启动强制重启参数,若启动则循环重启每一个节点,若未启动,则重启正常节点。
4.如权利要求3所述的一种基于管理平台上重启redis集群的方法,其特征在于,
所述若未启动,则重启正常节点的具体步骤是:
若用户选择不启动强制重启,则循环判断每一个节点状态,区分正常节点和不正常节点;
重启所有正常节点,忽略不正常节点。
5.如权利要求1所述的一种基于管理平台上重启redis集群的方法,其特征在于,
所述正常节点为无故障服务器,所述不正常节点为故障服务器。
CN202110922356.0A 2021-08-12 2021-08-12 一种基于管理平台上重启redis集群的方法 Active CN113806140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110922356.0A CN113806140B (zh) 2021-08-12 2021-08-12 一种基于管理平台上重启redis集群的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110922356.0A CN113806140B (zh) 2021-08-12 2021-08-12 一种基于管理平台上重启redis集群的方法

Publications (2)

Publication Number Publication Date
CN113806140A true CN113806140A (zh) 2021-12-17
CN113806140B CN113806140B (zh) 2024-01-05

Family

ID=78942774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110922356.0A Active CN113806140B (zh) 2021-08-12 2021-08-12 一种基于管理平台上重启redis集群的方法

Country Status (1)

Country Link
CN (1) CN113806140B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6691244B1 (en) * 2000-03-14 2004-02-10 Sun Microsystems, Inc. System and method for comprehensive availability management in a high-availability computer system
US20080244585A1 (en) * 2007-03-27 2008-10-02 Aster Data Systems, Inc. System and method for using failure casting to manage failures in computer systems
CN106547861A (zh) * 2016-10-21 2017-03-29 天脉聚源(北京)科技有限公司 一种智能管理机器节点的数据库的方法及装置
CN109728949A (zh) * 2018-12-26 2019-05-07 新华三技术有限公司 一种集群启动方法及装置
CN111125219A (zh) * 2019-12-18 2020-05-08 紫光云(南京)数字技术有限公司 一种修改云平台上Redis集群参数的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6691244B1 (en) * 2000-03-14 2004-02-10 Sun Microsystems, Inc. System and method for comprehensive availability management in a high-availability computer system
US20080244585A1 (en) * 2007-03-27 2008-10-02 Aster Data Systems, Inc. System and method for using failure casting to manage failures in computer systems
CN106547861A (zh) * 2016-10-21 2017-03-29 天脉聚源(北京)科技有限公司 一种智能管理机器节点的数据库的方法及装置
CN109728949A (zh) * 2018-12-26 2019-05-07 新华三技术有限公司 一种集群启动方法及装置
CN111125219A (zh) * 2019-12-18 2020-05-08 紫光云(南京)数字技术有限公司 一种修改云平台上Redis集群参数的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IOANNIS VARDAS等: "Towards Communication Profile, Topology and Node Failure Aware Process Placement", 《2020 IEEE 32ND INTERNATIONAL SYMPOSIUM ON COMPUTER ARCHITECTURE AND HIGH PERFORMANCE COMPUTING (SBAC-PAD)》, pages 241 - 248 *
田帅: "针对Hadoop集群的异常节点实时监测与诊断研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, pages 138 - 2056 *

Also Published As

Publication number Publication date
CN113806140B (zh) 2024-01-05

Similar Documents

Publication Publication Date Title
JP6756924B2 (ja) ブロックチェーンを基にしたコンセンサス方法およびデバイス
US8719386B2 (en) System and method for providing configuration synchronicity
WO2015188501A1 (zh) 配置文件更新方法、装置及系统和计算机存储介质
US9367261B2 (en) Computer system, data management method and data management program
JP2017538200A (ja) 分散環境におけるサービスアドレッシング
CN105069152B (zh) 数据处理方法及装置
CN109634638B (zh) 一种集群软件升级方法、装置、设备及介质
CN110545207B (zh) 一种同步自动化的智能dns系统及配置方法
CN111049928A (zh) 数据同步方法、系统、电子设备及计算机可读存储介质
CN105162879A (zh) 实现多机房数据一致性的方法、装置及系统
WO2023071999A1 (zh) 一种用户匹配方法、装置、设备及存储介质
CN112130761A (zh) 一种存储系统的扩容方法、系统及相关装置
US20210385406A1 (en) Device state monitoring method and apparatus
CN113126925B (zh) 一种成员列表确定方法、装置、设备及可读存储介质
CN108509296B (zh) 一种处理设备故障的方法和系统
US11226857B1 (en) Device, method and computer program product for fault elimination of a multilayer system
US9424362B2 (en) Storing and publishing contents of a content store
CN108170488B (zh) 一种升级插件的方法及装置
CN113806140B (zh) 一种基于管理平台上重启redis集群的方法
US9374437B2 (en) Schema validation proxy
CN110417601B (zh) 客户端中的信息提示方法、装置、系统及可读存储介质
CN109344202B (zh) 一种数据同步方法及管理节点
CN115098525B (zh) 索引更新方法、装置、电子设备及存储介质
CN115604286A (zh) 节点主备状态信息同步的方法、装置、设备及存储介质
CN113377714A (zh) 基于分布式存储系统的目标器重命名方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant