CN114666202B - 一种基于云数据库的主从切换的监控方法及装置 - Google Patents

一种基于云数据库的主从切换的监控方法及装置 Download PDF

Info

Publication number
CN114666202B
CN114666202B CN202210268578.XA CN202210268578A CN114666202B CN 114666202 B CN114666202 B CN 114666202B CN 202210268578 A CN202210268578 A CN 202210268578A CN 114666202 B CN114666202 B CN 114666202B
Authority
CN
China
Prior art keywords
instance
node information
node
master
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210268578.XA
Other languages
English (en)
Other versions
CN114666202A (zh
Inventor
王梓涵
周鹏
齐兴一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202210268578.XA priority Critical patent/CN114666202B/zh
Publication of CN114666202A publication Critical patent/CN114666202A/zh
Application granted granted Critical
Publication of CN114666202B publication Critical patent/CN114666202B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0659Management of faults, events, alarms or notifications using network fault recovery by isolating or reconfiguring faulty entities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 
    • H04L67/1048Departure or maintenance mechanisms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供一种基于云数据库的主从切换的监控方法及装置,该方法为:获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,其中,监控数据库中至少包含按照预设采集周期采集的各个实例的节点信息,节点信息至少包括主节点IP和主节点端口;获取上一个查询周期下从监控数据库中查询到的各个实例的第二节点信息;对于每个实例,比对实例的第一节点信息和第二节点信息,得到比对结果;若比对结果指示实例的节点信息发生变化,确定实例发生主从切换事件。获取目标数据库对应的各个实例的节点信息,比较各个实例的主节点IP和/或主节点端口是否发生变化来监控各个实例发生主从切换事件,实现对主从切换事件的监控。

Description

一种基于云数据库的主从切换的监控方法及装置
技术领域
本发明涉及云计算中数据库技术领域,尤其涉及一种基于云数据库的主从切换的监控方法及装置。
背景技术
当云数据库(如:云Redis数据库)的实例对应的主节点发生故障时,会自动发生主从切换事件以确保实例的正常运行,而用户无法感知这一主从切换事件。由于实例发生主从切换事件时会导致业务出现短暂中断,业务人员需要及时监控到主从切换事件,并根据所监控到的主从切换事件排查其他关联故障,验证云数据库的业务是否正常运行。
但是,目前只有监控实例整体的一些指标的技术,例如监控内存使用率、监控CPU使用率等。由于一套云数据库集群对应多台服务器,每台服务器上的资源分配给多个实例使用,且每个实例的节点分布在多台服务器上,因此同时监控多个实例的主从切换事件非常困难。
发明内容
有鉴于此,本发明实施例提供一种基于云数据库的主从切换的监控方法及装置,以解决监控主从切换事件的难度较大的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种基于云数据库的主从切换的监控方法,所述方法包括:
获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,其中,所述监控数据库中至少包含按照预设采集周期采集的各个所述实例的节点信息,所述节点信息至少包括主节点IP和主节点端口;
获取上一个查询周期下从所述监控数据库中查询到的各个所述实例的第二节点信息;
对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息,得到比对结果;
若所述比对结果指示所述实例的节点信息发生变化,确定所述实例发生主从切换事件。
优选的,按照预设采集周期采集各个所述实例的节点信息的过程,包括:
利用设置在目标数据库对应的服务器上的采集工具,按照预设采集周期从所述服务器上采集所述目标数据库对应的各个实例的节点信息;
将采集得到的所述节点信息存储至所述监控数据库。
优选的,所述对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息,得到比对结果,包括:
对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP是否一致,且比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口是否一致;
若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP不一致,和/或,若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口不一致,得到用于指示所述实例的节点信息发生变化的比对结果;
若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP一致,且所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口一致,得到用于指示所述实例的节点信息没有发生变化的比对结果。
优选的,若所述比对结果指示所述实例的节点信息发生变化,确定所述实例发生主从切换事件之后,还包括:
通过告警系统对应的接口触发所述告警系统,以使所述告警系统依据预设规则生成告警信息并输出所述告警信息。
优选的,所述目标数据库为云Redis,所述目标数据库对应的各个实例为云Redis实例。
本发明实施例第二方面公开一种基于云数据库的主从切换的监控装置,所述装置包括:
第一获取单元,用于获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,其中,所述监控数据库中至少包含按照预设采集周期采集的各个所述实例的节点信息,所述节点信息至少包括主节点IP和主节点端口;
第二获取单元,用于获取上一个查询周期下从所述监控数据库中查询到的各个所述实例的第二节点信息;
比对单元,用于对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息,得到比对结果;
确定单元,用于若所述比对结果指示所述实例的节点信息发生变化,确定所述实例发生主从切换事件。
优选的,按照预设采集周期采集各个所述实例的节点信息的过程,包括:
利用设置在目标数据库对应的服务器上的采集工具,按照预设采集周期从所述服务器上采集所述目标数据库对应的各个实例的节点信息;
将采集得到的所述节点信息存储至所述监控数据库。
优选的,所述比对单元包括:
比对模块,用于对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP是否一致,且比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口是否一致;
第一结果模块,用于若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP不一致,和/或,若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口不一致,得到用于指示所述实例的节点信息发生变化的比对结果;
第二结果模块,用于若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP一致,且所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口一致,得到用于指示所述实例的节点信息没有发生变化的比对结果。
优选的,所述装置还包括:
告警单元,用于通过告警系统对应的接口触发所述告警系统,以使所述告警系统依据预设规则生成告警信息并输出所述告警信息。
优选的,所述目标数据库为云Redis,所述目标数据库对应的各个实例为云Redis实例。
基于上述本发明实施例提供的一种基于云数据库主从切换的监控方法及装置,该方法为:获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,其中,监控数据库中至少包含按照预设采集周期采集的各个实例的节点信息,节点信息至少包括主节点IP和主节点端口;获取上一个查询周期下从监控数据库中查询到的各个实例的第二节点信息;对于每个实例,比对实例的第一节点信息和第二节点信息,得到比对结果;若比对结果指示实例的节点信息发生变化,确定实例发生主从切换事件。通过获取目标数据库对应的各个实例的节点信息,比较各个实例的主节点IP和/或主节点端口是否发生变化来监控各个实例发生主从切换事件,从而实现了对多个实例的主从切换事件的监控。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种基于云数据库的主从切换的监控方法的流程图;
图2为本发明实施例提供的一种基于云数据库的主从切换的监控方法的另一流程图;
图3为本发明实施例提供的一种基于云数据库的主从切换的监控方法的原理架构图;
图4为本发明实施例提供的一种基于云数据库的主从切换的监控装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,由于一套云数据库集群对应多台服务器,每台服务器上的资源分配给多个实例使用,且每个实例的节点分布在多台服务器上,因此监控云数据库多个实例的主从切换事件非常困难。
因此,本发明实施例提供一种基于云数据库主从切换的监控方法,获取在当前查询周期下从监控数据库中查询得到的目标数据库对应的各个实例的第一节点信息;获取上一个查询周期下从监控数据库中查询得到的各个实例的第二节点信息;比对第一节点信息和第二节点信息,得到比对结果;当比对结果指示实例的节点信息发生变化时,确定实例发生主从切换事件。周期性查询各个实例的节点信息,监控实例的节点信息是否发生变化,由此准确地确定实例发生主从切换事件,降低了监控主从切换事件的难度。
需要说明的是,本发明实施例提供的一种基于云数据库主从切换的监控方法可以用于监控云Redis实例的主从切换事件,帮助业务人员及时并准确地监控到云Redis实例的主从切换事件。
可以理解的是,云Redis实例通常包括一个主节点和一个从节点,或者,包括一个主节点和两个及两个以上从节点。主从切换事件即当云Redis实例的主节点发生故障时,其中的一个从节点会通过预设方式被升为主节点,以保证业务正常运行。
参见图1,示出了本发明实施例提供的一种基于云数据库的主从切换的监控方法的流程图,该监控方法包括:
步骤S101:获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息。
需要说明的是,监控数据库中至少包含按照预设采集周期采集的各个实例的节点信息,节点信息中至少包括主节点IP和主节点端口。
需要说明的是,查询周期和采集周期可以根据实际情况进行设定,其中,查询周期设定的时间间隔需要大于或等于采集周期设定的时间间隔(如采集周期设定的时间间隔为1分钟,则查询周期设定的时间间隔可以等于或大于1分钟)。也就是说,在采集周期下,采集工具从各个服务器中采集各个实例的节点信息并将节点信息存储至监控数据库之后,才可以依据查询周期从监控数据库中查询各个实例的当前主节点IP和当前主节点端口。
可以理解的是,每个实例(如云Redis实例)的节点对应目标数据库(如云Redis)集群中一台服务器上的一个进程(如:redis-server进程);利用设置在目标数据库集群对应的每台服务器上的采集工具,采集目标数据库对应的各个实例的节点信息。也就是说,每台服务器上都有一个采集工具,采集工具按照预设的采集周期从多台服务器上采集目标数据库对应的各个实例的节点信息。节点信息中包括实例节点角色、主节点IP、主节点端口、从节点IP和从节点端口以及实例ID。其中实例节点角色用于指示某一节点是主节点或者从节点。
可以理解的是,采集工具通过读取实例的节点配置文件信息,获取节点信息,将获取得到的节点信息存储至监控数据库。
需要说明的是,监控数据库可以为一个独立设置的MySQL数据库,监控数据库中的数据表,利用实例ID作为唯一标识以标记一个云Redis实例,数据表中依据每个实例为单位的存储方式存储实例ID、实例节点角色和实例节点IP以及实例节点端口等节点信息,基于此种存储方式,存储所有采集工具采集得到的所有云Redis实例的节点信息。
例如:将数据表分为四列,第一列为实例ID、第二列为实例节点角色、第三列为节点IP和第四列为节点端口。假设一个云Redis实例包括一个主节点和两个从节点,该云Redis实例的实例ID为1,则该云Redis实例对应的数据表中存储的数据为:
实例ID 实例节点角色 节点IP 节点端口
1 master 10.0.0.1 3333
1 slave 10.0.0.2 3334
1 slave 10.0.0.3 3335
在具体实现步骤S101的过程中,可以利用定时任务程序,在每个查询周期下都从监控数据库中查询目标数据库对应的各个实例的节点信息;在当前查询周期下,从监控数据库中查询目标数据库对应的各个实例的第一节点信息,第一节点信息中至少包括实例的主节点IP和主节点端口。
步骤S102:获取上一个查询周期下从监控数据库中查询到的各个实例的第二节点信息。
需要说明的是,上一个查询周期是相对于当前查询周期的前一个查询周期。
在具体实现步骤S102的过程中,获取上一个查询周期下从监控数据库中查询得到的各个实施例的第二节点信息,以便将第一节点信息和第二节点信息进行比对。
可以理解的是,可以从日志文件中获取上一个查询周期下从监控数据库中查询得到的各个实施例的第二节点信息。在获取到各个实例的第一节点信息后,将第一节点信息存储至日志文件中,以便在下一个查询周期下,将存储在日志文件中的第一节点信息作为下一个查询周期下的第二节点信息。
步骤S103:对于每个实例,比对实例的第一节点信息和第二节点信息,得到比对结果。
在具体实现步骤S103的过程中,在获取得到第一节点信息和第二节点信息之后,对于每一个实例,比对实例的第一节点信息和第二节点信息中的主节点IP是否一致,且比对实例的第一节点信息和第二节点信息中的主节点端口是否一致,得到比对结果,可以根据比对结果确定实例是否发生主从切换事件。
可以理解的是,对于任意实例,若该实例的第一节点信息和第二节点信息中的主节点IP不一致,和/或,若该实例的第一节点信息和第二节点信息中的主节点端口不一致,得到用于指示该实例的节点信息发生变化的比对结果,即该实例发生主从切换事件。
也就是说,若某一实例的主节点IP和/或主节点端口发生了变化,则该实例发生了主从节点切换事件。
对于任意实例,若该实例的第一节点信息和第二节点信息中的主节点IP一致,且,若该实例的第一节点信息和第二节点信息中的主节点端口一致,得到用于指示该实例的节点信息没有发生变化的比对结果,即该实例没有发生主从切换事件。
步骤S104:判断比对结果是否指示实例的节点信息发生变化。若比对结果指示实例的节点信息发生变化,执行步骤S105;若比对结果指示实例的节点信息没有发生变化,则返回步骤S101,等待下一查询周期,获取下一周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息。
在具体实施步骤S104的过程中,针对每个实例,判断比对该实例的第一节点信息和该实例的第二节点信息所得到的比对结果,是否指示该实例的节点信息发生变化。若比对结果指示该实例的节点信息发生变化,执行步骤S105;若比对结果指示该实例的节点信息没有发生变化,则返回步骤S101,以等待下一查询周期继续监控各个实例是否发生主从切换事件。
步骤S105:若比对结果指示实例的节点信息发生变化,确定实例发生主从切换事件。
在具体实现步骤S105的过程中,当得到用于指示实例的节点信息发生变化的比对结果时,确定实例发生主从切换事件,此时需要进行告警。
需要说明的是,当确定实例发生主从切换事件之后,通过告警系统对应的接口触发告警系统,以使告警系统依据预设规则生成告警信息并输出告警信息。
需要说明的是,生成告警信息之后,需要将告警信息存储至日志文件,以便后续更好地进行排查分析。
可以理解的是,预设规则可以是:告警信息中应包括:发生主从切换事件的实例所对应的实例ID,该发生主从切换事件的实例中原来的主节点IP、原来的主节点端口、当前主节点IP和当前主节点端口。根据预设规则生成告警信息可以方便相关人员直接定位发生主从切换事件的具体实例。
在本发明实施例中,根据查询周期,查询当前查询周期下监控数据库中的目标数据库对应的各个实例的第一节点信息和获取相较于当前查询周期的上一个查询周期查询得到的各个实例的第二节点信息;比较第一节点信息和第二节点信息,当比较的结果指示实例的节点信息发生变化时,确定实例发生主从切换事件,利用设置在目标数据库对应的服务器上的采集工具,采集所有实例的节点信息,定时检测所有实例的主节点信息是否发生变化,准确且及时地监控实例的主从切换事件,降低了监控实例主从切换事件的难度。
以上是对于一种基于云数据库的主从切换的监控方法的流程图的详细说明,为了方便理解,参见图2,示出了本发明实施例提供的一种基于云数据库的主从切换的监控方法的另一流程图,该方法包括:
步骤S201:每分钟利用采集工具对每个云Redis实例的节点信息进行采集。
需要说明的是,每分钟利用采集工具对每个云Redis实例的节点信息进行采集,即采集工具按照预设的采集周期采集各个实例的节点信息。
可以理解的是,每个云Redis实例的节点信息包括实例的实例ID、实例节点角色、实例的主节点IP、主节点端口和从节点IP以及从节点端口等信息。
步骤S202:利用采集工具将所采集的监控数据存储到监控数据库。
可以理解的是,监控数据即步骤S201中采集工具所采集得到的节点信息。
步骤S203:在当前查询周期下执行定时任务程序,从监控数据库中查询所有实例的第一节点信息,利用查询得到的第一节点信息,与上一查询周期执行定时任务程序查询得到的第二节点信息进行比较,得到比较结果。
可以理解的是,每隔设定时间,执行定时任务程序从监控数据库中查询所有实例的节点信息;在当前查询周期下,执行定时任务程序从监控数据库中查询所有实例的第一节点信息,第一节点信息至少包括:实例的主节点IP和主节点端口。
需要说明的是,上一查询周期查询得到的第二节点信息至少包括:实例的主节点IP和主节点端口。
可以理解的是,针对每个实例,若该实例的第一节点信息和第二节点信息中的主节点IP不一致,和/或,若该实例的第一节点信息和第二节点信息中的主节点端口不一致,得到用于指示该实例的节点信息发生变化的比对结果,即该实例发生主从切换事件。
针对每个实例,若该实例的第一节点信息和第二节点信息中的主节点IP一致,且,若该实例的第一节点信息和第二节点信息中的主节点端口一致,得到用于指示该实例的节点信息没有发生变化的比对结果,即该实例没有发生主从切换事件。
步骤S204:判断比较结果是否指示实例发生主从切换事件;若比较结果指示实例发生主从切换事件,执行步骤S205;若比较结果指示实例没有发生主从切换事件,进入下一查询周期,返回执行步骤S203。
步骤S205:触发告警系统,使告警系统生成告警信息并向相关人员发送告警信息。
需要说明的是,关于图2各步骤的详细实现原理参见图1中的内容,在此不再赘述。
以上是对于一种基于云数据库的主从切换的监控方法的另一流程图的说明,为了方便理解,参见图3,示出了本发明实施例提供的一种基于云数据库的主从切换的监控方法的原理架构图,该原理架构图包括:采集工具301、监控数据库302、定时任务程序303和告警接口304以及日志文件305;
采集工具301,设置在集群对应的每台服务器上,用于从集群对应的每台服务器上采集所有云Redis实例的节点信息,将采集得到的节点信息存储至监控数据库302。
监控数据库302,用于存储采集工具301所采集得到的节点信息,以实例为单位存储所有云Redis实例的节点信息。
定时任务程序303,用于定时从监控数据库302中获取所有云Redis实例的当前主节点IP和主节点端口,检测所有云Redis实例的主节点IP和主节点端口是否发生变化。当任一实例的主节点IP或主节点端口发生变化时,调用告警接口304。其中,将获取得到的所有云Redis实例的主节点IP和主节点端口存储至日志文件305。
告警接口304,用于连接告警系统,以使告警系统依据预设规则生成告警信息并将告警信息发送至相关人员,同时告警系统通过告警接口将告警信息存储至日志文件305。
日志文件305,用于存储定时任务程序303发送的所有云Redis实例的主节点IP和主节点端口以及告警信息。
需要说明的是,关于图3各部分的详细实现原理参见图1和图2中的内容,在此不再赘述。
与上述本发明实施例提供的一种基于云数据库的主从切换的监控方法相对应,参见图4,示出了本发明实施例提供的一种基于云数据库的主从切换的监控装置的结构框图,该监控装置包括:第一获取单元401、第二获取单元402、比对单元403和确定单元404;
需要说明的是,在一些具体实施例中,目标数据库为云Redis,目标数据库对应的各个实例为云Redis实例。
第一获取单元401,用于获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,其中,监控数据库中至少包含按照预设采集周期采集的各个实例的节点信息,节点信息至少包括主节点IP和主节点端口。
在一些具体实施例中,按照预设采集周期采集各个实例的节点信息的过程,包括:利用设置在目标数据库对应的服务器上的采集工具,按照预设采集周期从服务器上采集目标数据库对应的各个实例的节点信息;将采集得到的节点信息存储至监控数据库。
第二获取单元402,用于获取上一个查询周期下从监控数据库中查询到的各个实例的第二节点信息。
比对单元403,用于对于每个实例,比对实例的第一节点信息和第二节点信息,得到比对结果。
确定单元404,用于若比对结果指示实例的节点信息发生变化,确定实例发生主从切换事件。
在本发明实施例中,获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,获取上一个查询周期下从监控数据库中查询得到的目标数据库对应的各个实例的第二节点信息,对于每个实例,比对第一节点信息和第二节点信息,得到比对结果,当比对结果指示实例的节点信息发生变化时,确定节点信息发生变化的实例发生了主从切换事件。其中监控数据库中各个实例的节点信息,由设置在目标数据库集群对应的服务器上的采集工具进行采集,实现节点信息的采集过程和检测实例节点信息是否发生变化的过程相分离;将各个实例的节点信息采集并存储至监控数据库,减少占用云Redis的内存,保证监控主从切换事件的稳定性,降低监控主从切换事件的难度。
优选的,比对单元403还包括:比对模块和第一结果模块以及第二结果模块。
比对模块,用于对于每个实例,比对实例的第一节点信息和第二节点信息中的主节点IP是否一致,且比对实例的第一节点信息和第二节点信息中的主节点端口是否一致。
第一结果模块,用于若实例的第一节点信息和第二节点信息中的主节点IP不一致,和/或,若实例的第一节点信息和第二节点信息中的主节点端口不一致,得到用于指示实例的节点信息发生变化的比对结果。
第二结果模块,用于若实例的第一节点信息和第二节点信息中的主节点IP一致,且实例的第一节点信息和第二节点信息中的主节点端口一致,得到用于指示实例的节点信息没有发生变化的比对结果。
优选的,该监控装置还包括:告警单元,用于通过告警系统对应的接口触发告警系统,以使告警系统依据预设规则生成告警信息并输出告警信息。
综上所述,本发明实施例提供了一种基于云数据库的主从切换的监控方法及装置,利用设置在目标数据库集群对应的每台服务器上的采集工具采集所有云Redis实例的节点信息,准确地获取所有实例的节点信息,同时定时检测所有实例的主节点信息是否发生变化,及时并准确地确定实例发生主从切换事件,以降低获取实例主从切换事件的难度;当确定实例发生主从切换事件时调用告警接口,以使告警系统及时地发送告警信息,提高运维效率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于云数据库的主从切换的监控方法,其特征在于,所述方法包括:
获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,其中,所述监控数据库中至少包含按照预设采集周期采集的各个所述实例的节点信息,所述节点信息至少包括主节点IP和主节点端口;
获取上一个查询周期下从所述监控数据库中查询到的各个所述实例的第二节点信息;
对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息,得到比对结果;
若所述比对结果指示所述实例的节点信息发生变化,确定所述实例发生主从切换事件。
2.根据权利要求1所述的方法,其特征在于,按照预设采集周期采集各个所述实例的节点信息的过程,包括:
利用设置在目标数据库对应的服务器上的采集工具,按照预设采集周期从所述服务器上采集所述目标数据库对应的各个实例的节点信息;
将采集得到的所述节点信息存储至所述监控数据库。
3.根据权利要求1所述的方法,其特征在于,所述对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息,得到比对结果,包括:
对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP是否一致,且比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口是否一致;
若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP不一致,和/或,若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口不一致,得到用于指示所述实例的节点信息发生变化的比对结果;
若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP一致,且所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口一致,得到用于指示所述实例的节点信息没有发生变化的比对结果。
4.根据权利要求1所述的方法,其特征在于,若所述比对结果指示所述实例的节点信息发生变化,确定所述实例发生主从切换事件之后,还包括:
通过告警系统对应的接口触发所述告警系统,以使所述告警系统依据预设规则生成告警信息并输出所述告警信息。
5.根据权利要求1-4任一所述的方法,其特征在于,所述目标数据库为云Redis,所述目标数据库对应的各个实例为云Redis实例。
6.一种基于云数据库的主从切换的监控装置,其特征在于,所述装置包括:
第一获取单元,用于获取当前查询周期下从监控数据库中查询到的目标数据库对应的各个实例的第一节点信息,其中,所述监控数据库中至少包含按照预设采集周期采集的各个所述实例的节点信息,所述节点信息至少包括主节点IP和主节点端口;
第二获取单元,用于获取上一个查询周期下从所述监控数据库中查询到的各个所述实例的第二节点信息;
比对单元,用于对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息,得到比对结果;
确定单元,用于若所述比对结果指示所述实例的节点信息发生变化,确定所述实例发生主从切换事件。
7.根据权利要求6所述的装置,其特征在于,按照预设采集周期采集各个所述实例的节点信息的过程,包括:
利用设置在目标数据库对应的服务器上的采集工具,按照预设采集周期从所述服务器上采集所述目标数据库对应的各个实例的节点信息;
将采集得到的所述节点信息存储至所述监控数据库。
8.根据权利要求6所述的装置,其特征在于,所述比对单元包括:
比对模块,用于对于每个实例,比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP是否一致,且比对所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口是否一致;
第一结果模块,用于若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP不一致,和/或,若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口不一致,得到用于指示所述实例的节点信息发生变化的比对结果;
第二结果模块,用于若所述实例的所述第一节点信息和所述第二节点信息中的所述主节点IP一致,且所述实例的所述第一节点信息和所述第二节点信息中的所述主节点端口一致,得到用于指示所述实例的节点信息没有发生变化的比对结果。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
告警单元,用于通过告警系统对应的接口触发所述告警系统,以使所述告警系统依据预设规则生成告警信息并输出所述告警信息。
10.根据权利要求6-9任一所述的装置,其特征在于,所述目标数据库为云Redis,所述目标数据库对应的各个实例为云Redis实例。
CN202210268578.XA 2022-03-18 2022-03-18 一种基于云数据库的主从切换的监控方法及装置 Active CN114666202B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210268578.XA CN114666202B (zh) 2022-03-18 2022-03-18 一种基于云数据库的主从切换的监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210268578.XA CN114666202B (zh) 2022-03-18 2022-03-18 一种基于云数据库的主从切换的监控方法及装置

Publications (2)

Publication Number Publication Date
CN114666202A CN114666202A (zh) 2022-06-24
CN114666202B true CN114666202B (zh) 2024-04-26

Family

ID=82029925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210268578.XA Active CN114666202B (zh) 2022-03-18 2022-03-18 一种基于云数据库的主从切换的监控方法及装置

Country Status (1)

Country Link
CN (1) CN114666202B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018094909A1 (zh) * 2016-11-28 2018-05-31 网宿科技股份有限公司 节点连接方法及分布式计算系统
CN111581284A (zh) * 2020-04-29 2020-08-25 上海中通吉网络技术有限公司 一种数据库高可用性方法、装置、系统和存储介质
CN113259188A (zh) * 2021-07-15 2021-08-13 浩鲸云计算科技股份有限公司 一种构建大规模redis集群的方法
CN113515574A (zh) * 2021-05-17 2021-10-19 聚好看科技股份有限公司 一种数据同步方法及装置
CN114138754A (zh) * 2021-12-09 2022-03-04 安超云软件有限公司 基于Kubernetes平台的软件部署方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018094909A1 (zh) * 2016-11-28 2018-05-31 网宿科技股份有限公司 节点连接方法及分布式计算系统
CN111581284A (zh) * 2020-04-29 2020-08-25 上海中通吉网络技术有限公司 一种数据库高可用性方法、装置、系统和存储介质
CN113515574A (zh) * 2021-05-17 2021-10-19 聚好看科技股份有限公司 一种数据同步方法及装置
CN113259188A (zh) * 2021-07-15 2021-08-13 浩鲸云计算科技股份有限公司 一种构建大规模redis集群的方法
CN114138754A (zh) * 2021-12-09 2022-03-04 安超云软件有限公司 基于Kubernetes平台的软件部署方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
分布式存储系统中改进的一致性哈希算法;王康等;《计算机技术与发展》;20160812;第26卷(第7期);全文 *

Also Published As

Publication number Publication date
CN114666202A (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
JP5267749B2 (ja) 運用管理装置、運用管理方法、及びプログラム
CN112751726B (zh) 一种数据处理方法、装置、电子设备和存储介质
CN1493024A (zh) 用于在分布式编程网络中自适应可靠性平衡的系统和方法
WO2017020725A1 (zh) 一种数据检测方法及装置
CN103186603B (zh) 确定sql语句对关键业务的性能的影响的方法、系统和设备
CN106445781A (zh) 基于消息传递的hpc大规模并行程序异常自动监测及软硬件原因判断的检测系统
EP4020218B1 (en) Analyzing large-scale data processing jobs
CN111046011A (zh) 日志收集方法、系统、节点、电子设备及可读存储介质
JP2020057416A (ja) 分散データベースにおけるデータブロックを処理する方法およびデバイス
CN111147596A (zh) Prometheus集群部署方法、装置、设备及介质
CN111314158A (zh) 大数据平台监控方法、装置及设备、介质
US20160085655A1 (en) Monitoring system, monitoring device, and monitoring method
CN111526038B (zh) 业务请求分发方法、装置、计算机设备及可读存储介质
CN113722187B (zh) 一种面向微服务架构的服务监控系统
CN113835918A (zh) 一种服务器故障分析方法及装置
CN114666202B (zh) 一种基于云数据库的主从切换的监控方法及装置
CN111240936A (zh) 一种数据完整性校验的方法及设备
JP2015194797A (ja) 監視漏れ特定処理プログラム,監視漏れ特定処理方法及び監視漏れ特定処理装置
CN112256488A (zh) 云端数据的获取方法和装置、云端服务的数据存储架构
CN111614701B (zh) 一种分布式集群、以及容器状态切换方法、装置
CN116264541A (zh) 一种基于多维度的数据库容灾方法及装置
KR20100003597A (ko) 통합 성능 모니터링 방법 및 모니터링 시스템
CN112256489A (zh) 云端开发平台的数据获取方法和装置、数据存储架构
CN102567470A (zh) 系统级性能数据的处理方法及设备
CN114116122A (zh) 一种应用容器高可用负载平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant