CN117331801A - 一种分布式数据库集群运行状态的检查方法及装置 - Google Patents

一种分布式数据库集群运行状态的检查方法及装置 Download PDF

Info

Publication number
CN117331801A
CN117331801A CN202311305628.8A CN202311305628A CN117331801A CN 117331801 A CN117331801 A CN 117331801A CN 202311305628 A CN202311305628 A CN 202311305628A CN 117331801 A CN117331801 A CN 117331801A
Authority
CN
China
Prior art keywords
distributed database
database cluster
node
current node
checking
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311305628.8A
Other languages
English (en)
Inventor
王鸿鹏
孙皓哲
高连峰
邱峙
吴多刚
李艳茹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202311305628.8A priority Critical patent/CN117331801A/zh
Publication of CN117331801A publication Critical patent/CN117331801A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种分布式数据库集群运行状态的检查方法及装置,该方法包括:判断当前节点是否属于分布式数据库集群;若当前节点属于分布式数据库集群,判断当前节点是否是分布式数据库集群的主管理节点;若当前节点是分布式数据库集群的主管理节点,获取分布式数据库集群中所有待检查节点的三元组信息;对于每个待检查节点,根据三元组信息构建待检查节点的运行状态检查任务;执行所有运行状态检查任务,得到风险检查结果并展示。通过主管理节点生成分布式数据库集群中所有待检查节点的运行状态检查任务,提高了收集数据的完整性,完善了信息整合度。基于主管理节点对所有待检查节点进行运行状态检查,提高了分布式数据库集群运行状态的检查效率。

Description

一种分布式数据库集群运行状态的检查方法及装置
技术领域
本发明涉及数据库技术领域,尤其涉及一种分布式数据库集群运行状态的检查方法及装置。
背景技术
分布式数据库具有数据强一致、高可用、高性能、在线扩展、高度兼容SQL标准和主流关系数据库、低成本等特点。分布式数据库集群内的服务器从功能上可以分为不同的组件,主要包括Manager(数据库管理平台/管理节点)、Proxy(数据库代理服务器/计算节点)、DBServer(数据库服务器/数据节点)及其他应用组件。分布式数据库集群内分为多个副本,每个副本包含有多台服务器。在运维过程中,经常需要获取数据库集群中各个组件和各个节点的基础运行状况信息,以便运维人员对数据库集群的运行状态进行检查。但是由于分布式数据库的服务器数量较多,逐一收集基础运行状况信息需要耗费大量时间。
目前主要通过分布式数据库的管理平台的可视化页面展示了部分运行状态信息,但仅能获取部分组件的部分指标,存在基础运行状况信息收集困难且信息整合度不够完善的问题。同时依赖人工对数据库集群的运行状态进行检查,需要耗费大量的时间,检查速度慢,容易出现检查错误的问题。
发明内容
有鉴于此,本发明实施例提供一种分布式数据库集群运行状态的检查方法及装置,以解决分布式数据库信息收集困难且检查速度慢的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种分布式数据库集群运行状态的检查方法,所述方法包括:
判断当前节点是否属于分布式数据库集群;
若所述当前节点属于分布式数据库集群,判断所述当前节点是否是所述分布式数据库集群的主管理节点;
若所述当前节点是所述分布式数据库集群的主管理节点,获取所述分布式数据库集群中所有待检查节点的三元组信息;
对于每个所述待检查节点,根据所述三元组信息构建所述待检查节点的运行状态检查任务;
执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果。
优选的,所述判断当前节点是否属于分布式数据库集群,包括:
通过查询语句查询当前节点中是否存在数据库专用操作系统用户;
若当前节点中存在数据库专用操作系统用户,则确定所述当前节点属于分布式数据库集群;
若当前节点中不存在数据库专用操作系统用户,则确定所述当前节点不属于分布式数据库集群。
优选的,所述方法还包括:
若所述当前节点不属于所述分布式数据库集群,则将所述分布式数据库集群中所有待检查节点标记为禁用检查。
优选的,所述若所述当前节点属于分布式数据库集群,判断所述当前节点是否是所述分布式数据库集群的主管理节点,包括:
若所述当前节点属于分布式数据库集群,则查询所述当前节点中是否存在管理进程;
当所述当前节点中存在管理进程时,确定所述当前节点是所述分布式数据库集群的主管理节点;
当所述当前节点中不存在管理进程时,确定所述当前节点不是所述分布式数据库集群的主管理节点。
优选的,所述方法还包括:
若所述当前节点不是所述分布式数据库集群的主管理节点,则查找所述分布式数据库集群的主管理节点;
获取所述分布式数据库集群的主管理节点的IP地址并向用户展示所述IP地址。
优选的,所述对于每个所述待检查节点,根据所述三元组信息构建所述待检查节点的运行状态检查任务,包括:
对于每个所述待检查节点,根据所述三元组信息中的检查实例和检查指标确定所述待检查节点的具体检查项;
基于所述三元组信息中的检查命令和所述具体检查项构建所述待检查节点的运行状态检查任务。
优选的,所述执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果,包括:
对于每个运行状态检查任务,利用所述运行状态检查任务中的检查命令,获取所述运行状态检查任务中的具体检查项对应的检查值;
根据所述检查值对应的预设检查阈值,确定所述检查值对应的风险检查结果;
展示所述风险检查结果。
本发明实施例第二方面公开一种分布式数据库集群运行状态的检查装置,所述装置包括:
第一判断单元,用于判断当前节点是否属于分布式数据库集群;
第二判断单元,用于若所述当前节点属于分布式数据库集群,判断所述当前节点是否是所述分布式数据库集群的主管理节点;
获取单元,用于若所述当前节点是所述分布式数据库集群的主管理节点,获取所述分布式数据库集群中所有待检查节点的三元组信息;
构建单元,用于对于每个所述待检查节点,根据所述三元组信息构建所述待检查节点的运行状态检查任务;
执行检查单元,用于执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果。
优选的,所述第一判断单元,包括:
查询模块,用于通过查询语句查询当前节点中是否存在数据库专用操作系统用户;
第一确定模块,用于若当前节点中存在数据库专用操作系统用户,则确定所述当前节点属于分布式数据库集群;
第二确定模块,用于若当前节点中不存在数据库专用操作系统用户,则确定所述当前节点不属于分布式数据库集群。
优选的,所述装置还包括:
禁用检查单元,用于若所述当前节点不属于所述分布式数据库集群,则将所述分布式数据库集群中所有待检查节点标记为禁用检查。
基于上述本发明实施例提供的一种分布式数据库集群运行状态的检查方法及装置,该方法包括:判断当前节点是否属于分布式数据库集群;若当前节点属于分布式数据库集群,判断当前节点是否是分布式数据库集群的主管理节点;若当前节点是分布式数据库集群的主管理节点,获取分布式数据库集群中所有待检查节点的三元组信息;对于每个待检查节点,根据三元组信息构建待检查节点的运行状态检查任务;执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结构。通过主管理节点生成分布式数据库集群中所有待检查节点的运行状态检查任务,提高了收集数据的完整性,完善了信息整合度。基于主管理节点对所有待检查节点进行运行状态检查,提高了分布式数据库集群运行状态的检查效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种分布式数据库集群运行状态的检查方法的流程图;
图2为本发明实施例提供的一种分布式数据库集群运行状态的检查装置的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,由于分布式数据库的服务器数量较多,逐一收集基础运行状况信息需要耗费大量时间,而目前的信息收集方法仅能获取部分组件的部分指标,存在基础运行状况信息收集困难且信息整合度不够完善的问题。同时依赖人工对数据库集群的运行状态进行检查,检查速度慢,容易出现检查错误。
因此,本发明实施例提供一种分布式数据库集群运行状态的检查方法及装置,该方法包括:判断当前节点是否属于分布式数据库集群;若当前节点属于分布式数据库集群,判断当前节点是否是分布式数据库集群的主管理节点;若当前节点是分布式数据库集群的主管理节点,获取分布式数据库集群中所有待检查节点的三元组信息;对于每个待检查节点,根据三元组信息构建待检查节点的运行状态检查任务;执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结构。通过主管理节点生成分布式数据库集群中所有待检查节点的运行状态检查任务,提高了收集数据的完整性,完善了信息整合度。基于主管理节点对所有待检查节点进行运行状态检查,提高了分布式数据库集群运行状态的检查效率。
参见图1,示出了本发明实施例提供的本发明实施例提供的一种分布式数据库集群运行状态的检查方法的流程图。
需要说明的是,分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放在一个地方,每台计算机中都可能有DBMS的一份完整拷贝副本,或者部分拷贝副本,并具有自己局部的数据库。位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的逻辑上集中、物理上分布的大型数据库。该检查方法包括:
步骤S101:判断当前节点是否属于分布式数据库集群;若当前节点属于分布式数据库集群,则执行步骤S102。
在具体实现步骤S101的过程中,通过查询语句查询当前节点中是否存在数据库专用操作系统用户;若当前节点中存在数据库专用操作系统用户,则确定当前节点属于分布式数据库集群;若当前节点中不存在数据库专用操作系统用户,则确定当前节点不属于分布式数据库集群。
可以理解的是,通常分布式国产数据库都有对应的os层面的用户,其中,os层面的用户用于运行软件本身,如GoldenDB数据库有db、dbproxy、manager等os层面的用户,OceanBase数据库有admin等os层面的用户。
其中,GoldenDB是中兴通讯的关系型分布式数据库产品。OceanBase:是一款完全自研的国产原生分布式数据库软件,在普通硬件上实现金融级高可用。
需要说明的是,通过查询语句查询当前节点中是否存在数据库专用操作系统用户,具体可以通过例如“grep username/etc/passwd”查询语句进行查询。
可选的,在执行步骤S101之后还进一步包括:
若当前节点不属于分布式数据库集群,则将分布式数据库集群中所有待检查节点标记为禁用检查。
需要说明的是,若当前节点不属于分布式数据库集群,则为了保护数据的安全性,应禁止当前节点获取分布式数据库集群中的数据,因此,将分布式数据库集群中所有待检查节点标记为禁用检查。具体的,可以通过更新全局标记位,以实现禁用所有待检查节点的检查项,结束分布式数据库集群运行状态的检查的目的。
步骤S102:判断当前节点是否是分布式数据库集群的主管理节点;若当前节点是分布式数据库集群的主管理节点,则执行步骤S103。
在具体实现步骤S102的过程中,若当前节点属于分布式数据库集群,判断当前节点是否是分布式数据库集群的主管理节点;若当前节点是分布式数据库集群的主管理节点,则执行步骤S103。
需要说明的是,通过查询当前节点中是否存在管理进程来判断当前节点是否是分布式数据库集群的主管理节点;若当前节点中存在管理进程,则确定当前节点是分布式数据库集群的主管理节点;若当前节点中不存在管理进程,则确定当前节点不是分布式数据库集群的主管理节点。
可以理解的是,分布式数据库由数十台集群节点(节点即服务器)构成。其中的若干台集群节点是管理节点,用于管理分布式数据库集群。主管理节点本身不用于执行业务逻辑,而是用于管理和监控整个集群,因此,通过查询当前节点中是否存在管理进程的方式,判断当前节点是否是分布式数据库集群的主管理节点。
可选的,若当前节点不是分布式数据库集群的主管理节点,则无法执行分布式数据库集群运行状态的检查,因此,在本发明实施例中执行步骤S102之后,还进一步包括:
若当前节点不是分布式数据库集群的主管理节点,则查找分布式数据库集群的主管理节点;获取分布式数据库集群的主管理节点的IP地址并向用户展示IP地址。
可以理解的是,查找分布式数据库集群的主管理节点的IP地址,以便利用分布式数据库集群的主管理节点进行分布式数据库集群运行状态的检查。
步骤S103:获取分布式数据库集群中所有待检查节点的三元组信息。
可以理解的是,在分布式数据库中,预先构建所有集群的数据节点、计算节点、管理节点的数据库连接对象,并将其存入连接池内,以便获取分布式数据库集群中所有待检查节点的三元组信息。
其中,数据库连接对象指对数据库的长连接,每个长连接为一个数据库的会话,只要连接不断开,就可以持续执行不同的SQL语句,无需重复重建/释放连接。连接池指对不同组件/节点的连接对象存放在一个容器(如python语言中的list)中,这个容器称为连接池,需要执行sql时到连接池取对应的连接对象执行sql后再放回连接池。
需要说明的是,预先构建数据库连接对象并将数据库连接对象存入连接池中,有利于提高数据收集的速度,无需重复构建/释放连接,提高了数据收集的效率。
可以理解的是,三元组信息由检查实例、检查指标、检查命令三部分构成。其中,检查实例是分布式数据库集群内的某种组件类型的单个节点,检查指标是单个节点所属组件类型所需要执行的具体检查项,检查命令是该检查项获取的具体方法。
在具体实现步骤S103的过程中,若当前节点是分布式数据库集群的主管理节点,则加载配置文件,通过配置文件获取分布式数据库集群中所有待检查节点的三元组信息。
例如:若当前节点是分布式数据库集群的主管理节点,则加载配置文件,通过配置文件确定三元组信息中的检查实例为主机名,通过“hostname命令”获取检查实例;通过配置文件获取三元组信息中的检查指标和检查命令。
需要说明的是,获取所有待检查节点的三元组信息具体可以是获取需要收集的检查项、数据库用户信息(数据库用户账号及经过加密后的用户密码)以及各个检查项的预设检查阈值(例如专家经验阈值)。
需要说明的是,本申请涉及的信息(包括但不限于用户账号及经过加密后的用户密码)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
在具体实现中,获取所有待检查节点的三元组信息还包括连接主管理节点内的元数据库,获取所有集群(一组管理节点可能管理多个集群,每个集群都包含各种类型的数据库组件)的结构信息,包括但不限于计算节点、数据节点、管理节点及其他应用组件的结构信息。
步骤S104:对于每个待检查节点,根据三元组信息构建待检查节点的运行状态检查任务。
可以理解的是,每个物理机上可能部署多个实例(合并部署以节约资源),与每种实例相关的三元组可能有多个,每个三元组代表一个检查指标,如:数据节点-慢sql数、数据节点-长事务数等等,因此,每个待检查节点都有对应的三元组信息。
在具体实现步骤S104的过程中,对于每个待检查节点,根据三元组信息中的检查实例和检查指标确定待检查节点的具体检查项;基于三元组信息中的检查命令和具体检查项构建待检查节点的运行状态检查任务。
步骤S105:执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果。
在具体实现步骤S105的过程中,对于每个运行状态检查任务,利用运行状态检查任务中的检查命令,获取运行状态检查任务中的具体检查项对应的检查值;根据检查值对应的预设检查阈值(例如专家经验阈值),确定检查值对应的风险检查结果;输出到前端交互界面展示风险检查结果。
具体的,并行执行所有运行状态检查任务,例如同一组件类型的不同节点通过并行的方式执行运行状态检查任务,以缩短检查耗时。
需要说明的是,检查命令分为三种类型,所有运行状态检查任务中的具体检查项都是通过这三种类型的其中一种获取得到的。第一种类型是通过操作系统命令获取具体检查项,包含操作系统原生命令获取和数据库自带系统工具获取两种类型;第二种类型是通过登录数据库利用查询SQL获取具体检查项;第三种类型是通过调用数据库管理平台的接口获取具体检查项。
可以理解的是,每种待检查节点的具体检查项,均预先根据专家经验在配置文件中设置了不同风险级别的预设检查阈值,分为低/中/高风险;具体检查项的检查值与预设检查阈值进行比较,确定具体检查项的检查值对应的风险检查结果(例如风险检查结果指示该具体检查项的检查值为低风险/中风险/高风险)。
在本发明实施例中,定时收集分布式数据库集群内各个待检查节点(即各个服务器)的运行状态信息;通过主管理节点生成分布式数据库集群中所有待检查节点的运行状态检查任务,解决了分布式数据库运行状态健康程度难以快速获取的问题,提高了收集数据的完整性。基于主管理节点对所有待检查节点进行运行状态检查,并将风险检查结果按照固定格式聚合输出,提高了分布式数据库集群运行状态的检查效率。
与上述本发明实施例提供的一种分布式数据库集群运行状态的检查方法相对应,参见图2,示出了图2为本发明实施例提供的一种分布式数据库集群运行状态的检查装置的结构框图,该检查装置包括:第一判断单元201、第二判断单元202、获取单元203、构建单元204和执行检查单元205。
第一判断单元201,用于判断当前节点是否属于分布式数据库集群。
第二判断单元202,用于若当前节点属于分布式数据库集群,判断当前节点是否是分布式数据库集群的主管理节点。
获取单元203,用于若当前节点是分布式数据库集群的主管理节点,获取分布式数据库集群中所有待检查节点的三元组信息。
构建单元204,用于对于每个待检查节点,根据三元组信息构建待检查节点的运行状态检查任务。
执行检查单元205,用于执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果。
在本发明实施例中,定时收集分布式数据库集群内各个待检查节点(即各个服务器)的运行状态信息;通过主管理节点生成分布式数据库集群中所有待检查节点的运行状态检查任务,解决了分布式数据库运行状态健康程度难以快速获取的问题,提高了收集数据的完整性。基于主管理节点对所有待检查节点进行运行状态检查,并将风险检查结果按照固定格式聚合输出,提高了分布式数据库集群运行状态的检查效率。
结合图2示出的内容,第一判断单元201包括:查询模块、第一确定模块和第二确定模块,各个模块的实现原理如下:
查询模块,用于通过查询语句查询当前节点中是否存在数据库专用操作系统用户。
第一确定模块,用于若当前节点中存在数据库专用操作系统用户,则确定当前节点属于分布式数据库集群。
第二确定模块,用于若当前节点中不存在数据库专用操作系统用户,则确定当前节点不属于分布式数据库集群。
结合图2示出的内容,该检查装置还包括:禁用检查单元,用于若当前节点不属于分布式数据库集群,则将分布式数据库集群中所有待检查节点标记为禁用检查。
结合图2示出的内容,第二判断单元202包括:查询管理进程模块、第三确定模块和第四确定模块,各个模块的实现原理如下:
查询管理进程模块,用于若当前节点属于分布式数据库集群,则查询当前节点中是否存在管理进程。
第三确定模块,用于当当前节点中存在管理进程时,确定当前节点是分布式数据库集群的主管理节点。
第四确定模块,用于当当前节点中不存在管理进程时,确定当前节点不是分布式数据库集群的主管理节点。
结合图2示出的内容,该检查装置还包括:查找单元和获取IP地址单元。
查找单元,用于若当前节点不是分布式数据库集群的主管理节点,则查找分布式数据库集群的主管理节点。
获取IP地址单元,用于获取分布式数据库集群的主管理节点的IP地址并向用户展示IP地址。
结合图2示出的内容,构建单元204包括第五确定模块和构建模块,各个模块的实现原理如下:
第五确定模块,用于对于每个待检查节点,根据三元组信息中的检查实例和检查指标确定待检查节点的具体检查项。
构建模块,用于基于三元组信息中的检查命令和具体检查项构建待检查节点的运行状态检查任务。
结合图2示出的内容,执行检查单元205包括获取模块、第六确定模块和展示模块,各个模块的实现原理如下:
获取模块,用于对于每个运行状态检查任务,利用运行状态检查任务中的检查命令,获取运行状态检查任务中的具体检查项对应的检查值。
第六确定模块,用于根据检查值对应的预设检查阈值,确定检查值对应的风险检查结果。
展示模块,用于展示风险检查结果。
综上所述,基于上述本发明实施例提供的一种分布式数据库集群运行状态的检查方法及装置,定时收集分布式数据库集群内各个待检查节点(即各个服务器)的运行状态信息;通过主管理节点生成分布式数据库集群中所有待检查节点的运行状态检查任务,解决了分布式数据库运行状态健康程度难以快速获取的问题,提高了收集数据的完整性。基于主管理节点对所有待检查节点进行运行状态检查,并将风险检查结果按照固定格式聚合输出,提高了分布式数据库集群运行状态的检查效率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种分布式数据库集群运行状态的检查方法,其特征在于,所述方法包括:
判断当前节点是否属于分布式数据库集群;
若所述当前节点属于分布式数据库集群,判断所述当前节点是否是所述分布式数据库集群的主管理节点;
若所述当前节点是所述分布式数据库集群的主管理节点,获取所述分布式数据库集群中所有待检查节点的三元组信息;
对于每个所述待检查节点,根据所述三元组信息构建所述待检查节点的运行状态检查任务;
执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果。
2.根据权利要求1所述的方法,其特征在于,所述判断当前节点是否属于分布式数据库集群,包括:
通过查询语句查询当前节点中是否存在数据库专用操作系统用户;
若当前节点中存在数据库专用操作系统用户,则确定所述当前节点属于分布式数据库集群;
若当前节点中不存在数据库专用操作系统用户,则确定所述当前节点不属于分布式数据库集群。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述当前节点不属于所述分布式数据库集群,则将所述分布式数据库集群中所有待检查节点标记为禁用检查。
4.根据权利要求1所述的方法,其特征在于,所述若所述当前节点属于分布式数据库集群,判断所述当前节点是否是所述分布式数据库集群的主管理节点,包括:
若所述当前节点属于分布式数据库集群,则查询所述当前节点中是否存在管理进程;
当所述当前节点中存在管理进程时,确定所述当前节点是所述分布式数据库集群的主管理节点;
当所述当前节点中不存在管理进程时,确定所述当前节点不是所述分布式数据库集群的主管理节点。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述当前节点不是所述分布式数据库集群的主管理节点,则查找所述分布式数据库集群的主管理节点;
获取所述分布式数据库集群的主管理节点的IP地址并向用户展示所述IP地址。
6.根据权利要求1所述的方法,其特征在于,所述对于每个所述待检查节点,根据所述三元组信息构建所述待检查节点的运行状态检查任务,包括:
对于每个所述待检查节点,根据所述三元组信息中的检查实例和检查指标确定所述待检查节点的具体检查项;
基于所述三元组信息中的检查命令和所述具体检查项构建所述待检查节点的运行状态检查任务。
7.根据权利要求6所述的方法,其特征在于,所述执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果,包括:
对于每个运行状态检查任务,利用所述运行状态检查任务中的检查命令,获取所述运行状态检查任务中的具体检查项对应的检查值;
根据所述检查值对应的预设检查阈值,确定所述检查值对应的风险检查结果;
展示所述风险检查结果。
8.一种分布式数据库集群运行状态的检查装置,其特征在于,所述装置包括:
第一判断单元,用于判断当前节点是否属于分布式数据库集群;
第二判断单元,用于若所述当前节点属于分布式数据库集群,判断所述当前节点是否是所述分布式数据库集群的主管理节点;
获取单元,用于若所述当前节点是所述分布式数据库集群的主管理节点,获取所述分布式数据库集群中所有待检查节点的三元组信息;
构建单元,用于对于每个所述待检查节点,根据所述三元组信息构建所述待检查节点的运行状态检查任务;
执行检查单元,用于执行所有运行状态检查任务,得到风险检查结果并展示所有风险检查结果。
9.根据权利要求8所述的装置,其特征在于,所述第一判断单元,包括:
查询模块,用于通过查询语句查询当前节点中是否存在数据库专用操作系统用户;
第一确定模块,用于若当前节点中存在数据库专用操作系统用户,则确定所述当前节点属于分布式数据库集群;
第二确定模块,用于若当前节点中不存在数据库专用操作系统用户,则确定所述当前节点不属于分布式数据库集群。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
禁用检查单元,用于若所述当前节点不属于所述分布式数据库集群,则将所述分布式数据库集群中所有待检查节点标记为禁用检查。
CN202311305628.8A 2023-10-10 2023-10-10 一种分布式数据库集群运行状态的检查方法及装置 Pending CN117331801A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311305628.8A CN117331801A (zh) 2023-10-10 2023-10-10 一种分布式数据库集群运行状态的检查方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311305628.8A CN117331801A (zh) 2023-10-10 2023-10-10 一种分布式数据库集群运行状态的检查方法及装置

Publications (1)

Publication Number Publication Date
CN117331801A true CN117331801A (zh) 2024-01-02

Family

ID=89291395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311305628.8A Pending CN117331801A (zh) 2023-10-10 2023-10-10 一种分布式数据库集群运行状态的检查方法及装置

Country Status (1)

Country Link
CN (1) CN117331801A (zh)

Similar Documents

Publication Publication Date Title
US11755628B2 (en) Data relationships storage platform
US7107340B2 (en) System and method for collecting and storing event data from distributed transactional applications
US20180113771A1 (en) Transaction consistency query support for replicated data from recovery log to external data stores
US9508048B2 (en) System and method for integrated real time reporting and analytics across networked applications
US10216782B2 (en) Processing of updates in a database system using different scenarios
CN113094385B (zh) 一种基于软件定义开放工具集的数据共享融合平台及方法
US20150317331A1 (en) Unified platform for application development
US20070168334A1 (en) Normalization support in a database design tool
US11100152B2 (en) Data portal
CN112148578A (zh) 基于机器学习的it故障缺陷预测方法
CN109213826A (zh) 数据处理方法和设备
CN112579578A (zh) 基于元数据的数据质量管理方法、装置、系统及服务器
CN111639016A (zh) 大数据日志分析方法、装置及计算机存储介质
US9922085B2 (en) Template based generation of cross views
US11442995B2 (en) Filtering of log search results based on automated analysis
US11210352B2 (en) Automatic check of search configuration changes
US7917609B2 (en) Method and apparatus for managing lightweight directory access protocol information
CN117331801A (zh) 一种分布式数据库集群运行状态的检查方法及装置
CN115168474A (zh) 一种基于大数据模型的物联中台系统搭建方法
CN115827701B (zh) 一种多层异构数据的管理系统、方法及电子设备
CN118035178B (zh) 一种数据排查方法、装置、电子设备、计算机可读存储介质及程序产品
US10114822B2 (en) Enhanced reporting system
US20220321603A1 (en) Domain-independent resource security and management
US10762090B2 (en) Software discovery based on metadata analysis
Hägglund Comparison of Databases Used in Clearing House Systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination