CN117827509A - 一种数据库异常检测处理方法、装置、设备及介质 - Google Patents
一种数据库异常检测处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN117827509A CN117827509A CN202311746336.8A CN202311746336A CN117827509A CN 117827509 A CN117827509 A CN 117827509A CN 202311746336 A CN202311746336 A CN 202311746336A CN 117827509 A CN117827509 A CN 117827509A
- Authority
- CN
- China
- Prior art keywords
- data node
- disk
- abnormal
- database
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 19
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 230000005856 abnormality Effects 0.000 title abstract description 10
- 230000002159 abnormal effect Effects 0.000 claims abstract description 105
- 238000000034 method Methods 0.000 claims abstract description 62
- 230000008569 process Effects 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000012423 maintenance Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 4
- 230000036541 health Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0709—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0706—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
- G06F11/0727—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0751—Error or fault detection not based on redundancy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0793—Remedial or corrective actions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种数据库异常检测处理方法、装置、设备及介质,用以基于检测数据库所在磁盘是否异常,实现针对异常磁盘进行数据操作的目标数据节点的切换,从而保证基于数据库的业务正常进行,提升用户感受。本申请提供的方法一种数据库异常检测处理方法,包括:检测数据库所在磁盘是否异常;当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
Description
技术领域
本申请涉及数据库技术领域,尤其涉及一种数据库异常检测处理方法、装置、设备及介质。
背景技术
Greenplum数据库是面向数据库仓库应用的关系型数据库。采用大规模并行处理架构,具有可横向伸缩、高可用、高性能等优点。但是,在使用过程中,如果非默认表空间所处磁盘发生异常,查询表数据的时候,如果查询到此部分数据,会查询报错,即无法满足业务需求,给用户带来不好的体验。
发明内容
本申请实施例提供了一种数据库异常检测处理方法、装置、设备及介质,用以基于检测数据库所在磁盘是否异常,实现针对异常磁盘进行数据操作的目标数据节点的切换,从而保证基于数据库的业务正常进行,提升用户感受。
本申请实施例提供的一种数据库异常检测处理方法,包括:
检测数据库所在磁盘是否异常;
当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;
确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;
当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
本申请实施例通过检测数据库所在磁盘是否异常,并且当确定存在异常磁盘时,进一步确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;然后再进一步确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;当所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点,从而使得针对所述异常磁盘的数据操作都可以基于正常的辅数据节点实现,避免异常磁盘导致的业务无法实现,无法满足用户需求,从而提高了用户感受。
在一些实施例中,所述数据库,为Greenplum数据库。
在一些实施例中,所述检测数据库所在磁盘是否异常,包括:
针对Greenplum数据库集群中的每一数据库所在磁盘,检测是否异常。
在一些实施例中,确定所述异常磁盘对应的主数据节点,包括:
查询Greenplum数据库集群元数据表;
通过查询所述Greenplum数据库集群元数据表中的数据节点与磁盘挂载目录信息的对应关系,确定所述异常磁盘所对应的主数据节点。
在一些实施例中,确定所述主数据节点对应的辅数据节点,包括:
通过查询所述Greenplum数据库集群元数据表,确定所述辅数据节点为正常节点。
在一些实施例中,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点,包括:
结束所述主数据节点对应的进程。
在一些实施例中,所述方法还包括:
上报异常磁盘信息。
本申请实施例提供的一种数据库异常检测处理装置,包括:
第一单元,用于检测数据库所在磁盘是否异常;
第二单元,用于当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;
第三单元,用于确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;
第四单元,用于当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
本申请另一实施例提供了一种电子设备,其包括存储器和处理器,其中,所述存储器用于存储程序指令,所述处理器用于调用所述存储器中存储的程序指令,按照获得的程序执行上述任一种方法。
本申请另一实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行上述任一种方法。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的数据库异常检测处理方法的总体流程示意图;
图2为本申请实施例提供的一种数据库异常检测处理方法的具体流程示意图;
图3为本申请实施例提供的另一种数据库异常检测处理方法的具体流程示意图;
图4为本申请实施例提供的一种电子设备的结构示意图;
图5为本申请实施例提供的一种数据库异常检测处理装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种数据库异常检测处理方法、装置、设备及介质,用以基于检测数据库所在磁盘是否异常,实现针对异常磁盘进行数据操作的目标数据节点的切换,从而保证基于数据库的业务正常进行,提升用户感受。
其中,方法和装置、设备、介质是基于同一申请构思的,由于方法和装置、设备、介质解决问题的原理相似,因此装置、设备、介质和方法的实施可以相互参见,重复之处不再赘述。
本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下示例和实施例将只被理解为是说明性的示例。虽然本说明书可能在若干处提及“一”、“一个”或“一些”示例或实施例,但这并非意味着每个这种提及都与相同的示例或实施例有关,也并非意味着该特征仅适用于单个示例或实施例。不同实施例的单个特征也可以被组合以提供其他实施例。此外,如“包括”和“包含”的术语应被理解为并不将所描述的实施例限制为仅由已提及的那些特征组成;这种示例和实施例还可以包含并未具体提及的特征、结构、单元、模块等。
下面结合说明书附图对本申请各个实施例进行详细描述。需要说明的是,本申请实施例的展示顺序仅代表实施例的先后顺序,并不代表实施例所提供的技术方案的优劣。
Greenplum数据库集群包括了多个节点,每一个节点可以有一个或多个数据库。当一个节点存在多个数据库时,每个数据库位于同一个节点的不同数据盘。构成Greenplum数据库集群的节点主要分为两类:控制节点(master)和数据节点(segment)。控制节点不存放任何用户数据,只是对客户端进行访问控制和存储表分布逻辑的元数据;数据节点负责数据的存储和计算。
对于数据库集群来说,Greenplum数据库集群的稳定性是一个很重要的指标。在一个分布式数据库集群中,Greenplum数据库集群的高可用,支持Greenplum数据库集群在单点故障的情况仍能够正常提供服务。对于Greenplum来说,有些故障Greenplum数据库集群可检测到,然后自动完成数据节点的切换,不影响用户的使用。有些故障Greenplum数据库集群则无法检测到,并不会自动切换到正常的数据节点上,此时,用户使用Greenplum数据库集群过程中就会产生报错,或者Greenplum数据库集群不可用,影响用户体验。
如果只是对Greenplum数据库集群的硬件等进行监控或者对故障进行预判,对于出现的故障的节点未能及时进行切换,无法保障Greenplum数据库集群的使用不受影响。如果Greenplum数据库集群出现故障,则需要维护人员介入进行处理,处理期间Greenplum数据库集群不可用,影响用户体验。
因此,本申请实施例提供的技术方案中,提出对Greenplum数据库集群的磁盘进行监控,如果检测到磁盘异常,则将异常磁盘对应的数据节点进行切换,从而保证Greenplum数据库集群的正常使用。
参见图1,本申请实施例提供的一种数据库异常检测处理方法,包括:
S101、检测数据库所在磁盘是否异常;
其中,所述的数据库,可以是各种类型的数据库,本申请实施例中以Greenplum数据库进行说明,但并不限于此,也可以是其他类型的数据库,例如Clickhouse、doris等数据库。
S102、当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;
也就是说,为了数据的安全可靠,数据库都对应有两个不同的物理节点,一个作为主数据节点,另一个作为数据备份的辅数据节点。
S103、确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;
S104、当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
正常情况下,针对数据库的操作,都是基于主数据节点实现的,而本申请实施例进一步实现了在异常情况下的针对数据库的操作,也可以基于辅数据节点实现。
在一些实施例中,所述数据库,为Greenplum数据库。
在一些实施例中,所述检测数据库所在磁盘是否异常,包括:
针对Greenplum数据库集群中的每一数据库所在磁盘,检测是否异常。
在一些实施例中,确定所述异常磁盘对应的主数据节点,包括:
查询Greenplum数据库集群元数据表(gp_segment_configuration);
通过查询所述Greenplum数据库集群元数据表中的数据节点与磁盘挂载目录信息的对应关系,确定所述异常磁盘所对应的主数据节点。
其中,所述Greenplum数据库集群元数据表,例如可以从Greenplum数据库集群的控制节点中查询获得。
在一些实施例中,确定所述主数据节点对应的辅数据节点,包括:
通过查询所述Greenplum数据库集群元数据表,确定所述辅数据节点为正常节点。
在一些实施例中,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点,包括:
结束所述主数据节点对应的进程,从而使得针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
在一些实施例中,所述方法还包括:
上报异常磁盘信息。
所述的异常磁盘信息,例如包括:磁盘运行日志,运维告警信息等。使得运维人员直接可以找到坏掉的磁盘,以最快速度找到异常所在。
下面给出两个具体实施例的举例说明。
实施例一、
Greenplum数据库集群的异常检测处理方法,例如参见图2,包括如下步骤:
S201、按照预设规则,向Greenplum集群的目标节点的磁盘写文件;
其中,所述预设规则,例如是周期性地向Greenplum集群的目标节点的磁盘写文件,具体的周期可以根据实际需要而定,例如一分钟。
或者,所述预设规则,例如还可以是事件,即当发生预设事件时,向Greenplum集群的目标节点的磁盘写文件,所述事件可以根据实际需要而定,本申请实施例不进行限制。
也就是说,检测磁盘是否异常的触发条件,可以是时间,也可以是事件,看具体情况而定。
所述的目标节点,可以是Greenplum集群的预设节点,也可以是Greenplum集群的所有节点。
所述写的文件,具体内容也可以根据实际需要而定,本申请实施例不进行限制。
S202、判断是否写入成功,如果写文件成功,则说明磁盘正常,重返步骤S201;否则,如果写文件失败,则说明磁盘异常,执行步骤S203。
S203、如果存在磁盘异常,从控制节点中查询Greenplum数据库集群元数据表,并从Greenplum数据库集群元数据表(gp_segment_configuration)中根据节点(hostname)与磁盘挂载目录信息(datadir)的对应关系,找到异常磁盘所对应的主数据节点(primarysegment)。
S204、判断主数据节点对应的备数据节点(mirror segment)是否正常。
Greenplum数据库有自己的视图,即Greenplum数据库集群元数据表gp_segment_configuration,此视图会展示各个数据节点是否正常,视图中的内容由Greenplum数据库自己更新。因此,可以直接利用Greenplum数据库的视图gp_segment_configuration,判断主数据节点对应的备数据节点(mirror segment)是否正常。
若正常,则执行步骤S205;否则,执行步骤S206。
S205、主数据节点对应的备数据节点正常,则将主数据节点对应的进程结束掉,使得Greenplum数据库集群自动切换到备数据节点上。也就是说,Greenplum数据库集群检测到主数据节点(primary segment)进程结束掉后,内部会自动进行切换,无需外部用户操作。
后续,所有的数据查询等操作,都是在切换后的备数据节点对应的正常的磁盘上进行,因此保证业务不受影响。
S206、将异常磁盘信息上报到运维系统。
也就是说,若主数据节点对应的备数据节点也异常,则不进行数据节点的切换,将异常磁盘信息上报到运维系统,从而可以提示运维人员及时进行磁盘修复。
若主数据节点对应的备数据节点正常,在将主数据节点对应的进程结束掉之后,也可以将异常磁盘信息上报到运维系统,从而可以使得运维人员及时了解当前Greenplum数据库集群的健康状态。
实施例二、
Greenplum数据库集群的异常检测处理方法,例如参见图3,包括如下步骤:
S301、检测所有节点的磁盘状态;
例如,针对每一磁盘,通过向该磁盘写入数据,检测该磁盘状态是否正常,写入成功,则说明该磁盘正常,否则说明该磁盘异常;
S302、判断是否有磁盘损坏;如果是,则执行步骤S304;否则,执行步骤S303;
S303、等待预设时长;
其中,所述预设时长,例如一分钟,等待时长达到一分钟则继续返回执行步骤S301,从而实现周期性地检测所有节点的磁盘状态。
S304、从控制节点中查询Greenplum数据库集群元数据表,并从Greenplum数据库集群元数据表中根据节点与磁盘挂载目录信息的对应关系,找到异常磁盘所对应的主数据节点;
S305、判断主数据节点对应的备数据节点是否正常;如果是,则执行步骤S306;否则,执行步骤S307;
S306、将主数据节点对应的进程结束掉;
具体地,Greenplum会将主数据节点对应的元数据的状态设置为down,这样,后面的所有操作都不会下发到此主数据节点上,不会影响正常业务使用。
S307、将异常磁盘信息上报到运维系统。
另外,需要说明的是,Greenplum所有的数据节点对应的进程,都位于默认表空间(pg_default)所在的磁盘上,如果默认表空间对应的磁盘出现故障,数据节点对应的进程会挂掉,Greenplum数据库集群检测到数据节点对应的进程挂掉后,会自动切换到对应的数据节点上,即会将数据的查询节点由异常磁盘所对应的主数据节点切换到对应的辅数据节点上。
除了上述默认表空间,Greenplum还支持自定义表空间,即支持将同一个数据库中的数据放到不同的磁盘上。因此,自定义表空间就是为了实现将表的部分数据放到除初始化时设置的数据盘以外的其他数据盘上。
但是,如果Greenplum数据库集群中有自定义的表空间(即非默认表空间),而且将默认表空间的部分表的数据迁移到了自定义表空间上,如果自定义的表空间所在的磁盘发生故障,由于自定义的表空间所在的磁盘没有数据节点进程,所以Greenplum数据库集群不能感受到磁盘异常,此时关于查询或者插入自定义表空间上的表或数据等操作,就会报错。而采用本申请实施例提供的技术方案,不受表空间形式的限制,直接通过向磁盘写入数据的形式检测磁盘是否异常,从而采取相应的数据节点切换的处理措施,避免磁盘异常影响数据查询等针对数据库操作的业务的正常进行。
因此,本申请实施例提供的技术方案,不仅适用于支持默认表空间的数据库集群的健康状态检测处理,还适用于支持自定义表空间的数据库集群的健康状态检测处理。即无论数据库集群采用哪种表空间,本申请实施例都可以在磁盘出现故障时,将数据的查询节点由异常磁盘所对应的主数据节点切换到对应的辅数据节点上,从而避免业务受到影响。
综上所述,本申请实施例提供的技术方案,可以实时监控磁盘状态,磁盘异常后,及时将异常的磁盘对应的数据节点进行切换,不影响Greenplum数据库集群的正常服务,同时上报告警信息给运维人员,及时修复磁盘异常。
下面介绍一下本申请实施例提供的设备或装置,其中与上述方法中所述的相同或相应的技术特征的解释或举例说明,后续不再赘述。
本申请实施例提供的一种电子设备,参见图4,例如包括:
处理器600,用于读取存储器620中的程序,执行下列过程:
检测数据库所在磁盘是否异常;
当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;
确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;
当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
在一些实施例中,所述数据库,为Greenplum数据库。
在一些实施例中,所述检测数据库所在磁盘是否异常,包括:
针对Greenplum数据库集群中的每一数据库所在磁盘,检测是否异常。
在一些实施例中,确定所述异常磁盘对应的主数据节点,包括:
查询Greenplum数据库集群元数据表;
通过查询所述Greenplum数据库集群元数据表中的数据节点与磁盘挂载目录信息的对应关系,确定所述异常磁盘所对应的主数据节点。
在一些实施例中,确定所述主数据节点对应的辅数据节点,包括:
通过查询所述Greenplum数据库集群元数据表,确定所述辅数据节点为正常节点。
在一些实施例中,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点,包括:
结束所述主数据节点对应的进程。
在一些实施例中,所述处理器600,还用于读取存储器620中的程序,执行下列过程:
上报异常磁盘信息。
收发机610,用于在处理器600的控制下接收和发送数据。
其中,在图4中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器600代表的一个或多个处理器和存储器620代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机610可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元,这些传输介质包括,这些传输介质包括无线信道、有线信道、光缆等传输介质。针对不同的用户设备,用户接口630还可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
处理器600负责管理总线架构和通常的处理,存储器620可以存储处理器600在执行操作时所使用的数据。
在一些实施方式中,处理器600可以是CPU(中央处埋器)、ASIC(ApplicationSpecific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable GateArray,现场可编程门阵列)或CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件),处理器也可以采用多核架构。
处理器通过调用存储器存储的计算机程序,用于按照获得的可执行指令执行本申请实施例提供的任一所述方法。处理器与存储器也可以物理上分开布置。
在此需要说明的是,本申请实施例提供的上述装置,能够实现上述方法实施例所实现的所有方法步骤,且能够达到相同的技术效果,在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
参见图5,本申请实施例提供的一种数据库异常检测处理装置,包括:
第一单元11,用于检测数据库所在磁盘是否异常;
第二单元12,用于当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;
第三单元13,用于确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;
第四单元14,用于当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
在一些实施例中,所述数据库,为Greenplum数据库。
在一些实施例中,所述检测数据库所在磁盘是否异常,包括:
针对Greenplum数据库集群中的每一数据库所在磁盘,检测是否异常。
在一些实施例中,确定所述异常磁盘对应的主数据节点,包括:
查询Greenplum数据库集群元数据表;
通过查询所述Greenplum数据库集群元数据表中的数据节点与磁盘挂载目录信息的对应关系,确定所述异常磁盘所对应的主数据节点。
在一些实施例中,确定所述主数据节点对应的辅数据节点,包括:
通过查询所述Greenplum数据库集群元数据表,确定所述辅数据节点为正常节点。
在一些实施例中,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点,包括:
结束所述主数据节点对应的进程。
在一些实施例中,所述第四单元14还用于:
上报异常磁盘信息。
需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的任一所述的设备或装置,具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)等。可以包括中央处理器(Center Processing Unit,CPU)、存储器、输入/输出设备等,输入设备可以包括键盘、鼠标、触摸屏等,输出设备可以包括显示设备,如液晶显示器(Liquid CrystalDisplay,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器提供存储器中存储的程序指令和数据。在本申请实施例中,存储器可以用于存储本申请实施例提供的任一所述方法的程序。
处理器通过调用存储器存储的程序指令,处理器用于按照获得的程序指令执行本申请实施例提供的任一所述方法。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中的任一所述方法。所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本申请实施例提供了一种计算机可读存储介质,用于储存为上述本申请实施例提供的装置所用的计算机程序指令,其包含用于执行上述本申请实施例提供的任一方法的程序。所述计算机可读存储介质,可以是非暂时性计算机可读介质。
所述计算机可读存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
应当理解:
通信网络中的实体经由其往来传送流量的接入技术可以是任何合适的当前或未来技术,诸如可以使用WLAN(无线本地接入网络)、WiMAX(微波接入全球互操作性)、LTE、LTE-A、5G、蓝牙、红外等;另外,实施例还可以应用有线技术,例如,基于IP的接入技术,如有线网络或固定线路。
适合于被实现为软件代码或其一部分并使用处理器或处理功能运行的实施例是独立于软件代码的,并且可以使用任何已知或未来开发的编程语言来规定,诸如高级编程语言,诸如objective-C、C、C++、C#、Java、Python、Javascript、其他脚本语言等,或低级编程语言,诸如机器语言或汇编程序。
实施例的实现是独立于硬件的,并且可以使用任何已知或未来开发的硬件技术或其任何混合来实现,诸如微处理器或CPU(中央处理单元)、MOS(金属氧化物半导体)、CMOS(互补MOS)、BiMOS(双极MOS)、BiCMOS(双极CMOS)、ECL(发射极耦合逻辑)和/或TTL(晶体管-晶体管逻辑)。
实施例可以被实现为单独的设备、装置、单元、部件或功能,或者以分布式方式实现,例如,可以在处理中使用或共享一个或多个处理器或处理功能,或者可以在处理中使用和共享一个或多个处理段或处理部分,其中,一个物理处理器或多于一个的物理处理器可以被用于实现一个或多个专用于如所描述的特定处理的处理部分。
装置可以由半导体芯片、芯片组或包括这种芯片或芯片组的(硬件)模块来实现。
实施例还可以被实现为硬件和软件的任何组合,诸如ASIC(应用特定IC(集成电路))组件、FPGA(现场可编程门阵列)或CPLD(复杂可编程逻辑器件)组件或DSP(数字信号处理器)组件。
实施例还可以被实现为计算机程序产品,包括在其中体现计算机可读程序代码的计算机可用介质,该计算机可读程序代码适应于执行如实施例中所描述的过程,其中,该计算机可用介质可以是非暂时性介质。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种数据库异常检测处理方法,其特征在于,所述方法包括:
检测数据库所在磁盘是否异常;
当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;
确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;
当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
2.根据权利要求1所述的方法,其特征在于,所述数据库,为Greenplum数据库。
3.根据权利要求1所述的方法,其特征在于,所述检测数据库所在磁盘是否异常,包括:
针对Greenplum数据库集群中的每一数据库所在磁盘,检测是否异常。
4.根据权利要求3所述的方法,其特征在于,确定所述异常磁盘对应的主数据节点,包括:
查询Greenplum数据库集群元数据表;
通过查询所述Greenplum数据库集群元数据表中的数据节点与磁盘挂载目录信息的对应关系,确定所述异常磁盘所对应的主数据节点。
5.根据权利要求2所述的方法,其特征在于,确定所述主数据节点对应的辅数据节点,包括:
通过查询所述Greenplum数据库集群元数据表,确定所述辅数据节点为正常节点。
6.根据权利要求1所述的方法,其特征在于,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点,包括:
结束所述主数据节点对应的进程。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
上报异常磁盘信息。
8.一种数据库异常检测处理装置,其特征在于,所述装置包括:
第一单元,用于检测数据库所在磁盘是否异常;
第二单元,用于当确定存在异常磁盘时,确定所述异常磁盘对应的主数据节点;其中,所述主数据节点为针对所述异常磁盘进行数据操作的目标数据节点;
第三单元,用于确定所述主数据节点对应的辅数据节点;其中,所述辅数据节点是所述主数据节点的数据备份节点;
第四单元,用于当确定所述辅数据节点为正常节点时,将针对所述异常磁盘进行数据操作的目标数据节点,切换为所述辅数据节点。
9.一种电子设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述计算机执行权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311746336.8A CN117827509A (zh) | 2023-12-18 | 2023-12-18 | 一种数据库异常检测处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311746336.8A CN117827509A (zh) | 2023-12-18 | 2023-12-18 | 一种数据库异常检测处理方法、装置、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117827509A true CN117827509A (zh) | 2024-04-05 |
Family
ID=90505173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311746336.8A Pending CN117827509A (zh) | 2023-12-18 | 2023-12-18 | 一种数据库异常检测处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117827509A (zh) |
-
2023
- 2023-12-18 CN CN202311746336.8A patent/CN117827509A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190155677A1 (en) | Proactive failure handling in data processing systems | |
US9632887B2 (en) | Automatic client side seamless failover | |
US8108724B2 (en) | Field replaceable unit failure determination | |
CN100394394C (zh) | 容错双工计算机系统及其控制方法 | |
CN111104283B (zh) | 一种分布式存储系统的故障检测方法、装置、设备及介质 | |
CN110609699B (zh) | 维护存储系统的组件的方法、电子设备和计算机可读介质 | |
US10185614B2 (en) | Generic alarm correlation by means of normalized alarm codes | |
CN112966056B (zh) | 一种信息处理方法、装置、设备、系统及可读存储介质 | |
CN113312341A (zh) | 一种数据质量监控方法、系统和计算机设备 | |
CN112764956A (zh) | 数据库的异常处理系统、数据库的异常处理方法及装置 | |
US20140201566A1 (en) | Automatic computer storage medium diagnostics | |
US11226857B1 (en) | Device, method and computer program product for fault elimination of a multilayer system | |
CN116615719A (zh) | 生成用于在数据中心中电隔离故障域的配置的技术 | |
US20190124145A1 (en) | Method and apparatus for availability management | |
CN115037653B (zh) | 业务流量监控方法、装置、电子设备和存储介质 | |
CN117076196A (zh) | 一种数据库容灾的管控方法和装置 | |
CN117827509A (zh) | 一种数据库异常检测处理方法、装置、设备及介质 | |
CN113391937A (zh) | 用于存储管理的方法、电子设备以及计算机程序产品 | |
JP2016072668A (ja) | 影響範囲特定装置、影響範囲特定方法、及びプログラム | |
CN114900531B (zh) | 数据同步方法、装置和系统 | |
CN110837451B (zh) | 虚拟机高可用的处理方法、装置、设备和介质 | |
CN116991630B (zh) | 重试执行方法、装置、电子设备及计算机可读存储介质 | |
CN114640572B (zh) | 数据容灾的处理方法、装置、设备及计算机可读存储介质 | |
CN113590424A (zh) | 一种故障监控方法、装置、设备及存储介质 | |
CN114721847A (zh) | 设备发生故障的确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |