CN110990183B - 数据库集群的异常检测方法、装置、计算机可读存储介质 - Google Patents

数据库集群的异常检测方法、装置、计算机可读存储介质 Download PDF

Info

Publication number
CN110990183B
CN110990183B CN201911228316.5A CN201911228316A CN110990183B CN 110990183 B CN110990183 B CN 110990183B CN 201911228316 A CN201911228316 A CN 201911228316A CN 110990183 B CN110990183 B CN 110990183B
Authority
CN
China
Prior art keywords
database
cluster
detection
server
database cluster
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911228316.5A
Other languages
English (en)
Other versions
CN110990183A (zh
Inventor
张飞年
赖明星
姜承尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911228316.5A priority Critical patent/CN110990183B/zh
Publication of CN110990183A publication Critical patent/CN110990183A/zh
Application granted granted Critical
Publication of CN110990183B publication Critical patent/CN110990183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0712Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a virtual computing platform, e.g. logically partitioned systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及一种数据库集群的异常检测方法、装置、计算机可读存储介质和计算机设备,所述方法包括:按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果。本申请提供的方案可以提高对数据库集群异常检测的准确度。

Description

数据库集群的异常检测方法、装置、计算机可读存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据库集群的异常检测方法、装置、计算机可读存储介质和计算机设备。
背景技术
数据库集群,就是利用至少两台或者多台数据库服务器,构成一个虚拟单一数据库逻辑映像,从而向客户端提供透明的数据服务。随着计算机和网络技术的迅速发展,数据库集群因可以为用户提供大量的数据服务,得到了广泛的应用。
现有技术中通常采用人工方式对数据库集群中的故障进行检测,用户往往需要手动登录数据库集群中的主数据库和从数据库,通过执行SQL语句或使用自定义的脚本获取检测结果并进行分析,进而检测数据库的异常状态。
可见,目前的数据库集群异常检测方式存在准确度不高的问题。
发明内容
基于此,有必要针对目前的数据库集群异常检测方式存在准确度不高的问题的技术问题,提供一种数据库集群的异常检测方法、装置、计算机可读存储介质和计算机设备。
一种数据库集群的异常检测方法,所述方法包括:
按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;
在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;
根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果。
一种数据库集群的异常检测装置,其特征在于,所述装置包括:
探测模块,用于按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;
获取模块,用于在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;
输出模块,用于根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;
在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;
根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;
在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;
根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果。
上述一种数据库集群的异常检测方法、装置、计算机可读存储介质和计算机设备,通过按照预设的探测周期向数据库集群发送用于探测数据库集群的运行状态的探测请求,确定数据库集群响应探测请求后实际返回的至少两个的具有对应的时间截的集群探测结果;然后,通过在集群探测结果中,获取时间截在预设时间段内的集群探测结果,作为目标探测结果;通过根据预设时间段内的目标探测结果为失败的数目,准确且及时地检测出数据库集群在预设时间段内的异常状况,从而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
附图说明
图1为一个实施例中一种数据库集群的异常检测方法的应用环境图;
图2为一个实施例中一种数据库集群的异常检测方法的流程示意图;
图3为另一个实施例中一种数据库集群的异常检测方法的流程示意图;
图4为一个实施例中一种数据库集群的异常检测装置的结构框图;
图5为一个实施例中数据库集群的探测流程图;
图6为另一个实施例中数据库集群的探测流程图;
图7为一个实施例中一种数据库集群的异常检测方法中的检测服务器的监测模块的探测逻辑图;
图8为一个实施例中一种数据库集群的异常检测方法中的检测服务器的监测模块的异常判断逻辑图;
图9为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中一种数据库集群的异常检测方法的应用架构图。参照图1,该数据库集群的异常检测方法应用于数据库集群的异常检测系统。该数据库集群的异常检测系统包括检测服务器110和数据库集群120。检测服务器110和数据库集群120通过网络连接。检测服务器110可以用独立的服务器或者是多个服务器组成的服务器集群来实现。其中,数据库集群120可以由至少两个的提供数据库服务的服务器组成。其中,检测服务器110可以由至少两个的监测模块112、配置模块114和元数据库模块116组成。实际应用中,数据库集群120可以用于提供区块链储存服务。其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
如图2所示,在一个实施例中,提供了一种数据库集群的异常检测方法。本实施例主要以该方法应用于上述图1中的检测服务器110来举例说明。参照图2,该数据库集群的异常检测方法具体包括如下步骤:
S210,按照预设的探测周期向数据库集群发送探测请求,确定数据库集群响应探测请求后实际返回的至少两个的集群探测结果;其中,探测请求用于探测数据库集群的运行状态;集群探测结果具有对应的时间截。
其中,数据库集群可以是指由至少两台的数据库服务器搭建而成的集群。实际应用中,数据库集群可以是MySQL集群、Oracle集群、DB2集群等。
其中,集群探测结果可以是指对数据库集群的运行状态进行探测后得到的结果。
具体实现中,检测服务器110的至少两个的监测模块112会按照预设的探测周期向数据库集群发送探测请求,从而实现定期的探测下面数据库集群的运行状态,然后,各个监测模块112会确定数据库集群响应探测请求后实际返回的集群探测结果,并将集群探测结果写入到检测服务器110的元数据库模块116的元数据库中。
需要说明的是,在检测服务器110的各个监测模块112对数据库集群的运行状态进行探测之前,检测服务器110的配置模块114需要为各个监测模块112提供服务注册、服务选主和分布式配置中心功能。当各个监测模块112启动时,会去配置模块114读取所需要的配置,例如,探测时间和探测周期,这样当配置发生改变后,可以直接通过配置模块114来做到配置的一致性和同步。监测模块112启动后,都会去配置模块114进行注册,当有监测模块112停止服务,其它监测模块112可以通过配置模块114进行感知。
实际应用中,配置模块114可以是指ZooKeeper(一个分布式应用程序协调服务)模块,监测模块112可以是指Action模块,元数据库模块116可以是指MGR(MySQL GroupReplication)元数据库模块。
S220,在集群探测结果中,获取时间截在预设时间段内的集群探测结果,作为目标探测结果。
其中,目标探测结果可以是指用于判断数据库集群是否运行异常的集群探测结果。
具体实现中,配置模块114可以按照预设的选主算法,在各个监测模块112中确定一个主监测节点,即Leader节点;主监测节点用于负责判断数据库集群是否有异常,进而确定是否需要切换数据库集群的主节点;具体地,主监测节点定时会从元数据库模块116的元数据库中,获取时间截在预设时间段内的集群探测结果,作为目标探测结果,例如,获取预先配置的最近M秒内的监测模块112探测到的集群探测结果,作为目标探测结果;然后,主监测节点根据上述的目标探测结果,判断数据库集群是否有异常,进而确定是否需要切换数据库集群的主节点。
S230,根据目标探测结果为失败的数目,输出数据库集群在预设时间段内的异常检测结果。
其中,异常检测结果可以是指用于表征数据库集群的运行状态是否出现异常的结果。
具体实现中,主监测节点在根据上述的目标探测结果,判断数据库集群是否有异常,具体可以通过确定目标探测结果为失败的数目,根据目标探测结果为失败的数目,判断数据库集群的运行状态是否存在异常,进而输出数据库集群在预设时间段内的异常检测结果。
上述一种数据库集群的异常检测方法,通过按照预设的探测周期向数据库集群发送用于探测数据库集群的运行状态的探测请求,确定数据库集群响应探测请求后实际返回的至少两个的具有对应的时间截的集群探测结果;然后,通过在集群探测结果中,获取时间截在预设时间段内的集群探测结果,作为目标探测结果;通过根据预设时间段内的目标探测结果为失败的数目,准确且及时地检测出数据库集群在预设时间段内的异常状况,从而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
在一个实施例中,根据目标探测结果为失败的数目,输出数据库集群在预设时间段内的异常检测结果,包括:获取目标探测结果的总数目;根据目标探测结果的总数目,确定集群异常判定阈值;判断目标探测结果为失败的数目是否大于集群异常判定阈值;若是,则输出数据库集群在预设时间段内的异常检测结果。
具体实现中,当监测模块112中的主监测节点在根据目标探测结果为失败的数目,输出数据库集群在预设时间段内的异常检测结果的过程中,具体包括:监测模块112中的主监测节点获取目标探测结果的总数目;然后,根据目标探测结果的总数目,确定集群异常判定阈值;具体地,可以取目标探测结果的总数目的n%,作为集群异常判定阈值;然后,主监测节点判断目标探测结果为失败的数目是否大于集群异常判定阈值;若是,则判断数据库集群在预设时间段内有异常,例如,数据库集群的主节点所在的服务器存在宕机、高负载、网络异常等异常状况,从而输出数据库集群在预设时间段内的异常检测结果。实际应用中,n可以等于50。
实际应用中,可以预先在监测模块112配置第一判断公式,监测模块112可以按照第一判断公式,根据目标探测结果为失败的数目,输出数据库集群在预设时间段内的异常检测结果。
其中,第一判断公式可以为:fail>[total×n%];
其中,fail可以是指在预设时间段内的目标探测结果为失败的数目;total可以是指目标探测结果的总数目。
本实施例中的技术方案,通过根据目标探测结果的总数目,确定集群异常判定阈值;在目标探测结果为失败的数目大于集群异常判定阈值时,及时且准确地输出数据库集群在预设时间段内的异常检测结果,使得输出的异常检测结果可以同时满足大多数原则,进而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
在一个实施例中,输出数据库集群在预设时间段内的异常检测结果,包括:根据预设时间段和探测周期,确定向数据库集群发送的探测请求的总数目;根据探测请求的总数目,确定针对目标探测结果的有效判定阈值;判断目标探测结果的总数目是否大于有效判定阈值;若是,则判定数据库集群的主节点在预设时间段内存在异常。
具体实现中,当监测模块112中的主监测节点确定目标探测结果为失败的数目大于集群异常判定阈值,输出数据库集群在预设时间段内的异常检测结果的过程中,监测模块112的主监测节点还需要根据预设时间段和探测周期,确定向数据库集群发送的探测请求的总数目,并将探测请求的总数目作为在正常情况下应当写入到元数据库模块116的元数据库中的集群探测结果的总数目;然后,监测模块112中的主监测节点根据探测请求的总数目,确定针对目标探测结果的有效判定阈值;具体地,可以取探测请求的总数目的m%,作为针对目标探测结果的有效判定阈值;然后,测模块112中的主监测节点判断目标探测结果的总数目是否大于有效判定阈值;若是,则判定数据库集群的主节点在预设时间段内存在异常,例如,数据库集群的主节点所在的服务器存在宕机、高负载、网络异常等异常状况。实际应用中,m可以等于80。
实际应用中,可以预先在监测模块112配置第二判断公式,监测模块112可以按照第二判断公式,在确定目标探测结果为失败的数目大于集群异常判定阈值时,输出数据库集群在预设时间段内的异常检测结果。
其中,第二判断公式可以为:total>[num×m%];
其中,
Figure BDA0002302838040000081
其中,total可以是指目标探测结果的总数目;num可以是指探测请求的总数目或正常情况下应当写入元数据库中的集群探测结果的总数目;M可以是指预设时间段,N可以是指探测周期,C可以是指监测模块的总数目。
本实施例中的技术方案,通过当确定目标探测结果为失败的数目大于集群异常判定阈值后,通过确定向数据库集群发送的探测请求的总数目并根据探测请求的总数目,确定针对目标探测结果的有效判定阈值;当判定目标探测结果的总数目否大于有效判定阈值时再判定数据库集群的主节点在预设时间段内存在异常;使得输出的异常检测结果可以同时满足最低有效原则和大多数原则,进而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
在一个实施例中,判定数据库集群的主节点在预设时间段内存在异常的步骤之后,还包括:获取数据库集群的从节点,作为数据库集群的目标切换节点;将数据库集群的主节点切换至将目标切换节点。
其中,数据库集群可以包括一个主节点和至少一个的从节点。
具体实现中,检测服务器110判定数据库集群的主节点在预设时间段内存在异常的步骤之后,检测服务器110获取数据库集群的从节点,作为数据库集群的目标切换节点;检测服务器110执行预设的切换逻辑,将数据库集群的主节点切换至将目标切换节点,作为数据库集群的新主节点。
本实施例中的技术方案,当判定数据库集群的主节点在预设时间段内存在异常后,通过获取数据库集群的从节点,作为数据库集群的目标切换节点;及时将数据库集群的主节点切换至将目标切换节点,使得数据库集群一直处于正常的运行状态,避免对数据库集群的上层服务的正常运行造成影响。
在一个实施例中,向数据库集群发送探测请求,确定数据库集群响应探测请求后实际返回的至少两个的集群探测结果,包括:获取数据库集群的主节点所在服务器的服务器地址;根据服务器地址,发送预设的第一探测数据包至服务器;判断在预设的等待时间内是否接收到服务器返回的第二探测数据包:其中,第二探测数据包为服务器响应第一探测数据包返回的数据包;若否,则确定数据库集群响应探测请求后返回的集群探测结果为失败。
其中,第二探测数据包为服务器响应第一探测数据包返回的数据包。
具体实现中,当检测服务器110向数据库集群120发送探测请求,确定数据库集群120响应探测请求后实际返回的至少两个的集群探测结果的过程中,具体包括:检测服务器110中的监测模块获取数据库集群120的主节点所在服务器即主节点服务器的服务器地址,例如,IP(Internet Protocol,网际互连协议)地址、DNS(Domain Name System,域名系统)地址等;然后,检测服务器110中的监测模块根据该服务器地址,发送预设的第一探测数据包至数据库集群120的主节点服务器;判断在预设的等待时间内是否接收到数据库集群120的主节点服务器返回的第二探测数据包;如果在预设的等待时间内未能接收到主节点服务器返回的第二探测数据包,则确定数据库集群120响应探测请求后返回的集群探测结果为失败。
实际应用中,数据库集群120会提供一个IP/DNS:port连接端口对外提供服务;检测服务器110则根据服务器地址,发送ping(Packet Internet Groper,因特网包探索器,一种网路诊断指令)指令至数据库集群120的主节点服务器,根据主节点服务器返回的信息,从而用于确定检测服务器110是否能与节点服务器成功交换(发送与接收)数据包,再根据返回的信息,就可以推断TCP/IP参数是否设置正确,以及运行是否正常、网络是否通畅等。
本实施例中的技术方案,通过获取数据库集群的主节点所在服务器的服务器地址;根据服务器地址,发送预设的第一探测数据包至服务器;判断在预设的等待时间内是否接收到服务器返回的第二探测数据包,从而准确地数据库集群的网络连接状况,及时确定数据库集群的异常,提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
在一个实施例中,上述一种数据库集群的异常检测方法还包括:当在等待时间内接收到服务器返回的第二探测数据包时,则根据服务器地址,发送登录请求至服务器;登录请求用于供服务器进行验证,若验证通过,则服务器允许登录;若验证未通过,则服务器不允许登录;当成功登录至服务器时,连接服务器的数据库并判断服务器的数据库是否可用;若服务器的数据库不可用,则确定数据库集群响应探测请求后返回的集群探测结果为失败。若服务器的数据库可用,则确定数据库集群响应探测请求后返回的集群探测结果为成功。
其中,登录请求用于供服务器进行验证。
具体实现中,当检测服务器110在等待时间内接收到数据库集群120的主节点的服务器返回的第二探测数据包时,检测服务器110则根据服务器地址,发送登录请求至数据库集群120的主节点服务器,供数据库集群120的主节点服务器进行验证,若数据库集群120的主节点服务器验证通过,则数据库集群120的主节点服务器允许检测服务器110登录;若数据库集群120的主节点服务器验证未通过,则数据库集群120的主节点服务器不允许检测服务器110登录,则确定数据库集群响应探测请求后返回的集群探测结果为失败。当检测服务器110成功登录至数据库集群120的主节点服务器时,检测服务器110连接数据库集群120的主节点服务器的数据库并判断数据库集群120的主节点服务器的数据库是否可用;若数据库不可用,则确定数据库集群120响应探测请求后返回的集群探测结果为失败。
实际应用中,数据库集群120会提供一个IP/DNS:port连接端口对外提供服务;检测服务器110则根据服务器地址,发送telnet(一种远程登录指令)指令至数据库集群120的主节点服务器,进而尝试远程登录数据库集群120的主节点的服务器。
本实施例中的技术方案,通过当在等待时间内接收到服务器返回的第二探测数据包时,尝试登录服务器;当成功登录至服务器时,连接服务器的数据库并判断服务器的数据库是否可用;若服务器的数据库不可用,及时确定数据库集群响应探测请求后返回的集群探测结果为失败,使得集群探测结果可以准确反映数据库集群的运行状态,提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
在一个实施例中,判断服务器的数据库是否可用,包括:获取数据库测试数据;将数据库测试数据,写入至数据库中的预指定的数据库表;当成功将待写入数据写入至数据库表时,则判定服务器的数据库可用;当未能成功将待写入数据写入至数据库表时,则判定服务器的数据库不可用。
其中,数据库测试数据可以是指用于测试数据库是否可用的数据。
具体实现中,当检测服务器110判断服务器的数据库是否可用的过程中,具体包括:检测服务器110获取数据库测试数据;然后,检测服务器110将数据库测试数据,写入至数据库中的预指定的数据库表并判断是否成功将数据库测试数据写入预指定的数据库表;当检测服务器110成功将待写入数据写入至数据库表时,检测服务器110则判定服务器的数据库可用;当检测服务器110未能成功将待写入数据写入至数据库表时,检测服务器110则判定服务器的数据库不可用。
本实施例中的技术方案,通过获取数据库测试数据;将数据库测试数据,写入至数据库中的预指定的数据库表,准确地判断出数据库集群的主节点服务器数据库的运行状态,从而得到精度高的集群探测结果,进而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
如图3所示,在一个实施例中,提供了一种数据库集群的异常检测方法。参照图3,该数据库集群的异常检测方法具体包括如下步骤:
S302,按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截。
S304,在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果。
S306,根据所述目标探测结果的总数目,确定所述集群异常判定阈值。
S308,判断所述目标探测结果为失败的数目是否大于所述集群异常判定阈值。
S310,若是,则根据所述预设时间段和所述探测周期,确定向所述数据库集群发送的所述探测请求的总数目。
S312,根据所述探测请求的总数目,确定针对所述目标探测结果的有效判定阈值。
S314,判断所述目标探测结果的总数目是否大于所述有效判定阈值。
S316,若是,则判定所述数据库集群的主节点在所述预设时间段内存在异常。
S318,获取所述数据库集群的从节点,作为所述数据库集群的目标切换节点。
S320,将所述数据库集群的主节点切换至将所述目标切换节点。
上述步骤的具体限定可以参见上文对一种数据库集群的异常检测方法的具体限定,本实施例提供的技术方案,基于最低有效原则和大多数原则,通过根据预设时间段内的目标探测结果为失败的数目,准确且及时地检测出数据库集群在预设时间段内的异常状况,从而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
应该理解的是,虽然图2和图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图3中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图4所示,提供了一种数据库集群的异常检测装置,包括:
探测模块410,用于按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;
获取模块420,用于在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;
输出模块430,用于根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果。
上述的一种数据库集群的异常检测装置,通过按照预设的探测周期向数据库集群发送用于探测数据库集群的运行状态的探测请求,确定数据库集群响应探测请求后实际返回的至少两个的具有对应的时间截的集群探测结果;然后,通过在集群探测结果中,获取时间截在预设时间段内的集群探测结果,作为目标探测结果;通过根据预设时间段内的目标探测结果为失败的数目,准确且及时地检测出数据库集群在预设时间段内的异常状况,从而提高了数据库集群异常检测准确度。
在其中一个实施例中,上述的输出模块430,包括:第一获取子模块,用于获取所述目标探测结果的总数目;第一阈值子模块,根据所述目标探测结果的总数目,确定所述集群异常判定阈值;异常判定子模块,用于判断所述目标探测结果为失败的数目是否大于所述集群异常判定阈值;输出子模块,用于若是,则输出所述数据库集群在所述预设时间段内的异常检测结果。
在其中一个实施例中,上述的输出子模块,具体用于:根据所述预设时间段和所述探测周期,确定向所述数据库集群发送的所述探测请求的总数目;根据所述探测请求的总数目,确定针对所述目标探测结果的有效判定阈值;判断所述目标探测结果的总数目是否大于所述有效判定阈值;若是,则判定所述数据库集群的主节点在所述预设时间段内存在异常。
在其中一个实施例中,上述的一种数据库集群的异常检测装置,还包括:节点获取模块,用于获取所述数据库集群的从节点,作为所述数据库集群的目标切换节点;切换模块,用于将所述数据库集群的主节点切换至将所述目标切换节点。
在其中一个实施例中,上述的探测模块410,包括:地址获取子模块,用于获取所述数据库集群的主节点所在服务器的服务器地址;发送子模块,用于根据所述服务器地址,发送预设的第一探测数据包至所述服务器;第二判断子模块,用于判断在预设的等待时间内是否接收到所述服务器返回的第二探测数据包:其中,所述第二探测数据包为所述服务器响应所述第一探测数据包返回的数据包;第一判定子模块,用于若否,则确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。
在其中一个实施例中,上述的一种数据库集群的异常检测装置,还包括:登录模块,用于当在所述等待时间内接收到所述服务器返回的所述第二探测数据包时,则根据所述服务器地址,发送登录请求至所述服务器;所述登录请求用于供所述服务器进行验证,若验证通过,则所述服务器允许登录;若验证未通过,则所述服务器不允许登录;数据库测试模块,用于当成功登录至所述服务器时,连接所述服务器的数据库并判断所述服务器的数据库是否可用;判定模块,用于若所述服务器的数据库不可用,则确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。
在其中一个实施例中,上述的数据库测试模块,包括:测试数据获取子模块,用于获取数据库测试数据;写入子模块,用于将所述数据库测试数据,写入至所述数据库中的预指定的数据库表;第二判定子模块,用于当成功将所述待写入数据写入至所述数据库表时,则判定所述服务器的数据库可用;当未能成功将所述待写入数据写入至所述数据库表时,则判定所述服务器的数据库不可用。
关于数据库集群的异常检测装置的具体限定可以参见上文中对于数据库集群的异常检测方法的限定,在此不再赘述。上述数据库集群的异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
为了便于本领域技术人员的理解,图5示出了一个实施例中数据库集群的探测流程图;如图5所示,其中;检测服务器110中的各个监测模块112按照预设的探测周期定时启动探测任务,对数据库集群的运行状态进行探测,并将探测结果写入至元数据库模块116的元数据库,进而供后续监测模块112中的主监测节点对探测结果进行分析,输出数据库集群在预设时间段内的异常检测结果。
为了便于本领域技术人员的理解,图6示出了一个实施例中数据库集群的探测流程图;如图6所示,其中;检测服务器110中的监测模块112的主监测节点,定时在元数据库模块116的元数据库中获取时间截在预设时间段内的目标探测结果,然后,按照预设的判定规则,判断当前时间段内的数据库集群的主节点是否存在异常,若是,则确定需要对数据库集群的主节点进行切换,使得数据库集群一直处于正常的运行状态,避免对数据库集群的上层服务的正常运行造成影响。
为了便于本领域技术人员的理解,图7提供了一个实施例中一种数据库集群的异常检测方法中的检测服务器的监测模块的探测逻辑图:其中,包括如下步骤:
步骤710,获取所述数据库集群的主节点所在服务器的服务器地址;步骤720,根据所述服务器地址,发送预设的第一探测数据包至所述服务器;步骤730,判断在预设的等待时间内是否接收到所述服务器返回的第二探测数据包:其中,所述第二探测数据包为所述服务器响应所述第一探测数据包返回的数据包;步骤740,当在预设的等待时间内接收到所述服务器返回的第二探测数据包时,根据所述服务器地址,发送登录请求至所述服务器,所述登录请求用于供所述服务器进行验证。当在预设的等待时间未能内接收到所述服务器返回的第二探测数据包时,确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。步骤750,判断是否成功登录至所述服务器;若未能成功登录至所述服务器,确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。步骤760,若成功登录至所述服务器,连接所述服务器的数据库;步骤770,将所述数据库测试数据,写入至所述数据库中的预指定的数据库表。步骤780,判断是否成功将所述待写入数据写入至所述数据库表。若是,确定所述数据库集群响应所述探测请求后返回的集群探测结果为成功;若否,则确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。
上述步骤的具体限定可以参见上文对一种数据库集群的异常检测方法的具体限定,本实施例提供的技术方案,可以准确地对数据库集群的运行状态进行准确地探测,得到可以准确表征数据库集群运行状态的集群探测结果,进而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
为了便于本领域技术人员的理解,图8提供了一个实施例中一种数据库集群的异常检测方法中的检测服务器的监测模块的异常判断逻辑图:其中,包括如下步骤:
步骤810,在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果。步骤820,根据所述目标探测结果的总数目,确定所述集群异常判定阈值。步骤830,获取所述目标探测结果的总数目。步骤840,判断所述目标探测结果为失败的数目是否大于所述集群异常判定阈值;若否,则判定所述数据库集群的主节点在所述预设时间段内不存在异常。步骤850,若是,则根据所述预设时间段和所述探测周期,确定向所述数据库集群发送的所述探测请求的总数目。步骤860,根据所述探测请求的总数目,确定针对所述目标探测结果的有效判定阈值。步骤870,判断所述目标探测结果的总数目是否大于所述有效判定阈值;若否,则判定所述数据库集群的主节点在所述预设时间段内不存在异常;若是,则判定所述数据库集群的主节点在所述预设时间段内存在异常。
上述步骤的具体限定可以参见上文对一种数据库集群的异常检测方法的具体限定,本实施例提供的技术方案,通过基于最低有效原则和大多数原则,通过根据预设时间段内的目标探测结果为失败的数目,准确且及时地检测出数据库集群在预设时间段内的异常状况,从而提高了对预设时间段内的数据库集群异常状态进行检测的准确度。
图9示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的检测服务器110。如图9所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现一种数据库集群的异常检测方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种数据库集群的异常检测方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的一种数据库集群的异常检测装置可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成该一种数据库集群的异常检测装置的各个程序模块,比如,图4所示的探测模块410、确定模块420和输出模块430。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的一种数据库集群的异常检测方法中的步骤。
例如,图9所示的计算机设备可以通过如图4所示的一种数据库集群的异常检测装置中的探测模块410执行按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截。计算机设备可通过确定模块420执行在所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果。计算机设备可通过输出模块430执行根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述一种数据库集群的异常检测方法的步骤。此处一种数据库集群的异常检测方法的步骤可以是上述各个实施例的一种数据库集群的异常检测方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述一种数据库集群的异常检测方法的步骤。此处一种数据库集群的异常检测方法的步骤可以是上述各个实施例的一种数据库集群的异常检测方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (14)

1.一种数据库集群的异常检测方法,所述方法包括:
通过至少两个监测模块按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果并写入元数据库;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;
按照预设的选主算法,在各所述监测模块中确定主监测节点,通过所述主监测节点从所述元数据库中储存的所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;
根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果;其中,若所述目标探测结果为失败的数目大于集群异常判定阈值,则确定在所述预设时间段内向所述数据库集群发送的所述探测请求的总数目;根据所述探测请求的总数目,确定针对所述目标探测结果的有效判定阈值;若所述目标探测结果的总数目大于所述有效判定阈值,则判定所述数据库集群的主节点在所述预设时间段内存在异常;所述集群异常判定阈值为根据所述目标探测结果的总数目确定的。
2.根据权利要求1所述的方法,其特征在于,所述确定在所述预设时间段内向所述数据库集群发送的所述探测请求的总数目,包括:
根据所述预设时间段和所述探测周期,确定向所述数据库集群发送的所述探测请求的总数目。
3.根据权利要求1所述的方法,其特征在于,所述判定所述数据库集群的主节点在所述预设时间段内存在异常的步骤之后,还包括:
获取所述数据库集群的从节点,作为所述数据库集群的目标切换节点;
将所述数据库集群的主节点切换至将所述目标切换节点。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果,包括:
获取所述数据库集群的主节点所在服务器的服务器地址;
根据所述服务器地址,发送预设的第一探测数据包至所述服务器;
判断在预设的等待时间内是否接收到所述服务器返回的第二探测数据包:其中,所述第二探测数据包为所述服务器响应所述第一探测数据包返回的数据包;
若否,则确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。
5.根据权利要求4所述的方法,其特征在于,还包括:
当在所述等待时间内接收到所述服务器返回的所述第二探测数据包时,则根据所述服务器地址,发送登录请求至所述服务器;所述登录请求用于供所述服务器进行验证,若验证通过,则所述服务器允许登录;若验证未通过,则所述服务器不允许登录;
当成功登录至所述服务器时,连接所述服务器的数据库并判断所述服务器的数据库是否可用;
若所述服务器的数据库不可用,则确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。
6.根据权利要求5所述的方法,其特征在于,所述判断所述服务器的数据库是否可用,包括:
获取数据库测试数据;
将所述数据库测试数据,写入至所述数据库中的预指定的数据库表;
当成功将所述数据库测试数据写入至所述数据库表时,则判定所述服务器的数据库可用;当未能成功将所述数据库测试数据写入至所述数据库表时,则判定所述服务器的数据库不可用。
7.一种数据库集群的异常检测装置,其特征在于,所述装置包括:
探测模块,用于通过至少两个监测模块按照预设的探测周期向所述数据库集群发送探测请求,确定所述数据库集群响应所述探测请求后实际返回的至少两个的集群探测结果并写入元数据库;其中,所述探测请求用于探测所述数据库集群的运行状态;所述集群探测结果具有对应的时间截;
获取模块,用于按照预设的选主算法,在各所述监测模块中确定主监测节点,通过所述主监测节点从所述元数据库中储存的所述集群探测结果中,获取所述时间截在预设时间段内的集群探测结果,作为目标探测结果;
输出模块,用于根据所述目标探测结果为失败的数目,输出所述数据库集群在所述预设时间段内的异常检测结果;其中,若所述目标探测结果为失败的数目大于集群异常判定阈值,则确定在所述预设时间段内向所述数据库集群发送的所述探测请求的总数目;根据所述探测请求的总数目,确定针对所述目标探测结果的有效判定阈值;若所述目标探测结果的总数目大于所述有效判定阈值,则判定所述数据库集群的主节点在所述预设时间段内存在异常;所述集群异常判定阈值为根据所述目标探测结果的总数目确定的。
8.根据权利要求7所述的装置,其特征在于,所述输出模块包括输出子模块,所述输出子模块,具体用于:根据所述预设时间段和所述探测周期,确定向所述数据库集群发送的所述探测请求的总数目。
9.根据权利要求7所述的装置,其特征在于,所述数据库集群的异常检测装置,还包括:节点获取模块,用于获取所述数据库集群的从节点,作为所述数据库集群的目标切换节点;切换模块,用于将所述数据库集群的主节点切换至将所述目标切换节点。
10.根据权利要求7至9任意一项所述的装置,其特征在于,所述探测模块,包括:地址获取子模块,用于获取所述数据库集群的主节点所在服务器的服务器地址;发送子模块,用于根据所述服务器地址,发送预设的第一探测数据包至所述服务器;第二判断子模块,用于判断在预设的等待时间内是否接收到所述服务器返回的第二探测数据包:其中,所述第二探测数据包为所述服务器响应所述第一探测数据包返回的数据包;第一判定子模块,用于若否,则确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。
11.根据权利要求10所述的装置,其特征在于,所述数据库集群的异常检测装置,还包括:登录模块,用于当在所述等待时间内接收到所述服务器返回的所述第二探测数据包时,则根据所述服务器地址,发送登录请求至所述服务器;所述登录请求用于供所述服务器进行验证,若验证通过,则所述服务器允许登录;若验证未通过,则所述服务器不允许登录;数据库测试模块,用于当成功登录至所述服务器时,连接所述服务器的数据库并判断所述服务器的数据库是否可用;判定模块,用于若所述服务器的数据库不可用,则确定所述数据库集群响应所述探测请求后返回的集群探测结果为失败。
12.根据权利要求11所述的装置,其特征在于,所述数据库测试模块,包括:测试数据获取子模块,用于获取数据库测试数据;写入子模块,用于将所述数据库测试数据,写入至所述数据库中的预指定的数据库表;第二判定子模块,用于当成功将所述数据库测试数据写入至所述数据库表时,则判定所述服务器的数据库可用;当未能成功将所述数据库测试数据写入至所述数据库表时,则判定所述服务器的数据库不可用。
13.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至6中任一项所述方法的步骤。
CN201911228316.5A 2019-12-04 2019-12-04 数据库集群的异常检测方法、装置、计算机可读存储介质 Active CN110990183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911228316.5A CN110990183B (zh) 2019-12-04 2019-12-04 数据库集群的异常检测方法、装置、计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911228316.5A CN110990183B (zh) 2019-12-04 2019-12-04 数据库集群的异常检测方法、装置、计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110990183A CN110990183A (zh) 2020-04-10
CN110990183B true CN110990183B (zh) 2022-05-17

Family

ID=70090146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911228316.5A Active CN110990183B (zh) 2019-12-04 2019-12-04 数据库集群的异常检测方法、装置、计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110990183B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111694694A (zh) * 2020-05-22 2020-09-22 北京三快在线科技有限公司 数据库集群的处理方法、装置、存储介质和节点
CN114095506A (zh) * 2020-08-25 2022-02-25 李静波 一种呼叫中心服务器集群管理方法、服务器及系统
CN112242938B (zh) * 2020-10-14 2022-08-19 亚信科技(中国)有限公司 探测方法、装置、电子设备及计算机可读存储介质
CN112231280A (zh) * 2020-10-20 2021-01-15 中国建设银行股份有限公司 大数据集群的检测方法及装置、电子设备及存储介质
CN112527638A (zh) * 2020-12-01 2021-03-19 北京大米科技有限公司 程序监控系统、方法和计算机可读存储介质
CN112783792B (zh) * 2021-02-08 2024-01-09 腾讯云计算(北京)有限责任公司 分布式数据库系统的故障检测方法、装置及电子设备
CN114553747A (zh) * 2022-02-22 2022-05-27 度小满科技(北京)有限公司 redis集群的异常检测方法、装置、终端及存储介质
CN115242687B (zh) * 2022-07-20 2024-04-19 中国建设银行股份有限公司 一种节点探活方法、装置、设备及介质
CN115514625A (zh) * 2022-09-23 2022-12-23 深信服科技股份有限公司 数据库集群管理方法、装置及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558796B1 (en) * 2005-05-19 2009-07-07 Symantec Corporation Determining origins of queries for a database intrusion detection system
CN104486155A (zh) * 2014-12-15 2015-04-01 北京趣拿软件科技有限公司 一种数据库集群监控的方法及系统
CN105577799A (zh) * 2015-12-25 2016-05-11 北京奇虎科技有限公司 一种数据库集群的故障检测方法和装置
CN107153595A (zh) * 2016-03-04 2017-09-12 福建天晴数码有限公司 分布式数据库系统的故障检测方法及其系统
CN107924337A (zh) * 2015-11-13 2018-04-17 谷歌有限责任公司 分布式存储系统中的性能监测

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558796B1 (en) * 2005-05-19 2009-07-07 Symantec Corporation Determining origins of queries for a database intrusion detection system
CN104486155A (zh) * 2014-12-15 2015-04-01 北京趣拿软件科技有限公司 一种数据库集群监控的方法及系统
CN107924337A (zh) * 2015-11-13 2018-04-17 谷歌有限责任公司 分布式存储系统中的性能监测
CN105577799A (zh) * 2015-12-25 2016-05-11 北京奇虎科技有限公司 一种数据库集群的故障检测方法和装置
CN107153595A (zh) * 2016-03-04 2017-09-12 福建天晴数码有限公司 分布式数据库系统的故障检测方法及其系统

Also Published As

Publication number Publication date
CN110990183A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110990183B (zh) 数据库集群的异常检测方法、装置、计算机可读存储介质
JP7408725B2 (ja) コンピュータシステムの自動動作管理
US20180285217A1 (en) Failover response using a known good state from a distributed ledger
US9984365B2 (en) Device identification based on deep fingerprint inspection
CN110865927B (zh) 区块链调用链路异常检测方法、装置和计算机设备
CN112363941A (zh) 接口测试方法、装置、计算机设备及存储介质
CN111523890B (zh) 基于区块链的数据处理方法、装置、存储介质及设备
CN111460404A (zh) 双录数据处理方法、装置、计算机设备及存储介质
CN110597541B (zh) 基于区块链的接口更新处理方法、装置、设备及存储介质
CN113315828B (zh) 一种流量录制方法、装置及流量录制设备、存储介质
CN110149421B (zh) 域名系统的异常监测方法、系统、装置和计算机设备
CN112383535B (zh) 哈希传递攻击行为的检测方法、装置和计算机设备
WO2019127890A1 (zh) 漏洞扫描方法、装置、计算机设备和存储介质
CN112256593B (zh) 一种程序处理方法、装置、计算机设备和可读存储介质
CN111679978B (zh) 一种程序测试方法、程序测试装置、电子设备及存储介质
CN114244503B (zh) 一种密码设备性能测试方法
CN115208779A (zh) 基于区块链和大数据的数据流监测方法及云计算服务平台
CN112199441B (zh) 基于大数据平台的数据同步处理方法、装置、设备及介质
CN113609230A (zh) 数据同步异常告警方法、装置、计算机设备和存储介质
WO2024078015A1 (zh) 基于镜像对的故障注入方法、装置、设备和存储介质
CN113660254A (zh) 一种云桌面分布式网络终端安全接入策略、设备及系统
CN110417567A (zh) 一种物联网设备的配置方法和装置
CN112395125A (zh) 页面报错的通知方法、装置、计算机设备及存储介质
CN111752819B (zh) 一种异常监控方法、装置、系统、设备和存储介质
CN111797410A (zh) 一种多服务器授权控制方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40023487

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant