CN105429826A - 一种数据库集群的故障检测方法和装置 - Google Patents

一种数据库集群的故障检测方法和装置 Download PDF

Info

Publication number
CN105429826A
CN105429826A CN201510997570.7A CN201510997570A CN105429826A CN 105429826 A CN105429826 A CN 105429826A CN 201510997570 A CN201510997570 A CN 201510997570A CN 105429826 A CN105429826 A CN 105429826A
Authority
CN
China
Prior art keywords
destination server
database
detection
information
testing result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510997570.7A
Other languages
English (en)
Inventor
贾欣桥
杨挺
王立新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510997570.7A priority Critical patent/CN105429826A/zh
Publication of CN105429826A publication Critical patent/CN105429826A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供了一种数据库集群的故障检测方法和装置,其中的方法具体包括:接收用户输入的检测对象参数和检测项目参数;确定所述数据库集群中所述检测对象参数对应的目标服务器;以及在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。本发明实施例能够实现自动检测数据库集群中存在的故障,从而可以简化故障检测的操作、以及可以降低故障检测的难度。

Description

一种数据库集群的故障检测方法和装置
技术领域
本发明涉及计算机技术领域,特别是涉及一种数据库集群的故障检测方法和装置。
背景技术
随着计算机和网络技术的迅速发展,数据库集群广泛应用于各种领域,尤其用于存储海量数据。在具体应用中,数据库集群通常可以包括一个主数据库(Master)和多个从数据库(Slave),以MySQL数据库为例,参照图1,示出了现有一种MySQL数据库集群的架构示意图,其具体包括:主数据库Master和三个从数据库Slave,分别为Slave-1、Slave-2和Slave-3。其中,Slave-1和Slave-2位于机房1,Slave-3位于机房2。主数据库master分别与从数据库Slave-1、Slave-2和Slave-3连接。
在实际应用中,主数据库或者从数据库都有可能因为各种原因出现故障,例如出现用户无法登录数据库、数据查询速度较慢等情况。目前,通常采用人工方式对数据库集群中的故障进行检测,具体地,人工登录数据库集群中的主数据库和从数据库,通过对执行SQL语句得到的结果进行分析,检测数据库的状态,从而找到故障原因。然而,在数据库服务器数量较多时,现有的数据库故障检测方法不仅耗费大量的人力资源和时间资源,导致故障检测的效率低下,而且通过执行SQL语句来检测数据库的状态,往往需要较高的专业技术水平,因此,对故障检测人员的要求也较高,为数据库的故障检测带来困难。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种数据库集群的故障检测方法和装置。
依据本发明的一个方面,提供了一种数据库集群的故障检测方法,包括:
接收用户输入的检测对象参数和检测项目参数;
确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
可选地,所述检测项目参数对应的检测操作为连通性检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
可选地,所述通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果的步骤,进一步包括:
使用所述目标服务器中的预置账户信息连接所述目标数据库,以得到所述目标数据库的连接状态信息;
在所述连接状态信息符合预置条件时,将所述连接状态信息作为对应的检测结果。
可选地,所述检测项目参数对应的检测操作为代理检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
查询所述目标服务器中记录的数据库访问日志,并将查询得到的异常访问记录作为对应的检测结果;其中,所述数据库访问日志中记录有通过所述目标服务器间接访问目标数据库的访问记录。
可选地,所述异常访问记录包括以下任一种:
所述数据库访问日志中预置时间段内的访问报错信息;
所述数据库访问日志中满足预置慢查询条件的访问记录。
可选地,所述检测项目参数对应的检测操作为数据库状态检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
在所述目标服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
可选地,所述状态信息包括:所述数据库的可用内存信息,则所述将所述状态信息中的异常状态信息作为对应的检测结果的步骤,进一步包括:
在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
可选地,所述远程登录所述目标服务器的步骤,进一步包括:
根据所述目标服务器的数目,建立对应数目的进程;
通过所述对应数目的进程,并行执行远程登录目标服务器的操作。
可选地,所述确定所述数据库集群中所述检测对象参数对应的目标服务器的步骤,进一步包括:
根据所述检测对象参数查询预置的管理配置文件,得到与所述检测对象参数对应的目标服务器的信息;
根据所述目标服务器的信息生成服务器列表,所述服务器列表中包括至少一个目标服务器的信息。
可选地,所述目标服务器的信息包括:目标服务器的地址信息、账户名称信息以及账户密码信息;
相应地,所述远程登录所述目标服务器的步骤,进一步包括:
根据所述目标服务器的地址信息、账户名称信息以及账户密码信息,远程登录所述服务器列表中对应的目标服务器。
可选地,所述方法还包括:
通过预置页面方式展现所述检测结果。
依据本发明的另一方面,提供了一种数据库集群的故障检测装置,包括:
参数接收模块,用于接收用户输入的检测对象参数和检测项目参数;
目标服务器确定模块,用于确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
检测执行模块,用于在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
可选地,所述检测项目参数对应的检测操作为连通性检测;所述检测执行模块,进一步包括:
连通性检测子模块,用于通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
可选地,所述连通性检测子模块,进一步包括:
连接状态获取单元,用于使用所述目标服务器中的预置账户信息连接所述目标数据库,以得到所述目标数据库的连接状态信息;
连通性结果获取单元,用于在所述连接状态信息符合预置条件时,将所述连接状态信息作为对应的检测结果。
可选地,所述检测项目参数对应的检测操作为代理检测;所述检测执行模块,进一步包括:
代理检测子模块,用于查询所述目标服务器中记录的数据库访问日志,并将查询得到的异常访问记录作为对应的检测结果;其中,所述数据库访问日志中记录有通过所述目标服务器间接访问目标数据库的访问记录。
可选地,所述异常访问记录包括以下任一种:
所述数据库访问日志中预置时间段内的访问报错信息;
所述数据库访问日志中满足预置慢查询条件的访问记录。
可选地,所述检测项目参数对应的检测操作为数据库状态检测;所述检测执行模块,进一步包括:
数据库状态检测子模块,用于在所述目标服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
可选地,所述状态信息包括:所述数据库的可用内存信息,则所述数据库状态检测子模块,进一步包括:
状态结果获取单元,用于在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
可选地,所述检测执行模块,进一步包括:
进程创建子模块,用于根据所述目标服务器的数目,建立对应数目的进程;
并行登录子模块,用于通过所述对应数目的进程,并行执行远程登录目标服务器的操作。
可选地,所述目标服务器确定模块,进一步包括:
信息查询子模块,用于根据所述检测对象参数查询预置的管理配置文件,得到与所述检测对象参数对应的目标服务器的信息;
列表生成子模块,用于根据所述目标服务器的信息生成服务器列表;所述服务器列表中包括至少一个目标服务器的信息。
可选地,所述目标服务器的信息包括:目标服务器的地址信息、账户名称信息以及账户密码信息;
相应地,所述检测执行模块,进一步包括:
远程登录子模块,用于根据所述目标服务器的地址信息、账户名称信息以及账户密码信息,远程登录所述服务器列表中对应的目标服务器。
可选地,所述装置还包括:
结果展现模块,用于通过预置页面方式展现所述检测结果。
根据本发明实施例的一种数据库集群的故障检测方法和装置,通过远程登录数据库集群中检测对象参数对应的目标服务器,并针对所述目标服务器执行检测项目参数对应的检测操作,以得到对应的检测结果;相对于现有方案,由于本发明实施例的故障检测流程可以不需要人工参与,因此可以节省大量的人力资源,从而能够提高检测效率;此外,现有技术中通过人工方式执行SQL语句来检测数据库的状态,以找到故障原因,往往需要较高的专业技术水平,通过本发明实施例可以实现自动检测数据库集群中存在的故障,从而可以简化故障检测的操作、以及可以降低故障检测的难度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文可选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出可选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了现有一种MySQL数据库集群的架构示意图;
图2示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图;
图3示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图;
图4示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图;
图5示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图;
图6示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图;
图7示出了根据本发明一个实施例的一种数据库集群的故障检测系统的结构框图;以及
图8示出了根据本发明一个实施例的一种数据库集群的故障检测装置的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图2,示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图,具体可以包括如下步骤:
步骤201、接收用户输入的检测对象参数和检测项目参数;
步骤202、确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
步骤203、在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
本发明实施例可适用于数据库集群中数据库的故障检测,其中,所述数据库可以包括ORACLE(甲骨文)、DB2、MySQL等类型的数据库等,可以理解,本发明实施例对于数据库的具体类型不加以限制。为了便于说明,本发明实施例均以MySQL数据库集群为例进行描述,其它类型的数据库集群相互参照即可。
在实际应用中,数据库集群中具体可以包括一个主(Master)数据库和多个从(Slave)数据库。当然,本领域技术人员可以根据实际应用需求,搭建不同架构的数据库集群,例如为了实现数据库的读写分离,还可以在数据库集群中设置有代理(Proxy)服务器,以及还可以设置用于增加吞吐量、加强网络数据处理能力的负载均衡服务器等等,总之,本发明实施例对于数据库的具体类型以及数据库集群的具体架构不加以限制。
在实际应用中,所述数据库集群可以适用于任意的操作系统环境中,例如Linux操作系统、Windows操作系统等,本发明实施例对于数据库集群所适用于的具体操作系统环境不加以限制,为了便于说明,本发明实施例均以Linux操作系统环境下的数据库集群为例进行描述,其它操作系统相互参照即可。
在本发明的一种可选实施例中,所述检测对象参数可用于标识该检测对象参数对应的数据库,所述检测对象参数具体可以包括:端口号。则可以在管理服务器中预置的管理配置文件中查找得到该端口号对应的所有目标服务器的信息,从而可以生成该端口号对应的检测列表。可以理解,本发明对于检测参数的具体形式不加以限制,其还可以包括IP(InternetProtocol,互联网协议地址)地址、或者IP地址和端口号的组合等等。
在本发明的另一种可选实施例中,所述检测项目参数可用于标识检测的故障类型,所述检测项目参数的类型具体可以包括:连通性检测、代理(Proxy)检测以及数据库状态检测中的至少一种。其中,连通性检测用于检测用户账户是否能够正常连接数据库;Proxy检测用于检测通过代理服务器访问数据库的状态是否正常;以及数据库状态检测用于检测数据库的运行状态是否正常,例如数据库的内存使用情况,是否存在慢查询等等。可以理解,上述列举的检测项目参数仅作为本发明的一种应用示例,本发明实施例对于检测项目参数的具体类型不加以限制。其中,所述检测项目参数可以同时包括上述连通性检测、代理(Proxy)检测以及数据库状态检测三种类型,则分别执行这三种类型对应的检测操作,以及得到对应的检测结果。
在本发明实施例中,可以在管理服务器中设置有故障检测模块,用户在使用数据库的过程中,如果发现数据库集群出现问题,例如连接不上数据库、查询速度较慢等,即可触发该故障检测模块,以使其执行本发明实施例中数据库集群的故障检测流程。可以理解,本发明实施例对于故障检测模块的具体触发时机不加以限制,例如可以在数据库集群出现问题时,触发该故障检测模块,以对数据库集群中的故障进行检测;或者,也可以通过预设周期自动执行故障检测模块以监控数据库集群中各服务器的运行状况,为了防止以较高的频率监控而浪费系统的资源,本发明实施例中可以3分钟到5分钟的周期监控数据库集群的运行状况,将检测结果进行保存,并且在管理服务器中进行显示,从而可以及早发现数据库集群中存在的异常数据,在故障出现之前提前采取预防措施,以避免造成不必要的损失。其中,上述故障检测模块可以为一个已有程序中具有独立功能的模块,或者,上述故障检测模块还可以独立的程序存在,如,其可以为Linux操作系统环境下的脚本程序。具体地,可以采用的脚本语言为python。当然,在实际应用中,还可以使用JavaScript,VBScript、ASP,JSP,PHP(HypertextPreprocessor,文本预处理语言)等其它脚本语言,本发明对于具体的脚本语言不加以限制。
在本发明实施例中,所述故障检测模块可以运行python脚本,以向用户提供检测对象参数和检测项目参数的输入接口。例如,通过向用户展示UI(UserInterface,用户界面),以使用户可以输入检测对象参数,例如用户输入的检测对象参数为端口号,以及输入的检测项目参数为连通性检测。在实际应用中,还可以在UI中显示可供用户选择的一个或多个检测对象参数,用户直接选择需要的检测对象参数即可,因此可以简化用户的操作。在所述python脚本接收到用户输入的检测对象参数和检测项目参数之后,可以确定所述数据库集群中所述检测对象参数对应的目标服务器,在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
本发明实施例中,所述管理服务器可用于管理数据库集群中的服务器,并依据所管理的各服务器的当前状况执行相应的故障检测。管理服务器中可以存储预置的管理配置文件,该管理配置文件中可以包括数据库集群中各个服务器的信息,例如数据库集群中主数据库所在服务器、从数据库所在服务器、代理服务器、负载均衡服务器的信息等。在本发明实施例的可选实施例中,可以通过在管理服务器中设置的故障检测模块来本发明实施例中数据库集群的故障检测流程。具体地,该故障检测模块可以根据用户输入的检测参数,查询所述预置的管理配置文件,以确定所述数据库集群中所述检测参数对应的目标服务器,在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
在本发明的一种可选实施例中,所述确定所述数据库集群中所述检测对象参数对应的目标服务器的步骤,具体可以包括如下子步骤:
子步骤S11、根据所述检测对象参数查询预置的管理配置文件,得到与所述检测对象参数对应的目标服务器的信息;以及
子步骤S12、根据所述目标服务器的信息生成服务器列表;所述服务器列表中包括至少一个目标服务器的信息。
在本发明的一种可选实施例中,所述目标服务器的信息具体可以包括:目标服务器的地址信息、账户名称信息以及账户密码信息;所述远程登录所述目标服务器的步骤,具体可以包括:根据所述目标服务器的地址信息、账户名称信息以及账户密码信息,远程登录所述服务器列表中对应的目标服务器。
在具体应用中,所述故障检测模块可以运行python脚本,以向用户提供检测对象参数和检测项目参数的输入接口;并且,还可以根据用户输入的检测对象参数,获取该检测对象参数对应的服务器列表,再通过远程登录所述服务器列表中的各个目标服务器,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。其中,所述故障检测模块可以模拟远程登录服务器列表中的各个目标服务器,可选地,可以通过SSH(SecureShell,安全外壳协议),根据目标服务器的地址信息、账户名称信息以及账户密码信息,远程登录目标服务器。其中,SSH是创建在应用层和传输层基础上的安全协议。在远程登录目标服务器之后,即可执行所述检测项目参数对应的检测操作,以得到对应的检测结果。由此,可以实现对数据库集群中的故障进行自动检测,提高检测效率。
在本发明的一种可选实施例中,上述方法还可以包括:通过预置页面方式展现所述检测结果。在本发明实施例中,可以将所述检测结果通过预置页面方式在管理服务器中进行展现,以方便用户查看。具体地,可以使用日志文件、表格、图表等UI在预置页面方式展现检测结果,以使检测结果可以更加直观地展现给用户。可以理解,本发明实施例对于预置页面的具体形式不加以限制。本可选实施例能够自动检测数据库集群中存在的故障,例如数据库连通性故障、代理服务器故障以及数据库运行故障等,并把检测结果以页面的形式展现出来。在实际应用中,由于用户通常更加关注数据库集群中出现的异常状态,因此,在本发明的一种可选实施例中,可以将故障检测过程中出现异常的检测数据作为检测结果。通过本发明实施例,不仅能够节省大量人力资源和时间资源,而且使得数据库集群的故障检测过程简单易行,检测结果一目了然,极大地提高了数据库集群的故障检测效率。
在本发明的一种可选实施例中,上述方法还可以包括:在执行所述检测项目参数对应的检测操作,得到对应的检测结果之后,保存所述检测结果。在本可选实施例中,可以对所述连通性检测、代理(Proxy)检测以及数据库状态检测对应的检测结果保存在数据库或者文件中,以在数据库集群的使用过程中或者后续的故障检测过程中,对之前的检测结果进行浏览和分析,从而可以提高故障检测的效率。
综上,本发明实施例远程登录数据库集群中检测对象参数对应的目标服务器,并针对所述目标服务器执行检测项目参数对应的检测操作,以得到对应的检测结果;相对于现有方案,由于本发明实施例的故障检测流程可以不需要人工参与,因此可以节省大量的人力资源,从而能够提高检测效率;此外,现有技术中通过人工方式执行SQL语句来检测数据库的状态,以找到故障原因,往往需要较高的专业技术水平,通过本发明实施例可以实现自动检测数据库集群中存在的故障,从而可以简化故障检测的操作、以及可以降低故障检测的难度。
参照图3,示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图,具体可以包括如下步骤:
步骤301、接收用户输入的检测对象参数和检测项目参数;
步骤302、确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
步骤303、在远程登录所述目标服务器后,通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
本实施例在图2所示实施例的基础上,所述检测项目参数对应的检测操作具体可以为连通性检测,也即本实施例可以对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果;从而可以使得分析工具或者分析人员根据检测结果分析目标数据库中出现连通性故障的原因。
在本发明实施例中,可以通过触发管理服务器中预置的故障检测模块运行python脚本,为用户提供检测对象参数和检测项目参数的输入接口,在用户输入的检测项目参数为连通性检测时,首先,通过所述python脚本,确定所述数据库集群中所述检测对象参数对应的目标服务器;其中,所述目标服务器具体可以为数据库集群中所述检测对象参数对应的所有监控服务器,所述监控服务器可用于监控数据库集群中各服务器的运行状态。在实际应用中,可以为每个机房设置一个监控服务器,以监控该机房中的各服务器的运行状态。然后,通过所述python脚本,在远程登录所述监控服务器后,通过所述监控服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。其中,预置账户信息具体可以为预置的监控账户信息,在具体应用中,可以在建立数据库时设置对应的监控账户,该监控账户可以具有访问所有数据库的权限,通过使用该监控账户连接目标数据库,即可对目标数据库进行连通性测试,也即测试用户账户是否能够正常访问目标数据库。
在本发明的一种可选实施例中,所述通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测的步骤,具体可以包括如下子步骤:
子步骤S21、使用所述目标服务器中的预置账户信息连接所述目标数据库,以得到所述目标数据库的连接状态信息;以及
子步骤S22、在所述连接状态信息符合预置条件时,将所述连接状态信息作为对应的检测结果。
在本发明实施例中,在远程登录监控服务器后,使用所述监控服务器中的预置监控账户信息连接目标数据库,以得到所述目标数据库的连接状态信息,在所述连接状态信息符合预置条件时,认为连通性出现异常,则将所述连接状态信息作为对应的检测结果。例如,所述预置条件可以包括连接失败或者连接超时等异常条件,本发明实施例对于所述预置条件的具体内容不加以限制。
在实际应用中,可以将所述检测结果显示在管理服务器中,用户在发现所述检测结果中包括连接失败或者连接超时等异常数据时,可以根据该检测结果进一步分析出故障原因,并且解决该故障,以保证用户可以正常访问数据库。例如,通过连通性测试得到连接失败的检测结果,则可以通过python脚本远程登录主数据所在服务器,查看MySQL服务进程是否正常运行,若MySQL服务进程已经意外终止,则可以重新启动MySQL服务进程,以使用户可以正常访问数据库。
综上,本发明实施例在接收用户输入的检测对象参数和检测项目参数之后,即可对数据库的连通性进行检测,将对应连通性检测结果中的异常数据作为对应的检测结果。相对于现有技术中的人工检测方案,可以节省大量的人力资源以及提高检测效率。
参照图4,示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图,具体可以包括如下步骤:
步骤401、接收用户输入的检测对象参数和检测项目参数;
步骤402、确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
步骤403、在远程登录所述目标服务器后,查询所述目标服务器中记录的数据库访问日志,并将查询得到的异常访问记录作为对应的检测结果;其中,所述数据库访问日志中记录有通过所述目标服务器间接访问目标数据库的访问记录。
本实施例在图2所示实施例的基础上,所述检测项目参数对应的检测操作具体可以为代理检测,也即本实施例可以对目标数据库执行代理(Proxy)检测,具体地,在目标数据库中记录的数据库访问日志中查询得到其中通过所述目标服务器间接访问目标数据库的访问记录,将对应查询结果中的的异常访问记录作为对应的检测结果,以使分析工具或者分析人员根据所述检测结果确定故障原因。其中,所述数据库访问日志可以为所述目标服务器记录并存储的,为了实现对该访问日志的查询和分析,可以在所述目标服务器中设置有代理检测模块,用于通过运行预置的shell脚本实现对数据库访问日志进行查询和分析,具体地,可以在所述管理服务器中的python脚本远程登录所述目标服务器后,调用所述shell脚本执行数据库访问日志的查询操作,所述shell脚本对查询结果进行分析,并且将其中的异常访问记录作为对应的检测结果返回给python脚本。
在本发明的一种可选实施例中,所述异常访问记录可以包括如下记录中的任一:所述数据库访问日志中预置时间段内的访问报错信息;或者,所述数据库访问日志中慢查询时长超过预置时间范围的慢查询访问记录。
在本发明实施例中,可以通过触发管理服务器中预置的故障检测模块运行python脚本,为用户提供检测对象参数和检测项目参数的输入接口,在用户输入的检测项目参数为Proxy检测时,首先,通过所述python脚本,确定所述数据库集群中所述检测对象参数对应的目标服务器;其中,所述目标服务器具体可以为数据库集群中所述检测对象参数对应的所有Proxy服务器,所述Proxy服务器用于实现数据库的读写分离。然后,通过所述python脚本,在远程登录所述Proxy服务器后,在数据库访问日志中查询通过所述Proxy服务器间接访问目标数据库的访问记录,将对应查询结果中的异常访问记录作为对应的检测结果。
在具体应用中,所述异常访问记录可以为预置时间段内(例如最近1小时内)的访问报错信息。具体地,所述访问报错信息可以包括非法用户访问信息。在实际应用中,可以在Proxy服务器中设置用户白名单,在Proxy服务器接收到所述白名单之外的用户的访问请求时,可以在拒绝该请求的同时,将该非法访问记录作为对应的检测结果。或者,所述异常访问记录可以为满足预置慢查询条件的访问记录。例如,在所述Proxy服务器记录的数据库访问日志中,包括有慢查询访问记录,通过过滤所述慢查询访问记录,得到其中慢查询时长超过预置时间范围(例如100ms)的慢查询访问记录,将这些访问记录作为对应的检测结果。
在本发明的一种应用示例中,如果在得到的检测结果中包括最近1小时内的非法用户访问信息,且多个非法用户访问信息是相同的,则说明该用户账户的访问权限可能设置错误,则可以通知数据库管理员检查该用户账户的访问权限。在本发明的另一种应用示例中,如果该检测结果中包括大量的慢查询时长超过预置时间范围的慢查询访问记录,则可以认为当前业务不适合通过Proxy访问数据库,应该调整为对数据库直接访问的方式,以提高业务处理效率。
综上,本发明实施例在接收用户输入的检测对象参数和检测项目参数之后,即可对数据库访问状态进行检测,将异常访问记录作为对应的检测结果。相对于现有技术中的人工检测方案,可以节省大量的人力资源以及提高检测效率。
参照图5,示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图,具体可以包括如下步骤:
步骤501、接收用户输入的检测对象参数和检测项目参数;
步骤502、确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
步骤503、在远程登录所述目标服务器后,在所述目标服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
本实施例在图2所示实施例的基础上,所述检测项目参数对应的检测操作具体可以为数据库状态检测,也即本实施例可以对目标数据库执行数据库状态检测,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。以使用户根据所述检测结果确定数据库发生故障的原因,并且解决该故障,从而可以保证数据库的正常运行。为了实现在所述目标服务器中执行数据库状态的查询和分析,可以在所述目标服务器中设置有数据库状态检测模块,用于通过运行预置shell脚本实现对数据库状态的查询和分析,具体地,可以在所述管理服务器中的python脚本远程登录所述目标服务器后,调用所述shell脚本以在所述目标服务器中执行数据库状态的查询操作,所述shell脚本对获取的数据库的状态信息进行分析,将其中的异常状态信息作为对应的检测结果返回给python脚本。
在本发明实施例中,可以通过触发管理服务器中预置的故障检测模块运行python脚本,为用户提供检测对象参数和检测项目参数的输入接口,在用户输入的检测项目参数为数据库状态检测时,首先,通过所述python脚本,确定所述数据库集群中所述检测对象参数对应的目标服务器;其中,所述目标服务器具体可以为数据库集群中所述检测对象参数对应的所有主数据库和从数据库所在服务器。然后,通过所述python脚本,在远程登录所述主数据库和从数据库所在服务器后,在所述主数据库和从数据库所在服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
在本发明的一种可选实施例中,所述状态信息具体可以包括:所述数据库的可用内存信息,则所述将所述状态信息中的异常状态信息作为对应的检测结果的步骤,具体可以包括:在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
在具体应用中,所述数据库状态查询操作具体可以通过执行如下数据库状态查询命令来实现:showglobalstatus;通过执行该查询命令,可以得到数据库的状态信息,例如数据库的可用内存信息,在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
可以理解,本发明实施例对于所述状态信息的具体内容不加以限制。例如,所述状态信息还可以包括:慢查询信息。通过查询数据库的日志记录,可以得到慢查询信息,将其中符合预置慢查询条件(例如查询时长超过0.5s)的记录信息作为对应的检测结果。再例如,所述状态信息还可以包括:锁状态、存储引擎类型、由于客户端没有正确关闭连接导致客户端终止而中断的连接数等等。
综上,本发明实施例在接收用户输入的检测对象参数和检测项目参数之后,即可对目标数据库自动执行数据库状态的检测,将所述状态信息中的异常状态信息作为对应的检测结果。相对于现有技术中的人工检测方案,可以节省大量的人力资源以及提高检测效率。
参照图6,示出了根据本发明一个实施例的一种数据库集群的故障检测方法的步骤流程示意图,具体可以包括如下步骤:
步骤601、接收用户输入的检测对象参数和检测项目参数;
步骤602、确定所述数据库集群中所述检测对象参数对应的目标服务器;
步骤603、根据所述目标服务器的数目,建立对应数目的进程;以及
步骤604、通过所述对应数目的进程,并行执行远程登录目标服务器的操作,以并行执行所述检测项目参数对应的检测操作,得到对应的检测结果。
在实际应用中,在数据库集群中的服务器数量较多时,如果对其中的每台服务器按顺序逐个执行故障检测,无疑会耗费大量的时间,导致检测效率低下。相对于图2所示实施例,本实施例为了提高数据库集群的故障检测效率,通过建立与目标服务器的数目对应的多个进程,以实现对目标服务器并行执行远程登录,以提高服务器集群的故障检测效率,节省检测时间。
在本发明的一种应用示例中,假设输入的检测对象参数为端口3717,且检测项目参数为数据库状态检测时,通过运行故障检测模块查询得到该3717端口下对应有50台目标服务器,其中包括5台主数据库所在服务器和45台从数据库所在服务器,则可以生成对应的服务器列表,该服务器列表中包括上述50台目标服务器的地址信息、账户名称信息以及账户密码信息。如果按顺序依次对所述服务器列表中的各个目标服务器进行远程登录以及执行数据库状态检测命令,将会耗费较长的时间,因此,本发明实施例可以对上述服务器列表中的50台目标服务器分别建立对应的进程,以对上述50台目标服务器并行执行远程登录操作,从而可以大幅提高故障检测的效率。
在实际应用中,建立的多个进程可以位于一台服务器或者多台服务器上。在本发明的一种可选实施例中,在远程登录某台目标服务器之后,可以再创建多个进程以并行执行所述检测项目参数对应的检测操作。例如,在数据库状态检测过程中,可以包括检测数据库的内存使用信息、数据库服务的状态信息等,则可以创建进程1检测数据库的内存使用信息,以及同时可以创建进程2检测数据库服务的状态信息,从而使得多个检测操作可以并行执行,以进一步地提高数据库集群的故障检测效率。
参照图7,示出了根据本发明一个实施例的一种数据库集群的故障检测系统的结构框图,具体可以包括:
管理服务器710,用于管理数据库集群中的服务器,并依据所管理的各服务器的当前状况执行相应的数据库故障检测;以及目标服务器720,用于提供数据库服务。
其中,所述管理服务器710中设置有故障检测模块711,用户在使用数据库的过程中,如果发现数据库出现问题,即可触发该故障检测模块711,以检测数据库集群中数据库的故障。具体地,所述故障检测模块711可以运行预置的python脚本,以向用户提供检测对象参数和检测项目参数的输入接口;并且,还可以根据用户输入的检测对象参数,获取该检测对象参数对应的服务器列表,再通过远程登录所述服务器列表中的各个目标服务器,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。其中,所述检测项目参数的类型具体可以包括:连通性检测、代理(Proxy)检测以及数据库状态检测中的至少一种。
在本发明的一种可选实施例中,在所述检测项目参数的类型为连通性检测时,首先,通过所述python脚本,确定所述数据库集群中所述检测对象参数对应的目标服务器;其中,所述目标服务器具体可以为数据库集群中所述检测对象参数对应的所有监控服务器。然后,通过所述python脚本,在远程登录所述监控服务器后,通过所述监控服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
在本发明的另一种可选实施例中,在所述检测项目参数的类型为代理检测时,首先,通过所述python脚本,确定所述数据库集群中所述检测对象参数对应的目标服务器;其中,所述目标服务器具体可以为数据库集群中所述检测对象参数对应的所有代理服务器。然后,通过所述python脚本,在远程登录所述监控服务器后,调用所述代理服务器中预置的代理检测模块,以使所述代理检测模块在数据库访问日志中查询通过所述目标服务器间接访问目标数据库的访问记录,将对应查询结果中的异常访问记录作为对应的检测结果。
在本发明的又一种可选实施例中,在所述检测项目参数的类型为数据库状态检测时,首先,通过所述python脚本,确定所述数据库集群中所述检测对象参数对应的目标服务器;其中,所述目标服务器具体可以为数据库集群中所述检测对象参数对应的所有主数据库和从数据库所在服务器。然后,通过所述python脚本,在远程登录所述主数据库和从数据库所在服务器后,调用所述主数据库和从数据库所在服务器中预置的数据库状态检测模块,以使所述数据库状态检测模块执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
参照图8,示出了根据本发明一个实施例的一种数据库集群的故障检测装置的结构框图,具体可以包括如下模块:
参数接收模块810,用于接收用户输入的检测对象参数和检测项目参数;
目标服务器确定模块820,用于确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
检测执行模块830,用于在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
在本发明的一种可选实施例中,所述检测项目参数对应的检测操作具体可以为连通性检测;所述检测执行模块830,进一步可以包括:
连通性检测子模块,用于通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
在本发明的另一种可选实施例中,所述连通性检测子模块,进一步可以包括:
连接状态获取单元,用于使用所述目标服务器中的预置账户信息连接所述目标数据库,以得到所述目标数据库的连接状态信息;
连通性结果获取单元,用于在所述连接状态信息符合预置条件时,将所述连接状态信息作为对应的检测结果。
在本发明的又一种可选实施例中,所述检测项目参数对应的检测操作具体可以为代理检测;所述检测执行模块830,进一步可以包括:
代理检测子模块,用于查询所述目标服务器中记录的数据库访问日志,并将查询得到的异常访问记录作为对应的检测结果;其中,所述数据库访问日志中记录有通过所述目标服务器间接访问目标数据库的访问记录。
在本发明的再一种可选实施例中,所述异常访问记录可以包括以下任一种:
所述数据库访问日志中预置时间段内的访问报错信息;
所述数据库访问日志中满足预置慢查询条件的访问记录。
在本发明的再一种可选实施例中,所述检测项目参数对应的检测操作具体可以为数据库状态检测;所述检测执行模块830,进一步可以包括:
数据库状态检测子模块,用于在所述目标服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
在本发明的再一种可选实施例中,所述状态信息具体可以包括:所述数据库的可用内存信息,则所述数据库状态检测子模块,进一步可以包括:
状态结果获取单元,用于在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
在本发明的再一种可选实施例中,所述检测执行模块830,进一步可以包括:
进程创建子模块,用于根据所述目标服务器的数目,建立对应数目的进程;
并行登录子模块,用于通过所述对应数目的进程,并行执行远程登录目标服务器的操作。
在本发明的再一种可选实施例中,所述目标服务器确定模块820,进一步可以包括:
信息查询子模块,用于根据所述检测对象参数查询预置的管理配置文件,得到与所述检测对象参数对应的目标服务器的信息;
列表生成子模块,用于根据所述目标服务器的信息生成服务器列表;所述服务器列表中包括至少一个目标服务器的信息。
在本发明的再一种可选实施例中,所述目标服务器的信息具体可以包括:目标服务器的地址信息、账户名称信息以及账户密码信息;
相应地,所述检测执行模块830,进一步可以包括:
远程登录子模块,用于根据所述目标服务器的地址信息、账户名称信息以及账户密码信息,远程登录所述服务器列表中对应的目标服务器。
在本发明的再一种可选实施例中,所述装置还可以包括:
结果展现模块,用于通过预置页面方式展现所述检测结果。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的数据库集群的故障检测方法和装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网平台上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”或“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种数据库集群的故障检测方法,包括:
接收用户输入的检测对象参数和检测项目参数;
确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
A2、如权利要求A1所述的方法,所述检测项目参数对应的检测操作为连通性检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
A3、如权利要求A2所述的方法,所述通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果的步骤,进一步包括:
使用所述目标服务器中的预置账户信息连接所述目标数据库,以得到所述目标数据库的连接状态信息;
在所述连接状态信息符合预置条件时,将所述连接状态信息作为对应的检测结果。
A4、如权利要求A1所述的方法,所述检测项目参数对应的检测操作为代理检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
查询所述目标服务器中记录的数据库访问日志,并将查询得到的异常访问记录作为对应的检测结果;其中,所述数据库访问日志中记录有通过所述目标服务器间接访问目标数据库的访问记录。
A5、如权利要求A4所述的方法,所述异常访问记录包括以下任一种:
所述数据库访问日志中预置时间段内的访问报错信息;
所述数据库访问日志中满足预置慢查询条件的访问记录。
A6、如权利要求A1所述的方法,所述检测项目参数对应的检测操作为数据库状态检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
在所述目标服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
A7、如权利要求A6所述的方法,所述状态信息包括:所述数据库的可用内存信息,则所述将所述状态信息中的异常状态信息作为对应的检测结果的步骤,进一步包括:
在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
A8、如权利要求A1所述的方法,所述远程登录所述目标服务器的步骤,进一步包括:
根据所述目标服务器的数目,建立对应数目的进程;
通过所述对应数目的进程,并行执行远程登录目标服务器的操作。
A9、如权利要求A1至A8中任一所述的方法,所述确定所述数据库集群中所述检测对象参数对应的目标服务器的步骤,进一步包括:
根据所述检测对象参数查询预置的管理配置文件,得到与所述检测对象参数对应的目标服务器的信息;
根据所述目标服务器的信息生成服务器列表,所述服务器列表中包括至少一个目标服务器的信息。
A10、如权利要求A9所述的方法,所述目标服务器的信息包括:目标服务器的地址信息、账户名称信息以及账户密码信息;
相应地,所述远程登录所述目标服务器的步骤,进一步包括:
根据所述目标服务器的地址信息、账户名称信息以及账户密码信息,远程登录所述服务器列表中对应的目标服务器。
A11、如权利要求A1所述的方法,所述方法还包括:
通过预置页面方式展现所述检测结果。
本发明公开了B12、一种数据库集群的故障检测装置,包括:
参数接收模块,用于接收用户输入的检测对象参数和检测项目参数;
目标服务器确定模块,用于确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
检测执行模块,用于在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
B13、如权利要求B12所述的装置,所述检测项目参数对应的检测操作为连通性检测;所述检测执行模块,进一步包括:
连通性检测子模块,用于通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
B14、如权利要求B13所述的装置,所述连通性检测子模块,进一步包括:
连接状态获取单元,用于使用所述目标服务器中的预置账户信息连接所述目标数据库,以得到所述目标数据库的连接状态信息;
连通性结果获取单元,用于在所述连接状态信息符合预置条件时,将所述连接状态信息作为对应的检测结果。
B15、如权利要求B12所述的装置,所述检测项目参数对应的检测操作为代理检测;所述检测执行模块,进一步包括:
代理检测子模块,用于查询所述目标服务器中记录的数据库访问日志,并将查询得到的异常访问记录作为对应的检测结果;其中,所述数据库访问日志中记录有通过所述目标服务器间接访问目标数据库的访问记录。
B16、如权利要求B15所述的装置,所述异常访问记录包括以下任一种:
所述数据库访问日志中预置时间段内的访问报错信息;
所述数据库访问日志中满足预置慢查询条件的访问记录。
B17、如权利要求B12所述的装置,所述检测项目参数对应的检测操作为数据库状态检测;所述检测执行模块,进一步包括:
数据库状态检测子模块,用于在所述目标服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
B18、如权利要求B17所述的装置,所述状态信息包括:所述数据库的可用内存信息,则所述数据库状态检测子模块,进一步包括:
状态结果获取单元,用于在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
B19、如权利要求B12所述的装置,所述检测执行模块,进一步包括:
进程创建子模块,用于根据所述目标服务器的数目,建立对应数目的进程;
并行登录子模块,用于通过所述对应数目的进程,并行执行远程登录目标服务器的操作。
B20、如权利要求B12至B19中任一所述的装置,所述目标服务器确定模块,进一步包括:
信息查询子模块,用于根据所述检测对象参数查询预置的管理配置文件,得到与所述检测对象参数对应的目标服务器的信息;
列表生成子模块,用于根据所述目标服务器的信息生成服务器列表;所述服务器列表中包括至少一个目标服务器的信息。
B21、如权利要求B20所述的装置,所述目标服务器的信息包括:目标服务器的地址信息、账户名称信息以及账户密码信息;
相应地,所述检测执行模块,进一步包括:
远程登录子模块,用于根据所述目标服务器的地址信息、账户名称信息以及账户密码信息,远程登录所述服务器列表中对应的目标服务器。
B22、如权利要求B12所述的装置,所述装置还包括:
结果展现模块,用于通过预置页面方式展现所述检测结果。

Claims (10)

1.一种数据库集群的故障检测方法,包括:
接收用户输入的检测对象参数和检测项目参数;
确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
2.如权利要求1所述的方法,其特征在于,所述检测项目参数对应的检测操作为连通性检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果。
3.如权利要求2所述的方法,其特征在于,所述通过所述目标服务器中的预置账户信息对目标数据库执行连通性检测,将对应连通性检测结果中的异常数据作为对应的检测结果的步骤,进一步包括:
使用所述目标服务器中的预置账户信息连接所述目标数据库,以得到所述目标数据库的连接状态信息;
在所述连接状态信息符合预置条件时,将所述连接状态信息作为对应的检测结果。
4.如权利要求1所述的方法,其特征在于,所述检测项目参数对应的检测操作为代理检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
查询所述目标服务器中记录的数据库访问日志,并将查询得到的异常访问记录作为对应的检测结果;其中,所述数据库访问日志中记录有通过所述目标服务器间接访问目标数据库的访问记录。
5.如权利要求4所述的方法,其特征在于,所述异常访问记录包括以下任一种:
所述数据库访问日志中预置时间段内的访问报错信息;
所述数据库访问日志中满足预置慢查询条件的访问记录。
6.如权利要求1所述的方法,其特征在于,所述检测项目参数对应的检测操作为数据库状态检测;所述执行所述检测项目参数对应的检测操作的步骤,进一步包括:
在所述目标服务器中执行数据库状态查询操作,以获取数据库的状态信息,将所述状态信息中的异常状态信息作为对应的检测结果。
7.如权利要求6所述的方法,其特征在于,所述状态信息包括:所述数据库的可用内存信息,则所述将所述状态信息中的异常状态信息作为对应的检测结果的步骤,进一步包括:
在所述数据库的可用内存信息小于预设门限时,将相应的状态信息作为对应的检测结果。
8.如权利要求1所述的方法,其特征在于,所述远程登录所述目标服务器的步骤,进一步包括:
根据所述目标服务器的数目,建立对应数目的进程;
通过所述对应数目的进程,并行执行远程登录目标服务器的操作。
9.如权利要求1至8中任一所述的方法,其特征在于,所述确定所述数据库集群中所述检测对象参数对应的目标服务器的步骤,进一步包括:
根据所述检测对象参数查询预置的管理配置文件,得到与所述检测对象参数对应的目标服务器的信息;
根据所述目标服务器的信息生成服务器列表,所述服务器列表中包括至少一个目标服务器的信息。
10.一种数据库集群的故障检测装置,包括:
参数接收模块,用于接收用户输入的检测对象参数和检测项目参数;
目标服务器确定模块,用于确定所述数据库集群中所述检测对象参数对应的目标服务器;以及
检测执行模块,用于在远程登录所述目标服务器后,执行所述检测项目参数对应的检测操作,以得到对应的检测结果。
CN201510997570.7A 2015-12-25 2015-12-25 一种数据库集群的故障检测方法和装置 Pending CN105429826A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510997570.7A CN105429826A (zh) 2015-12-25 2015-12-25 一种数据库集群的故障检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510997570.7A CN105429826A (zh) 2015-12-25 2015-12-25 一种数据库集群的故障检测方法和装置

Publications (1)

Publication Number Publication Date
CN105429826A true CN105429826A (zh) 2016-03-23

Family

ID=55507775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510997570.7A Pending CN105429826A (zh) 2015-12-25 2015-12-25 一种数据库集群的故障检测方法和装置

Country Status (1)

Country Link
CN (1) CN105429826A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106059853A (zh) * 2016-05-26 2016-10-26 中国建设银行股份有限公司 一种网络连通性测试方法及装置
CN106503550A (zh) * 2016-10-10 2017-03-15 哈尔滨理工大学 一种基于Python开发的预警机系统
CN106528388A (zh) * 2016-10-21 2017-03-22 网易(杭州)网络有限公司 一种数据库检测方法和装置
CN107231267A (zh) * 2016-03-25 2017-10-03 中兴通讯股份有限公司 一种通讯网络巡检的方法、装置及巡检客户端
CN107391633A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据库集群自动优化处理方法、装置及服务器
CN107634871A (zh) * 2016-07-19 2018-01-26 北京金山云网络技术有限公司 一种连通性测试方法、装置及系统
CN107919980A (zh) * 2017-10-30 2018-04-17 贵州白山云科技有限公司 一种集群化系统的评测方法和装置
CN108039958A (zh) * 2017-11-17 2018-05-15 深圳前海微众银行股份有限公司 数据查错方法、装置及计算机可读存储介质
CN108173678A (zh) * 2017-12-20 2018-06-15 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN108280097A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 一种数据库系统的故障处理方法和装置
CN109144765A (zh) * 2018-08-21 2019-01-04 平安科技(深圳)有限公司 报表生成方法、装置、计算机设备及存储介质
CN109194543A (zh) * 2018-08-24 2019-01-11 北京天元创新科技有限公司 数据采集方法和装置
CN109462491A (zh) * 2017-09-06 2019-03-12 北京京东尚科信息技术有限公司 用于测试服务器功能的系统、方法和装置
CN109634938A (zh) * 2018-12-25 2019-04-16 浪潮电子信息产业股份有限公司 云平台的Mysql数据库性能优化方法、装置、设备及介质
CN110647415A (zh) * 2019-08-14 2020-01-03 平安科技(深圳)有限公司 数据库检测方法、装置、设备及计算机可读存储介质
CN110751055A (zh) * 2019-09-26 2020-02-04 联想(北京)有限公司 一种智能制造系统
CN112231280A (zh) * 2020-10-20 2021-01-15 中国建设银行股份有限公司 大数据集群的检测方法及装置、电子设备及存储介质
CN113051403A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 数据库故障处理知识图谱构建方法、装置和计算机设备
CN113094266A (zh) * 2021-04-06 2021-07-09 中国工商银行股份有限公司 一种容器数据库的故障测试方法、平台及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050203881A1 (en) * 2004-03-09 2005-09-15 Akio Sakamoto Database user behavior monitor system and method
CN1858738A (zh) * 2006-02-15 2006-11-08 华为技术有限公司 访问数据库的方法及装置
CN101876924A (zh) * 2009-04-30 2010-11-03 升东网络科技发展(上海)有限公司 数据库故障自动检测及转移方法
CN102968365A (zh) * 2012-12-10 2013-03-13 江西省电力公司信息通信分公司 一种基于Web方式对多个数据库运行状态集中监测的方法
CN103425683A (zh) * 2012-05-18 2013-12-04 上海宝信软件股份有限公司 数据库性能测试系统
CN104951524A (zh) * 2015-06-11 2015-09-30 上海新炬网络信息技术有限公司 一种用于数据库运维的移动平台及其使用方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050203881A1 (en) * 2004-03-09 2005-09-15 Akio Sakamoto Database user behavior monitor system and method
CN1858738A (zh) * 2006-02-15 2006-11-08 华为技术有限公司 访问数据库的方法及装置
CN101876924A (zh) * 2009-04-30 2010-11-03 升东网络科技发展(上海)有限公司 数据库故障自动检测及转移方法
CN103425683A (zh) * 2012-05-18 2013-12-04 上海宝信软件股份有限公司 数据库性能测试系统
CN102968365A (zh) * 2012-12-10 2013-03-13 江西省电力公司信息通信分公司 一种基于Web方式对多个数据库运行状态集中监测的方法
CN104951524A (zh) * 2015-06-11 2015-09-30 上海新炬网络信息技术有限公司 一种用于数据库运维的移动平台及其使用方法

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107231267A (zh) * 2016-03-25 2017-10-03 中兴通讯股份有限公司 一种通讯网络巡检的方法、装置及巡检客户端
CN106059853B (zh) * 2016-05-26 2019-05-31 中国建设银行股份有限公司 一种网络连通性测试方法及装置
CN106059853A (zh) * 2016-05-26 2016-10-26 中国建设银行股份有限公司 一种网络连通性测试方法及装置
CN107634871A (zh) * 2016-07-19 2018-01-26 北京金山云网络技术有限公司 一种连通性测试方法、装置及系统
CN107634871B (zh) * 2016-07-19 2020-06-19 北京金山云网络技术有限公司 一种连通性测试方法、装置及系统
CN106503550A (zh) * 2016-10-10 2017-03-15 哈尔滨理工大学 一种基于Python开发的预警机系统
CN106528388A (zh) * 2016-10-21 2017-03-22 网易(杭州)网络有限公司 一种数据库检测方法和装置
CN108280097A (zh) * 2017-01-06 2018-07-13 阿里巴巴集团控股有限公司 一种数据库系统的故障处理方法和装置
CN107391633A (zh) * 2017-06-30 2017-11-24 北京奇虎科技有限公司 数据库集群自动优化处理方法、装置及服务器
CN109462491A (zh) * 2017-09-06 2019-03-12 北京京东尚科信息技术有限公司 用于测试服务器功能的系统、方法和装置
CN107919980B (zh) * 2017-10-30 2020-02-21 贵州白山云科技股份有限公司 一种集群化系统的评测方法和装置
CN107919980A (zh) * 2017-10-30 2018-04-17 贵州白山云科技有限公司 一种集群化系统的评测方法和装置
CN108039958A (zh) * 2017-11-17 2018-05-15 深圳前海微众银行股份有限公司 数据查错方法、装置及计算机可读存储介质
CN108173678B (zh) * 2017-12-20 2021-03-12 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN108173678A (zh) * 2017-12-20 2018-06-15 北京奇艺世纪科技有限公司 客户端数据发送方法、客户端连接异常显示方法及装置
CN109144765A (zh) * 2018-08-21 2019-01-04 平安科技(深圳)有限公司 报表生成方法、装置、计算机设备及存储介质
CN109144765B (zh) * 2018-08-21 2024-02-02 平安科技(深圳)有限公司 报表生成方法、装置、计算机设备及存储介质
CN109194543A (zh) * 2018-08-24 2019-01-11 北京天元创新科技有限公司 数据采集方法和装置
CN109634938A (zh) * 2018-12-25 2019-04-16 浪潮电子信息产业股份有限公司 云平台的Mysql数据库性能优化方法、装置、设备及介质
CN110647415A (zh) * 2019-08-14 2020-01-03 平安科技(深圳)有限公司 数据库检测方法、装置、设备及计算机可读存储介质
CN110751055A (zh) * 2019-09-26 2020-02-04 联想(北京)有限公司 一种智能制造系统
CN113051403A (zh) * 2019-12-27 2021-06-29 北京国双科技有限公司 数据库故障处理知识图谱构建方法、装置和计算机设备
CN112231280A (zh) * 2020-10-20 2021-01-15 中国建设银行股份有限公司 大数据集群的检测方法及装置、电子设备及存储介质
CN113094266A (zh) * 2021-04-06 2021-07-09 中国工商银行股份有限公司 一种容器数据库的故障测试方法、平台及设备

Similar Documents

Publication Publication Date Title
CN105429826A (zh) 一种数据库集群的故障检测方法和装置
US11481498B2 (en) Continuous vulnerability management for modern applications
US10824521B2 (en) Generating predictive diagnostics via package update manager
US8209564B2 (en) Systems and methods for initiating software repairs in conjunction with software package updates
US20220050765A1 (en) Method for processing logs in a computer system for events identified as abnormal and revealing solutions, electronic device, and cloud server
US10268574B2 (en) Deployment testing for infrastructure delivery automation
WO2020244307A1 (zh) 一种漏洞检测方法及装置
US9116802B2 (en) Diagnostic notification via package update manager
CN105577799A (zh) 一种数据库集群的故障检测方法和装置
US20110296248A1 (en) Systems and methods for restoring machine state history related to detected faults in package update process
CN103490941A (zh) 一种云计算环境中实时监控在线配置方法
CN105404581A (zh) 一种数据库的评测方法和装置
CN113014445B (zh) 用于服务器的运维方法、装置、平台及电子设备
CN110851471A (zh) 分布式日志数据处理方法、装置以及系统
US20120151036A1 (en) Identifying stray assets in a computing enviroment and responsively taking resolution actions
US10185559B2 (en) Documentation notification
CN111654495B (zh) 用于确定流量产生来源的方法、装置、设备及存储介质
CN111628927A (zh) 邮件管理方法及装置、存储介质及电子终端
CN112162761A (zh) 自动化部署项目至公有云容器化平台的方法、系统及设备
JP2022100301A (ja) ソフトウェア・アップグレードがコンピューティング・デバイスに与える潜在的な影響を判定するための方法、コンピュータ・プログラム、および更新推奨コンピュータ・サーバ(ソフトウェア・アップグレードの安定性の推奨)
CN112699369A (zh) 一种通过栈回溯检测异常登录的方法及装置
AU2017276243A1 (en) System And Method For Generating Service Operation Implementation
CN112148545A (zh) 嵌入式系统的安全基线检测方法以及安全基线检测系统
CN116302738A (zh) 一种测试芯片的方法、系统、设备和存储介质
US9354962B1 (en) Memory dump file collection and analysis using analysis server and cloud knowledge base

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160323

RJ01 Rejection of invention patent application after publication