CN106100938A - 一种分布式集群系统的监控和告警方法及系统 - Google Patents

一种分布式集群系统的监控和告警方法及系统 Download PDF

Info

Publication number
CN106100938A
CN106100938A CN201610694727.3A CN201610694727A CN106100938A CN 106100938 A CN106100938 A CN 106100938A CN 201610694727 A CN201610694727 A CN 201610694727A CN 106100938 A CN106100938 A CN 106100938A
Authority
CN
China
Prior art keywords
service data
poll
submodule
back end
alarm prompt
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610694727.3A
Other languages
English (en)
Inventor
张大帅
周龙飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610694727.3A priority Critical patent/CN106100938A/zh
Publication of CN106100938A publication Critical patent/CN106100938A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种分布式集群系统的监控和告警方法,包括:通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;通过部署在主节点上的轮询存储进程周期性地获取轮询搜集进程采集到的运行数据,并将运行数据存储于所在的主节点的数据库中;获取数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过阈值;如果是,则输出告警提示信息。该方法简单,只需要利用数据库中的运行数据来判断即可,无需重新获取,并且数据真实可靠。由此可见,在实现监控的基础上,也实现了告警提示的目的。另外,本发明还公开一种分布式集群系统的监控和告警装置,效果如上所述。

Description

一种分布式集群系统的监控和告警方法及系统
技术领域
本发明涉及分布式集群系统技术领域,特别是涉及一种分布式集群系统的监控和告警方法及系统。
背景技术
分布式集群系统是指多台服务器或者主机通过网络互连形成一个集群系统,在该系统中,按照节点类型划分为主节点和数据节点。
为了实现分布式集群系统的安全运行,现有技术中,采用监控模块实现对集群系统的性能和硬件状态指标实时的监控。监控模块的功能在于实时监控分布式集群中对应的各数据节点的各项指标数据,并将数据存储于数据库中。
但是在具体实施中,不仅需要对集群系统的性能和硬件状态指标实时的监控,还需要在集群系统性能或数据节点硬件状态出现异常时能够及时告警提示。很显然,现有的监控模块无法满足告警提示的需求。
由此可见,在实现对分布式集群系统监控的基础上,如何同时实现告警的目的是本领域技术人员亟待解决地问题。
发明内容
本发明的目的是提供一种分布式集群系统的监控和告警方法,用于在实现对分布式集群系统监控的基础上,如何同时实现告警的目的。
为解决上述技术问题,本发明提供一种分布式集群系统的监控和告警方法,包括:
通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;
通过部署在主节点上的轮询存储进程周期性地获取所述轮询搜集进程采集到的所述运行数据,并将所述运行数据存储于所在的主节点的数据库中;
获取所述数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过所述阈值;如果是,则输出告警提示信息。
优选地,当输出告警提示信息之后还包括:
获取所述数据库中下一周期的运行数据,并判断所述下一周期的运行数据是否超过所述阈值;如果否,则输出恢复提示信息。
优选地,所述输出告警提示信息具体为:通过邮件或短信输出告警提示信息。
优选地,所述输出恢复提示信息具体为:通过邮件或短信输出恢复提示信息。
优选地,所述轮询存储进程的获取周期为15s。
为解决上述技术问题,本发明提供一种分布式集群系统的监控和告警系统,包括:监控模块和告警模块,其中,监控模块包括轮询搜集进程部署子模块和轮询存储进程部署子模块,所述告警模块包括判断子模块和告警提示子模块;
所述轮询搜集进程部署子模块,用于在各数据节点上部署轮询搜集进程,并通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;
所述轮询存储进程部署子模块,用于在主节点上部署轮询存储进程,并通过部署在主节点上的轮询存储进程周期性地获取所述轮询搜集进程采集到的所述运行数据,并将所述运行数据存储于所在的主节点的数据库中;
所述判断子模块,用于获取所述数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过所述阈值;如果是,则触发所述告警提示子模块;
所述告警提示子模块,用于输出告警提示信息。
优选地,所述告警模块还包括恢复提示子模块,用于输出恢复提示信息;
其中,所述判断子模块还用于获取所述数据库中下一周期的运行数据,并判断所述下一周期的运行数据是否超过所述阈值,如果否,则触发所述恢复提示子模块。
优选地,所述告警提示子模块具体通过邮件或短信输出告警提示信息。
优选地,所述恢复提示子模块具体通过邮件或短信输出恢复提示信息。
优选地,所述轮询存储进程的获取周期为15s。
本发明所提供的分布式集群系统的监控和告警方法,通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;通过部署在主节点上的轮询存储进程周期性地获取轮询搜集进程采集到的运行数据,并将运行数据存储于所在的主节点的数据库中;获取数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过阈值;如果是,则输出告警提示信息。该方法简单,只需要利用数据库中的运行数据来判断即可,无需重新获取,并且数据真实可靠。由此可见,在实现监控的基础上,也实现了告警提示的目的。另外,本发明所提供的分布式集群系统的监控和告警装置,效果如上所述。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种分布式集群系统的监控和告警方法的流程图;
图2为本发明实施例提供的一种轮询搜集进程采集所在的数据节点的运行数据的示意图;
图3为本发明实施例提供的一种轮询存储进程获取数据节点的运行数据的示意图;
图4为本发明实施例提供的另一种分布式集群系统的监控和告警方法的流程图;
图5为本发明实施例提供的一种分布式集群系统的监控和告警系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的核心是提供一种分布式集群系统的监控和告警方法及系统。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例提供的一种分布式集群系统的监控和告警方法的流程图。如图1所示,分布式集群系统的监控和告警方法,包括:
S10:通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据。
图2为本发明实施例提供的一种轮询搜集进程采集所在的数据节点的运行数据的示意图。如图2所示,包括了两个数据节点,分别为数据节点A和数据节点B,轮询搜集进程SerachA部署于数据节点A上,轮询搜集进程SerachB部署于数据节点B上。其中,运行数据包括磁盘指标、电源指标以及网卡指标等,通过各自的扩展文件获取各自的指标数据,这些指标数据就是本数据节点的运行数据。另外,各个数据节点之间还通过UDP通信,如图2所示,数据节点A和数据节点B通过各自的接收通道和发送通道向对方发送自身的运行数据。可以理解的是,图2只是为了方便本领域技术人员更加清楚本发明的技术方案的示意图,并没有实质性的含义。
S11:通过部署在主节点上的轮询存储进程周期性地获取轮询搜集进程采集到的运行数据,并将运行数据存储于所在的主节点的数据库中。
作为一种优选地实施方式,轮询存储进程的获取周期为15s。换句话说,每隔15s获取轮询搜集进程采集到的运行数据,并将运行数据存储于所在的主节点的数据库中。
图3为本发明实施例提供的一种轮询存储进程获取数据节点的运行数据的示意图。如图3所示,主节点所在的轮询存储进程Store,通过TCP协议获取数据节点A、B和C的运行数据,并将这些运行数据存储至数据库中。
S12:获取数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值。
S13:判断当前周期内的运行数据是否超过阈值。如果是,进入步骤S14;
S14:输出告警提示信息。
作为一种优选地实施方式,输出告警提示信息具体为:通过邮件或短信输出告警提示信息。可以理解的是,输出告警提示信息的方式有很多种,除了以邮件或短信的形式为,还可以直接输出到显示屏上。
在具体实施中,不同的指标具有不同的识别属性,例如,电源指标有电源指标的属性,网卡指标有网卡指标的属性,通过识别属性就可以判断出该指标是否超过正常范围。另外,不同的数据节点得到的运行数据也是有识别属性的,通过识别属性就可以判断出是哪个数据节点的运行数据。在本实施例中,步骤S13具体为:获取当前周期运行数据,通过各个数据节点的识别属性就可以将多种运行数据区分开,例如区分出数据节点A和数据节点B以及数据节点C各自的运行数据,再针对具体的数据节点进行判断。每个数据节点有其对应的正常对照数据的范围,即阈值,如果该节点的运行数据超过阈值,则说明该节点就出现异常。例如对于数据节点A的运行数据进行区分,分为电源指标、网卡指标等,然后再分别与电源指标的阈值和网卡指标的阈值比较,只要有一个指标异常,则判断结果就是运行数据超过阈值。以上内容只是举例说明。
本实施例提供的分布式集群系统的监控和告警方法,通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;通过部署在主节点上的轮询存储进程周期性地获取轮询搜集进程采集到的运行数据,并将运行数据存储于所在的主节点的数据库中;获取数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过阈值;如果是,则输出告警提示信息。该方法简单,只需要利用数据库中的运行数据来判断即可,无需重新获取,并且数据真实可靠。由此可见,在实现监控的基础上,也实现了告警提示的目的。
图4为本发明实施例提供的另一种分布式集群系统的监控和告警方法的流程图。如图4所示,在上述实施例的基础上,当输出告警提示信息之后还包括:
S15:获取数据库中下一周期的运行数据。
S16:判断下一周期的运行数据是否超过阈值。如果否,进入步骤S17;
S17:输出恢复提示信息。
作为一种优选地实施方式,输出恢复提示信息具体为:通过邮件或短信输出恢复提示信息。
可以理解的是,输出恢复提示信息的方式有很多种,除了以邮件或短信的形式为,还可以直接输出到显示屏上。
由于各个数据节点在上一周期出现异常时,有可能在下一个周期就会自行恢复,为了及时提醒运维人员,在本实施例中,当输出告警提示信息之后,继续获取数据库中下一周期的运行数据,如果下一周期的运行数据未超过阈值,则说明各个数据节点已经恢复正常,因此,需要输出恢复提示信息,以提示运维人员,告警已经解除。
图5为本发明实施例提供的一种分布式集群系统的监控和告警系统的结构图。如图5所示,分布式集群系统的监控和告警系统,包括:监控模块10和告警模块11,其中,监控模块10包括轮询搜集进程部署子模块100和轮询存储进程部署子模块101,告警模块11包括判断子模块110和告警提示子模块111;
轮询搜集进程部署子模块100,用于在各数据节点上部署轮询搜集进程,并通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;
轮询存储进程部署子模块101,用于在主节点上部署轮询存储进程,并通过部署在主节点上的轮询存储进程周期性地获取轮询搜集进程采集到的运行数据,并将运行数据存储于所在的主节点的数据库中;
判断子模块110,用于获取数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过阈值;如果是,则触发告警提示子模块;
告警提示子模块111,用于输出告警提示信息。
本实施例提供的分布式集群系统的监控和告警系统,在现有技术的基础上,增加了告警模块,与数据库连接,用于将监控模块存储在数据库中运行数据与所在主节点的配置文件中设定的阈值进行比较,从而判断出是否有数据节点出现异常,该系统简单,只需要利用数据库中的运行数据来判断即可,无需重新获取,并且数据真实可靠。由此可见,本系统在实现监控的基础上,也实现了告警提示的目的。
作为优选地实施方式,告警模块11还包括恢复提示子模块,用于输出恢复提示信息;
其中,判断子模块110还用于获取数据库中下一周期的运行数据,并判断下一周期的运行数据是否超过阈值,如果否,则触发恢复提示子模块。
作为优选地实施方式,告警提示子模块111具体通过邮件或短信输出告警提示信息。
作为优选地实施方式,恢复提示子模块具体通过邮件或短信输出恢复提示信息。
作为优选地实施方式,轮询存储进程的获取周期为15s。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
以上对本发明所提供的分布式集群系统的监控和告警方法及系统进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

Claims (10)

1.一种分布式集群系统的监控和告警方法,其特征在于,包括:
通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;
通过部署在主节点上的轮询存储进程周期性地获取所述轮询搜集进程采集到的所述运行数据,并将所述运行数据存储于所在的主节点的数据库中;
获取所述数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过所述阈值;如果是,则输出告警提示信息。
2.根据权利要求1所述的方法,其特征在于,当输出告警提示信息之后还包括:
获取所述数据库中下一周期的运行数据,并判断所述下一周期的运行数据是否超过所述阈值;如果否,则输出恢复提示信息。
3.根据权利要求1所述的方法,其特征在于,所述输出告警提示信息具体为:通过邮件或短信输出告警提示信息。
4.根据权利要求2所述的方法,其特征在于,所述输出恢复提示信息具体为:通过邮件或短信输出恢复提示信息。
5.根据权利要求1所述的方法,其特征在于,所述轮询存储进程的获取周期为15s。
6.一种分布式集群系统的监控和告警系统,其特征在于,包括:监控模块和告警模块,其中,监控模块包括轮询搜集进程部署子模块和轮询存储进程部署子模块,所述告警模块包括判断子模块和告警提示子模块;
所述轮询搜集进程部署子模块,用于在各数据节点上部署轮询搜集进程,并通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;
所述轮询存储进程部署子模块,用于在主节点上部署轮询存储进程,并通过部署在主节点上的轮询存储进程周期性地获取所述轮询搜集进程采集到的所述运行数据,并将所述运行数据存储于所在的主节点的数据库中;
所述判断子模块,用于获取所述数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过所述阈值;如果是,则触发所述告警提示子模块;
所述告警提示子模块,用于输出告警提示信息。
7.根据权利要求6所述的系统,其特征在于,所述告警模块还包括恢复提示子模块,用于输出恢复提示信息;
其中,所述判断子模块还用于获取所述数据库中下一周期的运行数据,并判断所述下一周期的运行数据是否超过所述阈值,如果否,则触发所述恢复提示子模块。
8.根据权利要求6所述的系统,其特征在于,所述告警提示子模块具体通过邮件或短信输出告警提示信息。
9.根据权利要求7所述的系统,其特征在于,所述恢复提示子模块具体通过邮件或短信输出恢复提示信息。
10.根据权利要求6所述的系统,其特征在于,所述轮询存储进程的获取周期为15s。
CN201610694727.3A 2016-08-19 2016-08-19 一种分布式集群系统的监控和告警方法及系统 Pending CN106100938A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610694727.3A CN106100938A (zh) 2016-08-19 2016-08-19 一种分布式集群系统的监控和告警方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610694727.3A CN106100938A (zh) 2016-08-19 2016-08-19 一种分布式集群系统的监控和告警方法及系统

Publications (1)

Publication Number Publication Date
CN106100938A true CN106100938A (zh) 2016-11-09

Family

ID=58070682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610694727.3A Pending CN106100938A (zh) 2016-08-19 2016-08-19 一种分布式集群系统的监控和告警方法及系统

Country Status (1)

Country Link
CN (1) CN106100938A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886477A (zh) * 2017-02-20 2017-06-23 郑州云海信息技术有限公司 一种云系统中监控阈值设定方法及装置
CN107181616A (zh) * 2017-05-19 2017-09-19 郑州云海信息技术有限公司 一种监控存储系统性能数据的方法及系统
CN107273273A (zh) * 2017-06-27 2017-10-20 郑州云海信息技术有限公司 一种分布式集群硬件故障预警方法及系统
CN107465575A (zh) * 2017-08-17 2017-12-12 郑州云海信息技术有限公司 一种集群的监控方法及系统
CN108038043A (zh) * 2017-12-22 2018-05-15 郑州云海信息技术有限公司 一种分布式存储集群告警方法、系统及设备
CN108563550A (zh) * 2018-04-23 2018-09-21 上海达梦数据库有限公司 一种分布式系统的监控方法、装置、服务器和存储介质
CN108958960A (zh) * 2018-07-26 2018-12-07 郑州云海信息技术有限公司 分布式存储集群中坏盘定位方法、装置、设备及存储介质
CN109032525A (zh) * 2018-07-26 2018-12-18 广东浪潮大数据研究有限公司 一种自动定位坏盘的方法、装置、设备及存储介质
CN109240126A (zh) * 2018-11-21 2019-01-18 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法
CN109298945A (zh) * 2018-10-17 2019-02-01 北京京航计算通讯研究所 面向大数据平台的Ceph分布式存储监控与调优管理方法
CN109413095A (zh) * 2018-11-29 2019-03-01 新华三大数据技术有限公司 防御攻击的方法及装置
CN109614283A (zh) * 2018-10-24 2019-04-12 世纪龙信息网络有限责任公司 分布式数据库集群的监控系统
CN110266549A (zh) * 2019-07-12 2019-09-20 上海纳宇电气有限公司 一种子系统故障监测装置及方法
CN110659174A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 监控告警方法、装置和系统
CN111988165A (zh) * 2020-07-09 2020-11-24 云知声智能科技股份有限公司 一种分布式存储系统使用情况的监控方法及系统
CN112118030A (zh) * 2020-08-27 2020-12-22 深圳市力合微电子股份有限公司 一种适用于泛dali系统的预应答方法
CN112199249A (zh) * 2020-09-16 2021-01-08 中国建设银行股份有限公司 监控数据的处理方法、装置、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240799A1 (en) * 2004-04-10 2005-10-27 Manfredi Charles T Method of network qualification and testing
CN101009586A (zh) * 2006-01-27 2007-08-01 华为技术有限公司 告警系统中对告警过滤条件的处理方法
CN103389715A (zh) * 2013-07-26 2013-11-13 浪潮电子信息产业股份有限公司 一种高性能的分布式数据中心监控架构
CN103873298A (zh) * 2014-03-14 2014-06-18 浪潮通信信息系统有限公司 一种可以配置的维护中心操作维护中心北向接口的数据质量自动监测的方法
CN105589789A (zh) * 2015-12-25 2016-05-18 浪潮电子信息产业股份有限公司 一种动态调整内存监控阀值的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050240799A1 (en) * 2004-04-10 2005-10-27 Manfredi Charles T Method of network qualification and testing
CN101009586A (zh) * 2006-01-27 2007-08-01 华为技术有限公司 告警系统中对告警过滤条件的处理方法
CN103389715A (zh) * 2013-07-26 2013-11-13 浪潮电子信息产业股份有限公司 一种高性能的分布式数据中心监控架构
CN103873298A (zh) * 2014-03-14 2014-06-18 浪潮通信信息系统有限公司 一种可以配置的维护中心操作维护中心北向接口的数据质量自动监测的方法
CN105589789A (zh) * 2015-12-25 2016-05-18 浪潮电子信息产业股份有限公司 一种动态调整内存监控阀值的方法

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886477A (zh) * 2017-02-20 2017-06-23 郑州云海信息技术有限公司 一种云系统中监控阈值设定方法及装置
CN106886477B (zh) * 2017-02-20 2021-06-29 郑州云海信息技术有限公司 一种云系统中监控阈值设定方法及装置
CN107181616A (zh) * 2017-05-19 2017-09-19 郑州云海信息技术有限公司 一种监控存储系统性能数据的方法及系统
CN107273273A (zh) * 2017-06-27 2017-10-20 郑州云海信息技术有限公司 一种分布式集群硬件故障预警方法及系统
CN107465575A (zh) * 2017-08-17 2017-12-12 郑州云海信息技术有限公司 一种集群的监控方法及系统
CN108038043A (zh) * 2017-12-22 2018-05-15 郑州云海信息技术有限公司 一种分布式存储集群告警方法、系统及设备
CN108038043B (zh) * 2017-12-22 2021-04-23 郑州云海信息技术有限公司 一种分布式存储集群告警方法、系统及设备
CN108563550A (zh) * 2018-04-23 2018-09-21 上海达梦数据库有限公司 一种分布式系统的监控方法、装置、服务器和存储介质
CN110659174A (zh) * 2018-06-28 2020-01-07 阿里巴巴集团控股有限公司 监控告警方法、装置和系统
CN108958960A (zh) * 2018-07-26 2018-12-07 郑州云海信息技术有限公司 分布式存储集群中坏盘定位方法、装置、设备及存储介质
CN109032525A (zh) * 2018-07-26 2018-12-18 广东浪潮大数据研究有限公司 一种自动定位坏盘的方法、装置、设备及存储介质
CN109298945A (zh) * 2018-10-17 2019-02-01 北京京航计算通讯研究所 面向大数据平台的Ceph分布式存储监控与调优管理方法
CN109614283A (zh) * 2018-10-24 2019-04-12 世纪龙信息网络有限责任公司 分布式数据库集群的监控系统
CN109614283B (zh) * 2018-10-24 2022-04-08 天翼数字生活科技有限公司 分布式数据库集群的监控系统
CN109240126A (zh) * 2018-11-21 2019-01-18 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法
CN109240126B (zh) * 2018-11-21 2024-03-08 国网湖北省电力有限公司电力科学研究院 一种具有模拟操作功能的分布式应用服务监测系统及方法
CN109413095B (zh) * 2018-11-29 2021-11-12 新华三大数据技术有限公司 防御攻击的方法及装置
CN109413095A (zh) * 2018-11-29 2019-03-01 新华三大数据技术有限公司 防御攻击的方法及装置
CN110266549A (zh) * 2019-07-12 2019-09-20 上海纳宇电气有限公司 一种子系统故障监测装置及方法
CN111988165A (zh) * 2020-07-09 2020-11-24 云知声智能科技股份有限公司 一种分布式存储系统使用情况的监控方法及系统
CN111988165B (zh) * 2020-07-09 2023-01-24 云知声智能科技股份有限公司 一种分布式存储系统使用情况的监控方法及系统
CN112118030A (zh) * 2020-08-27 2020-12-22 深圳市力合微电子股份有限公司 一种适用于泛dali系统的预应答方法
CN112118030B (zh) * 2020-08-27 2022-02-11 深圳市力合微电子股份有限公司 一种适用于泛dali系统的预应答方法
CN112199249A (zh) * 2020-09-16 2021-01-08 中国建设银行股份有限公司 监控数据的处理方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN106100938A (zh) 一种分布式集群系统的监控和告警方法及系统
CN102932195B (zh) 一种基于网络协议分析的业务分析监控方法及系统
CN105093033A (zh) 一种基于电网多源信息的故障综合分析系统及分析方法
CN107018023A (zh) 一种服务器诊断方法、装置及系统
CN104410067A (zh) 一种基于公变和用户采集大数据分析的台区停电分析方法
CN107145959A (zh) 一种基于大数据平台的电力数据处理方法
CN105207822A (zh) 一种电力通信设备的告警信息处理方法及装置
CN110334155A (zh) 一种基于大数据整合的区块链威胁情报分析方法及系统
CN106411617A (zh) 电力通信网络故障告警关联处理方法
CN102231161A (zh) 数据库同步验证及监控方法
CN106990321A (zh) 基于电压监测的配电线路故障识别装置
CN106354685A (zh) 一种psu和me通信i2c总线挂死恢复的实现方法
CN105302697A (zh) 一种密集数据模型数据库的运行状态监控方法及系统
CN105606958A (zh) 电力系统故障信息的处理方法、系统及装置
CN106650964A (zh) 一种充电设备的故障分析系统、方法和装置
CN105446197B (zh) 一种列控地面关键数据检测装置
CN110135171A (zh) 一种物联网信息安全态势系统
CN106251497A (zh) 一种城市免费自行车租赁管理系统
CN105303453A (zh) 一种变电站智能电子装置信息交互过程的表达方法
CN102984013A (zh) 一种用于通信传输网的告警分析方法
CN204376535U (zh) 一种智能spd监控系统
CN109687592A (zh) 变电站信息显示控制方法、装置及电子设备
CN106445006B (zh) 一种融合架构服务器
CN110702982B (zh) 一种电能计量装置智能回收管理系统
CN105938610A (zh) 一种用电采集系统中违约用电判别与报表自动生成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161109