CN108390907A - 一种基于Hadoop集群的管理监控系统及方法 - Google Patents

一种基于Hadoop集群的管理监控系统及方法 Download PDF

Info

Publication number
CN108390907A
CN108390907A CN201810019566.7A CN201810019566A CN108390907A CN 108390907 A CN108390907 A CN 108390907A CN 201810019566 A CN201810019566 A CN 201810019566A CN 108390907 A CN108390907 A CN 108390907A
Authority
CN
China
Prior art keywords
management
module
monitoring
hadoop clusters
serviced
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810019566.7A
Other languages
English (en)
Other versions
CN108390907B (zh
Inventor
唐磊
宫潍
常晨
聂小燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Aerospace Heng Jia Data Technology Co Ltd
Original Assignee
Zhejiang Aerospace Heng Jia Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Aerospace Heng Jia Data Technology Co Ltd filed Critical Zhejiang Aerospace Heng Jia Data Technology Co Ltd
Priority to CN201810019566.7A priority Critical patent/CN108390907B/zh
Publication of CN108390907A publication Critical patent/CN108390907A/zh
Application granted granted Critical
Publication of CN108390907B publication Critical patent/CN108390907B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/56Provisioning of proxy services

Abstract

本发明公开了一种基于Hadoop集群的管理监控系统,包括:Hadoop集群和管理服务器模块,其中,Hadoop集群包括多个节点服务器,每个节点服务器上均部署有一个监控模块、一个代理模块和多种服务组件,管理服务器模块包括日志管理模块。本发明的有益效果是:本技术方案能够对大数据平台进行监控,监控的内容包括每个节点和每种服务组件的状态,方便运维人员对大数据平台进行维护;提供一个统一日志管理工具,使运维人员能够更方便的管理日志,排查错误。

Description

一种基于Hadoop集群的管理监控系统及方法
技术领域
本发明涉及大数据平台领域,特别涉及一种基于Hadoop集群的管理监控系统及方法。
背景技术
以往对大数据平台的的监控通常需要单独选用某种监控工具,并且需要自行设计监控图表,在传统的大数据平台维护中,查看日志是一个定位问题的最直接的方法,但传统的大数据平台没有一个统一管理日志的工具,因此在排查错误的时候将会变得很繁琐。
发明内容
本发明提供了一种基于Hadoop集群的管理监控系统及方法,解决了现有技术的技术问题。
本发明解决上述技术问题的技术方案如下:
一种基于Hadoop集群的管理监控系统,包括:Hadoop集群和管理服务器模块,其中,所述Hadoop集群包括多个节点服务器,每个节点服务器上均部署有一个监控模块、一个代理模块和多种服务组件,所述管理服务器模块包括日志管理模块;
所述管理服务器模块用于管理所述多个节点服务器部署的多个监控模块和多个代理模块;
每个监控模块包括:
监控组件,用于监控自身所属的节点服务器的运行状态和各项系统指标,得到第一监控数据;
多个通道组件,分别用于收集自身所属的节点服务器部署的多种服务组件对应的多个监控指标,得到第二监控数据;
时间线服务组件,用于解析所述第一监控数据和所述第二监控数据,得到解析数据,将所述解析数据存储在HBase数据库中并发送给所述管理服务器模块;
每个代理模块用于接收并执行所述管理服务器模块根据所述解析数据下发的各项指令并向所述管理服务器模块上报心跳信息;
所述日志管理模块用于管理所述Hadoop集群中的所有服务组件的日志信息。
本发明的有益效果是:代理模块负责执行管理服务器模块发送的指令,并上报心跳信息,心跳信号是指每隔一段时间向互联的另一方发送一个很小的数据包,通过对方的回复情况可以判断互联的双方之间的通讯链路是否已经断开,因此,通过上报心跳信息可以实时监控节点服务器与管理服务器之间的通讯链路的开断。
监控模块负责监控节点服务器和其上部署的服务组件,通过监控组件和通道组件对节点服务器进行监控,获取节点服务器的监控数据,通过时间线服务组件对其进行解析后上传给管理服务器。
本技术方案能够对大数据平台进行监控,监控的内容包括每个节点和每种服务组件的状态,方便运维人员对大数据平台进行维护;提供一个统一日志管理工具,使运维人员能够更方便的管理日志,排查错误。
在上述技术方案的基础上,本发明还可以做如下改进。
优选地,所述管理服务器模块还包括两个管理服务器,其中一个管理服务器宕机时自动切换至另一个管理服务器,指向所述其中一个管理服务器的所有监控模块和代理模块均自动指向所述另一个管理服务器。
优选地,还包括:用户管理模块和视图管理模块,
所述用户管理模块用于管理所述Hadoop集群的版本、用户对所述Hadoop集群的访问权限和所述Hadoop集群的视图;
所述视图管理模块用于提供并管理客户端与所述Hadoop集群的服务组件之间的交互界面。
优选地,还包括:操作管理模块,用于在确认当前用户的管理员身份之后显示操作界面,管理所述Hadoop集群中的所有服务组件的CURD操作和常规操作,以及所述Hadoop集群中的单个服务组件的自定义操作,还用于管理所述Hadoop集群中的所述多个节点服务器和产生的告警信息。
优选地,所述Hadoop集群中的服务组件的服务种类包括:Hadoop服务、zookeeper服务、HBase服务、storm服务、Kafka服务、Flume服务、Hive服务、Spark服务、Oozie服务、Tez服务、Sqoop服务和Slider服务。
优选地,所述各项系统指标包括:节点服务器的中央处理器、硬盘、存储器和所述节点服务器所在网络的运行状态。
一种基于Hadoop集群的管理监控方法,适用于管理监控系统,所述管理监控系统包括:Hadoop集群和管理服务器模块,其中,所述Hadoop集群包括多个节点服务器,每个节点服务器上均部署有一个监控模块、一个代理模块和多种服务组件,所述管理服务器模块包括日志管理模块,每个监控模块包括:监控组件、多个通道组件和时间线服务组件,所述管理监控方法包括:
S1、监控组件监控自身所属的节点服务器的运行状态和各项系统指标,得到第一监控数据;
S2、多个通道组件分别收集自身所属的节点服务器部署的多种服务组件对应的多个监控指标,得到第二监控数据;
S3、时间线服务组件解析所述第一监控数据和所述第二监控数据,得到解析数据,将所述解析数据存储在HBase数据库中并发送给所述管理服务器模块;
S4、每个代理模块接收并执行所述管理服务器模块根据所述解析数据下发的各项指令并向所述管理服务器模块上报心跳信息;
S5、所述日志管理模块管理所述Hadoop集群中的所有服务组件的日志信息。
优选地,所述管理服务器模块还包括两个管理服务器,其中一个管理服务器宕机时自动切换至另一个管理服务器,指向所述其中一个管理服务器的所有监控模块和代理模块均自动指向所述另一个管理服务器。
优选地,所述Hadoop集群中的服务组件的服务种类包括:Hadoop服务、zookeeper服务、HBase服务、storm服务、Kafka服务、Flume服务、Hive服务、Spark服务、Oozie服务、Tez服务、Sqoop服务和Slider服务。
优选地,所述各项系统指标包括:节点服务器的中央处理器、硬盘、存储器和所述节点服务器所在网络的运行状态。
附图说明
图1为本发明实施例提供的一种基于Hadoop集群的管理监控系统的结构图;
图2为本发明另一实施例提供的一种基于Hadoop集群的管理监控系统的工作部署图;
图3为本发明另一实施例提供的一种基于Hadoop集群的管理监控系统的结构图;
图4为本发明另一实施例提供的一种基于Hadoop集群的管理监控方法的流程图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,一种基于Hadoop集群的管理监控系统,包括:Hadoop集群1和管理服务器模块2,其中,Hadoop集群1包括多个节点服务器11,每个节点服务器11上均部署有一个监控模块3、一个代理模块4和多种服务组件12,管理服务器模块2包括日志管理模块5;
管理服务器模块2用于管理多个节点服务器11部署的多个监控模块3和多个代理模块4;
每个监控模块3包括:
监控组件31,用于监控自身所属的节点服务器11的运行状态和各项系统指标,得到第一监控数据;
多个通道组件32,分别用于收集自身所属的节点服务器11部署的多种服务组件12对应的多个监控指标,得到第二监控数据;
时间线服务组件33,用于解析第一监控数据和第二监控数据,得到解析数据,将解析数据存储在HBase数据库中并发送给管理服务器模块2;
每个代理模块4用于接收并执行管理服务器模块2根据解析数据下发的各项指令并向管理服务器模块2上报心跳信息;
日志管理模块5用于管理Hadoop集群1中的所有服务组件12的日志信息。
优选地,管理服务器模块还包括两个管理服务器,其中一个管理服务器宕机时自动切换至另一个管理服务器,指向其中一个管理服务器的所有监控模块和代理模块均自动指向另一个管理服务器。
代理模块负责执行管理服务器模块发送的指令,并上报心跳信息,心跳信号是指每隔一段时间向互联的另一方发送一个很小的数据包,通过对方的回复情况可以判断互联的双方之间的通讯链路是否已经断开,因此,通过上报心跳信息可以实时监控节点服务器与管理服务器之间的通讯链路的开断。
监控模块负责监控节点服务器和其上部署的服务组件,通过监控组件和通道组件对节点服务器进行监控,获取节点服务器的监控数据,通过时间线服务组件对其进行解析后上传给管理服务器。
如图2所示,部署2台ADM Server(管理服务器模块)机,数据库相同,各stack、service、component版本配置文件相同,一台停止后切换至另一台。前提条件为:保证必须有一台Server是可用状态;两个Server机数据库自动同步(集群信息、Service信息都是保存在DB中,默认使用PostgreSQL);切换后需将所有节点中的agent(代理模块)重新定位到新主机上。
1.ADM(本管理监控系统)在提供服务的时候不可避免会因为各种原因出现故障,因此需要一个高可用方案。通过部署2台完全相同ADM Server,在一台ADM server宕机后自动切换到另一台ADM Server,并且所有的Agent自动指向新的ADM Server来实现ADM的高可用。
2.自动化部署通过控制一个service(服务组件)的生命周期来实现。在service的生命周期的start过程中更新service的配置,通过这种形式来完成对service的自动部署以及配置变更。
3.通过监控模块来完成对节点和service的监控。在节点层面,通过ganglia自身来实现对节点状态的监控;在service层面,通过配置相应的sink(通道组件)实现对service的监控。
以往对大数据平台的的监控通常需要单独选用某种监控工具,并且需要自行设计监控图表,ADM能够对大数据平台进行监控,监控的内容包括每个节点状态的监控、每个service的监控,同时提供告警功能,方便运维人员对大数据平台进行维护。
在传统的大数据平台维护中,查看日志是一个定位问题的最直接的方法,但传统的大数据平台没有一个统一管理日志的工具,因此在排查错误的时候将会变得很繁琐。ADM提供一个统一日志管理工具(日志管理模块),作为ADM的一个service而存在,使运维人员能够更方便的管理日志,排查错误。
如图3所示,图1所示的管理监控系统还包括:用户管理模块6和视图管理模块7,
用户管理模块6用于管理Hadoop集群1的版本、用户对Hadoop集群1的访问权限和Hadoop集群1的视图;
用户管理模块7还用于管理用户认证和日志审计等安全机制。大数据平台一般来说是部署在一个局域网中,因此很多开发人员经常会忽略大数据的安全问题,但大数据安全也是必不可少的。ADM提供一个完整的包含用户认证、权限管理、日志审计的大数据安全机制,能够使大数据平台在一个更加安全的环境下提供服务。
视图管理模块用于提供并管理客户端与Hadoop集群1的服务组件之间的交互界面。
还包括:操作管理模块8,用于在确认当前用户的管理员身份之后显示操作界面,管理Hadoop集群1中的所有服务组件的CURD操作和常规操作,以及Hadoop集群1中的单个服务组件的自定义操作,还用于管理Hadoop集群1中的多个节点服务器11和产生的告警信息。
优选地,Hadoop集群中的服务组件的服务种类包括:Hadoop服务、zookeeper服务、HBase服务、storm服务、Kafka服务、Flume服务、Hive服务、Spark服务、Oozie服务、Tez服务、Sqoop服务和Slider服务。
优选地,各项系统指标包括:节点服务器的中央处理器、硬盘、存储器和节点服务器所在网络的运行状态。
一种基于Hadoop集群的管理监控方法,适用于管理监控系统,管理监控系统包括:Hadoop集群和管理服务器模块,其中,Hadoop集群包括多个节点服务器,每个节点服务器上均部署有一个监控模块、一个代理模块和多种服务组件,管理服务器模块包括日志管理模块,每个监控模块包括:监控组件、多个通道组件和时间线服务组件。
如图4所示,管理监控方法包括:
S1、监控组件监控自身所属的节点服务器的运行状态和各项系统指标,得到第一监控数据;
S2、多个通道组件分别收集自身所属的节点服务器部署的多种服务组件对应的多个监控指标,得到第二监控数据;
S3、时间线服务组件解析第一监控数据和第二监控数据,得到解析数据,将解析数据存储在HBase数据库中并发送给管理服务器模块;
S4、每个代理模块接收并执行管理服务器模块根据解析数据下发的各项指令并向管理服务器模块上报心跳信息;
S5、日志管理模块管理Hadoop集群中的所有服务组件的日志信息。
优选地,管理服务器模块还包括两个管理服务器,其中一个管理服务器宕机时自动切换至另一个管理服务器,指向其中一个管理服务器的所有监控模块和代理模块均自动指向另一个管理服务器。
优选地,Hadoop集群中的服务组件的服务种类包括:Hadoop服务、zookeeper服务、HBase服务、storm服务、Kafka服务、Flume服务、Hive服务、Spark服务、Oozie服务、Tez服务、Sqoop服务和Slider服务。
优选地,各项系统指标包括:节点服务器的中央处理器、硬盘、存储器和节点服务器所在网络的运行状态。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于Hadoop集群的管理监控系统,其特征在于,包括:Hadoop集群和管理服务器模块,其中,所述Hadoop集群包括多个节点服务器,每个节点服务器上均部署有一个监控模块、一个代理模块和多种服务组件,所述管理服务器模块包括日志管理模块;
所述管理服务器模块用于管理所述多个节点服务器部署的多个监控模块和多个代理模块;
每个监控模块包括:
监控组件,用于监控自身所属的节点服务器的运行状态和各项系统指标,得到第一监控数据;
多个通道组件,分别用于收集自身所属的节点服务器部署的多种服务组件对应的多个监控指标,得到第二监控数据;
时间线服务组件,用于解析所述第一监控数据和所述第二监控数据,得到解析数据,将所述解析数据存储在HBase数据库中并发送给所述管理服务器模块;
每个代理模块用于接收并执行所述管理服务器模块根据所述解析数据下发的各项指令并向所述管理服务器模块上报心跳信息;
所述日志管理模块用于管理所述Hadoop集群中的所有服务组件的日志信息。
2.根据权利要求1所述的一种基于Hadoop集群的管理监控系统,其特征在于,所述管理服务器模块还包括两个管理服务器,其中一个管理服务器宕机时自动切换至另一个管理服务器,指向所述其中一个管理服务器的所有监控模块和代理模块均自动指向所述另一个管理服务器。
3.根据权利要求1所述的一种基于Hadoop集群的管理监控系统,其特征在于,还包括:用户管理模块和视图管理模块,
所述用户管理模块用于管理所述Hadoop集群的版本、用户对所述Hadoop集群的访问权限和所述Hadoop集群的视图;
所述视图管理模块用于提供并管理客户端与所述Hadoop集群的服务组件之间的交互界面。
4.根据权利要求1所述的一种基于Hadoop集群的管理监控系统,其特征在于,还包括:操作管理模块,用于在确认当前用户的管理员身份之后显示操作界面,管理所述Hadoop集群中的所有服务组件的CURD操作和常规操作,以及所述Hadoop集群中的单个服务组件的自定义操作,还用于管理所述Hadoop集群中的所述多个节点服务器和产生的告警信息。
5.根据权利要求1-4任一项所述的一种基于Hadoop集群的管理监控系统,其特征在于,所述Hadoop集群中的服务组件的服务种类包括:Hadoop服务、zookeeper服务、HBase服务、storm服务、Kafka服务、Flume服务、Hive服务、Spark服务、Oozie服务、Tez服务、Sqoop服务和Slider服务。
6.根据权利要求1-4任一项所述的一种基于Hadoop集群的管理监控系统,其特征在于,所述各项系统指标包括:节点服务器的中央处理器、硬盘、存储器和所述节点服务器所在网络的运行状态。
7.一种基于Hadoop集群的管理监控方法,其特征在于,适用于管理监控系统,所述管理监控系统包括:Hadoop集群和管理服务器模块,其中,所述Hadoop集群包括多个节点服务器,每个节点服务器上均部署有一个监控模块、一个代理模块和多种服务组件,所述管理服务器模块包括日志管理模块,每个监控模块包括:监控组件、多个通道组件和时间线服务组件,所述管理监控方法包括:
S1、监控组件监控自身所属的节点服务器的运行状态和各项系统指标,得到第一监控数据;
S2、多个通道组件分别收集自身所属的节点服务器部署的多种服务组件对应的多个监控指标,得到第二监控数据;
S3、时间线服务组件解析所述第一监控数据和所述第二监控数据,得到解析数据,将所述解析数据存储在HBase数据库中并发送给所述管理服务器模块;
S4、每个代理模块接收并执行所述管理服务器模块根据所述解析数据下发的各项指令并向所述管理服务器模块上报心跳信息;
S5、所述日志管理模块管理所述Hadoop集群中的所有服务组件的日志信息。
8.根据权利要求7所述的一种基于Hadoop集群的管理监控方法,其特征在于,所述管理服务器模块还包括两个管理服务器,其中一个管理服务器宕机时自动切换至另一个管理服务器,指向所述其中一个管理服务器的所有监控模块和代理模块均自动指向所述另一个管理服务器。
9.根据权利要求7所述的一种基于Hadoop集群的管理监控方法,其特征在于,所述Hadoop集群中的服务组件的服务种类包括:Hadoop服务、zookeeper服务、HBase服务、storm服务、Kafka服务、Flume服务、Hive服务、Spark服务、Oozie服务、Tez服务、Sqoop服务和Slider服务。
10.根据权利要求7所述的一种基于Hadoop集群的管理监控方法,其特征在于,所述各项系统指标包括:节点服务器的中央处理器、硬盘、存储器和所述节点服务器所在网络的运行状态。
CN201810019566.7A 2018-01-09 2018-01-09 一种基于Hadoop集群的管理监控系统及方法 Active CN108390907B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810019566.7A CN108390907B (zh) 2018-01-09 2018-01-09 一种基于Hadoop集群的管理监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810019566.7A CN108390907B (zh) 2018-01-09 2018-01-09 一种基于Hadoop集群的管理监控系统及方法

Publications (2)

Publication Number Publication Date
CN108390907A true CN108390907A (zh) 2018-08-10
CN108390907B CN108390907B (zh) 2021-06-22

Family

ID=63076070

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810019566.7A Active CN108390907B (zh) 2018-01-09 2018-01-09 一种基于Hadoop集群的管理监控系统及方法

Country Status (1)

Country Link
CN (1) CN108390907B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109656570A (zh) * 2018-12-18 2019-04-19 江苏满运软件科技有限公司 集群系统及其运行方法、电子设备和存储介质
CN109743230A (zh) * 2019-02-18 2019-05-10 国家计算机网络与信息安全管理中心 基于统计信息的监控数据传输系统
CN111782205A (zh) * 2020-07-30 2020-10-16 杭州玳数科技有限公司 一种通用软件部署监控系统及方法
CN112115016A (zh) * 2020-08-06 2020-12-22 北京健康之家科技有限公司 应用性能监控系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080228917A1 (en) * 2006-05-02 2008-09-18 John Jason Auvenshine Method and system for importing an application and server map to a business systems manager display
CN103747060A (zh) * 2013-12-26 2014-04-23 惠州华阳通用电子有限公司 一种基于流媒体服务集群的分布式监控系统及方法
CN104504013A (zh) * 2014-12-10 2015-04-08 无锡城市云计算中心有限公司 大数据软件的管理方法和装置
CN105718351A (zh) * 2016-01-08 2016-06-29 北京汇商融通信息技术有限公司 一种面向Hadoop集群的分布式监控管理系统
CN106549829A (zh) * 2016-10-28 2017-03-29 北方工业大学 大数据计算平台监控系统及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080228917A1 (en) * 2006-05-02 2008-09-18 John Jason Auvenshine Method and system for importing an application and server map to a business systems manager display
CN103747060A (zh) * 2013-12-26 2014-04-23 惠州华阳通用电子有限公司 一种基于流媒体服务集群的分布式监控系统及方法
CN104504013A (zh) * 2014-12-10 2015-04-08 无锡城市云计算中心有限公司 大数据软件的管理方法和装置
CN105718351A (zh) * 2016-01-08 2016-06-29 北京汇商融通信息技术有限公司 一种面向Hadoop集群的分布式监控管理系统
CN106549829A (zh) * 2016-10-28 2017-03-29 北方工业大学 大数据计算平台监控系统及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109656570A (zh) * 2018-12-18 2019-04-19 江苏满运软件科技有限公司 集群系统及其运行方法、电子设备和存储介质
CN109656570B (zh) * 2018-12-18 2022-03-22 江苏满运软件科技有限公司 集群系统及其运行方法、电子设备和存储介质
CN109743230A (zh) * 2019-02-18 2019-05-10 国家计算机网络与信息安全管理中心 基于统计信息的监控数据传输系统
CN111782205A (zh) * 2020-07-30 2020-10-16 杭州玳数科技有限公司 一种通用软件部署监控系统及方法
CN112115016A (zh) * 2020-08-06 2020-12-22 北京健康之家科技有限公司 应用性能监控系统

Also Published As

Publication number Publication date
CN108390907B (zh) 2021-06-22

Similar Documents

Publication Publication Date Title
CN108390907A (zh) 一种基于Hadoop集群的管理监控系统及方法
US6115743A (en) Interface system for integrated monitoring and management of network devices in a telecommunication network
CN108600029A (zh) 一种配置文件更新方法、装置、终端设备及存储介质
US8977886B2 (en) Method and apparatus for rapid disaster recovery preparation in a cloud network
EP1900144B1 (en) Method and system for identifying faults in communication networks
CN109714192A (zh) 一种监控云平台的监控方法及系统
WO2023142054A1 (zh) 一种面向容器微服务的性能监控告警方法及告警系统
CN106612199B (zh) 一种网络监控数据收集与分析系统及方法
CN103716173B (zh) 一种存储监控系统及监控告警发布的方法
CN107947998A (zh) 一种基于应用系统的实时监测系统
CN110209518A (zh) 一种多数据源日志数据集中收集存储方法及装置
CN107124315A (zh) 基于snmp及ipmi协议的多服务器监测系统及监测方法
CN110855481B (zh) 数据采集系统及方法
US6931357B2 (en) Computer network monitoring with test data analysis
CN108199901A (zh) 硬件报修方法、系统、设备、硬件管理服务器与存储介质
EP1622310B1 (en) Administration method and system for network management systems
CN108011906A (zh) 具有智能监控功能的数字标牌管理系统及监控方法
CN109120647A (zh) 一种安全交换系统
CN110545197A (zh) 节点状态监控方法及装置
Ellsworth et al. A non-proprietary network operations platform for openroadm environment
KR100650584B1 (ko) 이엠에스의 성능관리모듈에서 통계데이터 오류 통보방법
CN103248505A (zh) 基于视图的网络监控方法及装置
CN110971467A (zh) 一种网络集中化管理系统
CN103095486A (zh) 一种呼叫系统的故障管理方法及系统
Qin et al. Control infrastructure monitoring system at the NSRL facility cluster

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant