CN106453504A - 一种基于nginx服务器集群的监控系统及方法 - Google Patents

一种基于nginx服务器集群的监控系统及方法 Download PDF

Info

Publication number
CN106453504A
CN106453504A CN201610820813.4A CN201610820813A CN106453504A CN 106453504 A CN106453504 A CN 106453504A CN 201610820813 A CN201610820813 A CN 201610820813A CN 106453504 A CN106453504 A CN 106453504A
Authority
CN
China
Prior art keywords
configuration item
web application
application configuration
monitoring information
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610820813.4A
Other languages
English (en)
Inventor
朱汶珍
杨克伟
付刚云
陈新亮
朱志琨
胡剑
许宜斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd
Original Assignee
HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd filed Critical HANGZHOU DONGFANG COMMUNICATION SOFTWARE TECHNOLOGY Co Ltd
Priority to CN201610820813.4A priority Critical patent/CN106453504A/zh
Publication of CN106453504A publication Critical patent/CN106453504A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • H04L67/025Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/104Peer-to-peer [P2P] networks
    • H04L67/1044Group management mechanisms 

Abstract

本发明公开了一种基于NGINX服务器集群的监控系统及方法。其中,该方法包括采集WEB应用配置项的指标数据;根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息;接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。该系统包括数据采集模块(31)、数据处理模块(32)和IT网管应用(33)。本发明提供的一种基于NGINX服务器集群的监控系统及方法,通过告警关联分析、关联告警影响分析,在WEB应用的可用性受影响时生成关联告警,提升用户感知,便于用户及时发现故障进行处理。

Description

一种基于NGINX服务器集群的监控系统及方法
技术领域
本发明涉及IT、网络管理技术领域,尤其涉及一种基于NGINX服务器集群的监控系统及方法。
背景技术
目前,基于NGINX+Keepalived组建高可用WEB被广泛使用,其中一种系统部署架构是通过NGINX的反向代理实现WEB服务器的负载均衡,通过Keepalived保障NGINX的双机主备。在实际运作中,需要对网管系统的WEB应用进行监控,及时发现故障进行处理,保障网管系统稳步运行。当前已有方案主要针对单台应用服务器设备和单个软件进行监控,通过对硬件性能、网络和软件运行状态等反映业务运行情况的指标采集,并设定阀值,超过阀值区间产生告警来判断单台服务器、单个软件是否正常运行。
当前技术主要对单台应用服务器的CPU、内存、磁盘、ping不通,以及单个软件的运行状态进行告警监控。但缺乏对关联应用服务器、关联软件的联合分析。
发明内容
本发明的目的在于,解决现有的NGINX服务器集群的监控方案存在的上述问题,提供了一种基于NGINX服务器集群的监控系统及方法,通过告警关联分析、关联告警影响分析,在WEB应用的可用性受影响时生成关联告警,提升用户感知,便于用户及时发现故障进行处理。
为了实现上述目的,一方面,本发明提供了一种基于NGINX服务器集群的监控方法,该方法包括以下步骤:
采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标;根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息;接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。
另一方面,本发明提供一种基于NGINX服务器集群的监控系统,具体包括:
数据采集模块,用于采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标;
数据处理模块,用于根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息;
IT网管应用:用于接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。
进一步地,该监控系统还包括告警处理模块,用于根据WEB应用配置项及配置项的关联关系,制定告警策略以及关联分析规则,告警策略为将监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。
进一步地,该系统还包括配置项管理模块,配置项管理模块用于定义WEB应用配置项及配置项的关联关系。
进一步地,WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。
进一步地,WEB应用配置项包括应用服务器、应用软件和中间件。
本发明提供的一种基于NGINX服务器集群的监控系统及方法,通过告警关联分析、关联告警影响分析,在WEB应用的可用性受影响时生成关联告警,提升用户感知,便于用户及时发现故障进行处理。
附图说明
图1为本发明实施例提供的一种基于NGINX服务器集群的监控系结构示意图;
图2为本发明实施例提供的一种基于NGINX服务器集群的监控方法流程示意图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案作进一步的详细描述。
图1为本发明实施例提供的一种基于NGINX服务器集群的监控系结构示意图。如图1所示,该系统包括:数据采集模块31、数据处理模块32和IT网管应用33。其中,数据采集模块31用于采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标。数据处理模块32根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息,WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。IT网管应用33接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。
优选地,该系统还包括告警处理模块34,告警处理模块34用于根据WEB应用配置项及配置项的关联关系,制定告警策略以及关联分析规则,告警策略为将所述监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。
优选地,该系统还包括配置项管理模块35,配置项管理模块35用于定义所述WEB应用配置项及配置项的关联关系。
WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。WEB应用配置项包括应用服务器、应用软件和中间件。
监控者通过配置项管理模块35定义WEB应用配置项及配置项的关联关系;数据处理模块32通过配置项管理模块35加载WEB应用配置项及配置项的关联关系。其中,WEB应用配置项包括应用服务器、应用软件和中间件。
监控者通过告警处理模块34制定告警策略以及关联分析规则;数据处理模块32通过告警处理模块34加载告警策略以及关联分析规则。其中,告警策略为将监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。
关联分析规则包括:①同个配置项不同事件分析,比如NGINX每秒请求数突变、NGINX服务器错误率突变;②同类配置项相关事件分析,比如主备Keepalived进程状态同时异常;③关联配置项相关事件分析,比如集群主备切换;④影响业务的事件关联分析,比如ping不通VIP地址则表明WEB应用不可达,主用Keepalived、备用NGINX进程状态同时异常时WEB应用不可用。
图2为本发明实施例提供的一种基于NGINX服务器集群的监控方法流程示意图。如图2所示,该方法包括步骤201-203:
步骤201,采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标。
步骤202,根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息。其中,WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。
步骤203,接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。
优选地,步骤201之前,还可以包括步骤101和/或步骤102。
步骤101,监控者通过配置项管理模块35定义WEB应用配置项及配置项的关联关系;数据处理模块32通过配置项管理模块35加载WEB应用配置项及配置项的关联关系。其中,WEB应用配置项包括应用服务器、应用软件和中间件。
步骤102,监控者通过告警处理模块34制定告警策略以及关联分析规则;数据处理模块32通过告警处理模块34加载告警策略以及关联分析规则。其中,告警策略为将监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。
关联分析规则包括:①同个配置项不同事件分析,比如NGINX每秒请求数突变、NGINX服务器错误率突变;②同类配置项相关事件分析,比如主备Keepalived进程状态同时异常;③关联配置项相关事件分析,比如集群主备切换;④影响业务的事件关联分析,比如ping不通VIP地址则表明WEB应用不可达,主用Keepalived、备用NGINX进程状态同时异常时WEB应用不可用。
本发明实施例提供的一种基于NGINX服务器集群的监控系统及方法,通过告警关联分析、关联告警影响分析,在WEB应用的可用性受影响时生成关联告警,提升用户感知,便于用户及时发现故障进行处理。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于NGINX服务器集群的监控系统,其特征在于,包括:数据采集模块(31)、数据处理模块(32)和IT网管应用(33);其中,
数据采集模块(31),用于采集WEB应用配置项的指标数据,所述WEB应用配置项的指标数据包括性能指标;
数据处理模块(32),用于根据所述WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息;
IT网管应用(33),用于接收所述WEB应用配置项的监控信息,监控者通过所述监控信息查看所述WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。
2.根据权利要求1所述的监控系统,其特征在于,还包括告警处理模块(34),所述告警处理模块(34)用于根据WEB应用配置项及配置项的关联关系,制定告警策略以及关联分析规则,所述告警策略为将所述监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。
3.根据权利要求1或2所述的监控系统,其特征在于,还包括配置项管理模块(35),所述配置项管理模块(35)用于定义所述WEB应用配置项及配置项的关联关系。
4.根据权利要求1所述的监控系统,其特征在于,所述WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。
5.根据权利要求1所述的监控系统,其特征在于,所述WEB应用配置项包括应用服务器、应用软件和中间件。
6.一种基于NGINX服务器集群的监控方法,其特征在于,包括以下步骤:
采集WEB应用配置项的指标数据,所述WEB应用配置项的指标数据包括性能指标;
根据所述WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息;
接收所述监控信息,监控者通过所述监控信息查看所述WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。
7.根据权利要求6所述的监控方法,其特征在于,所述生成WEB应用配置项的监控信息步骤包括:
根据WEB应用配置项及配置项的关联关系,制定告警策略以及关联分析规则,所述告警策略为将所述监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。
8.根据权利要求6或7所述的监控方法,其特征在于,在所述采集WEB应用配置项的指标数据步骤之前,还包括:定义所述WEB应用配置项及配置项的关联关系。
9.根据权利要求6所述的监控方法,其特征在于,所述WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。
10.根据权利要求6所述的监控方法,其特征在于,所述WEB应用配置项包括应用服务器、应用软件和中间件。
CN201610820813.4A 2016-09-13 2016-09-13 一种基于nginx服务器集群的监控系统及方法 Pending CN106453504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610820813.4A CN106453504A (zh) 2016-09-13 2016-09-13 一种基于nginx服务器集群的监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610820813.4A CN106453504A (zh) 2016-09-13 2016-09-13 一种基于nginx服务器集群的监控系统及方法

Publications (1)

Publication Number Publication Date
CN106453504A true CN106453504A (zh) 2017-02-22

Family

ID=58167961

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610820813.4A Pending CN106453504A (zh) 2016-09-13 2016-09-13 一种基于nginx服务器集群的监控系统及方法

Country Status (1)

Country Link
CN (1) CN106453504A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107104858A (zh) * 2017-06-09 2017-08-29 携程旅游信息技术(上海)有限公司 Web负载均衡系统的监控系统
CN107844403A (zh) * 2017-12-14 2018-03-27 上海振大电器成套有限公司 一种硬件设备监控系统
CN109391693A (zh) * 2018-10-24 2019-02-26 国云科技股份有限公司 一种堡垒机支持审计web应用的方法
CN110287079A (zh) * 2019-05-14 2019-09-27 中山大学 一种集群自动化监控系统及方法
CN112202895A (zh) * 2020-09-30 2021-01-08 北京达佳互联信息技术有限公司 监控指标数据的收集方法、系统、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103326874A (zh) * 2012-03-22 2013-09-25 西门子公司 告警管理系统及方法
CN103475544A (zh) * 2013-09-18 2013-12-25 浪潮电子信息产业股份有限公司 一种基于云资源监控平台的业务监控方法
CN105553691A (zh) * 2015-12-08 2016-05-04 中国南方电网有限责任公司 一种基于电力监管信息的监控告警实现方法
CN105892387A (zh) * 2016-05-30 2016-08-24 国网江苏省电力公司信息通信分公司 基于跨平台多点数据采集mpca模型的机房隐患自动上报装置及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103326874A (zh) * 2012-03-22 2013-09-25 西门子公司 告警管理系统及方法
CN103475544A (zh) * 2013-09-18 2013-12-25 浪潮电子信息产业股份有限公司 一种基于云资源监控平台的业务监控方法
CN105553691A (zh) * 2015-12-08 2016-05-04 中国南方电网有限责任公司 一种基于电力监管信息的监控告警实现方法
CN105892387A (zh) * 2016-05-30 2016-08-24 国网江苏省电力公司信息通信分公司 基于跨平台多点数据采集mpca模型的机房隐患自动上报装置及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107104858A (zh) * 2017-06-09 2017-08-29 携程旅游信息技术(上海)有限公司 Web负载均衡系统的监控系统
CN107844403A (zh) * 2017-12-14 2018-03-27 上海振大电器成套有限公司 一种硬件设备监控系统
CN109391693A (zh) * 2018-10-24 2019-02-26 国云科技股份有限公司 一种堡垒机支持审计web应用的方法
CN110287079A (zh) * 2019-05-14 2019-09-27 中山大学 一种集群自动化监控系统及方法
CN112202895A (zh) * 2020-09-30 2021-01-08 北京达佳互联信息技术有限公司 监控指标数据的收集方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN106453504A (zh) 一种基于nginx服务器集群的监控系统及方法
TWI746512B (zh) 實體機器故障分類處理方法、裝置和虛擬機器恢復方法、系統
CN102932466B (zh) 基于内容分发网络的分布式源监控方法和系统
CN102929773B (zh) 信息采集方法和装置
CN105659528B (zh) 一种实现故障定位的方法及装置
CN107707380B (zh) 一种监控告警方法和装置
CN106385339B (zh) 企业网络的访问性能的监控方法和监控系统
CN108306747B (zh) 一种云安全检测方法、装置和电子设备
CN103812675A (zh) 一种实现业务交付平台异地容灾切换的方法和系统
CN101631048A (zh) 一种监视被管理对象的方法、装置及系统
CN107947998A (zh) 一种基于应用系统的实时监测系统
CN110457176A (zh) 用于分布式系统的监控方法、装置、存储介质及电子设备
CN109936467A (zh) 电网系统安全运行维护监管平台
CN109495530A (zh) 一种实时交通数据传输方法、传输装置及传输系统
US10135671B2 (en) Policy-based M2M terminal device monitoring and control method and device
US9674065B2 (en) Method, apparatus and system for detecting network element load imbalance
US11228485B2 (en) Dynamic action dashlet for real-time systems operation management
WO2018035765A1 (zh) 网络异常的检测方法及装置
CN104468224A (zh) 一种双重过滤的数据中心监控系统故障告警方法
CN107528705A (zh) 故障处理方法及装置
KR20190104759A (ko) 지능형 장비 이상 증상 사전 탐지 시스템 및 방법
CN107612755A (zh) 一种云资源的管理方法及其装置
CN107911229A (zh) 运行状态改变的提醒方法、装置、电子设备及存储介质
CN104199763A (zh) 具有远程报警功能的多单元服务器管理系统
CN103457792B (zh) 一种故障检测方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222

RJ01 Rejection of invention patent application after publication