CN103117878A - 一种基于Nagios的分布式监控系统的设计方法 - Google Patents

一种基于Nagios的分布式监控系统的设计方法 Download PDF

Info

Publication number
CN103117878A
CN103117878A CN2013100349766A CN201310034976A CN103117878A CN 103117878 A CN103117878 A CN 103117878A CN 2013100349766 A CN2013100349766 A CN 2013100349766A CN 201310034976 A CN201310034976 A CN 201310034976A CN 103117878 A CN103117878 A CN 103117878A
Authority
CN
China
Prior art keywords
node
distributed
main controlled
data
controlled node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2013100349766A
Other languages
English (en)
Inventor
付正全
刘成平
李锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN2013100349766A priority Critical patent/CN103117878A/zh
Publication of CN103117878A publication Critical patent/CN103117878A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于Nagios的分布式监控系统的设计方法,系统包括:主控节点、分布式节点及共享数据库三部分,各分布式节点实现定时采集数据并将实时数据存入远程数据库,历史数据则以rrd文件的形式存在本地数据库中,主控节点负责添加及查看所监控的设备及监测器信息,共享数据库位于主控节点中,即共享数据库是主控节点的本地数据库,从而提高主控节点查看监控状态的效率。

Description

一种基于Nagios的分布式监控系统的设计方法
技术领域
本发明涉及一种计算机应用技术领域,具体地说是一种基于Nagios的分布式监控系统的设计方法。
背景技术
随着云计算时代的到来,网络中的资源被集中起来充分利用资源以提供更高的性能,从而出现了大量的数据中心,随之出现的还有大量的服务器运维工作,然而这给网络中成千上万的服务器设备运行状态的监控及管理带来了巨大的挑战,面对如此多需要监控的设备以及复杂的网络环境,对这些大量的设备进行实时准确的性能监控显得尤为必要。
目前业界采用的普遍方式是通过部署Nagios的分布式监控系统完成这个巨大的工作量。具体来说,该系统分为主控节点和分布式节点两部分,首先,各分布式节点需要配置Nagios监控所必需的配置信息(主机、主机组、监测器、监测器阀值、联系人等),各分布式节点监控的实时数据通过nsca_client进程实时的上报给主控节点,在主控节点中同样需要配置Nagios的监控所必需的配置信息,而主控节点的的守护进程nsca则负责接收客户端发送的数据,这样就完成了监控数据上报的过程。
上述过程实现了基于Nagios的分布式监控功能,相比与没有采用分布式监控的Nagios系统来说性能得到了极大的提升,但是,经过仔细的研究与分析,这种分布式监控方式也有其不足的地方。首先,主控机需要和各分布式监控节点保持设备、设备组、监测器、联系人、阀值等参数完全一致才能正确解析分布式节点上报的数据,这就要求主控节点和各个分布式节点要进行数据库的同步工作,在复杂的网络环境中这种同步操作的代价非常大,同时需要在主控端和分布式节点分别进行激活配置的操作,也导致管理员的进行重复性的工作。其次,各个分布式节点采集到的数据都会实时上报到主控节点,这就给主控节点的服务器带来巨大的压力,也是导致该分布式监控系统性能的最大瓶颈之一。
基于以上分析,我设计了一种基于Nagios的分布式监控系统设计方法。
发明内容
本发明的目的在于克服现有的技术的不足,提供一种基于Nagios的以共享数据库为特征的分布式监控系统设计方法。
本发明的目的是按以下方式实现的,设计一种分布式监控系统,分为主控节点、分布式节点及共享数据库三部分,各分布式节点实现定时采集数据并将实时数据存入共享数据库,历史数据则以rrd文件的形式存在各个分布式节点中,主控节点负责添加及查看所监控的设备及监测器信息,共享数据库位于主控节点中,也就是说此共享数据库是主控节点的本地数据库,从而提高主控节点查看监控状态的效率。
本发明是通过以下技术方案实现的:设计步骤如下:
(1)提供若干装有Nagios的系统,随机选定其中一个为主控节点,其余为分布式节点,分布式节点需要安装rrdtool、PNP4Nagios插件;
(2)在主控节点中提供一个本地数据库,同时可被各个分布式节点共享的共享数据库;
(3)所有分布式节点添加监控设备组、设备、监测器以及复杂的配置信息时均在主控节点上添加,也即主控节点上存储的是系统中所有被监控的节点信息;
(4)主控节点的数据库表记录通过添加新的字段来记录该设备组、设备属于某个分布式节点;
(5)各分布式节点建立一个永久的数据库连接读取共享数据库中属于本分布式节点的信息,进而生成配置文件,进行监控;
(6)各个分布式节点Nagios插件采集到的数据直接存在共享数据库中,历史数据则存储在分布式节点本地;
(7)主控节点查看监控信息时直接查询本地数据库即可,查看历史曲线图数据时,可通过访问PNP4Nagios提供的URL查看;
本发明的有益效果是:本发明提供了一种基于Nagios的以共享数据库为特征的分布式监控方法和系统。应用在大型及超大型的数据中心,可以实现高可靠性低延时的全方位监控,有效减少了数据处理的代价。因此,本发明具有以下优点:
1、配置操作只需要在主控机端进行,各个分布式节点无需配置,大大简化了管理员的操作,降低了因配置不当造成监控信息错误的概率;
2、对于主控节点来说仅仅是数据的存取操作,没有类似nsca之类的守护进程,提高了查看监控状态的有效性与实时性,也没有nsca存在的单点故障隐患;
3、由于不存在数据同步的问题,相比传统的基于nsca的分布式设计,本系统支持的监控节点更多,同时,采用本系统也会大大减少用于监控的主机数量,达到节约成本的目地;
4、本系统消耗资源少,执行效率较高,可靠性强,可移植性较强。
附图说明
图1 是传统Nagios分布式监控系统结构示意图;
图2 是Nagios分布式监控系统结构图。
具体实施方式
参照说明书附图对本发明的方法作以下详细地说明。
一种基于Nagios的分布式监控系统设计方法,系统包括:主控节点、分布式节点及共享数据库三部分,各分布式节点实现定时采集数据并将实时数据存入远程数据库,历史数据则以rrd文件的形式存在本地数据库中,主控节点负责添加及查看所监控的设备及监测器信息,共享数据库位于主控节点中,即共享数据库是主控节点的本地数据库,从而提高主控节点查看监控状态的效率,
具体设计步骤为:
1)提供若干装有Nagios的系统,随机选定其中一个为主控节点,其余为分布式节点,分布式节点需要安装rrdtool、PNP4Nagios插件;
2)在主控节点中提供一个同时可被各个分布式节点共享的共享数据库;
3)所有分布式节点在添加监控设备、监测器以及配置信息时,均同时在主控节点上添加,即主控节点上存储的是系统中所有被监控的节点信息;
4)主控节点的数据库表记录,是通过添加新的字段来记录该设备属于某个分布式节点;
5)各分布式节点建立一个永久的数据库,连接读取共享数据库中属于本分布式节点的信息,进而生成配置文件,进行监控;
6)各个分布式节点Nagios插件采集到的数据直接存在共享数据库中,历史数据则存储在分布式节点本地;
7)主控节点查看监控信息时,直接查询本地数据库,查看历史曲线图数据时,通过访问PNP4Nagios提供的URL查看。
实施例
下面详细描述本发明内容的运行及实施过程,主要分为3个大的步骤:
S1:安装主控节点和各个分布式节点,提供若干装有Nagios的系统,随机选定其中一个为主控节点,其余为分布式节点,分布式节点需要安装rrdtool、PNP4Nagios插件;
S2:创建共享数据库在主控节点中提供一个本地数据库,此数据库是同时可被各个分布式节点共享的共享数据库;
S3:添加设备组、设备及监测器信息,所有分布式节点添加监控设备组、设备、监测器以及复杂的配置信息时均在主控节点上添加,也即主控节点上存储的是系统中所有被监控的节点信息;主控节点的数据库表记录通过添加新的字段来记录该设备组、设备属于某个分布式节点;
S4:各个分布式节点读取共享数据库,生成配置文件,各分布式节点建立一个永久的数据库连接读取共享数据库中属于本分布式节点的信息,进而生成配置文件,进行监控;各个分布式节点Nagios插件采集到的数据直接存在共享数据库中,历史数据则存储在分布式节点本地;
S5: 主控节点查看监控状态主控节点查看监控信息时直接查询本地数据库即可,查看历史曲线图数据时,可通过访问PNP4Nagios提供的URL查看。
除说明书所述的技术特征外,均为本专业技术人员的已知技术。

Claims (1)

1.一种基于Nagios的分布式监控系统的设计方法, 其特征在于系统包括:主控节点、分布式节点及共享数据库三部分,各分布式节点实现定时采集数据并将实时数据存入远程数据库,历史数据则以rrd文件的形式存在本地数据库中,主控节点负责添加及查看所监控的设备及监测器信息,共享数据库位于主控节点中,即共享数据库是主控节点的本地数据库,从而提高主控节点查看监控状态的效率,
具体设计步骤为:
(1)提供若干装有Nagios的系统,随机选定其中一个为主控节点,其余为分布式节点,分布式节点需要安装rrdtool、PNP4Nagios插件;
(2)在主控节点中提供一个同时可被各个分布式节点共享的共享数据库;
(3)所有分布式节点在添加监控设备、监测器以及配置信息时,均同时在主控节点上添加,即主控节点上存储的是系统中所有被监控的节点信息;
(4)主控节点的数据库表记录,是通过添加新的字段来记录该设备属于某个分布式节点;
(5)各分布式节点建立一个永久的数据库,连接读取共享数据库中属于本分布式节点的信息,进而生成配置文件,进行监控;
(6)各个分布式节点Nagios插件采集到的数据直接存在共享数据库中,历史数据则存储在分布式节点本地;
(7)主控节点查看监控信息时,直接查询本地数据库,查看历史曲线图数据时,通过访问PNP4Nagios提供的URL查看。
CN2013100349766A 2013-01-30 2013-01-30 一种基于Nagios的分布式监控系统的设计方法 Pending CN103117878A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2013100349766A CN103117878A (zh) 2013-01-30 2013-01-30 一种基于Nagios的分布式监控系统的设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2013100349766A CN103117878A (zh) 2013-01-30 2013-01-30 一种基于Nagios的分布式监控系统的设计方法

Publications (1)

Publication Number Publication Date
CN103117878A true CN103117878A (zh) 2013-05-22

Family

ID=48416157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2013100349766A Pending CN103117878A (zh) 2013-01-30 2013-01-30 一种基于Nagios的分布式监控系统的设计方法

Country Status (1)

Country Link
CN (1) CN103117878A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984617A (zh) * 2014-05-28 2014-08-13 浪潮电子信息产业股份有限公司 一种服务器主动推送监控数据的方法
CN104253706A (zh) * 2013-06-29 2014-12-31 北京新媒传信科技有限公司 一种数据库管理平台的监控方法和装置
CN105072167A (zh) * 2015-07-24 2015-11-18 江苏省公用信息有限公司 一种用于门户主机系统的监控方法
CN106375480A (zh) * 2016-11-01 2017-02-01 北京博望华科科技有限公司 一种基于分布式系统的电能数据实时采集系统及方法
CN107463484A (zh) * 2017-08-02 2017-12-12 郑州云海信息技术有限公司 一种采集监控记录的方法及系统
CN109726211A (zh) * 2018-12-27 2019-05-07 无锡华云数据技术服务有限公司 一种分布式时序数据库
CN110096546A (zh) * 2019-03-18 2019-08-06 视联动力信息技术股份有限公司 分布式级联数据处理方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188267A (zh) * 1996-11-29 1998-07-22 松下电工株式会社 建筑物自动监控系统
CN101252603A (zh) * 2008-04-11 2008-08-27 清华大学 基于存储区域网络san的集群分布式锁管理方法
CN202127408U (zh) * 2011-06-29 2012-01-25 上海地面通信息网络有限公司 一种基于Nagios的网络监控系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1188267A (zh) * 1996-11-29 1998-07-22 松下电工株式会社 建筑物自动监控系统
CN101252603A (zh) * 2008-04-11 2008-08-27 清华大学 基于存储区域网络san的集群分布式锁管理方法
CN202127408U (zh) * 2011-06-29 2012-01-25 上海地面通信息网络有限公司 一种基于Nagios的网络监控系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王飞: "基于分布式Nagios体系的应用监控平台设计与实现", 《中国优秀硕士学位论文全文数据库—信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104253706A (zh) * 2013-06-29 2014-12-31 北京新媒传信科技有限公司 一种数据库管理平台的监控方法和装置
CN104253706B (zh) * 2013-06-29 2017-10-10 北京新媒传信科技有限公司 一种数据库管理平台的监控方法和装置
CN103984617A (zh) * 2014-05-28 2014-08-13 浪潮电子信息产业股份有限公司 一种服务器主动推送监控数据的方法
CN105072167A (zh) * 2015-07-24 2015-11-18 江苏省公用信息有限公司 一种用于门户主机系统的监控方法
CN106375480A (zh) * 2016-11-01 2017-02-01 北京博望华科科技有限公司 一种基于分布式系统的电能数据实时采集系统及方法
CN107463484A (zh) * 2017-08-02 2017-12-12 郑州云海信息技术有限公司 一种采集监控记录的方法及系统
CN107463484B (zh) * 2017-08-02 2020-11-20 苏州浪潮智能科技有限公司 一种采集监控记录的方法及系统
CN109726211A (zh) * 2018-12-27 2019-05-07 无锡华云数据技术服务有限公司 一种分布式时序数据库
CN110096546A (zh) * 2019-03-18 2019-08-06 视联动力信息技术股份有限公司 分布式级联数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN103117878A (zh) 一种基于Nagios的分布式监控系统的设计方法
CN108156225B (zh) 基于容器云平台的微应用监控系统和方法
CN105138615A (zh) 一种构建大数据分布式日志的方法和系统
CN104111996A (zh) 基于hadoop平台的医保门诊大数据抽取系统及方法
CN104506373A (zh) 网络信息采集与处理的装置和方法
CN104361031B (zh) 一种政务大数据预处理系统及处理方法
CN104933114A (zh) 一种海量日志管理云平台
CN112163039A (zh) 基于企业级数据中台分析域的数据资源标准化管理系统
KR101357135B1 (ko) 로그 정보 수집 장치
CN106502875A (zh) 一种基于云计算的日志生成方法及系统
CN117194156A (zh) 一种多云平台的统一监控运维管理方法及系统
CN104915460A (zh) 一种日志存储方法及系统
CN105607606B (zh) 一种基于双主板架构的数据采集装置及方法
CN112559280A (zh) 基于数据中台的数据全链路监控方法
CN108389131A (zh) 一种金融系统微服务交易监控实现方法
CN115840656A (zh) 一种基于故障自愈的应用程序自动化运维方法和系统
CN105677853A (zh) 一种基于大数据技术框架的数据存储方法及装置
CN113886472A (zh) 一种数据接入系统、接入方法、计算机设备和存储介质
CN114218299A (zh) 接口响应情况的监控方法、装置、设备及存储介质
CN110515955B (zh) 数据的存储、查询方法、系统、电子设备和存储介质
CN113988678A (zh) 一种用于陆上风电基建管理的非现场全过程监管系统
Zheng et al. Design of real-time distributed data collection and analysis system
CN105205168A (zh) 一种基于Redis数据库的曝光系统及其操作方法
CN107330089A (zh) 跨网络结构化数据收集系统
CN203911987U (zh) 一种基于云计算的数据处理系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130522

WD01 Invention patent application deemed withdrawn after publication