CN110677293B - 一种基于机房运维管理平台的告警系统 - Google Patents

一种基于机房运维管理平台的告警系统 Download PDF

Info

Publication number
CN110677293B
CN110677293B CN201910924817.0A CN201910924817A CN110677293B CN 110677293 B CN110677293 B CN 110677293B CN 201910924817 A CN201910924817 A CN 201910924817A CN 110677293 B CN110677293 B CN 110677293B
Authority
CN
China
Prior art keywords
management platform
maintenance management
environment
maintenance
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910924817.0A
Other languages
English (en)
Other versions
CN110677293A (zh
Inventor
李福存
王苏扬
任国庆
陈传浩
张远兆
潘世祥
周涵
冯昌邮
李楠楠
汪联欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Jinheng Information Technology Co Ltd
Original Assignee
Jiangsu Jinheng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Jinheng Information Technology Co Ltd filed Critical Jiangsu Jinheng Information Technology Co Ltd
Priority to CN201910924817.0A priority Critical patent/CN110677293B/zh
Publication of CN110677293A publication Critical patent/CN110677293A/zh
Application granted granted Critical
Publication of CN110677293B publication Critical patent/CN110677293B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/18Status alarms
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Selective Calling Equipment (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本申请提供一种基于机房运维管理平台的告警系统,包括运维管理平台、被控设备以及环境监测器。其中,环境监测器可采集所属厂区范围内的环境监测数据,并向运维管理平台发送环境监测数据。被控设备可通过外接数据采集设备或者自带的性能状态采集模块将自身的状态信息及时的传输给运维管理平台。运维管理平台可以定期从被控设备接收环境或设备日志;如果未接收到环境日志,从被控设备终端相匹配的环境监测器接收环境监测数据;以及根据环境日志或环境监测数据生成告警信息。所述告警系统可以未接收到环境日志时,通过环境监测器获取环境监测数据,从而判断是否存在设备异常,以提高告警的时效性。

Description

一种基于机房运维管理平台的告警系统
技术领域
本申请涉及计算机运维管理技术领域,尤其涉及一种基于机房运维管理平台的告警系统。
背景技术
大规模企业,如钢铁企业,的生产中需要在不同的厂区范围内布置机房,机房中包括多个计算机主机,以对生产环境参数和生产技术参数进行实时监控、设定和处理,保障生产过程的有序进行。对于大规模企业,其机房运维状况需要统一进行维护管理,以及时发现各厂区突发的技术故障,统一进行调配管理。为了实现上述过程,实际应用中需要针对各厂区构建运维管理平台系统。
典型的运维管理平台系统包括管理平台和分布在各厂区机房内的被控设备。其中,管理平台可以是统一部署在中心机房的管理服务器,各个被控设备统一与管理平台建立通信连接,以将其运行状态数据发送至管理平台进行分析处理。当任意一个被控设备出现数据异常时,管理平台可以根据接收到的数据生成告警信息,通知相关技术人员进行处理。
可见,当前管理平台告警信息的生成,需要以各厂区范围内的被控设备所收集数据为基准,即被控设备收集的数据的准确度,直接影响到管理平台的判断准确度。而当被控设备出现故障宕机时,其无法将数据传送给管理平台,造成此时被控设备已经出现技术故障,但管理平台因未接收到数据,而不能判断其故障,即造成误判,使技术人员无法接收到相关告警信息,因此不能及时进行处理,造成告警时效性低。
发明内容
本申请提供了一种基于机房运维管理平台的告警系统,以解决传统管理平台告警时效性低的问题。
本申请提供一种基于机房运维管理平台的告警系统,包括:运维管理平台和多个被控设备;多个所述被控设备分别布置在多个厂区范围内,以收集所属厂区的运维数据;多个所述被控设备与运维管理平台建立通信连接,以将收集到的所述运维数据发送至所述运维管理平台。还包括设置在各厂区范围内的多个环境监测器;多个所述环境监测器与所述运维管理平台建立通信连接;
所述环境监测器被配置为采集所属厂区范围内的环境监测数据,所述环境监测数据包括温度信息、湿度信息以及网络状况信息中的至少一种信息;以及向所述运维管理平台和所述被控设备发送所述环境监测数据;
所述被控设备被配置为接收所述环境监测数据,以及根据所述环境监测数据建立环境日志,并将所述环境日志发送至所述运维管理平台;
所述运维管理平台被配置为定期从所述被控设备接收所述环境日志;如果未接收到所述环境日志,从所述被控设备相匹配的所述环境监测器接收所述环境监测数据;以及根据所述环境日志或所述环境监测数据生成告警信息。
可选的,所述告警系统还包括多个被控设备终端,多个所述被控设备终端被预先设置为多个运维权限;
所述运维管理平台被进一步配置为:获取所述告警信息对应的所述被控设备终端的管理权限,匹配所述运维权限高于所述管理权限的所述被控设备终端;以及向匹配的所述被控设备终端发送所述告警信息。
可选的,在向匹配的所述被控设备终端发送所述告警信息的步骤中,所述运维管理平台被进一步配置为:
遍历多个匹配到的所述被控设备终端的运维权限;以及,优先向运维权限低的所述被控设备终端发送所述告警信息。
可选的,所述被控设备终端被配置为:获取处理动作信息,以及根据所述处理动作信息生成反馈信号,并将所述反馈信号发送给所述运维管理平台;
所述运维管理平台被进一步配置为接收所述被控设备终端的反馈信号;以及,如果在预设处理时间内未接收到所述反馈信号,按照所述运维权限由低至高的顺序依次向其他所述被控设备终端发送所述告警信息。
可选的,所述被控设备终端安装有运维客户端应用程序;或者,所述被控设备终端被配置有运维应用进程,以收集所属厂区的运维数据。
可选的,新接入所述运维管理平台的所述被控设备终端被进一步配置为:向所述运维管理平台发送系统类型信息;
所述运维管理平台被进一步配置为:根据所述系统类型信息获取客户端应用程序安装包,以及将所述安装包发送给新接入的所述被控设备终端;或者,根据所述系统类型信息获取运维程序进程,以及将所述运维程序进程发送给新接入的所述被控设备终端。
可选的,所述运维管理平台被进一步配置为:按照各个厂区范围预设接收的数据类型;以及根据所述数据类型向所述被控设备发送数据接收指令;
所述被控设备被进一步配置为:获取所述运维管理平台发送的数据接收指令,根据所述数据接收指令筛选所述运维数据;以及,将筛选后的所述运维数据发送至所述运维管理平台。
可选的,如果所述运维管理平台未接收到环境日志,与所述被控设备相匹配的所述环境监测器被进一步配置为:向所属厂区范围内的其他被控设备发送所述环境监测数据;
所属厂区范围内的其他被控设备被配置为:根据所述环境监测数据生成环境日志,以及将所述环境日志发送给所述运维管理平台。
可选的,其特征在于,所述环境监测器被进一步配置为:
从所述运维管理平台获取所属厂区范围内的所有被控设备的负载信息;以及遍历所述负载信息,并将所述环境监测数据发送给负载最小的所述被控设备。
可选的,所述运维管理平台为基于zabbix开源技术搭建的云服务平台;所述环境监测器通过SNMP协议将所述环境监测数据发送至所述运维管理平台。
由以上技术方案可知,本申请提供一种基于机房运维管理平台的告警系统,包括运维管理平台、被控设备以及环境监测器。其中,环境监测器可采集所属厂区范围内的环境监测数据,并向运维管理平台和被控设备发送环境监测数据。被控设备可根据环境监测数据建立环境日志,并将环境日志发送至运维管理平台。运维管理平台可以定期从被控设备接收环境日志;如果未接收到环境日志,从被控设备相匹配的环境监测器接收环境监测数据;以及根据环境日志或环境监测数据生成告警信息。所述告警系统可以未接收到环境日志时,通过环境监测器获取环境监测数据,从而判断是否存在技术异常,以提高告警的时效性。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一种基于机房运维管理平台的告警系统结构示意图;
图2为本申请一种基于机房运维管理平台的告警系统运行流程示意图;
图3为本申请根据数据接收指令筛选运维数据的流程示意图;
图4为本申请根据环境监测数据生成环境日志的流程示意图:
图5为本申请被控设备终端的连接结构示意图。
具体实施方式
下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。
参见图1,为本申请一种基于机房运维管理平台的告警系统结构示意图。
参见图2,为本申请一种基于机房运维管理平台的告警系统运行流程示意图。
由图1、图2可知,本申请提供的一种基于机房运维管理平台的告警系统,包括:运维管理平台、多个被控设备和多个环境监测器。其中,多个所述被控设备分别布置在多个厂区范围内,以收集所属厂区的运维数据。实际应用中,可以根据实际生产项目,对整个工厂内的厂区范围进行划分,每个厂区范围内可以设置有多个被控设备和至少一个环境监测器。所述运维数据是指不同厂区内进行生产的工艺参数数据和机器运转情况数据。例如,对于出货对应的厂区范围,所述运维数据可以包括厂区范围内进出货物的类型信息、重量信息、出货地址信息等生产工艺参数;还可以包括当前厂区范围内各计算机的运行状态信息、CPU使用率、累积宕机次数等机器运转情况数据。
多个所述被控设备与运维管理平台建立通信连接,以将收集到的所述运维数据发送至所述运维管理平台。实际应用中,多个所述被控设备与运维管理平台可以采用信号线、数据线或者直接通过网络连接,从而可以针对运维数据对生产过程进行判断,以实现统一管理。还可以根据运维数据生成多种日志,以表现生产过程。例如,可以针对一个厂区范围内的所有被控设备的CPU使用率,生成一个使用率分析表,从而合理安排不同时段下的机器运行状态。
对于实际生产过程中,受限于不同类型的环境因素,被控设备的宕机原因可能存在差别。例如,对于铸造车间中使用的计算机设备,由于车间内的热源较多,容易由于温度过高而导致计算机宕机;对于淬火车间,由于车间内的水蒸气较多,容易由于湿度过高而导致计算机宕机;而对于距运维管理中心较远的现场称重车间或门禁设备,可能由于网络连接中断而造成被控设备收集的数据无法上传到运维管理中心。因此,对于应用环境较特殊的生产厂区范围,处理宕机的首要条件是了解宕机原因,从而及时排查技术问题,减少检测时间。
为了实现上述目的,本申请提供的一种基于机房运维管理平台的告警系统还包括设置在各厂区范围内的多个环境监测器;多个所述环境监测器与所述运维管理平台建立通信连接。其中,环境监测器内置多种环境检测传感器,例如温度计、湿度计、网络监控器等。通过内置的传感器可以直接获取到所属环境的具体情况,从而根据环境情况判断计算机宕机的原因。需要说明的是,环境监测器还内置有数据收发模块,从而将所检测的数据传递给被控设备或者运维管理平台。并且,环境监测器还可以内置有数据转换模块,以将传感器检测到的模拟信号转化为数字信号数据,并通过指定的协议将数据进行转化和发送。
因此,所述环境监测器被配置为采集所属厂区范围内的环境监测数据,所述环境监测数据包括温度信息、湿度信息以及网络状况信息中的至少一种信息;以及向所述运维管理平台和所述被控设备发送所述环境监测数据。实际应用中,可以通过温湿度采集器,将厂区范围内的机房等重要被监控场所的温湿度进行检测,并且可以数字的方式收集及展示在液晶显示屏上。而通过网络监控器,如路由器设备等,实时检测网络的连接状态,例如IP地址分配情况,网络通断情况等。还可以针对不同的厂区范围,自主选择对应的传感器类型。例如对于铸造车间,温度作为主要参数,因此可以选择温度传感器作为环境监测器。为了使数据采集结果可以具有完整的一致性,本申请优选在各个厂区范围内均布置有温度传感器、湿度传感器和网络监控器,而具体在生成告警信息时,可以由运维管理平台或者被控设备进行重点选取。
所述被控设备被配置为接收所述环境监测数据,以及根据所述环境监测数据建立环境日志,并将所述环境日志发送至所述运维管理平台。本申请提供的技术方案中,所述环境日志可以包括环境监测数据中的全部或部分内容,并且通过预先定义指定形式的格式,以便于运维管理平台可以根据环境日志提取有用的信息生成告警信息或产生分析报告等分析结果数据。
本申请提供的技术方案中,通过被控设备可以对环境监测数据进行预处理,从而分担运维管理平台的处理负荷,使运维管理平台的部分工作分摊给多个被控设备,在不影响被控设备工作情况的前提下,大大提升运维管理平台的处理能力,以适应大规模的厂区应用环境。
所述运维管理平台被配置为定期从所述被控设备接收所述环境日志;如果未接收到所述环境日志,从所述被控设备相匹配的所述环境监测器接收所述环境监测数据;以及根据所述环境日志或所述环境监测数据生成告警信息。实际应用中,如果被控设备未出现宕机现象或者当前网络状态连接正常,运维管理平台可以定期从被控设备中获取环境日志。
获取到环境日志后,运维管理平台可以针对环境日志,对环境数据进行判断,确定当前环境是否存在温度或湿度过高的情况,以及时通知相关技术人员排出存在的问题。并且,运维管理平台还可以图表的方式将环境数据展示出来,并设置合理的报警阈值,当温湿度超过该阈值,会触发运维管理平台带入脚本事先设定的参数,从而通知相关技术人员进行处理。
如果被控设备出现宕机现象,或者当前网络连接断开,运维管理平台将无法接收到当前时间段内的环境日志。因此,运维管理平台可以直接从环境监测器中获取环境监测数据,并且通过分析环境监测数据,判断被控设备出现宕机的原因。例如,在未接收到环境日志预定时间后,运维管理平台可以从环境监测器中获取环境监测数据,获得当前厂区范围内的环境参数。同时通过对环境监测数据进行分析,当温度超过预设阈值时,确定当前厂区范围内很有可能是因为环境温度过高而造成的被控设备宕机。并且将这一判断结果,也添加至告警信息中,以通知相关技术人员进行处理。
由以上技术方案可知,如图2所示,在本申请提供的技术方案中,所述告警系统可以按照以下步骤进行告警信息处理。
S1:环境监测器获取环境监测数据,以及将所述环境监测数据发送至被控设备;
S2:被控设备根据所述环境监测数据生成环境日志,以及将所述环境日志发送至运维管理平台;
S3:运维管理平台定期获取环境日志,以及根据所述环境日志生成告警信息;
S4:如果所述运维管理平台未获取到所述环境日志,从所述环境监测器中获取所述环境监测数据;
S5:所述运维管理平台根据所述环境监测数据生成告警信息。
为了进一步分摊运维管理平台的处理负荷,在本申请的部分实施例中,如图3所示,所述运维管理平台被进一步配置为:按照各个厂区范围预设接收的数据类型;以及根据所述数据类型向所述被控设备发送数据接收指令。所述被控设备被进一步配置为:获取所述运维管理平台发送的数据接收指令,根据所述数据接收指令筛选所述运维数据;以及,将筛选后的所述运维数据发送至所述运维管理平台。
实际应用中,可以按照各个厂区范围预设接收的数据类型,以便根据需要生成的处理结果,从运维数据中定向提取目标数据。例如,当前运维管理平台需要生成各被控设备的CPU使用情况报告,则可以在运维管理平台的运行脚本中,定义一个提取CPU使用率的规则,在实际运行中,运维平台可以按照生成的规则在被控设备的多个日志中只提取CPU使用率这一项,从而减少数据处理量和传输量。
另外,被控设备收集的运维数据可以保存在各被控设备的系统中,不必将全部运维数据都上传给运维管理平台,而哪些数据需要上传由运维管理平台中的预设接收的数据类型确定,从而大大减小运维数据上传时对网络带宽的占用情况,提高数据上传效率。
进一步地,如图4所示,如果所述运维管理平台未接收到环境日志,与所述被控设备相匹配的所述环境监测器被进一步配置为:向所属厂区范围内的其他被控设备发送所述环境监测数据;所属厂区范围内的其他被控设备被配置为:根据所述环境监测数据生成环境日志,以及将所述环境日志发送给所述运维管理平台。
实际应用中,为了能够适应更大规模的厂区运行环境,在运维管理平台未接收到环境日志时,还可以控制环境监测器将监测的环境监测数据发送给厂区范围内的其他被控设备中,并由其他被控设备进行处理生成环境日志上传到运维管理平台。这种方式可以进一步避免运维管理平台的处理器处理较多的环境监测的原始数据,充分利用多个被控设备的处理能力。
显然,通过其他被控设备生成的环境日志应带有当前厂区范围的唯一识别标识,以及未接收到的环境日志对应的被控设备的识别标识,以便确定出现宕机的计算机为哪一个被控设备。
为了减小对其他被控设备资源的占用,避免影响实际生产过程,所述环境监测器被进一步配置为:从所述运维管理平台获取所属厂区范围内的所有被控设备的负载信息;以及遍历所述负载信息,并将所述环境监测数据发送给负载最小的所述被控设备。实际应用中,通过负载最小的被控设备生成当前厂区范围内的环境日志,一方面可以减少对当前厂区范围内各被控设备处理能力的浪费,另一方面还可以提高环境日志的生成效率。
为了通知相关技术人员对厂区存在的技术问题进行处理,在本申请的部分实施例中,如图5所示,所述告警系统还包括多个被控设备终端,多个所述被控设备终端被预先设置为多个运维权限。显然,不同的被控设备终端对应不同的技术人员,而根据技术人员的技术分工不同,其所具有的管理权限也不同,因此,对于职称较高的技术人员,可以拥有较高的运维权限。
相应地,所述运维管理平台被进一步配置为:获取所述告警信息对应的所述被控设备终端的管理权限,匹配所述运维权限高于所述管理权限的所述被控设备终端;以及向匹配的所述被控设备终端发送所述告警信息。实际应用中,向各被控设备终端发送告警信息时,可以仅向厂区范围内具有相应权限的人推送告警信息。
需要说明的是,告警信息旨在通知相关技术人员进行对应处理,排除相应的技术问题。因此告警信息可以多种方式发送至被控设备终端,例如,在脚本内事先定义好报警接收人邮箱、微信号、手机号码、通知消息内容等参数,再通过短信接口、微信、邮件、钉钉等多种方式,将告警信息发送给具有权限的技术人员,以通知相关技术人员进行处理。
进一步地,在向匹配的所述被控设备终端发送所述告警信息的步骤中,所述运维管理平台被进一步配置为:遍历多个匹配到的所述被控设备终端的运维权限;以及,优先向运维权限低的所述被控设备终端发送所述告警信息。由于具有较高运维权限的技术人员数量较少,因此可以优先推送权限相对较低的技术人员,以及时处理。
另外,所述被控设备终端被配置为:获取处理动作信息,以及根据所述处理动作信息生成反馈信号,并将所述反馈信号发送给所述运维管理平台;实际应用中,处理动作可以是技术人员针对告警信息在指定页面上的一系列操作,例如,点击、触摸滑动,指纹验证等。所述运维管理平台被进一步配置为接收所述被控设备终端的反馈信号;以及,如果在预设处理时间内未接收到所述反馈信号,按照所述运维权限由低至高的顺序依次向其他所述被控设备终端发送所述告警信息。
本申请的部分实施例中,所述被控设备终端安装有运维客户端应用程序;或者,所述被控设备终端被配置有运维应用进程,以收集所属厂区的运维数据。被控设备终端可以安装运维客户端应用程序或者运行运维应用进程实现上述功能的配置,通过软件的方式完成系统部署,提高系统的应用普及效率。
进一步地,当系统中有新接入的被控设备终端时,新接入所述运维管理平台的所述被控设备终端被进一步配置为:向所述运维管理平台发送系统类型信息;所述运维管理平台被进一步配置为:根据所述系统类型信息获取客户端应用程序安装包,以及将所述安装包发送给新接入的所述被控设备终端;或者,根据所述系统类型信息获取运维程序进程,以及将所述运维程序进程发送给新接入的所述被控设备终端。
在本申请的部分实施例中,所述运维管理平台为基于zabbix开源技术搭建的云服务平台;所述环境监测器通过SNMP协议将所述环境监测数据发送至所述运维管理平台。所述运维管理平台,可以基于zabbix开源方式构建监控平台,并结合结合厂区的实际需求,自定义需要被监控的内容,例如:服务器、交换机、防火墙、AIX(小型机)性能(cpu、内存、磁盘空间)、机房温湿度、应用服务(数据库、中间件)等。使得运维管理平台能够具有方便运维管理,节约成本,可移植性强等特点。
同时,厂区范围内的环境监测器将收集的现场环境监测数据通过SNMP(简单网络管理协议)的方式,将数据传送到运维管理平台。相应地,运维管理平台上配置被控设备的接口IP地址及端口、SNMP OID、SNMP community等参数,以便对需要被采集的数据进行筛选与处理。
由以上技术方案可知,本申请提供一种基于机房运维管理平台的告警系统,包括运维管理平台、被控设备以及环境监测器。其中,环境监测器可采集所属厂区范围内的环境监测数据,并向运维管理平台和被控设备发送环境监测数据。被控设备可根据环境监测数据建立环境日志,并将环境日志发送至运维管理平台。运维管理平台可以定期从被控设备接收环境日志;如果未接收到环境日志,从被控设备相匹配的环境监测器接收环境监测数据;以及根据环境日志或环境监测数据生成告警信息。所述告警系统可以未接收到环境日志时,通过环境监测器获取环境监测数据,从而判断是否存在技术异常,以提高告警的时效性。
本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。

Claims (10)

1.一种基于机房运维管理平台的告警系统,包括:运维管理平台和多个被控设备;多个所述被控设备分别布置在多个厂区范围内,以收集所属厂区的运维数据;多个所述被控设备与运维管理平台建立通信连接,以将收集到的所述运维数据发送至所述运维管理平台,其特征在于,还包括设置在各厂区范围内的多个环境监测器;多个所述环境监测器与所述运维管理平台建立通信连接;
所述环境监测器被配置为采集所属厂区范围内的环境监测数据,所述环境监测数据包括温度信息、湿度信息以及网络状况信息中的至少一种信息;以及向所述运维管理平台发送所述环境监测数据;
所述被控设备被配置为接收所述环境监测数据,以及根据所述环境监测数据建立环境日志,并将所述环境日志发送至所述运维管理平台;
所述运维管理平台被配置为定期从所述被控设备接收所述环境日志;如果未接收到所述环境日志,从所述被控设备相匹配的所述环境监测器接收所述环境监测数据;以及根据所述环境日志或所述环境监测数据生成告警信息。
2.根据权利要求1所述的基于机房运维管理平台的告警系统,其特征在于,所述告警系统还包括多个被控设备终端,多个所述被控设备终端被预先设置为多个运维权限;
所述运维管理平台被进一步配置为:获取所述告警信息对应的所述被控设备的管理权限,匹配所述运维权限高于所述管理权限的所述被控设备终端;以及向匹配的所述被控设备终端发送所述告警信息。
3.根据权利要求2所述的基于机房运维管理平台的告警系统,其特征在于,在向匹配的所述被控设备终端发送所述告警信息的步骤中,所述运维管理平台被进一步配置为:
遍历多个匹配到的所述被控设备终端的运维权限;以及,优先向运维权限低的所述被控设备终端发送所述告警信息。
4.根据权利要求3所述的基于机房运维管理平台的告警系统,其特征在于,所述被控设备终端被配置为:获取处理动作信息,以及根据所述处理动作信息生成反馈信号,并将所述反馈信号发送给所述运维管理平台;
所述运维管理平台被进一步配置为接收所述被控设备终端的反馈信号;以及,如果在预设处理时间内未接收到所述反馈信号,按照所述运维权限由低至高的顺序依次向其他所述被控设备终端发送所述告警信息。
5.根据权利要求4所述的基于机房运维管理平台的告警系统,其特征在于,所述被控设备终端安装有运维客户端应用程序;或者,所述被控设备终端被配置有运维应用进程,以收集所属厂区的运维数据。
6.根据权利要求5所述的基于机房运维管理平台的告警系统,其特征在于,新接入所述运维管理平台的所述被控设备终端被进一步配置为:向所述运维管理平台发送系统类型信息;
所述运维管理平台被进一步配置为:根据所述系统类型信息获取客户端应用程序安装包,以及将所述安装包发送给新接入的所述被控设备终端;或者,根据所述系统类型信息获取运维程序进程,以及将所述运维程序进程发送给新接入的所述被控设备终端。
7.根据权利要求1所述的基于机房运维管理平台的告警系统,其特征在于,所述运维管理平台被进一步配置为:按照各个厂区范围预设接收的数据类型;以及根据所述数据类型向所述被控设备发送数据接收指令;
所述被控设备被进一步配置为:获取所述运维管理平台发送的数据接收指令,根据所述数据接收指令筛选所述运维数据;以及,将筛选后的所述运维数据发送至所述运维管理平台。
8.根据权利要求7所述的基于机房运维管理平台的告警系统,其特征在于,如果所述运维管理平台未接收到环境日志,与所述被控设备相匹配的所述环境监测器被进一步配置为:向所属厂区范围内的其他被控设备发送所述环境监测数据;
所属厂区范围内的其他被控设备被配置为:根据所述环境监测数据生成环境日志,以及将所述环境日志发送给所述运维管理平台。
9.根据权利要求8所述的基于机房运维管理平台的告警系统,其特征在于,所述环境监测器被进一步配置为:
从所述运维管理平台获取所属厂区范围内的所有被控设备的负载信息;以及遍历所述负载信息,并将所述环境监测数据发送给负载最小的所述被控设备。
10.根据权利要求1所述的基于机房运维管理平台的告警系统,其特征在于,所述运维管理平台为基于zabbix开源技术搭建的云服务平台;所述环境监测器通过SNMP协议将所述环境监测数据发送至所述运维管理平台。
CN201910924817.0A 2019-09-27 2019-09-27 一种基于机房运维管理平台的告警系统 Active CN110677293B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910924817.0A CN110677293B (zh) 2019-09-27 2019-09-27 一种基于机房运维管理平台的告警系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910924817.0A CN110677293B (zh) 2019-09-27 2019-09-27 一种基于机房运维管理平台的告警系统

Publications (2)

Publication Number Publication Date
CN110677293A CN110677293A (zh) 2020-01-10
CN110677293B true CN110677293B (zh) 2022-08-16

Family

ID=69079525

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910924817.0A Active CN110677293B (zh) 2019-09-27 2019-09-27 一种基于机房运维管理平台的告警系统

Country Status (1)

Country Link
CN (1) CN110677293B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111882832B (zh) * 2020-08-12 2022-09-27 湖南紫薇垣信息系统有限公司 一种机房环境监测预警系统
CN114596696A (zh) * 2022-03-21 2022-06-07 广东电网有限责任公司 一种异常预警通知方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6295558B1 (en) * 1998-08-21 2001-09-25 Hewlett-Packard Company Automatic status polling failover or devices in a distributed network management hierarchy
CN105610629A (zh) * 2016-01-29 2016-05-25 张波 一种信息通信系统运行维护管理方法
CN206807469U (zh) * 2017-06-20 2017-12-26 胡新炜 一种网络机房集成监控及故障远程处理系统
CN108737577A (zh) * 2018-08-20 2018-11-02 山东润智能科技有限公司 医院设备安全立体监测云平台、系统及其方法
CN109062756A (zh) * 2018-07-09 2018-12-21 何思阳 一种数据中心集中预警监测的方法和系统
CN208537636U (zh) * 2018-04-28 2019-02-22 中国神华能源股份有限公司 电气设备事故原因分析装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011197785A (ja) * 2010-03-17 2011-10-06 Nomura Research Institute Ltd ログ収集システムおよびログ収集プログラム
CN102571865B (zh) * 2010-12-30 2015-09-23 北京时代凌宇科技有限公司 一种监控方法和系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6295558B1 (en) * 1998-08-21 2001-09-25 Hewlett-Packard Company Automatic status polling failover or devices in a distributed network management hierarchy
CN105610629A (zh) * 2016-01-29 2016-05-25 张波 一种信息通信系统运行维护管理方法
CN206807469U (zh) * 2017-06-20 2017-12-26 胡新炜 一种网络机房集成监控及故障远程处理系统
CN208537636U (zh) * 2018-04-28 2019-02-22 中国神华能源股份有限公司 电气设备事故原因分析装置
CN109062756A (zh) * 2018-07-09 2018-12-21 何思阳 一种数据中心集中预警监测的方法和系统
CN108737577A (zh) * 2018-08-20 2018-11-02 山东润智能科技有限公司 医院设备安全立体监测云平台、系统及其方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《小谈现代机房动力、环境监控技术》;黄综联;《科技资讯》;20101123(第33期);62-63 *

Also Published As

Publication number Publication date
CN110677293A (zh) 2020-01-10

Similar Documents

Publication Publication Date Title
CN100536403C (zh) 一种通信网络智能巡检的方法及设备
CN102694871A (zh) 基于手机短信的服务器远程监控及故障处理的装置和方法
CN109857020A (zh) 远程运维管理系统
CN107947998B (zh) 一种基于应用系统的实时监测系统
CN201821366U (zh) 一种机房环境温湿度实时监控系统
CN102722165A (zh) 可靠性试验远程监控系统
CN101651556A (zh) 服务器监控系统及监控方法
CN110677293B (zh) 一种基于机房运维管理平台的告警系统
JP2011034181A (ja) 遠隔監視又は遠隔操作のための異種通信サーバーシステム
CN111488258A (zh) 一种用于软硬件运行状态分析与预警的系统
CN104637265A (zh) 调度自动化多级一体化智能值班报警系统
CN103580914A (zh) 基于远程数字安防系统故障监控平台运行的方法和装置
US20240056463A1 (en) Method and system to detect abnormal message transactions on a network
CN109905262A (zh) 一种cdn设备服务的监控系统及监控方法
CN111123096A (zh) 一种物联网电机监测平台
CN116166499A (zh) 数据监测方法、装置、电子设备及非易失性存储介质
CN117010665A (zh) 智慧运维idc机房管理系统
EP2882216B1 (en) Device and method for controlling, supervising and giving an alarming from a power supply of base station
CN108408362A (zh) 一种用于输送带的智能传输监控系统及监控方法
CN108988961B (zh) 一种无线电监测运行管理系统
KR100908131B1 (ko) 로그 필터링을 통한 장애 감지 장치 및 그 방법과 그장치를 이용한 장애 감지 시스템
CN202661863U (zh) 一种可靠性试验远程监控系统
CN204389937U (zh) 交通设备全过程运营监控装置
EP1622310B1 (en) Administration method and system for network management systems
KR20030015925A (ko) 무선 인터넷을 이용한 원격지 관리대상장치의 상태감시/제어 시스템 및 방법

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220421

Address after: 5 / F, building A5, No. 9, Kechuang Avenue, Zhongshan Science Park, Liuhe District, Nanjing City, Jiangsu Province

Applicant after: JIANGSU JINHENG INFORMATION TECHNOLOGY Co.,Ltd.

Address before: Room 201, unit 1, building 527, Fukang Park, 399 Xiongzhou South Road, Longchi street, Liuhe District, Nanjing City, Jiangsu Province, 211500

Applicant before: Nanjing Tianxin Cloud Data Service Co.,Ltd.

GR01 Patent grant
GR01 Patent grant