CN106506248B - 一种服务器智能监控系统 - Google Patents
一种服务器智能监控系统 Download PDFInfo
- Publication number
- CN106506248B CN106506248B CN201710025466.0A CN201710025466A CN106506248B CN 106506248 B CN106506248 B CN 106506248B CN 201710025466 A CN201710025466 A CN 201710025466A CN 106506248 B CN106506248 B CN 106506248B
- Authority
- CN
- China
- Prior art keywords
- module
- reset
- data
- alarm
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
- H04L67/025—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP] for remote control or remote monitoring of applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3006—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4403—Processor initialisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/4401—Bootstrapping
- G06F9/4416—Network booting; Remote initial program loading [RIPL]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Debugging And Monitoring (AREA)
- Alarm Systems (AREA)
Abstract
本发明提供一种服务器智能监控系统,监控中心包括:远程通信模块,中央处理单元,数据库,复位集成模块;系统中复位状态选择模块设置各个模块的复位状态,当模块的复位状态参数设置为低电平时为可复位状态,状态参数设置为高电平的复位状态模块为不可复位状态。用户需要对系统模块进行复位时,将需要复位的模块设置为低电平状态,然后通过复位控制模块对模块进行复位。如果有些模块不适合复位,用户可以将复位状态参数设置为高电平,则无法对该模块进行复位。这样的复位方式是有针对性的复位,这样避免了所有模块都同时进行复位容易导致系统宕机,保证了监控系统稳定运行。
Description
技术领域
本发明涉及服务器监控领域,尤其涉及一种服务器智能监控系统。
背景技术
众所周知,监控管理功能在整个服务器系统中占据重要地位,其提供的主要功能为:通过Web界面实现远程控制、监控并调节系统散热风扇的转速、查看处理器及内存等硬件信息、提供配置管理及故障排除等功能;这些信息将辅助用户更直观、方便的使用服务器设备。因此监控管理系统的正常工作对服务器十分重要。
初期的开发设计中,直接将复位按键连接到系统中各个模块,当监控系统需要复位时,通过复位按键对系统中各个模块进行复位,但是由于系统中模块众多,所有模块都同时进行复位容易导致系统宕机,影响监控系统稳定运行。
发明内容
为了克服上述现有技术中的不足,本发明的目的在于,提供一种服务器智能监控系统,包括:监控中心以及部署在各个数据信息处理服务站,用于采集数据信息处理服务站数据信息的服务器;
监控中心包括:远程通信模块,中央处理单元,数据库,复位集成模块;
中央处理单元包括:数据解析模块,数据分类报警模块,日志记录模块,数据封装模块,GPIO模块,I2C模块,SDRAM模块,ARM处理器;
复位集成模块包括:分别与数据解析模块连接的数据解析复位状态模块和数据解析复位标示模块,分别与数据分类报警模块连接的分类报警复位状态模块和分类报警复位标示模块,分别与日志记录模块连接的日志记录复位状态模块和日志记录复位标示模块,分别与数据封装模块连接的封装复位状态模块和封装复位标示模块,分别与GPIO模块连接的GPIO复位状态模块和GPIO复位标示模块,分别与I2C模块连接的I2C复位状态模块和I2C复位标示模块,分别与SDRAM模块连接的SDRAM复位状态模块和SDRAM复位标示模块,分别与ARM处理器连接的ARM复位状态模块和ARM复位标示模块,复位控制模块,复位状态选择模块,复位标示获取模块;
复位状态选择模块用于根据用户输入的设置指令,分别设置数据解析复位状态模块,分类报警复位状态模块,日志记录复位状态模块,封装复位状态模块,GPIO复位状态模块,I2C复位状态模块,SDRAM复位状态模块,ARM复位状态模块的状态参数;状态参数设置为低电平的复位状态模块为可复位状态,状态参数设置为高电平的复位状态模块为不可复位状态;
复位标示获取模块分别与数据解析复位标示模块,分类报警复位标示模块,日志记录复位标示模块,封装复位标示模块,GPIO复位标示模块,I2C复位标示模块,SDRAM复位标示模块,ARM复位标示模块连接,复位标示获取模块用于获取每个模块的复位完成信息;
复位控制模块分别与数据解析模块,数据分类报警模块,日志记录模块,数据封装模块,GPIO模块,I2C模块,SDRAM模块,ARM处理器连接,复位控制模块用于接收用户输入的复位指令,当用户输入的复位指令,且数据解析模块,数据分类报警模块,日志记录模块,数据封装模块,GPIO模块,I2C模块,SDRAM模块,ARM处理器其中的模块状态参数设置为低电平时,该模块执行复位;
服务器包括:远程访问模块,数据管理控制模块,远程控制模块,数据采集模块;
远程通信模块分别与每个远程访问模块建立通信连接;
数据采集模块用于采集工作站的数据信息;
远程访问模块用于通过通信信道接收来自监控中心的控制命令,同时也将采集到的数据发送给监控中心;
数据管理控制模块用于将采集到的数据信息进行储存,并通过远程访问模块将数据信息发送给监控中心以及将远程访问模块接收的来自监控中心的控制命令转化为本地命令,通过操作系统接口实现对本地操作系统的控制;
远程通信模块用于接收和发送来自各个服务器的数据信息;
数据解析模块用于解析接收的来自各个服务器的数据信息,并将解析后的数据分别发送给中央处理单元、数据分类报警模块和日志记录模块;
日志记录模块用于将解析后的数据信息和报警信息以日志的形式存放到数据库当中,以便在需要时查阅相应的历史记录;
数据分类报警模块用于接收解析后的数据信息,并将解析后的数据信息通过相应的报警参数进行分类,对超过报警阈值的消息形成相应的报警信息,发送给进行报警提示,同时也将报警信息发送给日志记录模块形成相应的报警日志;
中央处理单元用于将各个服务器采集到的数据信息,以及监控中心的报警信息呈现给用户,同时接收用户对监控中心的控制指令;还提供了统一的CUI接口,供用户对历史日志、报警信息的查询和浏览以及对报警参数的设置;
数据封装模块用于接收来自中央处理单元的控制指令,并将控制指令封装为控制指令请求信息,通过远程通信模块实现对服务器的控制。
优选地,复位控制模块包括:复位信号处理器、电阻R、复位输入模块、数据解析与门模块,分类报警与门模块,日志记录与门模块,封装与门模块,GPIO与门模块,I2C与门模块,SDRAM与门模块,ARM与门模块;
复位信号处理器的一号管脚通过电阻R接电源,复位信号处理器的二号管脚接电源,复位信号处理器的一号管脚通过复位输入模块接三号管脚,且三号管脚和四号管脚接地;复位信号处理器五号管脚接地,复位信号处理器八号管脚通过二极管VD与一号管脚连接,复位信号处理器七号管脚分别与数据解析与门模块第一输入端,分类报警与门模块第一输入端,日志记录与门模块第一输入端,封装与门模块第一输入端,GPIO与门模块第一输入端,I2C与门模块第一输入端,SDRAM与门模块第一输入端,ARM与门模块第一输入端连接;
数据解析与门模块第二输入端与数据解析复位状态模块连接,分类报警与门模块第二输入端与分类报警复位状态模块连接,日志记录与门模块第二输入端与日志记录复位状态模块连接,封装与门模块第二输入端与封装复位状态模块连接,GPIO与门模块第二输入端与GPIO复位状态模块连接,I2C与门模块第二输入端与I2C复位状态模块连接,SDRAM与门模块第二输入端与SDRAM复位状态模块连接,ARM与门模块第二输入端与ARM复位状态模块连接;
数据解析与门模块输出端与数据解析模块连接,当数据解析复位状态模块为低电平且接收到复位信号时,数据解析模块进行复位;
分类报警与门模块输出端与数据分类报警模块连接,当数据解析复位状态模块为低电平且接收到复位信号时,数据分类报警模块进行复位;
日志记录与门模块输出端与日志记录模块连接,当日志记录复位状态模块为低电平且接收到复位信号时,日志记录模块进行复位;
封装与门模块输出端与数据封装模块连接,当封装复位状态模块为低电平且接收到复位信号时,数据封装模块进行复位;
GPIO与门模块输出端与GPIO模块连接,当GPIO复位状态模块为低电平且接收到复位信号时,GPIO模块进行复位;
I2C与门模块输出端与I2C模块连接,当I2C复位状态模块为低电平且接收到复位信号时,I2C模块进行复位;
SDRAM与门模块输出端与SDRAM模块连接,当SDRAM复位状态模块为低电平且接收到复位信号时,SDRAM模块进行复位;
ARM与门模块输出端与ARM处理器连接,当ARM复位状态模块为低电平且接收到复位信号时,ARM处理器进行复位;
复位输入模块用于接收用户发送的复位信号,在发出复位脉冲后使复位信号处理器的八号管脚变成高电平并持续预设时间,使复位信号处理器输出复位信号。
优选地,数据采集模块采集的数据信息包括:CPU的占用情况、系统各个组件的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况。
温度信息包括CPU温度,主板温度,背板温度、热插拔模组温度;
电压信息包括CPU电压,主板电压,SCSI背板电压,热插拔模组电压;
风扇信息包括CPU风扇,主板风扇,背板风扇,热插拔模组风扇。
优选地,监控中心还包括:应急处置模块,数据库处理模块;
应急处置模块用于当系统发生死机或者某一服务器或多个服务器死机时,应急处置模块自动对整个系统或死机的服务器执行关机、重启、加电启动操作;
数据库处理模块用于给用户提供对数据库内部数据进行增加、删除、查询、修改的操作界面。
优选地,日志记录模块还用于将系统中发生的传感器记录的信息、报警信息、关机、重启事件信息做一个长期的日志记录,使系统维护人员根据日志分析诊断故障;将日志保存在集中监控系统的非易失性存储器中,在监控中心宕机或电源被切断的情况下,仍然能够为系统维护人员提供一个分析故障的途径;
数据分类报警模块还用于设置报警上限、安全上限、安全下限和报警下限;当接收到的系统某一组件或多个组件的温度数据超出阈值或散热风扇停止工作时,通过声光报警的形式报告给系统管理人员;
监控中心还包括:报警信息通知模块;
报警信息通知模块用于通过短信通知、客户端浏览器界面、电子邮件方式发出通知,客户端浏览器界面通知方式:客户端浏览器平台搜索事件列表,如果有报警事件信息,将报警信息显示在客户端浏览器平台页面的状态栏上,提示用户有报警信息产生;短信通知方式,当有报警信息产生时,报警信息通知模块自动通过硬件设备以发送短信的形式将报警信息发出;电子邮件通知方式是当有报警信息产生时,报警信息通知模块自动将报警信息发送到指定用户的电子邮箱中。
优选地,服务器还包括:数据传输处理模块;
数据传输处理模块用于将向监控中心发送的数据信息进行封装,数据信息包括:MAC地址层,服务器IP层,数据帧段;
数据帧段中当该帧段的最低位为0时表示请求/回复响应的组件的地址码,当最低位为1时表示请求/回复响应的软件ID;数据帧段的高7位表示具体的地址码和软件ID;
在数据帧段中设有奇偶信息编码,当奇偶信息编码为偶数时表示此消息是一条请求,当奇偶信息编码为奇数时表示此消息是一条响应;当消息是一条基本的控制请求或状态响应时数据帧段为00h和01h;
在数据帧段中还设有请求者自行生成的一序列号,当服务器需要发出多条请求时用以标识不同的请求;序列号是响应/接收该消息的组件的子组件号或子地址号。
优选地,监控中心还用于接收每个服务器发送的数据信息,采用MySQL存储平台进行对接收的数据信息数据存储,生成每个服务器各项数据的趋势分析报告,进行保存;监控中心通过广播的形式设置每个服务器运行时间,统一设置每个服务器数据采集发送处理时间;使监控中心与每个服务器之间通过光缆或WIFI或者CAN的形式通信连接;监控中心从数据角度将每个服务器的数据信息通过线路、表格、图形的展现形式进行有机整合,可视化展示,帮助用户了解每个被监控工作站状况;监控中心将获取的数据信息与预设阈值以及往期数据进行对比,当前数据超出预设阈值或者与往期数据比较产生不良的效果时,进行报警提示;将报警信息形成报警统计,并存储;监控中心接收来自客户端的请求,并将处理后的数据通过HTTP协议返回给用户。
从以上技术方案可以看出,本发明具有以下优点:
系统中复位状态选择模块设置各个模块的复位状态,当模块的复位状态参数设置为低电平时为可复位状态,状态参数设置为高电平的复位状态模块为不可复位状态。用户需要对系统模块进行复位时,将需要复位的模块设置为低电平状态,然后通过复位控制模块对模块进行复位。如果有些模块不适合复位,用户可以将复位状态参数设置为高电平,则无法对该模块进行复位。这样的复位方式是有针对性的复位,这样避免了所有模块都同时进行复位容易导致系统宕机,保证了监控系统稳定运行。
附图说明
为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为服务器智能监控系统的整体示意图;
图2为服务器智能监控系统实施例的示意图;
图3为复位控制模块电路图;
图4为数据解析模块的复位示意图;
图5为数据分类报警模块复位示意图;
图6为日志记录模块复位示意图;
图7为数据封装模块复位示意图;
图8为GPIO模块复位示意图;
图9为I2C模块复位示意图;
图10为SDRAM模块复位示意图;
图11为ARM处理器复位示意图。
具体实施方式
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将运用具体的实施例及附图,对本发明保护的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本专利中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利保护的范围。
本实施例提供一种服务器智能监控系统,如图1和图2所示,包括:监控中心1以及部署在各个数据信息处理服务站,用于采集数据信息处理服务站数据信息的服务器2;
监控中心1包括:远程通信模块11,中央处理单元12,数据库13,复位集成模块14;
中央处理单元12包括:数据解析模块23,数据分类报警模块33,日志记录模块43,数据封装模块53,GPIO模块63,I2C模块73,SDRAM模块83,ARM处理器93;
服务器2包括:远程访问模块15,数据管理控制模块16,远程控制模块17,数据采集模块18;
复位集成模块包括:分别与数据解析模块23连接的数据解析复位状态模块21和数据解析复位标示模块,分别与数据分类报警模块33连接的分类报警复位状态模块31和分类报警复位标示模块,分别与日志记录模块43连接的日志记录复位状态模块41和日志记录复位标示模块,分别与数据封装模块53连接的封装复位状态模块51和封装复位标示模块,分别与GPIO模块63连接的GPIO复位状态模块61和GPIO复位标示模块,分别与I2C模块73连接的I2C复位状态模块71和I2C复位标示模块,分别与SDRAM模块83连接的SDRAM复位状态模块81和SDRAM复位标示模块,分别与ARM处理器93连接的ARM复位状态模块91和ARM复位标示模块,复位控制模块,复位状态选择模块,复位标示获取模块;
复位状态选择模块用于根据用户输入的设置指令,分别设置数据解析复位状态模块,分类报警复位状态模块,日志记录复位状态模块,封装复位状态模块,GPIO复位状态模块,I2C复位状态模块,SDRAM复位状态模块,ARM复位状态模块的状态参数;状态参数设置为低电平的复位状态模块为可复位状态,状态参数设置为高电平的复位状态模块为不可复位状态;
复位标示获取模块分别与数据解析复位标示模块,分类报警复位标示模块,日志记录复位标示模块,封装复位标示模块,GPIO复位标示模块,I2C复位标示模块,SDRAM复位标示模块,ARM复位标示模块连接,复位标示获取模块用于获取每个模块的复位完成信息;
复位控制模块分别与数据解析模块,数据分类报警模块,日志记录模块,数据封装模块,GPIO模块,I2C模块,SDRAM模块,ARM处理器连接,复位控制模块用于接收用户输入的复位指令,当用户输入的复位指令,且数据解析模块,数据分类报警模块,日志记录模块,数据封装模块,GPIO模块,I2C模块,SDRAM模块,ARM处理器其中的模块状态参数设置为低电平时,该模块执行复位;
远程通信模块11分别与每个远程访问模块15建立通信连接;数据采集模块18用于采集工作站的数据信息;远程访问模块15用于通过通信信道接收来自监控中心1的控制命令,同时也将采集到的数据发送给监控中心1;数据管理控制模块16用于将采集到的数据信息进行储存,并通过远程访问模块将数据信息发送给监控中心1以及将远程访问模块接收的来自监控中心1的控制命令转化为本地命令,通过操作系统接口实现对本地操作系统的控制;远程通信模块11用于接收和发送来自各个服务器的数据信息;
数据解析模块用于解析接收的来自各个服务器的数据信息,并将解析后的数据分别发送给中央处理单元、数据分类报警模块和日志记录模块;
日志记录模块用于将解析后的数据信息和报警信息以日志的形式存放到数据库当中,以便在需要时查阅相应的历史记录;数据分类报警模块33用于接收解析后的数据信息,并将解析后的数据信息通过相应的报警参数进行分类,对超过报警阈值的消息形成相应的报警信息,发送给中央处理单元进行报警提示,同时也将报警信息发送给日志记录模块形成相应的报警日志;中央处理单元12用于将各个服务器采集到的数据信息,以及监控中心的报警信息呈现给用户,同时接收用户对监控中心的控制指令;还提供了统一的CUI接口,供用户对历史日志、报警信息的查询和浏览以及对报警参数的设置;数据封装模块用于接收来自监控模块的控制指令,并将控制指令封装为控制指令请求信息,通过远程通信模块实现对服务器的控制。
本实施例中,如图3所示,复位控制模块包括:复位信号处理器3、电阻R、复位输入模块4、数据解析与门模块22,分类报警与门模块32,日志记录与门模块42,封装与门模块52,GPIO与门模块62,I2C与门模块72,SDRAM与门模块82,ARM与门模块92;
复位信号处理器3的一号管脚通过电阻R接电源,复位信号处理器3的二号管脚接电源,复位信号处理器3的一号管脚通过复位输入模块接三号管脚,且三号管脚和四号管脚接地;复位信号处理器3五号管脚接地,复位信号处理器3八号管脚通过二极管VD与一号管脚连接,复位信号处理器七号管脚分别与数据解析与门模块第一输入端,分类报警与门模块第一输入端,日志记录与门模块第一输入端,封装与门模块第一输入端,GPIO与门模块第一输入端,I2C与门模块第一输入端,SDRAM与门模块第一输入端,ARM与门模块第一输入端连接;电阻R有效的避免了信号失真和抖动。
数据解析与门模块第二输入端与数据解析复位状态模块连接,分类报警与门模块第二输入端与分类报警复位状态模块连接,日志记录与门模块第二输入端与日志记录复位状态模块连接,封装与门模块第二输入端与封装复位状态模块连接,GPIO与门模块第二输入端与GPIO复位状态模块连接,I2C与门模块第二输入端与I2C复位状态模块连接,SDRAM与门模块第二输入端与SDRAM复位状态模块连接,ARM与门模块第二输入端与ARM复位状态模块连接;
如图4所示,数据解析与门模块输出端与数据解析模块连接,当数据解析复位状态模块为低电平且接收到复位信号时,数据解析模块进行复位;
如图5所示,分类报警与门模块输出端与数据分类报警模块连接,当数据解析复位状态模块为低电平且接收到复位信号时,数据分类报警模块进行复位;
如图6所示,日志记录与门模块输出端与日志记录模块连接,当日志记录复位状态模块为低电平且接收到复位信号时,日志记录模块进行复位;
如图7所示,封装与门模块输出端与数据封装模块连接,当封装复位状态模块为低电平且接收到复位信号时,数据封装模块进行复位;
如图8所示,GPIO与门模块输出端与GPIO模块连接,当GPIO复位状态模块为低电平且接收到复位信号时,GPIO模块进行复位;
如图9所示,I2C与门模块输出端与I2C模块连接,当I2C复位状态模块为低电平且接收到复位信号时,I2C模块进行复位;
如图10所示,SDRAM与门模块输出端与SDRAM模块连接,当SDRAM复位状态模块为低电平且接收到复位信号时,SDRAM模块进行复位;
如图11所示,ARM与门模块输出端与ARM处理器连接,当ARM复位状态模块为低电平且接收到复位信号时,ARM处理器进行复位;
复位输入模块用于接收用户发送的复位信号,在发出复位脉冲后使复位信号处理器的八号管脚变成高电平并持续预设时间,使复位信号处理器输出复位信号。
本实施例中,监控中心包括:数据库处理模块;数据库处理模块用于给用户提供对数据库内部数据进行增加、删除、查询、修改的操作界面。
数据采集模块采集的数据信息包括:CPU的占用情况、系统各个组件的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况。温度信息包括CPU温度,主板温度,背板温度、热插拔模组温度;电压信息包括CPU电压,主板电压,SCSI背板电压,热插拔模组电压;风扇信息包括CPU风扇,主板风扇,背板风扇,热插拔模组风扇。
本实施例中,监控中心还包括:应急处置模块;应急处置模块用于当系统发生死机或者某一服务器或多个服务器死机时,应急处置模块自动对整个系统或死机的服务器执行关机、重启、加电启动操作。
日志记录模块还用于将系统中发生的传感器记录的信息、报警信息、关机、重启事件信息做一个长期的日志记录,使系统维护人员根据日志分析诊断故障;将日志保存在集中监控系统的非易失性存储器中,在监控中心宕机或电源被切断的情况下,仍然能够为系统维护人员提供一个分析故障的途径;
数据分类报警模块还用于设置报警上限、安全上限、安全下限和报警下限;当接收到的系统某一组件或多个组件的温度数据超出阈值或散热风扇停止工作时,通过声光报警的形式报告给系统管理人员。
本实施例中,监控中心还包括:报警信息通知模块;报警信息通知模块用于通过短信通知、客户端浏览器界面、电子邮件方式发出通知,客户端浏览器界面通知方式:客户端浏览器平台搜索事件列表,如果有报警事件信息,将报警信息显示在客户端浏览器平台页面的状态栏上,提示用户有报警信息产生;短信通知方式,当有报警信息产生时,报警信息通知模块自动通过硬件设备以发送短信的形式将报警信息发出;电子邮件通知方式是当有报警信息产生时,报警信息通知模块自动将报警信息发送到指定用户的电子邮箱中。
服务器还包括:数据传输处理模块;数据传输处理模块用于将向监控中心发送的数据信息进行封装,数据信息包括:MAC地址层,服务器IP层,数据帧段;数据帧段中当该帧段的最低位为0时表示请求/回复响应的组件的地址码,当最低位为1时表示请求/回复响应的软件ID;数据帧段的高7位表示具体的地址码和软件ID;在数据帧段中设有奇偶信息编码,当奇偶信息编码为偶数时表示此消息是一条请求,当奇偶信息编码为奇数时表示此消息是一条响应;当消息是一条基本的控制请求或状态响应时数据帧段为00h和01h;在数据帧段中还设有请求者自行生成的一序列号,当服务器需要发出多条请求时用以标识不同的请求;序列号是响应/接收该消息的组件的子组件号或子地址号。
监控中心还用于接收每个服务器发送的数据信息,采用MySQL存储平台进行对接收的数据信息数据存储,生成每个服务器各项数据的趋势分析报告,进行保存;监控中心通过广播的形式设置每个服务器运行时间,统一设置每个服务器数据采集发送处理时间;使监控中心与每个服务器之间通过光缆或WIFI或者CAN的形式通信连接;监控中心从数据角度将每个服务器的数据信息通过线路、表格、图形的展现形式进行有机整合,可视化展示,帮助用户了解每个被监控工作站状况;监控中心将获取的数据信息与预设阈值以及往期数据进行对比,当前数据超出预设阈值或者与往期数据比较产生不良的效果时,进行报警提示;将报警信息形成报警统计,并存储;监控中心接收来自客户端的请求,并将处理后的数据通过HTTP协议返回给用户。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参考即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种服务器智能监控系统,其特征在于,包括:监控中心以及部署在各个数据信息处理服务站,用于采集数据信息处理服务站数据信息的服务器;
监控中心包括:远程通信模块、中央处理单元、数据库、复位集成模块;
远程通信模块用于接收和发送来自各个服务器的数据信息;
远程通信模块分别与每个服务器的远程访问模块建立通信连接;
中央处理单元用于将各个服务器采集到的数据信息,以及监控中心的报警信息呈现给用户,同时接收用户对监控中心的控制指令;还提供了统一的CUI接口,供用户对历史日志、报警信息的查询和浏览以及对报警参数的设置;
中央处理单元包括:数据解析模块、数据分类报警模块、日志记录模块、数据封装模块、GPIO模块、I2C模块、SDRAM模块以及ARM处理器;
数据解析模块用于解析接收的来自各个服务器的数据信息,并将解析后的数据分别发送给中央处理单元、数据分类报警模块和日志记录模块;
日志记录模块用于将解析后的数据信息和报警信息以日志的形式存放到数据库当中,以便在需要时查阅相应的历史记录;
数据分类报警模块用于接收解析后的数据信息,并将解析后的数据信息通过相应的报警参数进行分类,对超过报警阈值的消息形成相应的报警信息,发送给进行报警提示,同时也将报警信息发送给日志记录模块形成相应的报警日志;
数据封装模块用于接收来自中央处理单元的控制指令,并将控制指令封装为控制指令请求信息,通过远程通信模块实现对服务器的控制;复位集成模块包括:分别与数据解析模块连接的数据解析复位状态模块和数据解析复位标示模块、分别与数据分类报警模块连接的分类报警复位状态模块和分类报警复位标示模块、分别与日志记录模块连接的日志记录复位状态模块和日志记录复位标示模块、分别与数据封装模块连接的封装复位状态模块和封装复位标示模块、分别与GPIO模块连接的GPIO复位状态模块和GPIO复位标示模块、分别与I2C模块连接的I2C复位状态模块和I2C复位标示模块、分别与SDRAM模块连接的SDRAM复位状态模块和SDRAM复位标示模块、分别与ARM处理器连接的ARM复位状态模块、ARM复位标示模块、复位控制模块、复位状态选择模块以及复位标示获取模块;
复位状态选择模块用于根据用户输入的设置指令,分别设置数据解析复位状态模块、分类报警复位状态模块、日志记录复位状态模块、封装复位状态模块、GPIO复位状态模块、I2C复位状态模块、SDRAM复位状态模块以及ARM复位状态模块的状态参数;状态参数设置为低电平的复位状态模块为可复位状态,状态参数设置为高电平的复位状态模块为不可复位状态;
复位标示获取模块分别与数据解析复位标示模块、分类报警复位标示模块、日志记录复位标示模块、封装复位标示模块、GPIO复位标示模块、I2C复位标示模块、SDRAM复位标示模块以及ARM复位标示模块连接;
复位标示获取模块用于获取每个模块的复位完成信息;
复位控制模块分别与数据解析模块、数据分类报警模块、日志记录模块、数据封装模块、GPIO模块、I2C模块、SDRAM模块以及ARM处理器连接,复位控制模块用于接收用户输入的复位指令,当用户输入复位指令,且数据解析模块、数据分类报警模块、日志记录模块、数据封装模块、GPIO模块、I2C模块、SDRAM模块以及ARM处理器其中的模块状态参数设置为低电平时,该模块执行复位;
服务器包括:远程访问模块、数据管理控制模块、远程控制模块以及数据采集模块;
数据采集模块用于采集工作站的数据信息;
远程访问模块用于通过通信信道接收来自监控中心的控制命令,同时也将采集到的数据发送给监控中心;
数据管理控制模块用于将采集到的数据信息进行储存,并通过远程访问模块将数据信息发送给监控中心以及将远程访问模块接收的来自监控中心的控制命令转化为本地命令,通过操作系统接口实现对本地操作系统的控制。
2.根据权利要求1所述的服务器智能监控系统,其特征在于,
复位控制模块包括:复位信号处理器、电阻R、复位输入模块、数据解析与门模块、分类报警与门模块、日志记录与门模块、封装与门模块、GPIO与门模块、I2C与门模块、SDRAM与门模块以及ARM与门模块;
复位信号处理器的一号管脚通过电阻R接电源,复位信号处理器的二号管脚接电源,复位信号处理器的一号管脚通过复位输入模块接三号管脚,且三号管脚和四号管脚接地;复位信号处理器五号管脚接地,复位信号处理器八号管脚通过二极管VD与一号管脚连接,复位信号处理器七号管脚分别与数据解析与门模块第一输入端、分类报警与门模块第一输入端、日志记录与门模块第一输入端、封装与门模块第一输入端、GPIO与门模块第一输入端、I2C与门模块第一输入端、SDRAM与门模块第一输入端以及ARM与门模块第一输入端连接;
数据解析与门模块第二输入端与数据解析复位状态模块连接,分类报警与门模块第二输入端与分类报警复位状态模块连接,日志记录与门模块第二输入端与日志记录复位状态模块连接,封装与门模块第二输入端与封装复位状态模块连接,GPIO与门模块第二输入端与GPIO复位状态模块连接,I2C与门模块第二输入端与I2C复位状态模块连接,SDRAM与门模块第二输入端与SDRAM复位状态模块连接,ARM与门模块第二输入端与ARM复位状态模块连接;
数据解析与门模块输出端与数据解析模块连接,当数据解析复位状态模块为低电平且接收到复位信号时,数据解析模块进行复位;
分类报警与门模块输出端与数据分类报警模块连接,当数据解析复位状态模块为低电平且接收到复位信号时,数据分类报警模块进行复位;
日志记录与门模块输出端与日志记录模块连接,当日志记录复位状态模块为低电平且接收到复位信号时,日志记录模块进行复位;
封装与门模块输出端与数据封装模块连接,当封装复位状态模块为低电平且接收到复位信号时,数据封装模块进行复位;
GPIO与门模块输出端与GPIO模块连接,当GPIO复位状态模块为低电平且接收到复位信号时,GPIO模块进行复位;
I2C与门模块输出端与I2C模块连接,当I2C复位状态模块为低电平且接收到复位信号时,I2C模块进行复位;
SDRAM与门模块输出端与SDRAM模块连接,当SDRAM复位状态模块为低电平且接收到复位信号时,SDRAM模块进行复位;
ARM与门模块输出端与ARM处理器连接,当ARM复位状态模块为低电平且接收到复位信号时,ARM处理器进行复位;
复位输入模块用于接收用户发送的复位信号,在发出复位脉冲后使复位信号处理器的八号管脚变成高电平并持续预设时间,使复位信号处理器输出复位信号。
3.根据权利要求1或2所述的服务器智能监控系统,其特征在于,数据采集模块采集的数据信息包括:CPU的占用情况、系统各个组件的温度信息、风扇信息、电压信息、网卡工作情况以及操作系统工作情况;
温度信息包括CPU温度、主板温度、背板温度以及热插拔模组温度;
电压信息包括CPU电压、主板电压、SCSI背板电压以及热插拔模组电压;
风扇信息包括CPU风扇、主板风扇、背板风扇以及热插拔模组风扇。
4.根据权利要求2所述的服务器智能监控系统,其特征在于,
监控中心还包括:应急处置模块和数据库处理模块;
应急处置模块用于当系统发生死机或者某一服务器或多个服务器死机时,应急处置模块自动对整个系统或死机的服务器执行关机、重启、加电启动操作;
数据库处理模块用于给用户提供对数据库内部数据进行增加、删除、查询、修改的操作界面。
5.根据权利要求2所述的服务器智能监控系统,其特征在于,
日志记录模块还用于将系统中发生的传感器记录的信息、报警信息、关机、重启事件信息做一个长期的日志记录,使系统维护人员根据日志分析诊断故障;将日志保存在集中监控系统的非易失性存储器中,在监控中心宕机或电源被切断的情况下,仍然能够为系统维护人员提供一个分析故障的途径;
数据分类报警模块还用于设置报警上限、安全上限、安全下限和报警下限;当接收到的系统某一组件或多个组件的温度数据超出阈值或散热风扇停止工作时,通过声光报警的形式报告给系统管理人员;
监控中心还包括:报警信息通知模块;
报警信息通知模块用于通过短信通知、客户端浏览器界面、电子邮件方式发出通知,客户端浏览器界面通知方式:客户端浏览器平台搜索事件列表,如果有报警事件信息,将报警信息显示在客户端浏览器平台页面的状态栏上,提示用户有报警信息产生;短信通知方式,当有报警信息产生时,报警信息通知模块自动通过硬件设备以发送短信的形式将报警信息发出;电子邮件通知方式是当有报警信息产生时,报警信息通知模块自动将报警信息发送到指定用户的电子邮箱中。
6.根据权利要求2所述的服务器智能监控系统,其特征在于,
服务器还包括:数据传输处理模块;
数据传输处理模块用于将向监控中心发送的数据信息进行封装,数据信息包括:MAC地址层、服务器IP层以及数据帧段;
数据帧段中当该帧段的最低位为0时表示请求/回复响应的组件的地址码,当最低位为1时表示请求/回复响应的软件ID;数据帧段的高7位表示具体的地址码和软件ID;
在数据帧段中设有奇偶信息编码,当奇偶信息编码为偶数时表示此消息是一条请求,当奇偶信息编码为奇数时表示此消息是一条响应;当消息是一条基本的控制请求或状态响应时数据帧段为00h和01h;
在数据帧段中还设有请求者自行生成的一序列号,当服务器需要发出多条请求时用以标识不同的请求;序列号是响应/接收该消息的组件的子组件号或子地址号。
7.根据权利要求1所述的服务器智能监控系统,其特征在于,
监控中心还用于接收每个服务器发送的数据信息,采用MySQL存储平台进行对接收的数据信息数据存储,生成每个服务器各项数据的趋势分析报告,进行保存;监控中心通过广播的形式设置每个服务器运行时间,统一设置每个服务器数据采集发送处理时间;使监控中心与每个服务器之间通过光缆或WIFI或者CAN的形式通信连接;监控中心从数据角度将每个服务器的数据信息通过线路、表格、图形的展现形式进行有机整合,可视化展示,帮助用户了解每个被监控工作站状况;
监控中心将获取的数据信息与预设阈值以及往期数据进行对比,当前数据超出预设阈值或者与往期数据比较产生不良的效果时,进行报警提示;将报警信息形成报警统计,并存储;监控中心接收来自客户端的请求,并将处理后的数据通过HTTP协议返回给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710025466.0A CN106506248B (zh) | 2017-01-13 | 2017-01-13 | 一种服务器智能监控系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710025466.0A CN106506248B (zh) | 2017-01-13 | 2017-01-13 | 一种服务器智能监控系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106506248A CN106506248A (zh) | 2017-03-15 |
CN106506248B true CN106506248B (zh) | 2019-12-17 |
Family
ID=58345313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710025466.0A Active CN106506248B (zh) | 2017-01-13 | 2017-01-13 | 一种服务器智能监控系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106506248B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107193670B (zh) * | 2017-05-25 | 2021-03-26 | 苏州浪潮智能科技有限公司 | 一种集群工作站的远程管理方法、装置及系统 |
JP7027974B2 (ja) * | 2018-03-12 | 2022-03-02 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
CN108880761A (zh) * | 2018-06-29 | 2018-11-23 | 郑州云海信息技术有限公司 | 服务器网卡信息获取系统 |
CN109524732B (zh) * | 2018-11-14 | 2021-10-26 | 郑州云海信息技术有限公司 | 一种电池温度获取方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101067744A (zh) * | 2007-06-06 | 2007-11-07 | 中国安全生产科学研究院 | 烟花爆竹生产、储存及运输过程动态监控系统与方法 |
CN102185707A (zh) * | 2011-04-15 | 2011-09-14 | 浪潮电子信息产业股份有限公司 | 一种对服务器管理ipmi接口协议的扩展方法 |
CN103166804A (zh) * | 2011-12-14 | 2013-06-19 | 北京赛斯通科技发展有限公司 | Sstm集中监控管理系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100042852A1 (en) * | 2008-08-18 | 2010-02-18 | Huawei Technologies Co., Ltd. | Power-on protection method, module and system |
-
2017
- 2017-01-13 CN CN201710025466.0A patent/CN106506248B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101067744A (zh) * | 2007-06-06 | 2007-11-07 | 中国安全生产科学研究院 | 烟花爆竹生产、储存及运输过程动态监控系统与方法 |
CN102185707A (zh) * | 2011-04-15 | 2011-09-14 | 浪潮电子信息产业股份有限公司 | 一种对服务器管理ipmi接口协议的扩展方法 |
CN103166804A (zh) * | 2011-12-14 | 2013-06-19 | 北京赛斯通科技发展有限公司 | Sstm集中监控管理系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106506248A (zh) | 2017-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106815115B (zh) | 一种服务器运行状态监控系统 | |
CN106506248B (zh) | 一种服务器智能监控系统 | |
CN110224858B (zh) | 基于日志的告警方法及相关装置 | |
US7783744B2 (en) | Facilitating root cause analysis for abnormal behavior of systems in a networked environment | |
US7051244B2 (en) | Method and apparatus for managing incident reports | |
CN101997925A (zh) | 具有预警功能的服务器监控方法及其系统 | |
WO2017161964A1 (zh) | 通讯网络巡检的方法、装置及巡检客户端 | |
CN112132538A (zh) | 一种基于NB-IoT的光伏发电管理系统 | |
CN112395156A (zh) | 故障的告警方法和装置、存储介质和电子设备 | |
CN103455404A (zh) | 服务器风扇运转监视系统及方法 | |
CN111488258A (zh) | 一种用于软硬件运行状态分析与预警的系统 | |
CN112631866A (zh) | 服务器硬件状态监控方法、装置、电子设备及介质 | |
CN111625389A (zh) | 一种vr的故障数据获取方法、装置及相关组件 | |
EP2882216B1 (en) | Device and method for controlling, supervising and giving an alarming from a power supply of base station | |
CN106534162A (zh) | 一种基于远程管理通讯协议的服务器温度监控系统及方法 | |
CN103166779A (zh) | 一种基于移动终端的告警确认和处理方法及装置 | |
EP1622310A2 (en) | Administration system for network management systems | |
CN105825641A (zh) | 一种业务报警方法和装置 | |
CN115277353B (zh) | 一种智能柜机远程故障主被动预警方法 | |
CN111522712A (zh) | 一种bmc日志收集系统 | |
CN113794586B (zh) | 一种网络拓扑的快照与回放方法及系统 | |
TWI682655B (zh) | 產生網路事件告警的方法及其網路管理裝置 | |
CN104284210A (zh) | Iptv故障自诊断网络系统 | |
CN112865312A (zh) | 一种电力调度系统及电力数据处理方法 | |
CN103036778A (zh) | 一种家庭网关设备中防止设备僵死的装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191121 Address after: 215100 No. 1 Guanpu Road, Guoxiang Street, Wuzhong Economic Development Zone, Suzhou City, Jiangsu Province Applicant after: Suzhou Wave Intelligent Technology Co., Ltd. Address before: 450000 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601 Applicant before: Zhengzhou Yunhai Information Technology Co. Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |