CN115858290A - 一种基于龙芯平台的主板工作状态实时监控系统及方法 - Google Patents

一种基于龙芯平台的主板工作状态实时监控系统及方法 Download PDF

Info

Publication number
CN115858290A
CN115858290A CN202211566829.9A CN202211566829A CN115858290A CN 115858290 A CN115858290 A CN 115858290A CN 202211566829 A CN202211566829 A CN 202211566829A CN 115858290 A CN115858290 A CN 115858290A
Authority
CN
China
Prior art keywords
state
mainboard
information
management module
state information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211566829.9A
Other languages
English (en)
Inventor
樊镕
赵连云
霍兴华
吴振宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
707th Research Institute of CSIC
Original Assignee
707th Research Institute of CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 707th Research Institute of CSIC filed Critical 707th Research Institute of CSIC
Priority to CN202211566829.9A priority Critical patent/CN115858290A/zh
Publication of CN115858290A publication Critical patent/CN115858290A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种基于龙芯平台的主板工作状态实时监控系统及方法,包括管理模块、硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块和监控计算机;所述硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块的输出端分别与管理模块相连接,所述管理模块用于实现硬件状态信息、固件状态信息、软件状态信息的主板信息进行收集汇总,并对主板信息进行分类、分级、编码和整合;所述管理模块还与监控计算机相连接,该监控计算机用于解析管理模块定时发送的状态报文信息,判别主板实施工作状态是否正常,并将监控结果反馈给维护人员。本发明能够全方位实时监控龙芯主板工作状态,以提升系统整体稳定性、可靠性。

Description

一种基于龙芯平台的主板工作状态实时监控系统及方法
技术领域
本发明属于计算机主板技术领域,涉及一种主板工作状态实时监控系统及方法,尤其是一种基于龙芯平台的主板工作状态实时监控系统及方法。
背景技术
历来信息泄密事件表明,采用国外核心器件设计的计算机可能存在不可弥补的漏洞,存在着巨大的安全隐患,因此,研发以国产CPU为核心的专用计算机,对于保护国家信息安全具有重要意义。随着国家对信息安全的逐渐重视,以国产核心器件为基础的专用计算机得到大力发展,如以龙芯等国产CPU为核心的专用计算机已经得到大量使用。
以龙芯CPU为核心的计算机主板模块大量应用于工控及军用领域,对于主板的稳定性及可靠性要求极高,因此如何能够实时监控其软件硬件工作状态并依据监视结果及时进行反馈调整对于提高整个计算系统的稳定性,避免由于主板工作状态失控造成严重事故是本领域技术人员亟待解决的技术难题。
经检索,未发现与本发明相同或相似的已公开的专利文献。
发明内容
本发明的目的在于克服现有技术的不足,提出一种基于龙芯平台的主板工作状态实时监控系统及方法,充分结合龙芯处理器及配套桥片的硬件资源特点,收集固件启动及操作系统运行过程中主板的关键状态数据,建立监控机制,从而达到能够全方位实时监控龙芯主板工作状态,以提升系统整体稳定性、可靠性的目的。
本发明解决其现实问题是采取以下技术方案实现的:
一种基于龙芯平台的主板工作状态实时监控系统,包括管理模块、硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块和监控计算机;
所述硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块的输出端分别与管理模块相连接,所述管理模块用于实现硬件状态信息、固件状态信息、软件状态信息的主板信息进行收集汇总,并对主板信息进行分类、分级、编码和整合;所述管理模块还与监控计算机相连接,该监控计算机用于解析管理模块定时发送的状态报文信息,判别主板实施工作状态是否正常,并将监控结果反馈给维护人员。
而且,所述硬件状态信息包括:主板关键电压电流状态、核心器件温度状态、上电启动流程关键信号状态、龙芯桥片ACPI状态。
而且,所述固件状态信息包括:固件版本状态、CPU信息状态、桥片初始化状态、内存扫描状态、PCI设备树扫描状态。
而且,所述软件状态信息包括:操作系统版本状态、CPU使用率状态、内存使用率状态、网络负载状态、硬盘使用率状态。
一种基于龙芯平台的主板工作状态实时监控方法,包括以下步骤:
步骤1、主板常备电上电,管理模块启动,监控计算机启动运行;
步骤2、主板上电启动,管理模块开始收集上电状态信息、ACPI状态信息、电压、电流、温度状态的硬件状态信息,并将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令;
步骤3、主板固件启动,CPU调试串口开始发送带固件版本状态、CPU信息状态、桥片初始化状态、内存扫描状态、PCI设备树扫描状态的日志信息到管理模块,管理模块将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令。
步骤4、主板操作系统启动,监控脚本开始运行,脚本程序在操作系统下将操作系统基本信息、CPU使用率状态、内存使用率状态、网络负载状态、硬盘使用率等信息通过主板串口发送到管理模块,管理模块将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令。
本发明的优点和有益效果:
本发明提出了一种基于龙芯平台的主板工作状态实时监控系统及方法,充分结合龙芯平台硬件特点及固件、操作系统特点,在主板启动、运行过程中监控主板硬件工作状态、硬件资源扫描状态、处理器运行状态、外扩通信接口状态等,本发明能够全面掌控主板工作状态,避免由于主板工作状态失控造成严重事故。
附图说明
图1是本发明的实时监控系统架构图;
图2是本发明的实时监控系统工作流程图;
图3是本发明的实时监控数据封装协议格式示意图。
具体实施方式
以下结合附图对本发明实施例作进一步详述:
一种基于龙芯平台的主板工作状态实时监控系统,如图1所示,包括管理模块、硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块和监控计算机;
所述硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块的输出端分别与管理模块相连接,所述管理模块用于实现硬件状态信息、固件状态信息、软件状态信息的主板信息进行收集汇总,并对主板信息进行分类、分级、编码和整合;所述管理模块还与监控计算机相连接,该监控计算机用于解析管理模块定时发送的状态报文信息,判别主板实施工作状态是否正常,并将监控结果反馈给维护人员。
管理模块信息处理功能将硬件、固件、软件状态信息依据预定义格式,按照类别进行编码,之后整合到IIC协议中定时发送到监控计算机中,由监控计算机解析状态报文,并将监控结果反馈给维护人员。
所述硬件状态信息包括:主板关键电压电流状态、核心器件温度状态、上电启动流程关键信号状态、龙芯桥片ACPI状态。
所述固件状态信息包括:固件版本状态、CPU信息状态、桥片初始化状态、内存扫描状态、PCI设备树扫描状态。
所述软件状态信息包括:操作系统版本状态、CPU使用率状态、内存使用率状态、网络负载状态、硬盘使用率状态。
下面对本发明中系统内各模块的组成和功能作进一步说明:
在龙芯平台主板上由管理模块实现硬件状态信息、固件状态信息、软件状态信息的收集汇总,信息收集后管理模块对主板信息进行分类、分级、整合、编码,之后转发到监控计算机,由监控计算机判别主板实施工作状态是否正常,并执行相应后续处理机制。
硬件状态信息主要包含:主板关键电压电流状态、核心器件温度状态、上电启动流程关键信号状态、龙芯桥片ACPI状态。
固件状态信息主要包含:固件版本状态、CPU信息状态、桥片初始化状态、内存扫描状态、PCI设备树扫描状态。
软件状态信息主要包含:操作系统版本状态、CPU使用率状态、内存使用率状态、网络负载状态、硬盘使用率状态。
管理模块由低功耗嵌入式处理器实现,主要有信息收集和信息处理2部分功能。
管理模块信息收集功能分为三部分:硬件状态信息收集方面,由嵌入式处理器AD功能接收电压、电流状态;由GPIO接收上电启动关键信号、ACPI信号;IIC接口接收关键器件温度传感器信息;固件状态信息收集方面,由嵌入式处理通过串口连接龙芯CPU调试串口,在上电固件启动过程中接收调试串口打印信息,并解析其中固件版本、CPU信息、桥片初始化状态、内存扫描、PCI设备树扫描信息等;软件状态信息方面,配合运行于主板操作系统上的监控脚本程序,收集操作系统信息,CPU使用率状态信息、内存使用率状态信息、网络负载状态信息、硬盘使用率信息等,并通过串口发送到管理模块。
管理模块信息处理功能将硬件、固件、软件状态信息依据预定义格式,按照类别进行编码,之后整合到IIC协议中定时发送到监控计算机中,由监控计算机解析状态报文,并将监控结果反馈给维护人员已达到实时监控目的。
一种基于龙芯平台的主板工作状态实时监控方法,如图2所示,包括以下步骤:
步骤1、主板常备电上电,管理模块启动,监控计算机启动运行;
步骤2、主板上电启动,管理模块开始收集上电状态信息、ACPI状态信息、电压、电流、温度状态等硬件状态信息,并将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令。
在本实施例中,监控计算机监控到故障,则记录故障日志,并向龙芯主板电源管理模块反馈重新上电操作;
步骤3、主板固件启动,CPU调试串口开始发送带固件版本状态、CPU信息状态、桥片初始化状态、内存扫描状态、PCI设备树扫描状态的日志信息到管理模块,管理模块将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令。
在本实施例中,监控计算机监控到故障,则记录故障日志,并向龙芯主板反馈硬件复位操作;
步骤4、主板操作系统启动,监控脚本开始运行,脚本程序在操作系统下将操作系统基本信息、CPU使用率状态、内存使用率状态、网络负载状态、硬盘使用率等信息通过主板串口发送到管理模块,管理模块将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令。
在本实施例中,监控计算机监控到故障,则记录故障日志,并向龙芯主板反馈软复位操作。
在本实施例中,龙芯主板平台采用龙芯3A3000CPU加龙芯7A1000桥片为核心架构,运行龙芯Pmon固件,运行中标麒麟Linux操作系统。管理模块处理器选择GD32F103处理器。
依据龙芯3A3000加龙芯7A1000桥片主板平台特点,电压需监控cpu核电、桥片核电、内存供电、网卡核电、主板主5V供电、主3.3V供电,各电压通过精密电阻分压后连接到GD32F103的AD接口;
电流需监控CPU核电电流、主3.3V电流、内存电流,由电流传感器通过IIC接口连接到GD32F103;
温度需监控3A3000CPU温度、7A1000桥片温度,由温度传感器通过IIC接口连接到GD32F103;
依据龙芯主板上电时序,上电流程需监控RTC电源OK信号、CPU电源OK信号、桥片电源OK信号、内存电源OK信号,直接通过GPIO连接到GD32F103;
依据龙芯7A1000桥片ACPI接口特性,检测ACPIS3状态、ACPIS4状态、ACPIPowerButton状态、ACPIPlantPowerOK状态,直接通过GPIO连接到GD32F103.
在龙芯平台运行Pmon固件,由龙芯3A3000CPUUART0接口将Pmon运行日志信息传输到GD32F103串口,GD32F103中运行日志解析程序依据Pmon日志关键字解析出Pmon固件版本、3A3000配置状态、7A1000桥片配置状态、内存扫描参数状态、PCI设备树扫描状态等信息。
在龙芯平台运行中标麒麟Linux操作系统,运行监控脚本,通过cat/proc/version获取系统信息,通过top获取查看CPU使用率,通过free命令获取内存使用率,通过uptime命令获取网络状态,通过fdisk命令获取硬盘状态,之后通过龙芯7A1000串口将数据发送到GD32F103。
管理模块将收集到的状态监控信息统一进行整合编码,封装为一个IIC应用层数据包,以每5s更新一次的频率将数据包通过IIC总线传输到监控计算机。数据封装协议示意如图3所示。
监控计算机通过IIC接口接收到龙芯主板管理模块的实时监控数据包,依据协议格式进行解析,解析后依据主板工作所处的状态阶段对监控数据是否正常进行判断并采取相应处理机制。在主板上电过程中主要关注电压电流状态、上电状态信息、ACPI状态信息及Pmon状态信息,如检测到异常状态,则监控计算机反馈信号进行复位或重启操作;在主板正常工作过程中则主要监控温度状态、软件状态,如检测到异常状态,则监控计算机反馈信号进行复位或重启操作。
通过以上的技术实现,可在龙芯主板的启动和运行过程中对硬件状态、固件状态、软件状态的全方位监控,采取可行的管理模块信息收集、整合、监控机制,实现高效实施监控。
本发明提出了一种基于龙芯平台的主板工作状态实时监控方法,充分结合龙芯处理器及配套桥片的硬件资源特点,收集固件启动及操作系统运行过程中主板的关键状态数据,建立实时监控机制。从而达到提升系统整体稳定性、可靠性的目的。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims (5)

1.一种基于龙芯平台的主板工作状态实时监控系统,其特征在于:包括管理模块、硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块和监控计算机;
所述硬件状态信息采集模块、固件状态信息采集模块、软件状态信息采集模块的输出端分别与管理模块相连接,所述管理模块用于实现硬件状态信息、固件状态信息、软件状态信息的主板信息进行收集汇总,并对主板信息进行分类、分级、编码和整合;所述管理模块还与监控计算机相连接,该监控计算机用于解析管理模块定时发送的状态报文信息,判别主板实施工作状态是否正常,并将监控结果反馈给维护人员。
2.根据权利要求1所述的一种基于龙芯平台的主板工作状态实时监控系统,其特征在于:所述硬件状态信息包括:主板关键电压电流状态、核心器件温度状态、上电启动流程关键信号状态、龙芯桥片ACPI状态。
3.根据权利要求1所述的一种基于龙芯平台的主板工作状态实时监控系统,其特征在于:所述固件状态信息包括:固件版本状态、CPU信息状态、桥片初始化状态、内存扫描状态、PCI设备树扫描状态。
4.根据权利要求1所述的一种基于龙芯平台的主板工作状态实时监控系统,其特征在于:所述软件状态信息包括:操作系统版本状态、CPU使用率状态、内存使用率状态、网络负载状态、硬盘使用率状态。
5.一种基于龙芯平台的主板工作状态实时监控方法,其特征在于:包括以下步骤:
步骤1、主板常备电上电,管理模块启动,监控计算机启动运行;
步骤2、主板上电启动,管理模块开始收集上电状态信息、ACPI状态信息、电压、电流、温度状态的硬件状态信息,并将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令;
步骤3、主板固件启动,CPU调试串口开始发送带固件版本状态、CPU信息状态、桥片初始化状态、内存扫描状态、PCI设备树扫描状态的日志信息到管理模块,管理模块将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令。
步骤4、主板操作系统启动,监控脚本开始运行,脚本程序在操作系统下将操作系统基本信息、CPU使用率状态、内存使用率状态、网络负载状态、硬盘使用率等信息通过主板串口发送到管理模块,管理模块将整合编码后的信息发送到监控计算机,监控计算机向龙芯主板反馈软操作命令。
CN202211566829.9A 2022-12-07 2022-12-07 一种基于龙芯平台的主板工作状态实时监控系统及方法 Pending CN115858290A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211566829.9A CN115858290A (zh) 2022-12-07 2022-12-07 一种基于龙芯平台的主板工作状态实时监控系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211566829.9A CN115858290A (zh) 2022-12-07 2022-12-07 一种基于龙芯平台的主板工作状态实时监控系统及方法

Publications (1)

Publication Number Publication Date
CN115858290A true CN115858290A (zh) 2023-03-28

Family

ID=85670869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211566829.9A Pending CN115858290A (zh) 2022-12-07 2022-12-07 一种基于龙芯平台的主板工作状态实时监控系统及方法

Country Status (1)

Country Link
CN (1) CN115858290A (zh)

Similar Documents

Publication Publication Date Title
US11360842B2 (en) Fault processing method, related apparatus, and computer
EP3591485B1 (en) Method and device for monitoring for equipment failure
CN114328102B (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN106952464A (zh) 智能数据采集系统和采集方法
CN104424084A (zh) 服务器的系统错误信息侦测系统及方法
CN111831488B (zh) 具有安全等级设计的tcms-mpu控制单元
CN105760241A (zh) 一种内存数据导出方法和系统
CN105511937A (zh) 一种适用于云平台的批量虚拟机蓝屏监控方法
CN105260286A (zh) 一种实时监控cpu工作状态的方法
CN115543746A (zh) 图形处理器监测方法、系统、装置及电子设备
CN116126772A (zh) 一种应用于arm服务器的uart串口管理系统及方法
CN116010156A (zh) 异常处理系统
CN113918411A (zh) 基于边缘计算的终端设备管控方法和系统
CN103995759A (zh) 基于核内外协同的高可用计算机系统故障处理方法及装置
CN115858290A (zh) 一种基于龙芯平台的主板工作状态实时监控系统及方法
CN114387123B (zh) 数据采集管理方法
CN114090382B (zh) 超融合集群健康巡检方法和装置
CN115757045A (zh) 一种交易日志分析方法、系统及装置
CN100369009C (zh) 使用系统管理中断信号的监控系统及方法
CN110489286B (zh) 一种box节点机电源均流测试方法及系统
CN113691390A (zh) 一种云端协同的边缘节点报警系统及方法
CN113064776A (zh) 一种bmc故障的诊断方法及装置
CN113868036B (zh) 服务器时序异常监测方法、系统、终端及存储介质
CN115865634B (zh) 功能模块的控制方法及装置、服务器
CN215642677U (zh) 一种计算机故障报警系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination