CN116126772A - 一种应用于arm服务器的uart串口管理系统及方法 - Google Patents

一种应用于arm服务器的uart串口管理系统及方法 Download PDF

Info

Publication number
CN116126772A
CN116126772A CN202310101914.6A CN202310101914A CN116126772A CN 116126772 A CN116126772 A CN 116126772A CN 202310101914 A CN202310101914 A CN 202310101914A CN 116126772 A CN116126772 A CN 116126772A
Authority
CN
China
Prior art keywords
serial port
module
bmc
uart
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310101914.6A
Other languages
English (en)
Inventor
刘圣金
王安
李岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310101914.6A priority Critical patent/CN116126772A/zh
Publication of CN116126772A publication Critical patent/CN116126772A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/40Bus structure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明UART串口管理技术领域,具体提供一种应用于ARM服务器的UART串口管理系统及方法,所述系统包括带外UART串口管理模块和分别与带外UART串口管理模块连接的ARM处理器SOC和BMC;ARM处理器SOC与BMC连接;带外UART串口管理模块,用于对ARM处理器输出的串口信息进行研判处理,当判断ARM处理器出现异常时采用预设方案进行处理;还用于将ARM处理器的运行日志并行输出到BMC;BMC,用于收集带外UART串口管理模块传递过来的串口信息以及ARM处理器SOC输出的运行日志,并记录在内部SEL时间记录表内。实现对ARM服务器系统的串口日志智能管理。

Description

一种应用于ARM服务器的UART串口管理系统及方法
技术领域
本发明涉及UART串口管理技术领域,具体涉及一种应用于ARM服务器的UART串口管理系统及方法。
背景技术
现阶段,计算数据中心成为了金融、电信、互联网等行业基础设施建立的重中之重,数据中心承担着整个业务运行的重要责任,这样就需要有更多稳定可靠的服务器来搭建组成。ARM平台的服务器与生俱来拥有者众多的优势,例如内核多、体积小、低功耗、低成本和高性能等优点,在对当今金融、电信、互联网业务的处理有高效、更便捷的推动作用。如此来看,如何更好的方便管理ARM服务器集群成为了服务器整机解决方案厂商的首要任务,也是众多行业客户翘首以待的新技术。
目前大部分常规ARM服务器很少拥有独立的带外UART串口管理功能,一般都是传统的单口端到端的串口管理,没有批量管理、多串口并行管理的功能,做不到自由控制、告警记录等,这种简单的UART串口不能最优地管理整机的UART串口,对机房运维带来不便。
以ARM服务器开机启动过程为例,如果在开机启动过程中出现了系统宕机、部件识别丢失等错误后,这种简单的处理器内部的串口管理方案不能实时收集UART串口的日志,无法全程监控服务器整机的健康状态,没有办法做到批量处理异常。一旦服务器出现启动失败,如果无法及时地定位故障源,快速屏蔽可纠正错误的话,则很有可能带来服务器的宕机,进而导致集群的崩溃,对用户造成数据丢失、业务中断等不可换回的损失,增加客户机房运维成本,影响机房整体环境的稳定运行。这就说明,如果没有一套智能的ARM服务器UART串口管理系统,就很难应对当今时代的数据业务激增的局面。
发明内容
鉴于常规型ARM服务器对UART串口的管理仅使用单口端对端的系统,无法满足服务器在多场景的应用需求,使得服务器串口管理单一化、应用配置固定化的问题,本发明提供一种应用于ARM服务器的UART串口管理系统及方法,它可以有效解决常规型设计不能并行收集串口信息,不能批量识别串口信息的缺点,最大化保障ARM服务器的稳定运行,使服务器串口管理更智能,对业务处理保障性更高。
本发明的技术方案是:
第一方面,本发明技术方案提供一种应用于ARM服务器的UART串口管理系统,包括带外UART串口管理模块和分别与带外UART串口管理模块连接的ARM处理器SOC和BMC;ARM处理器SOC与BMC连接;
ARM处理器SOC,用于输出串口信息和ARM处理器的运行日志;
带外UART串口管理模块,用于对ARM处理器输出的串口信息进行研判处理,当判断ARM处理器出现异常时采用预设方案进行处理;还用于将ARM处理器的运行日志并行输出到BMC;
BMC,用于收集带外UART串口管理模块传递过来的串口信息以及ARM处理器SOC输出的运行日志,并记录在内部SEL时间记录表内;同时可将相关信息发送给服务器运维人员进行及时告警提醒。
集成了ARM处理器SOC、带外UART串口管理模块、BMC,主要对ARM处理器SOC的UART串口、BMC的串口进行智能管理。在出现异常情况时,快速进行安全控制、快速记录错误日志和远程监控上报等智能串口管理功能。
带外UART串口管理模块内部拥有着智能研判串口数据的控制逻辑,可独立于ARMCPU之外来运行,并行收集多串口数据,抗干扰能力强,控制较灵活。本发明中这种应用于ARM服务器的UART串口管理系统,它是一种拥有着多种功能、可独立运行的UART串口管理模块。可解决因系统崩溃、错误堆积等问题而造成ARM CPU无法自我判断控制的问题,最大化保障ARM服务器的稳定启动,对业务处理保障性更高。它可以更好的对ARM服务器集群进行有效的智能管理,提高机房运维的效率,最大化的利用ARM服务器的性能,节约成本。
作为本发明技术方案的进一步限定,带外UART串口管理模块包括侦测模块,用于实时侦测ARM处理器SOC的串口信息,并识别串口信息的状态关键字,当串口信息为正常打印时,将串口信息输出给BMC,还用于将串口信息通过MAX3232输出到外部机房管理系统中。
作为本发明技术方案的进一步限定,侦测模块,还用于当识别串口信息出现异常时,实时输出串口信息,同时通过MAX3232上报给外部机房管理系统中。
作为本发明技术方案的进一步限定,带外UART串口管理模块包括与侦测模块连接的I2C从模块;
侦测模块,还用于当识别串口信息出现异常时,通过I2C从模块做相应寄存器的记录。
作为本发明技术方案的进一步限定,BMC包括与I2C从模块连接的I2C模块,BMC通过I2C模块读取I2C从模块的寄存器信息。
作为本发明技术方案的进一步限定,BMC包括与侦测模块连接的BMC UART模块,用于对ARM处理器SOC输出的运行日志做日志记录,并将日志的关键信息输出给带外UART串口管理模块;
侦测模块,用于对接收到的关键信息进行识别侦测,当出现告警、错误关键字时,及时上报给外部机房管理系统。
作为本发明技术方案的进一步限定,带外UART串口管理模块还包括第一MUX和与第一MUX连接的第二MUX;
BMC UART模块包括与第二MUX连接的BMC UART4;
ARM处理器SOC包括与第一类模块;
侦测模块,用于实时侦测ARM处理器SOC的第一类模块的串口信息,并识别串口信息的状态关键字,当串口信息为正常打印时,通过第一MUX将串口信息汇总输出到第二MUX,第二MUX会将其输出给BMC UART4。
作为本发明技术方案的进一步限定,侦测模块还包括分别与BMC UART模块、第一MUX和第二MUX连接的第三MUX,当识别第一类模块的串口信息出现异常时,实时输出串口信息,同时通过第三MUX将当前告警信息传送给MAX3232,通过MAX3232上报给外部机房管理系统中。
作为本发明技术方案的进一步限定,ARM处理器SOC包括与BMC UART模块连接的第二类模块;BMC UART模块包括BMC UART5;
第二类模块将ARM处理器的运行日志传输到BMC UART模块做日志记录,并将关键信息通过BMC UART5输出给第三MUX,通过侦测模块做智能识别侦测。
ARM处理器SOC为CPU,带外UART串口管理模块通过CPLD或FPGA实现。
1、将CPU0 UART0/1/2/4,CPU1 UART1分别连接到带外UART串口管理模块和BMC;2、带外UART串口管理模块会监控CPU0 UART0和CPU0 UART2的串口信息,当发生异常时会及时收集日志;3、带外UART串口管理模块按照预定策略进行研判处理,必要时传递给下游BMC进行收集;4、下游BMC可以将此信息记录在其内部SEL时间记录表内,同时可将相关信息发送给服务器运维人员;5、带外UART串口管理模块会同步实时监控CPU UART串口、BMC UART串口,按照预定策略传递到外部串口监控设备。可独立于ARM CPU之外来运行,并行收集多串口数据,抗干扰能力强,控制较灵活。
可以有效解决常规型设计不能并行收集串口信息,不能批量识别串口信息的缺点,最大化保障ARM服务器的稳定运行,使服务器串口管理更智能,对业务处理保障性更高。本发明中这种应用于ARM服务器的UART串口管理系统,它是一种拥有着多种功能、可独立运行的UART串口管理模块。它是对ARM处理器的UART串口进行并行处理,内有一套完整的UART串口控制逻辑,可对服务器的处理器、外设部件的串口信息进行监控,在出现异常情况时,快速进行安全控制、快速记录错误日志和远程监控上报等智能串口管理功能。
第二方面,本发明技术方案还提供一种应用于ARM服务器的UART串口管理方法,包括如下步骤:
通过侦测模块实时侦测第一类模块的串口信息;
当第一类模块的串口信息为正常打印时,将串口信息输出给BMC,还用于将串口信息通过MAX3232输出到外部机房管理系统中;
当识别第一类模块的串口信息出现异常关键字时,实时输出串口信息,同时将当前告警信息上报给外部机房管理系统,同时还通过带外UART串口管理模块做相应寄存器的记录;
侦测第一类模块的同时第二类模块将ARM处理器的运行日志传输到BMC做日志记录,将日志的关键信息输出给侦测模块进行智能识别侦测。
作为本发明技术方案的进一步限定,该方法具体包括:
当第一类模块的串口信息为正常打印时,通过第一MUX将串口信息汇总输出到第二MUX,第二MUX将其输出给BMC;还通过MAX 3232输入不同的特殊字符指令去切换通道将串口信息输出到外部机房管理系统中;
当识别第一类模块的串口信息出现异常关键字时,实时输出串口信息,同时通过第三MUX将当前告警信息传送给MAX3232,进而上报给外部机房管理系统中,同时还通过带外UART串口管理模块做相应寄存器的记录;
侦测第一类模块的同时第二类模块将ARM处理器的运行日志传输到BMC做日志记录,将关键信息通过BMC输出给第三MUX,通过侦测模块进行智能识别侦测,当出现告警、错误关键字时,及时上报给外部机房管理系统.
从以上技术方案可以看出,本发明具有以下优点:
可以有效解决常规型设计不能并行收集串口信息,不能批量识别串口信息的缺点,最大化保障ARM服务器的稳定运行,使服务器串口管理更智能,对业务处理保障性更高。本发明中这种应用于ARM服务器的UART串口管理系统,它是一种拥有着多种功能、可独立运行的UART串口管理模块。它是对ARM处理器的UART串口进行并行处理,内有一套完整的UART串口控制逻辑,可对服务器的处理器、外设部件的串口信息进行监控,在出现异常情况时,快速进行安全控制、快速记录错误日志和远程监控上报等智能串口管理功能。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的系统的示意性框图。
图2是本发明另一个实施例的系统的示意性框图。
图3是本发明一个实施例的方法的示意性流程图。
具体实施方式
以ARM服务器开机启动过程为例,如果在开机启动过程中出现了系统宕机、部件识别丢失等错误后,这种简单的处理器内部的串口管理方案不能实时收集UART串口的日志,无法全程监控服务器整机的健康状态,没有办法做到批量处理异常。一旦服务器出现启动失败,如果无法及时地定位故障源,快速屏蔽可纠正错误的话,则很有可能带来服务器的宕机,进而导致集群的崩溃,对用户造成数据丢失、业务中断等不可换回的损失,增加客户机房运维成本,影响机房整体环境的稳定运行。这就说明,如果没有一套智能的ARM服务器UART串口管理系统,就很难应对当今时代的数据业务激增的局面。
鉴于上述常规型ARM服务器对UART串口的管理仅使用单口端对端的系统,无法满足服务器在多场景的应用需求,使得服务器串口管理单一化、应用配置固定化,本发明是一种独立于ARM处理单元的带外UART串口管理方案,它可以有效解决常规型设计不能并行收集串口信息,不能批量识别串口信息的缺点,最大化保障ARM服务器的稳定运行,使服务器串口管理更智能,对业务处理保障性更高。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
如图1所示,本发明实施例提供一种应用于ARM服务器的UART串口管理系统,包括带外UART串口管理模块和分别与带外UART串口管理模块连接的ARM处理器SOC和BMC;ARM处理器SOC与BMC连接;
ARM处理器SOC,用于输出串口信息和ARM处理器的运行日志;
ARM处理器SOC,即CPU,是服务器的运行大脑,它在启动和运行过程中会输出大量日志,用来记录处理器运行的状态。主要是通过CPU0 UART0输出系统串口,主要打印CPUBIOS和OS的运行日志;CPU0 UART2输出OS debug相关的log;CPU0 UART1输出CPU0 SCP运行的log,主要是SOC核的运行日志;CPU UART4输出CPU0 ATF运行的log,主要是ARM ATF模块运行日志。
带外UART串口管理模块,用于对ARM处理器输出的串口信息进行研判处理,当判断ARM处理器出现异常时采用预设方案进行处理;还用于将ARM处理器的运行日志并行输出到BMC;
带外UART串口管理模块,主要是独立于CPU处理单元范围外的一套智能多功能的UART串口管理单元,它可由CPLD或FPGA来实现。它可对ARM处理器输出的UART串口信息进行自动研判,内有一套完整的串口信息控制逻辑,可对ARM处理器出现异常时采用预设方案进行隔离、快速记录错误日志和远程监控上报故障等智能串口管理功能。
BMC是一种基板管理控制器,用于收集带外UART串口管理模块传递过来的串口信息以及ARM处理器SOC输出的运行日志,并记录在内部SEL时间记录表内;同时可将相关信息发送给服务器运维人员进行及时告警提醒。它可收集上游带外UART串口管理模块传递过来的CPU UART的日志,和ARM处理器输出的SCP和ATF日志。
集成了ARM处理器SOC、带外UART串口管理模块、BMC,主要对ARM处理器SOC的UART串口、BMC的串口进行智能管理。在出现异常情况时,快速进行安全控制、快速记录错误日志和远程监控上报等智能串口管理功能。
具体的工作过程如下:
ARM处理器通过CPU0 UART0输出系统串口,主要打印CPU BIOS和OS的运行日志;CPU0 UART2输出OS debug相关的log;CPU0 UART1输出CPU0 SCP运行的log,主要是SOC核的运行日志;CPU UART4输出CPU0 ATF运行的log,主要是ARM ATF模块运行日志。
BMC作为异常日志记录保存单元,将UART串口管理单元的输出UART连接到BMCUART4,CPU0 UART1连接到BMC UART2,CPU0 UART4连接到BMC UART3,将CPU1 UART1连接到BMC UART1,这样可同时批量记录ARM服务器整机的运行log,并实时上报运行异常给运维人员。
带外UART串口管理模块是整个系统的控制中心,它可由CPLD或FPGA逻辑器件实现。
一方面,带外UART串口管理模块实时侦测CPU0 UART0输出系统串口、CPU0 UART2输出OS debug相关的log。当它内部解析发现有异常信息后,带外UART串口管理模块会依据预设方案进行紧急处理,比如发现处理器内存运行ECC错误,则带外UART串口管理模块将此内存ECC错误上报给ARM处理器,ARM处理器可在第一时间做出屏蔽内存坏块区间等操作。
另一方面,带外UART串口管理模块可实时将ARM处理器的运行日志并行输出到BMC进行归类记录,方便运维人员查看和调度,运维人员通过远程网络发现机器异常后,可调整整机运行的业务量,进而实现人为主动管理的功能。
再一方面,带外UART串口管理模块会同步实时监控CPU UART串口、BMC UART串口,按照预定策略传递到外部串口监控设备,可以实现在机房现场通过控制电脑观察机器运行状态,方便实现对此服务器进行现场运维管理。
如图2所示,本发明实施例提供一种应用于ARM服务器的UART串口管理系统,包括带外UART串口管理模块和分别与带外UART串口管理模块连接的ARM处理器SOC和BMC;ARM处理器SOC与BMC连接;
ARM处理器SOC,用于输出串口信息和ARM处理器的运行日志;
ARM处理器SOC,即CPU,是服务器的运行大脑,它在启动和运行过程中会输出大量日志,用来记录处理器运行的状态。主要是通过CPU0 UART0输出系统串口,主要打印CPUBIOS和OS的运行日志;CPU0 UART2输出OS debug相关的log;CPU0 UART1输出CPU0 SCP运行的log,主要是SOC核的运行日志;CPU UART4输出CPU0 ATF运行的log,主要是ARM ATF模块运行日志。
带外UART串口管理模块,用于对ARM处理器输出的串口信息进行研判处理,当判断ARM处理器出现异常时采用预设方案进行处理;还用于将ARM处理器的运行日志并行输出到BMC;
带外UART串口管理模块,主要是独立于CPU处理单元范围外的一套智能多功能的UART串口管理单元,它可由CPLD或FPGA来实现。它可对ARM处理器输出的UART串口信息进行自动研判,内有一套完整的串口信息控制逻辑,可对ARM处理器出现异常时采用预设方案进行隔离、快速记录错误日志和远程监控上报故障等智能串口管理功能。
BMC是一种基板管理控制器,用于收集带外UART串口管理模块传递过来的串口信息以及ARM处理器SOC输出的运行日志,并记录在内部SEL时间记录表内;同时可将相关信息发送给服务器运维人员进行及时告警提醒。它可收集上游带外UART串口管理模块传递过来的CPU UART的日志,和ARM处理器输出的SCP和ATF日志。
带外UART串口管理模块包括侦测模块,用于实时侦测ARM处理器SOC的串口信息,并识别串口信息的状态关键字,当串口信息为正常打印时,将串口信息输出给BMC,还用于将串口信息通过MAX3232输出到外部机房管理系统中。
侦测模块,还用于当识别串口信息出现异常时,实时输出串口信息,同时通过MAX3232上报给外部机房管理系统中。
带外UART串口管理模块包括与侦测模块连接的I2C从模块;
侦测模块,还用于当识别串口信息出现异常时,通过I2C从模块做相应寄存器的记录。
BMC包括与I2C从模块连接的I2C模块,BMC通过I2C模块读取I2C从模块的寄存器信息。
BMC包括与侦测模块连接的BMC UART模块,用于对ARM处理器SOC输出的运行日志做日志记录,并将日志的关键信息输出给带外UART串口管理模块;
侦测模块,用于对接收到的关键信息进行识别侦测,当出现告警、错误关键字时,及时上报给外部机房管理系统。
带外UART串口管理模块还包括第一MUX和与第一MUX连接的第二MUX;
BMC UART模块包括与第二MUX连接的BMC UART4;
ARM处理器SOC包括与第一类模块;
侦测模块,用于实时侦测ARM处理器SOC的第一类模块的串口信息,并识别串口信息的状态关键字,当串口信息为正常打印时,通过第一MUX将串口信息汇总输出到第二MUX,第二MUX会将其输出给BMC UART4。
侦测模块还包括分别与BMC UART模块、第一MUX和第二MUX连接的第三MUX,当识别第一类模块的串口信息出现异常时,实时输出串口信息,同时通过第三MUX将当前告警信息传送给MAX3232,通过MAX3232上报给外部机房管理系统中。
ARM处理器SOC包括与BMC UART模块连接的第二类模块;BMC UART模块包括BMCUART5;
第二类模块将ARM处理器的运行日志传输到BMC UART模块做日志记录,并将关键信息通过BMC UART5输出给第三MUX,通过侦测模块做智能识别侦测。
将CPU0 UART0/1/2/4,CPU1 UART1分别连接到带外UART串口管理模块和BMC;带外UART串口管理模块会监控CPU0 UART0和CPU0 UART2的串口信息,当发生异常时会及时收集日志;带外UART串口管理模块按照预定策略进行研判处理,必要时传递给下游BMC进行收集;下游BMC可以将此信息记录在其内部SEL时间记录表内,同时可将相关信息发送给服务器运维人员;带外UART串口管理模块会同步实时监控CPU UART串口、BMC UART串口,按照预定策略传递到外部串口监控设备。可独立于ARM CPU之外来运行,并行收集多串口数据,抗干扰能力强,控制较灵活。
具体的,a)通过侦测模块(在这里是UART DETECT模块)实时侦测CPU UART0和UART1的串口信息,可智能识别其串口信息的告警、错误等关键字,例如error、fatal、warning。
b)当CPU UART0和UART1的串口信息为正常打印时,可通过第一MUX将其汇总输出到第二MUX,第二MUX会将其输出给BMC UART4。若机房管理人员想不定期查看当前CPUUART0和UART1的串口信息,则可以通过MAX 3232输入不同的特殊字符指令去切换通道。比如:$%&*0代表将CPU0 UART0通过MAX3232输出到外部机房管理系统中,$%&*1代表将CPU0UART1通过MAX3232输出到外部机房管理系统中.
c)当识别CPU UART0和UART1的串口信息出现异常关键字时,CPLD实时输出CPUUART的信息,可同时通过第三MUX将当前告警信息传送给MAX3232,进而上报给外部机房管理系统中,同时还可通过CPLD内部的I2C SLAVE做相应寄存器的记录,BMC可通过I2C模块读取到相应的异常状态,机房运维人员还可通过BMC的网络做远程访问管理,以便做出关机保护、隔离异常、处理故障等操作。
d)同时CPU0 UART1/4、CPU1 UART1会传输到BMC UART模块做日志记录,可通过BMC的网络做远程访问管理,并可将关键信息通过BMC UART5输出给CPLD的第三MUX,CPLD做智能识别侦测。当出现告警、错误等关键字时,也可及时上报给外部机房管理系统。
带外UART串口管理模块,它内部拥有着智能研判串口数据的控制逻辑,可独立于ARM CPU之外来运行,并行收集多串口数据,抗干扰能力强,控制较灵活。本发明中这种应用于ARM服务器的UART串口管理系统,它是一种拥有着多种功能、可独立运行的UART串口管理模块。可解决因系统崩溃、错误堆积等问题而造成ARM CPU无法自我判断控制的问题,最大化保障ARM服务器的稳定启动,对业务处理保障性更高。它可以更好的对ARM服务器集群进行有效的智能管理,提高机房运维的效率,最大化的利用ARM服务器的性能,节约成本。
带外UART串口管理模块的UART切换逻辑代码包括如下:
    
Figure BDA0004085653460000171
Figure BDA0004085653460000181
Figure BDA0004085653460000191
Figure BDA0004085653460000201
如图3所示,本发明实施例还提供一种应用于ARM服务器的UART串口管理方法,包括如下步骤:
步骤1:通过侦测模块实时侦测第一类模块的串口信息;
步骤2:当第一类模块的串口信息为正常打印时,将串口信息输出给BMC,还用于将串口信息通过MAX3232输出到外部机房管理系统中;
步骤3:当识别第一类模块的串口信息出现异常关键字时,实时输出串口信息,同时将当前告警信息上报给外部机房管理系统,同时还通过带外UART串口管理模块做相应寄存器的记录;
步骤4:侦测第一类模块的同时第二类模块将ARM处理器的运行日志传输到BMC做日志记录,将日志的关键信息输出给侦测模块进行智能识别侦测。
本发明实施例还提供一种应用于ARM服务器的UART串口管理方法,包括如下步骤:
S1:通过侦测模块实时侦测第一类模块的串口信息;
S2:当第一类模块的串口信息为正常打印时,通过第一MUX将串口信息汇总输出到第二MUX,第二MUX将其输出给BMC;还通过MAX 3232输入不同的特殊字符指令去切换通道将串口信息输出到外部机房管理系统中;
S4:当识别第一类模块的串口信息出现异常关键字时,实时输出串口信息,同时通过第三MUX将当前告警信息传送给MAX3232,进而上报给外部机房管理系统中,同时还通过带外UART串口管理模块做相应寄存器的记录;
S4:侦测第一类模块的同时第二类模块将ARM处理器的运行日志传输到BMC做日志记录,将关键信息通过BMC输出给第三MUX,通过侦测模块进行智能识别侦测。
结合上述实施例提供的系统,本发明实施例提供的方法具体包括:
具体的,a)通过侦测模块(在这里是UART DETECT模块)实时侦测CPU UART0和UART1的串口信息,可智能识别其串口信息的告警、错误等关键字,例如error、fatal、warning。
b)当CPU UART0和UART1的串口信息为正常打印时,可通过第一MUX将其汇总输出到第二MUX,第二MUX会将其输出给BMC UART4。若机房管理人员想不定期查看当前CPUUART0和UART1的串口信息,则可以通过MAX 3232输入不同的特殊字符指令去切换通道。比如:$%&*0代表将CPU0 UART0通过MAX3232输出到外部机房管理系统中,$%&*1代表将CPU0UART1通过MAX3232输出到外部机房管理系统中.
c)当识别CPU UART0和UART1的串口信息出现异常关键字时,CPLD实时输出CPUUART的信息,可同时通过第三MUX将当前告警信息传送给MAX3232,进而上报给外部机房管理系统中,同时还可通过CPLD内部的I2C从模块(指的是I2C SLAVE)做相应寄存器的记录,BMC可通过I2C模块读取到相应的异常状态,机房运维人员还可通过BMC的网络做远程访问管理,以便做出关机保护、隔离异常、处理故障等操作。
d)同时CPU0 UART1/4、CPU1 UART1会传输到BMC UART模块做日志记录,可通过BMC的网络做远程访问管理,并可将关键信息通过BMC UART5输出给CPLD的第三MUX,CPLD做智能识别侦测。当出现告警、错误等关键字时,也可及时上报给外部机房管理系统。
从批量管理、最大化利用等层面独立于CPU处理单元而完成了ARM CPU的UART串口的智能控制,拥有对ARM CPU的BIOS/OS/SCP/ATF等多个串口并行侦测;对ARM CPU的串口日志存储控制权进行管理;对ARM CPU的运行状态进行记录等操作,实现对ARM服务器系统的串口日志智能管理,此发明智能可靠,安全便捷。
本发明同样可应用到其他带有ARM CPU平台的数据存储机、个人电脑和工业控制等设备中,可从硬件系统设计层面实现对ARM机器的SCP固件安全进行智能管理。节约后期机房维护成本,智能控制,多样管理。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种应用于ARM服务器的UART串口管理系统,其特征在于,包括带外UART串口管理模块和分别与带外UART串口管理模块连接的ARM处理器SOC和BMC;ARM处理器SOC与BMC连接;
ARM处理器SOC,用于输出串口信息和ARM处理器的运行日志;
带外UART串口管理模块,用于对ARM处理器输出的串口信息进行研判处理,当判断ARM处理器出现异常时采用预设方案进行处理;还用于将ARM处理器的运行日志并行输出到BMC;
BMC,用于收集带外UART串口管理模块传递过来的串口信息以及ARM处理器SOC输出的运行日志并进行记录;同时将相关信息发送给服务器运维人员进行及时告警提醒。
2.根据权利要求1所述的应用于ARM服务器的UART串口管理系统,其特征在于,带外UART串口管理模块包括侦测模块,用于实时侦测ARM处理器SOC的串口信息,并识别串口信息的状态关键字,当串口信息为正常打印时,将串口信息输出给BMC,还用于将串口信息通过MAX3232输出到外部机房管理系统中。
3.根据权利要求2所述的应用于ARM服务器的UART串口管理系统,其特征在于,侦测模块,还用于当识别串口信息出现异常时,实时输出串口信息,同时通过MAX3232上报给外部机房管理系统中。
4.根据权利要求3所述的应用于ARM服务器的UART串口管理系统,其特征在于,带外UART串口管理模块包括与侦测模块连接的I2C从模块;
侦测模块,还用于当识别串口信息出现异常时,通过I2C从模块做相应寄存器的记录。
5.根据权利要求4所述的应用于ARM服务器的UART串口管理系统,其特征在于,BMC包括与I2C从模块连接的I2C模块,BMC通过I2C模块读取I2C从模块的寄存器信息。
6.根据权利要求5所述的应用于ARM服务器的UART串口管理系统,其特征在于,BMC包括与侦测模块连接的BMC UART模块,用于对ARM处理器SOC输出的运行日志做日志记录,并将日志的关键信息输出给带外UART串口管理模块;
侦测模块,用于对接收到的关键信息进行识别侦测,当出现告警、错误关键字时,及时上报给外部机房管理系统。
7.根据权利要求6所述的应用于ARM服务器的UART串口管理系统,其特征在于,带外UART串口管理模块还包括第一MUX和与第一MUX连接的第二MUX;
BMC UART模块包括与第二MUX连接的BMC UART4;
ARM处理器SOC包括与第一类模块;
侦测模块,用于实时侦测ARM处理器SOC的第一类模块的串口信息,并识别串口信息的状态关键字,当串口信息为正常打印时,通过第一MUX将串口信息汇总输出到第二MUX,第二MUX会将其输出给BMC UART4。
8.根据权利要求7所述的应用于ARM服务器的UART串口管理系统,其特征在于,侦测模块还包括分别与BMC UART模块、第一MUX和第二MUX连接的第三MUX,当识别第一类模块的串口信息出现异常时,实时输出串口信息,同时通过第三MUX将当前告警信息传送给MAX3232,通过MAX3232上报给外部机房管理系统中。
9.根据权利要求8所述的应用于ARM服务器的UART串口管理系统,其特征在于,ARM处理器SOC包括与BMC UART模块连接的第二类模块;BMC UART模块包括BMC UART5;
第二类模块将ARM处理器的运行日志传输到BMC UART模块做日志记录,并将关键信息通过BMC UART5输出给第三MUX,通过侦测模块做智能识别侦测。
10.一种应用于ARM服务器的UART串口管理方法,其特征在于,包括如下步骤:
通过侦测模块实时侦测第一类模块的串口信息;
当第一类模块的串口信息为正常打印时,将串口信息输出给BMC,还用于将串口信息通过MAX3232输出到外部机房管理系统中;
当识别第一类模块的串口信息出现异常关键字时,实时输出串口信息,同时将当前告警信息上报给外部机房管理系统,同时还通过带外UART串口管理模块做相应寄存器的记录;
侦测第一类模块的同时第二类模块将ARM处理器的运行日志传输到BMC做日志记录,将日志的关键信息输出给侦测模块进行智能识别侦测。
CN202310101914.6A 2023-02-10 2023-02-10 一种应用于arm服务器的uart串口管理系统及方法 Pending CN116126772A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310101914.6A CN116126772A (zh) 2023-02-10 2023-02-10 一种应用于arm服务器的uart串口管理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310101914.6A CN116126772A (zh) 2023-02-10 2023-02-10 一种应用于arm服务器的uart串口管理系统及方法

Publications (1)

Publication Number Publication Date
CN116126772A true CN116126772A (zh) 2023-05-16

Family

ID=86297123

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310101914.6A Pending CN116126772A (zh) 2023-02-10 2023-02-10 一种应用于arm服务器的uart串口管理系统及方法

Country Status (1)

Country Link
CN (1) CN116126772A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116719712A (zh) * 2023-08-09 2023-09-08 金舟远航(北京)信息产业有限公司 处理器串口日志输出方法、装置、电子设备及存储介质
CN116881091A (zh) * 2023-09-08 2023-10-13 深圳云豹智能有限公司 系统事件日志上报方法、装置、芯片、设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116719712A (zh) * 2023-08-09 2023-09-08 金舟远航(北京)信息产业有限公司 处理器串口日志输出方法、装置、电子设备及存储介质
CN116719712B (zh) * 2023-08-09 2024-01-19 金舟远航(北京)信息产业有限公司 处理器串口日志输出方法、装置、电子设备及存储介质
CN116881091A (zh) * 2023-09-08 2023-10-13 深圳云豹智能有限公司 系统事件日志上报方法、装置、芯片、设备及存储介质
CN116881091B (zh) * 2023-09-08 2024-05-28 深圳云豹智能有限公司 系统事件日志上报方法、装置、芯片、设备及存储介质

Similar Documents

Publication Publication Date Title
CN116126772A (zh) 一种应用于arm服务器的uart串口管理系统及方法
CN110175451A (zh) 一种基于电力云的安全监控方法和系统
CN100409125C (zh) 一种监控系统
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN103905255A (zh) 服务器内部硬件运行故障远程自动告警系统及方法
CN111131936B (zh) 一种光模块的监控方法、监控装置、交换机及存储介质
CN100370756C (zh) 系统的复位处理方法及装置
CN114328102B (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN106100884A (zh) 变电站监控设备运行异常的告警方法
CN111488050B (zh) 一种电源监控方法、系统及服务器
CN107943670A (zh) 一种ups电源设备监控系统
CN111858411A (zh) 实现服务器Expander卡带外交互的系统及方法
CN112601216A (zh) 一种基于Zigbee的可信平台告警方法与系统
CN112882901A (zh) 一种分布式处理系统健康状态智能监控器
CN103995759B (zh) 基于核内外协同的高可用计算机系统故障处理方法及装置
CN107943654A (zh) 一种快速判定服务器环境温度监控异常原因的方法
CN113176982A (zh) 一种基于vpx架构机箱管理系统的实现装置及方法
CN206460446U (zh) 一种针对加固计算机主板的监控装置
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
CN212645787U (zh) 一种机房动力环境监测系统
CN111274089B (zh) 一种基于旁路技术的服务器异常行为感知系统
CN104410376A (zh) 一种带有故障监控的功率放大器系统
CN113741656A (zh) 一种基于vpx架构的机箱管理系统及方法
CN114528163A (zh) 一种服务器故障硬盘自动定位系统、方法及装置
CN113342596A (zh) 一种设备指标的分布式监控方法、系统及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination