CN116185799A - 中断时间获取方法、装置、系统、通信设备及存储介质 - Google Patents

中断时间获取方法、装置、系统、通信设备及存储介质 Download PDF

Info

Publication number
CN116185799A
CN116185799A CN202310139180.0A CN202310139180A CN116185799A CN 116185799 A CN116185799 A CN 116185799A CN 202310139180 A CN202310139180 A CN 202310139180A CN 116185799 A CN116185799 A CN 116185799A
Authority
CN
China
Prior art keywords
time
smi
ipmi
bmc
shared memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310139180.0A
Other languages
English (en)
Inventor
唐建亮
董雪英
芦飞
李道童
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310139180.0A priority Critical patent/CN116185799A/zh
Publication of CN116185799A publication Critical patent/CN116185799A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/302Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明实施例提供了一种中断时间获取方法、装置、通信设备及存储介质,包括:在检测到OS运行时产生错误,触发SMI的情况下,计时模块通过定时寄存器获取SMI总用时以及通过定时寄存器获取IPMI发送信息用时,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至BMC的时间;BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时和SMI总用时。通过BMC时间分析模块获取中断时间,即带外方式获取SMI总用时,无需额外获取OS登陆权限,且获取SMI总用时的过程较为简便,解决了获取错误触发SMI至SMI结束所花费的时间效率较低的问题。

Description

中断时间获取方法、装置、系统、通信设备及存储介质
技术领域
本发明涉及计算机应用技术领域,特别涉及一种中断时间获取方法、装置、系统、通信设备及存储介质。
背景技术
目前的计算机基本上都是24小时不间断运行,在这种情况下计算机操作系统(Operating System,OS)产生一些故障错误是比较正常的,但当CE错误或者非致命错误出现次数过多,进入错误触发系统管理中断(System Management Interrupt,SMI)至SMI结束所花费得时间过长的话就很容易影响业务的正常运行。因此,如何获取错误触发SMI至SMI结束所花费的时间显得尤为重要。
现有技术中,一般通过获取OS登陆权限去带内获取错误触发SMI至SMI结束所花费的时间,然而现有的这种方式不仅需要额外获取OS登录权限,而且带内获取错误触发SMI至SMI结束所花费的时间过程也较为复杂,因此,该种方式会导致获取错误触发SMI至SMI结束所花费的时间效率较低的问题。
发明内容
本发明实施例的目的在于提供一种中断时间获取方法、装置、系统、通信设备及存储介质,解决因需要额外获取OS登陆权限,且带内获取错误触发SMI至SMI结束所花费的时间过程也较为复杂,导致的获取错误触发SMI至SMI结束所花费的时间效率较低的问题,具体技术方案如下:
在本发明实施的第一方面,首先提供了一种中断时间获取方法,所述方法包括:
在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将所述SMI总用时存储至共享内存;
所述计时模块通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时,将所述IPMI发送信息用时存储至所述共享内存,并将所述共享内存的更新标志位设置为1,其中,所述IPMI发送信息用时为所述计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将所述错误记录发送至基板管理控制器BMC的时间;
BMC时间分析模块通过循环读更新标志位的方式从所述共享内存中获取所述IPMI发送信息用时,以及,所述SMI总用时。
可选地,在所述在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下的步骤之前,所述方法还包括:
在接收到上电指令的情况下,服务初始化模块初始化BIOS运行时服务内存和BIOS运行时服务。
可选地,在所述计时模块通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时的步骤之前,所述方法还包括:
BMC初始化模块预先分配一块共享内存,并将所述共享内存映射至BIOS内存,以使所述BIOS和BMC对所述共享内存进行读写访问。
可选地,所述方法还包括:
BMC时间分析模块对所述共享内存进行访问,并读取所述共享内存的更新标志位;
判断所述共享内存的更新标志位是否是1;
若是1,则基于获取到的所述IPMI发送信息用时,所述SMI总用时,SMI触发次数和错误类型,生成日志,以及,按照预先设置的数据存储格式将所述日志存储至所述BMC的内存,并将所述共享内存的更新标志位设置为0。
可选地,所述方法还包括:
BMC时间分析模块基于所述BMC的内存中存储的所述日志,判断所述日志的数量是否大于预先设置的第一阈值;
若大于,则通过调用绘图工具对所述日志进行数据分析,将所述日志进行可视化显示。
可选地,所述方法还包括:
BMC时间分析模块基于所述BMC的内存中存储的所述日志,判断所述日志的数量是否大于预先设置的第二阈值;
若大于,则通过调用绘图工具对所述日志进行数据分析,生成可视化数据,并将所述可视化数据发送至用户,其中,所述可视化数据可以包括所述SMI总用时的最大值,以及,基于所述可视化数据判断所述SMI总用时的最大值是否大于预先设置的第三阈值;
若大于,则生成告警信息,并将所述告警信息发送至所述用户。
在本发明实施的第二方面,还提供了一种中断时间获取装置,包括:
SMI总用时获取模块,用于在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将所述SMI总用时存储至共享内存;
IPMI发送信息用时获取模块,用于所述计时模块通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时,将所述IPMI发送信息用时存储至所述共享内存,并将所述共享内存的更新标志位设置为1,其中,所述IPMI发送信息用时为所述计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将所述错误记录发送至基板管理控制器BMC的时间;
中断时间获取模块,用于BMC时间分析模块通过循环读更新标志位的方式从所述共享内存中获取所述IPMI发送信息用时,以及,所述SMI总用时。
可选地,所述装置还包括:
初始化模块,用于在接收到上电指令的情况下,服务初始化模块初始化BIOS运行时服务内存和BIOS运行时服务。
可选地,所述装置还包括:
内存分配模块,用于BMC初始化模块预先分配一块共享内存,并将所述共享内存映射至BIOS内存,以使所述BIOS和BMC对所述共享内存进行读写访问。
可选地,所述装置还包括:
读取更新标志位模块,用于BMC时间分析模块对所述共享内存进行访问,并读取所述共享内存的更新标志位;
第一数据判断模块,用于判断所述共享内存的更新标志位是否是1;
日志生成模块,用于若是1,则基于获取到的所述IPMI发送信息用时,所述SMI总用时,SMI触发次数和错误类型,生成日志,以及,按照预先设置的数据存储格式将所述日志存储至所述BMC的内存,并将所述共享内存的更新标志位设置为0。
可选地,所述装置还包括:
第二数据判断模块,用于BMC时间分析模块基于所述BMC的内存中存储的所述日志,判断所述日志的数量是否大于预先设置的第一阈值;
数据可视化显示模块,用于若大于,则通过调用绘图工具对所述日志进行数据分析,将所述日志进行可视化显示。
可选地,所述装置还包括:
第三数据判断模块,用于BMC时间分析模块基于所述BMC的内存中存储的所述日志,判断所述日志的数量是否大于预先设置的第二阈值;
第四数据判断模块,用于若大于,则通过调用绘图工具对所述日志进行数据分析,生成可视化数据,并将所述可视化数据发送至用户,其中,所述可视化数据可以包括所述SMI总用时的最大值,以及,基于所述可视化数据判断所述SMI总用时的最大值是否大于预先设置的第三阈值;
告警模块,用于若大于,则生成告警信息,并将所述告警信息发送至所述用户。
在本发明实施的第三方面,还提供了一种中断时间获取系统,包括:
服务初始化模块,用于初始化BIOS运行时服务内存和BIOS运行时服务;
计时模块,用于通过定时寄存器获取SMI总用时,并将所述SMI总用时存储至共享内存,通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时,将所述IPMI发送信息用时存储至所述共享内存,并将所述共享内存的更新标志位设置为1,其中,所述IPMI发送信息用时为所述计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将所述错误记录发送至基板管理控制器BMC的时间;
BMC时间分析模块,用于通过循环读更新标志位的方式从所述共享内存中获取所述IPMI发送信息用时,以及,所述SMI总用时。
在本发明实施的第四方面,还提供了一种通信设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;
所述处理器,用于读取存储器中的程序实现如第一方面任一所述的中断时间获取方法。
在本发明实施的第五方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机实现如第一方面任一所述的中断时间获取方法。
本发明实施例提供的中断时间获取方法,通过在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存;计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间;BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。本发明通过BMC中所包含的BMC时间分析模块获取中断时间,即带外方式获取SMI总用时,不需要额外获取OS登陆权限去带内获取SMI总用时,且该种方式获取SMI总用时更为简便,进而解决了获取SMI总用时效率较低的技术问题,进一步地达到了提高获取SMI总用时效率的技术效果;另外,本发明通过IPMI实现了BMC和BIOS之间的数据交互,由于IPMI能够横跨不同的操作系统、固件和硬件平台,可以智能的监视、控制和自动回报大量服务器的运作状况,进而能够达到降低服务器系统成本的技术效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的中断时间获取方法的步骤流程图一;
图2是本发明实施例提供的中断时间获取方法的步骤流程图二;
图3是本发明实施例提供的中断时间获取方法的步骤流程图三;
图4是本发明实施例提供的中断时间获取方法的步骤流程图四;
图5是本发明实施例提供的一种中断时间获取装置的结构示意图;
图6是本发明实施例提供的一种中断时间获取系统的结构示意图;
图7是本发明实施例提供的一种通信设备示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
参照图1,示出了本发明实施例提供的中断时间获取方法的步骤流程图一,所述方法可以包括:
步骤101,在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存。
需要说明的是,在本发明实施例中,当计算机启动后,操作系统(OperatingSystem,OS)在运行时产生了错误,且该错误触发了系统管理中断(System ManagementInterrupt,SMI)的情况下,基本输入输出系统(Basic Input Output System,BIOS)里所包含的计时模块可通过中央处理器(central processing unit,CPU)内部集成的定时寄存器中获取该次错误从触发系统管理中断至系统管理中断结束所花费的时间,也即SMI总用时。具体地,定时寄存器能够记录时间,在错误触发SMI时,计时模块可直接从定时寄存器中获取错误触发SMI时定时寄存器中所记录的一个时间数据;在SMI结束时,计时模块可直接从定时寄存器中获取SMI结束时定时寄存器中所记录的一个时间数据;计时模块根据获取到的触发SMI时定时寄存器中所记录的一个时间数据和SMI结束时定时寄存器中所记录的一个时间数据,将两个时间数据进行作差,即可得到SMI总用时。BIOS里包含的计时模块在获取到SMI总用时之后,可以先将SMI总用时暂时存储至BIOS运行时服务,进一步地可以将SMI总用时发送至共享内存中进行存储,以便BMC时间分析模块能够从共享内存中获取SMI总用时。
进一步地,在本发明实施例中,在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下的步骤之前,该方法还包括:在接收到上电指令的情况下,服务初始化模块初始化BIOS运行时服务内存和BIOS运行时服务。
需要说明的是,在本发明实施例中,计算机在接收到上电指令的情况下,开始进行上电过程,在上电过程中BIOS里所包含的服务初始化模块执行初始化BIOS运行时服务内存和BIOS运行时服务。
本发明通过服务初始化模块对BIOS运行时服务内存和BIOS运行时服务进行初始化,实现了为BIOS运行时服务提供了运行空间,即BIOS运行时服务内存,使得BIOS运行时服务能够正常工作,进一步地,能够通过BIOS运行时服务达到暂时存储SMI总用时的技术目的。
步骤102,计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间。
需要说明的是,在本发明实施例中,BIOS里包含的计时模块同时还能够通过定时寄存器获取智能平台管理接口(Intelligent Platform Management Interface,IPMI)发送信息用时,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器(Baseboard Management Controller,BMC)所花费的时间。具体地,在从存储错误记录的寄存器中获取错误记录时,计时模块可直接从定时寄存器中获取从存储错误记录的寄存器中获取错误记录时定时寄存器中所记录的一个时间数据;在通过IPMI将错误记录发送至BMC时,计时模块可直接从定时寄存器中获取将错误记录发送至BMC时定时寄存器中所记录的一个时间数据;计时模块根据获取到的从存储错误记录的寄存器中获取错误记录时定时寄存器中所记录的一个时间数据和通过IPMI将错误记录发送至BMC时定时寄存器中所记录的一个时间数据,将两个时间数据进行作差,即可得到IPMI发送信息用时。在计时模块获取到IPMI发送信息用时后,将IPMI发送信息用时发送至BMC所分配的共享内存中进行存储,并将共享内存的更新标志位设置为1。
进一步地,在本发明实施例中,在计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时的步骤之前,该方法还包括:BMC初始化模块预先分配一块共享内存,并将共享内存映射至BIOS内存,以使BIOS和BMC对共享内存进行读写访问。
需要说明的是,在本发明实施例中,BMC里所包含的BMC初始化模块可预先分配出一块共享内存,并将该共享内存映射至BIOS内存,以使BIOS和BMC能够对共享内存进行访问,读数据以及写数据。
本发明通过BMC里所包含的BMC初始化模块将预先设置的共享内存映射至BIOS里的BIOS内存,使得BIOS和BMC均能够对共享内存进行访问,读数据以及写数据,进一步地,能够通过共享内存达到存储IPMI发送信息用时的技术目的。
步骤103,BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。
需要说明的是,在本发明实施例中,BMC里所包含的BMC时间分析模块可通过循环读取共享内存中的更新标志位的方式从共享内存中获取IPMI发送信息用时和SMI总用时。
本发明实施例提供的中断时间获取方法,通过在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存;计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间;BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。本发明通过BMC中所包含的BMC时间分析模块获取中断时间,即带外方式获取SMI总用时,不需要额外获取OS登陆权限去带内获取SMI总用时,且该种方式获取SMI总用时更为简便,进而解决了获取SMI总用时效率较低的技术问题,进一步地达到了提高获取SMI总用时效率的技术效果;另外,本发明通过IPMI实现了BMC和BIOS之间的数据交互,由于IPMI能够横跨不同的操作系统、固件和硬件平台,可以智能的监视、控制和自动回报大量服务器的运作状况,进而能够达到降低服务器系统成本的技术效果。
进一步地,如图2所示,在本发明实施例中,该方法还可以包括以下步骤:
步骤201,BMC时间分析模块对共享内存进行访问,并读取共享内存的更新标志位。
步骤202,判断共享内存的更新标志位是否是1。
需要说明的是,在本发明实施例中,BMC里所包含的BMC时间分析模块通过对共享内存进行访问,能够读取到共享内存的更新标志位,其中,共享内存的更新标志位可以是1,也可以是0。在BMC时间分析模块读取到共享内存的更新标志位的情况下,判断共享内存的更新标志位是否为1.
步骤203,若是1,则基于获取到的IPMI发送信息用时,SMI总用时,SMI触发次数和错误类型,生成日志,以及,按照预先设置的数据存储格式将日志存储至BMC的内存,并将共享内存的更新标志位设置为0。
需要说明的是,在本发明实施例中,在BMC时间分析模块判断出共享内存的更新标志位是1的情况下,根据获取到的IPMI发送信息用时,SMI总用时,SMI触发次数和错误类型,生成日志;其中,SMI触发次数和错误类型的具体获取方式是BIOS通过IPMI将SMI触发次数和错误类型发送至BMC的,SMI触发次数指的是本次SMI是第几次触发,错误类型可以包括但不限于内存ce,内存uce,CPU ce,IERR,PCIE CE,PCIE UCE。在BMC时间分析模块生成日志之后,可按照预先设置的数据存储格式将日志存储至BMC的内存,并将共享内存的更新标志位设置为0。其中,预先设置的数据存储格式可以是SMI总用时、SMI触发次数、错误类型以及IPMI发送信息用时。
本发明通过BMC里所包含的BMC时间分析模块将获取到的IPMI发送信息用时,SMI总用时,SMI触发次数和错误类型,生成日志,并按照预先设置的数据存储格式将日志存储至BMC的内存,使得用户能够通过BMC直接获取到错误触发系统管理中断至系统管理中断结束中间所产生的详细数据,进而更加方便了开发人员、测试人员和客户去监控SMI总用时,进一步地,在提高了获取SMI总用时的效率的同时,还达到了提升用户体验的技术效果。
进一步地,如图3所示,在本发明实施例中,该方法还可以包括以下步骤:
步骤301,BMC时间分析模块基于BMC的内存中存储的日志,判断日志的数量是否大于预先设置的第一阈值。
需要说明的是,在本发明实施例中,错误触发一次SMI,BMC时间分析模块就会生成一条日志,所以BMC的内存中将存储有若干条日志。BMC时间分析模块根据BMC的内存中存储的日志数量,判断日志的数量是否大于预先设置的第一阈值;其中,预先设置的第一阈值可以是10,本发明对第一阈值的数值不作具体限定。
步骤302,若大于,则通过调用绘图工具对日志进行数据分析,将日志进行可视化显示。
需要说明的是,在本发明实施例中,若BMC时间分析模块判断出日志的数量大于预先设置的第一阈值,BMC时间分析模块将调用绘图工具对BMC的内存中存储的所有日志进行数据分析,并将日志进行可视化显示。例如:BMC时间分析模块可通过调用python的绘图库Matplotlib对BMC的内存中存储的所有日志进行数据分析,生成折线图,同时显示出触发n次SMI中断总用时的平均值,SMI总用时的最大值和SMI总用时的最小值。
本发明通过BMC里所包含的BMC时间分析模块将日志进行可视化显示,使得开发人员、测试人员和客户能够更加直观地监控SMI总用时,提升了用户的使用体验;另外,本发明通过调用绘图工具自动对日志进行数据分析,避免了手动去分析日志产生的失误,同时还节省了人力时间,给研发测试提供了极大方便,即对故障诊断测试的应用场景有非常显著的效果。
进一步地,如图4所示,在本发明实施例中,该方法还可以包括以下步骤:
步骤401,BMC时间分析模块基于BMC的内存中存储的日志,判断日志的数量是否大于预先设置的第二阈值。
需要说明的是,在本发明实施例中,BMC时间分析模块根据BMC的内存中存储的日志数量,判断日志的数量是否大于预先设置的第二阈值;其中,预先设置的第二阈值可以是1000,本发明对第二阈值的数值不作具体限定。
步骤402,若大于,则通过调用绘图工具对日志进行数据分析,生成可视化数据,并将可视化数据发送至用户,其中,可视化数据可以包括SMI总用时的最大值,以及,基于可视化数据判断SMI总用时的最大值是否大于预先设置的第三阈值。
需要说明的是,在本发明实施例中,若BMC时间分析模块判断出日志的数量大于预先设置的第二阈值,BMC时间分析模块将调用绘图工具对BMC的内存中存储的所有日志进行数据分析,生成可视化数据。例如:可视化数据可以是基于BMC的内存中存储的所有日志生成的折线图。在得到可视化数据之后,可以直接将可视化数据邮件发送至用户,该用户可以是运维人员。也可以在将可视化数据发送至用户之前,将可视化数据进行压缩,生成1份压缩存档文件,将该份压缩存档文件发送至用户。
进一步地,由于可视化数据中包括SMI总用时的最大值,BMC时间分析模块需要基于可视化数据判断SMI总用时的最大值是否大于预先设置的第三阈值;其中,预先设置的第三阈值可以是300ms,本发明对预先设置的第三阈值的数值不作具体限定。
步骤403,若大于,则生成告警信息,并将告警信息发送至用户。
需要说明的是,在本发明实施例中,若BMC时间分析模块判断出SMI总用时的最大值大于预先设置的第三阈值,BMC时间分析模块将生成告警信息,并将告警信息发送至用户,以使用户能够及时获知相应人员尽快来检查SMI中断总用时过长的原因。
本发明在日志数量过多的情况下,通过对日志进行数据分析生成可视化数据,实现了对日志的整合,使得开发人员、测试人员和客户能够随时远程监控SMI总用时,进而能够满足用户更加丰富的使用需求;另外,本发明在SMI总用时的最大值过大时,通过BMC时间分析模块生成告警信息,并进行告警,与此同时将告警信息发送至用户,使得用户能够及时获知SMI总用时的最大值过大这一信息,并针对该种情况进行维护,进而能够达到避免影响业务的正常运行的技术效果。
参照图5,示出了本发明实施例提供的一种中断时间获取装置的结构示意图,该装置可以包括:
SMI总用时获取模块501,用于在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存;
IPMI发送信息用时获取模块502,用于计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间。
中断时间获取模块503,用于BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。
进一步地,该装置还包括:
初始化模块,用于在接收到上电指令的情况下,服务初始化模块初始化BIOS运行时服务内存和BIOS运行时服务。
进一步地,该装置还包括:
内存分配模块,用于BMC初始化模块预先分配一块共享内存,并将共享内存映射至BIOS内存,以使BIOS和BMC对共享内存进行读写访问。
进一步地,该装置还包括:
读取更新标志位模块,用于BMC时间分析模块对共享内存进行访问,并读取共享内存的更新标志位;
第一数据判断模块,用于判断共享内存的更新标志位是否是1;
日志生成模块,用于若是1,则基于获取到的IPMI发送信息用时,SMI总用时,SMI触发次数和错误类型,生成日志,以及,按照预先设置的数据存储格式将日志存储至BMC的内存,并将共享内存的更新标志位设置为0。
进一步地,该装置还包括:
第二数据判断模块,用于BMC时间分析模块基于BMC的内存中存储的日志,判断日志的数量是否大于预先设置的第一阈值;
数据可视化显示模块,用于若大于,则通过调用绘图工具对日志进行数据分析,将日志进行可视化显示。
进一步地,该装置还包括:
第三数据判断模块,用于BMC时间分析模块基于BMC的内存中存储的日志,判断日志的数量是否大于预先设置的第二阈值;
第四数据判断模块,用于若大于,则通过调用绘图工具对日志进行数据分析,生成可视化数据,并将可视化数据发送至用户,其中,可视化数据可以包括SMI总用时的最大值,以及,基于可视化数据判断SMI总用时的最大值是否大于预先设置的第三阈值;
告警模块,用于若大于,则生成告警信息,并将告警信息发送至用户。
本发明实施例提供的中断时间获取装置,通过在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存;计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间;BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。本发明通过BMC中所包含的BMC时间分析模块获取中断时间,即带外方式获取SMI总用时,不需要额外获取OS登陆权限去带内获取SMI总用时,且该种方式获取SMI总用时更为简便,进而解决了获取SMI总用时效率较低的技术问题,进一步地达到了提高获取SMI总用时效率的技术效果;本发明通过IPMI实现了BMC和BIOS之间的数据交互,由于IPMI能够横跨不同的操作系统、固件和硬件平台,可以智能的监视、控制和自动回报大量服务器的运作状况,进而能够达到降低服务器系统成本的技术效果;本发明通过服务初始化模块对BIOS运行时服务内存和BIOS运行时服务进行初始化,实现了为BIOS运行时服务提供了运行空间,即BIOS运行时服务内存,使得BIOS运行时服务能够正常工作,进一步地,能够通过BIOS运行时服务达到暂时存储SMI总用时的技术目的;本发明通过BMC里所包含的BMC初始化模块将预先设置的共享内存映射至BIOS里的BIOS内存,使得BIOS和BMC均能够对共享内存进行访问,读数据以及写数据,进一步地,能够通过共享内存达到存储IPMI发送信息用时的技术目的;本发明通过BMC里所包含的BMC时间分析模块将获取到的IPMI发送信息用时,SMI总用时,SMI触发次数和错误类型,生成日志,并按照预先设置的数据存储格式将日志存储至BMC的内存,使得用户能够通过BMC直接获取到错误触发系统管理中断至系统管理中断结束中间所产生的详细数据,进而更加方便了开发人员、测试人员和客户去监控SMI总用时,进一步地,在提高了获取SMI总用时的效率的同时,还达到了提升用户体验的技术效果;本发明通过BMC里所包含的BMC时间分析模块将日志进行可视化显示,使得开发人员、测试人员和客户能够更加直观地监控SMI总用时,提升了用户的使用体验;本发明通过调用绘图工具自动对日志进行数据分析,避免了手动去分析日志产生的失误,同时还节省了人力时间,给研发测试提供了极大方便,即对故障诊断测试的应用场景有非常显著的效果;本发明在日志数量过多的情况下,通过对日志进行数据分析生成可视化数据,实现了对日志的整合,使得开发人员、测试人员和客户能够随时远程监控SMI总用时,进而能够满足用户更加丰富的使用需求;本发明在SMI总用时的最大值过大时,通过BMC时间分析模块生成告警信息,并进行告警,与此同时将告警信息发送至用户,使得用户能够及时获知SMI总用时的最大值过大这一信息,并针对该种情况进行维护,进而能够达到避免影响业务的正常运行的技术效果。
参照图6,示出了本发明实施例提供的一种中断时间获取的系统,包括:
服务初始化模块601,用于初始化BIOS运行时服务内存和BIOS运行时服务;
计时模块602,用于通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存,通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间;
BMC时间分析模块603,用于通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。
本发明实施例提供的中断时间获取系统,通过在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存;计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间;BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。本发明通过BMC中所包含的BMC时间分析模块获取中断时间,即带外方式获取SMI总用时,不需要额外获取OS登陆权限去带内获取SMI总用时,且该种方式获取SMI总用时更为简便,进而解决了获取SMI总用时效率较低的技术问题,进一步地达到了提高获取SMI总用时效率的技术效果;本发明通过IPMI实现了BMC和BIOS之间的数据交互,由于IPMI能够横跨不同的操作系统、固件和硬件平台,可以智能的监视、控制和自动回报大量服务器的运作状况,进而能够达到降低服务器系统成本的技术效果;本发明通过服务初始化模块对BIOS运行时服务内存和BIOS运行时服务进行初始化,实现了为BIOS运行时服务提供了运行空间,即BIOS运行时服务内存,使得BIOS运行时服务能够正常工作,进一步地,能够通过BIOS运行时服务达到暂时存储SMI总用时的技术目的。
本发明实施例还提供了一种通信设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,可以实现如下步骤:
在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将SMI总用时存储至共享内存;
计时模块通过定时寄存器获取智能平台管理接口IPMI发送信息用时,将IPMI发送信息用时存储至共享内存,并将共享内存的更新标志位设置为1,其中,IPMI发送信息用时为计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将错误记录发送至基板管理控制器BMC的时间;
BMC时间分析模块通过循环读更新标志位的方式从共享内存中获取IPMI发送信息用时,以及,SMI总用时。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的中断时间获取方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的中断时间获取方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种中断时间获取方法,其特征在于,所述方法包括:
在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将所述SMI总用时存储至共享内存;
所述计时模块通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时,将所述IPMI发送信息用时存储至所述共享内存,并将所述共享内存的更新标志位设置为1,其中,所述IPMI发送信息用时为所述计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将所述错误记录发送至基板管理控制器BMC的时间;
BMC时间分析模块通过循环读更新标志位的方式从所述共享内存中获取所述IPMI发送信息用时,以及,所述SMI总用时。
2.根据权利要求1所述的方法,其特征在于,在所述在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下的步骤之前,所述方法还包括:
在接收到上电指令的情况下,服务初始化模块初始化BIOS运行时服务内存和BIOS运行时服务。
3.根据权利要求1所述的方法,其特征在于,在所述计时模块通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时的步骤之前,所述方法还包括:
BMC初始化模块预先分配一块共享内存,并将所述共享内存映射至BIOS内存,以使所述BIOS和BMC对所述共享内存进行读写访问。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
BMC时间分析模块对所述共享内存进行访问,并读取所述共享内存的更新标志位;
判断所述共享内存的更新标志位是否是1;
若是1,则基于获取到的所述IPMI发送信息用时,所述SMI总用时,SMI触发次数和错误类型,生成日志,以及,按照预先设置的数据存储格式将所述日志存储至所述BMC的内存,并将所述共享内存的更新标志位设置为0。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
BMC时间分析模块基于所述BMC的内存中存储的所述日志,判断所述日志的数量是否大于预先设置的第一阈值;
若大于,则通过调用绘图工具对所述日志进行数据分析,将所述日志进行可视化显示。
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
BMC时间分析模块基于所述BMC的内存中存储的所述日志,判断所述日志的数量是否大于预先设置的第二阈值;
若大于,则通过调用绘图工具对所述日志进行数据分析,生成可视化数据,并将所述可视化数据发送至用户,其中,所述可视化数据可以包括所述SMI总用时的最大值,以及,基于所述可视化数据判断所述SMI总用时的最大值是否大于预先设置的第三阈值;
若大于,则生成告警信息,并将所述告警信息发送至所述用户。
7.一种中断时间获取装置,其特征在于,所述装置包括:
SMI总用时获取模块,用于在检测到操作系统OS运行时产生错误,以及,触发系统管理中断SMI的情况下,计时模块通过定时寄存器获取SMI总用时,并将所述SMI总用时存储至共享内存;
IPMI发送信息用时获取模块,用于所述计时模块通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时,将所述IPMI发送信息用时存储至所述共享内存,并将所述共享内存的更新标志位设置为1,其中,所述IPMI发送信息用时为所述计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将所述错误记录发送至基板管理控制器BMC的时间;
中断时间获取模块,用于BMC时间分析模块通过循环读更新标志位的方式从所述共享内存中获取所述IPMI发送信息用时,以及,所述SMI总用时。
8.一种中断时间获取系统,其特征在于,所述系统包括:
服务初始化模块,用于初始化BIOS运行时服务内存和BIOS运行时服务;
计时模块,用于通过定时寄存器获取SMI总用时,并将所述SMI总用时存储至共享内存,通过所述定时寄存器获取智能平台管理接口IPMI发送信息用时,将所述IPMI发送信息用时存储至所述共享内存,并将所述共享内存的更新标志位设置为1,其中,所述IPMI发送信息用时为所述计时模块从存储错误记录的寄存器中获取错误记录,并通过IPMI将所述错误记录发送至基板管理控制器BMC的时间;
BMC时间分析模块,用于通过循环读更新标志位的方式从所述共享内存中获取所述IPMI发送信息用时,以及,所述SMI总用时。
9.一种通信设备,其特征在于,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;
所述处理器,用于读取存储器中的程序实现如权利要求1-6中任意一项所述中断时间获取方法。
10.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任意一项所述中断时间获取方法。
CN202310139180.0A 2023-02-20 2023-02-20 中断时间获取方法、装置、系统、通信设备及存储介质 Pending CN116185799A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310139180.0A CN116185799A (zh) 2023-02-20 2023-02-20 中断时间获取方法、装置、系统、通信设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310139180.0A CN116185799A (zh) 2023-02-20 2023-02-20 中断时间获取方法、装置、系统、通信设备及存储介质

Publications (1)

Publication Number Publication Date
CN116185799A true CN116185799A (zh) 2023-05-30

Family

ID=86440035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310139180.0A Pending CN116185799A (zh) 2023-02-20 2023-02-20 中断时间获取方法、装置、系统、通信设备及存储介质

Country Status (1)

Country Link
CN (1) CN116185799A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116382968A (zh) * 2023-06-05 2023-07-04 苏州浪潮智能科技有限公司 外部设备的故障检测方法以及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116382968A (zh) * 2023-06-05 2023-07-04 苏州浪潮智能科技有限公司 外部设备的故障检测方法以及装置
CN116382968B (zh) * 2023-06-05 2023-08-18 苏州浪潮智能科技有限公司 外部设备的故障检测方法以及装置

Similar Documents

Publication Publication Date Title
CN110674025B (zh) 交互行为监测方法、装置以及计算机设备
CN108574601A (zh) 一种灰度发布方法及系统
CN105045714A (zh) 一种应用软件启动时长的测试方法、装置及终端
CN114328102A (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN116185799A (zh) 中断时间获取方法、装置、系统、通信设备及存储介质
CN111309743A (zh) 报表推送方法及装置
CN111694684A (zh) 存储设备的异常构造方法、装置、电子设备及存储介质
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
CN110347546B (zh) 监控任务动态调整方法、装置、介质及电子设备
CN110569157B (zh) 存储测试方法、装置、服务器及存储介质
CN114647548A (zh) 一种日志生成方法及装置
CN110780815A (zh) 日志的删除方法及装置
CN116126613A (zh) 一种PCIe设备的位置检测方法、装置、电子设备及存储介质
CN116069591A (zh) 一种接口性能监控方法、装置、设备以及存储介质
CN115580522A (zh) 一种容器云平台运行状态的监控方法及装置
CN114911706A (zh) 用例推荐方法、装置、设备及存储介质
CN114860432A (zh) 一种内存故障的信息确定方法及装置
CN114741218A (zh) 操作系统的异常指标提取方法、装置、设备、系统及介质
CN109039770B (zh) 一种服务器cmc的刷新方法、装置及相关设备
CN110362464B (zh) 软件分析方法及设备
CN113742113A (zh) 一种嵌入式系统健康管理方法、设备及储存介质
CN112860574B (zh) Linux内核的内存泄漏检测方法和装置、介质、设备
TWI817128B (zh) 企業資源規劃裝置及其智慧式除錯方法
WO2023221004A1 (zh) 测试数据处理方法、装置、电子设备及存储介质
TWI795950B (zh) 硬碟監控方法、電子裝置及存儲介質

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination