CN104753698A - 系统事件日志记录系统及方法 - Google Patents

系统事件日志记录系统及方法 Download PDF

Info

Publication number
CN104753698A
CN104753698A CN201310732927.XA CN201310732927A CN104753698A CN 104753698 A CN104753698 A CN 104753698A CN 201310732927 A CN201310732927 A CN 201310732927A CN 104753698 A CN104753698 A CN 104753698A
Authority
CN
China
Prior art keywords
server
memory cell
event log
system event
occupied full
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310732927.XA
Other languages
English (en)
Inventor
李世昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Original Assignee
Hongfujin Precision Industry Shenzhen Co Ltd
Hon Hai Precision Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hongfujin Precision Industry Shenzhen Co Ltd, Hon Hai Precision Industry Co Ltd filed Critical Hongfujin Precision Industry Shenzhen Co Ltd
Priority to CN201310732927.XA priority Critical patent/CN104753698A/zh
Publication of CN104753698A publication Critical patent/CN104753698A/zh
Pending legal-status Critical Current

Links

Abstract

本发明提供一种系统事件日志记录系统和方法。该方法应用于一服务器系统中的第一服务器中,该方法包括:在侦测到生成新的系统事件日志时,判断第一服务器的存储单元是否已经被占满;若确定该存储单元已经被占满,则获取该存储单元中存储的作为备份存储装置的服务器对应的标识符,侦测这些标识符对应的服务器中存储单元是否被占满,并确定存储单元没有被占满的服务器;在存储单元没有被占满的服务器中选择一个服务器作为暂存装置;将主板管理控制器新生成的系统事件日志通过通信单元发送至该被确定暂存装置的服务器的存储单元中进行存储。本发明有利于避免该存储单元在存储空间被占满后不能继续存储SEL的问题。

Description

系统事件日志记录系统及方法
技术领域
本发明涉及信息处理系统,尤其涉及一种系统事件日志记录系统及方法。
背景技术
一般而言,服务器中的主板管理控制器(Baseboard ManagementController,BMC)在会在服务器系统产生错误时,将错误事件的内容等相关信息记录为一系统事件日志(System Event Log,SEL)并存储至非易失性存储器(Non-Volatile Random Access Memory,NVRAM),以供使用者后续了解服务器系统的运行状况。
然而,服务器开/关机时会产生多笔系统事件日志。由于非易失性存储器存在空间大小的限制,只能存储一定数量的系统事件日志,倘若非易失性存储器的空间已经存储满,就无法再继续存储新的系统事件日志。
发明内容
有鉴于此,有必要提供一种系统事件日志记录系统及方法,以解决上述问题。
本发明的系统事件日志记录系统,应用于一服务器系统中的一第一服务器内,该第一服务器与该服务器系统中的其他服务器之间通过通信单元互相通信,其中,该服务器系统中的每个服务器均对应一唯一标识符,该第一服务器包括一主板管理控制器,用于监测该第一服务器在开关机过程中是否产生异常事件,并根据异常事件的内容生成若干系统事件日志,并将该系统事件日志存储至存储单元中。该系统事件日志记录系统包括:判断模块,用于在侦测到第一服务器中的该主板管理控制器生成新的系统事件日志时,判断该第一服务器的存储单元是否已经被占满;检测模块,用于在判断模块确定该第一服务器中的存储单元被占满时,获取预先存储在该存储单元中的作为备份存储装置的服务器对应的标识符,并侦测存储的标识符对应的服务器中的存储单元是否被占满,并在确认的存储单元没有被占满的服务器中选择一个服务器作为暂存装置;以及控制模块,用于将该主板管理控制器新生成的系统事件日志通过通信单元发送至被确定为暂存装置的服务器的存储单元中进行存储。
一种系统事件日志记录方法,运行于一系统事件日志记录系统,该系统应用于一服务器系统中的第一服务器内,该第一服务器与该服务器系统中的其他服务器通过通信单元进行通信,该第一服务器包括一主板管理控制器,用于监测该第一服务器在开关机过程中是否产生异常事件并根据异常事件的内容生成若干系统事件日志,并将系统事件日志存储至存储单元中。该方法包括:在侦测到该主板管理控制器生成新的系统事件日志时,判断该第一服务器的存储单元是否已经被占满;若确定该存储单元已经被占满,则获取该存储单元中存储的作为备份存储装置的服务器对应的标识符,侦测这些标识符对应的服务器中存储单元是否被占满,并确定存储单元没有被占满的服务器;在存储单元没有被占满的服务器中选择一个服务器作为暂存装置;将主板管理控制器新生成的系统事件日志通过通信单元发送至该被确定暂存装置的服务器的存储单元中进行存储。
本发明中的系统事件日志记录系统及方法,能够使得在服务器的存储单元不能再继续写入系统事件日志后,将该主板管理控制器新产生的系统事件日志转存至其他服务器的存储单元中,待该存储单元被清空后再将该缓存模块的系统事件日志写入该存储单元,从而有利于避免该存储单元在存储空间被占满后不能继续存储系统事件日志的问题。
附图说明
图1为本发明一实施方式中服务器系统的功能模块示意图。
图2为本发明中系统事件日志存储方法流程图。
主要元件符号说明
服务器系统 100
服务器 200、200a
主板管理控制器 10
存储单元 20
通信单元 30
系统事件日志记录系统 300
判断模块 301
检测模块 302
控制模块 303
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
下面结合附图,对本发明中的系统事件日志记录系统及方法作进一步的详细描述。
图1为本发明一较佳实施方式中服务器系统100的功能模块示意图。该服务器系统100中包括多个互相通信的服务器200,其中,每台服务器200均对应一唯一的标识符。在本实施方式中,每台服务器200对应的唯一标识符可以是本机的固定IP地址,也可以是每台服务器200的CPU序列号、内存条序列号等硬件识别码。该系统事件日志记录系统300应用于每一台服务器200中。
该服务器系统100中每台服务器的结构均相同,故下面仅以其中一台服务器200a为例进行说明。该服务器200a包括一主板管理控制器10(Baseboard Management Controller,BMC)、存储单元20以及通信单元30。
该主板管理控制器10用于监测该服务器200a在运行过程中是否产生异常事件并根据异常事件的内容生成若干系统事件日志(SystemEvent Log,SEL)。在本实施方式中,所述异常事件包括但并不局限于该服务器1的物理内存、虚拟内存使用率占空比、CPU风扇转速、CPU温度、硬盘单位时间内吞吐量、硬盘剩余空间、电源温度和电源输出电压等项目发生的异常情况。
该存储单元20用于存储该主板管理控制器10生成的该些系统事件日志。该存储单元20中还存储有作为该服务器200a的备份存储装置的其他服务器200对应的标识符,其中,该作为备份存储装置的其他服务器200为该服务器系统100中与该服务器200a进行通信的服务器200中的一台或多台。在本实施方式中,该作为备份存储装置的服务器200可以是用户通过该服务器200a中的输入单元(图未示)进行手动输入设置的,也可以是预先默认设置的。该在本实施方式中,该存储单元20为非易失性存储器(Non-Volatile Random Access Memory,NVRAM)。
该通信单元30用于与该服务器系统100中的其他服务器200进行通信。在本实施方式中,该通信单元30与其他服务器200通过有线或无线的方式进行网络通信外,还可以通过智能平台管理总线(Intelligent Platform Management BUS,IPMB)等方式进行通信。
在本实施方式中,该系统事件日志记录系统300运行于该主板管理控制器10中,为该主板管理控制器10内部的程序。在其他实施方式中,该系统事件日志记录系统300存储于一移动存储装置中,如移动硬盘、U盘中,其为一自动运行程序,用于当该移动存储装置连接至该服务器200a后自动运行,使得该系统事件日志记录系统300中各个功能模块执行相应的功能。
在本实施方式中,该系统事件日志记录系统300包括判断模块301、检测模块302以及控制模块303。
该判断模块301用于在侦测到该主板管理控制器10生成新的系统事件日志时,判断该存储单元20是否已经被占满。其中,该存储单元20被占满后不能继续存储新的系统时间日志。
该控制模块303用于在该判断模块301确定该存储单元20没有被占满,将该主板管理控制器10新生成的系统事件日志存储至该存储单元20中。
该检测模块302用于在该判断模块301确定该存储单元20被占满时,获取该存储单元20中存储的作为备份存储装置的服务器200对应的标识符,侦测这些标识符对应的服务器200中存储单元是否被占满,确定没有被占满的服务器200,并在存储单元没有被占满的服务器200中选择一个作为暂存装置。
在本实施方式中,该检测模块302侦测作为备份存储装置的服务器200的存储单元是否被占满的方法为:该检测模块302生成一个包含有作为备份存储装置的服务器200对应的标识符以及请求查看作为备份存储装置的服务器200中的存储单元是否被占满请求的请求信息;将该请求信息发送至每个作为备份存储装置的服务器200中,使得作为备份装置的服务器200接收到该请求信息后,确认存储单元是否被占满,并将该确认结果回传给该服务器200a,其中该结果中包含有该服务器200的标识符;该检测模块302接收到作为备份存储装置的服务器200回传的结果后,确认这些作为备份存储装置的服务器200中存储单元没有被占满的服务器200;然后在这些存储单元没有被占满的服务器200中选择一个作为暂存装置。在本实施方式中,该检测模块302可以在这些确认存储单元没有被占满的服务器200中随机选择一个作为暂存装置。在其他实施方式中,该存储单元20中存储的作为备份存储装置的服务器200也可以按照一预定的顺序进行排列,例如当标识符中含有数字时,按照该数字的大小顺序对该作为备份存储装置的服务器200进行排列,该检测模块302在这些确认存储单元没有被占满的服务器200中选择一个排在第一位或者最后一位的服务器200作为暂存装置。在其他实施方式中,该检测模块302还可以按照服务器200对应的标识符在存储单元20中排列的顺序依次向该标识符对应的服务器200发送该请求信息,当前一个标识符对应的服务器200的存储单元被占满时,再向后一个标识符对应的服务器200发送该请求信息,直至找到存储单元没有被占满的服务器200,并将该服务器200作为暂存装置。
该控制模块303还用于在服务器200a中的存储单元20被占满时,将主板管理控制器10新生成的系统事件日志通过通信单元30发送至该被确定暂存装置的服务器200的存储单元中进行存储。
从而,在本实施方式中,在该服务器200a本身的存储单元20被占满后,通过将该新生成的系统事件日志存储在其他服务器200的存储单元中,可以保证该新生成的系统事件日志被存储。
在本实施方式中,该控制模块303还响应用户的操作清除该服务器200a中的存储单元20先前存储的所有系统事件日志。
该控制模块303还用于在清除服务器200a的存储单元20中先前存储的系统事件日志后,生成一回传请求信息并将该回传请求信息发送至该作为暂存装置的服务器200,使得该被作为暂存装置的服务器200接收到该回传请求信息后,将该服务器200a暂存在该作为暂存装置的服务器200中的系统事件日志回传至该服务器200a中,该控制模块303还将该回传的系统事件日志存储至该服务器200a的存储单元中。
请参阅图2,一种系统事件日志记录方法,应用于服务器系统中的服务器中,该服务器系统中的服务器之间能够互相通信。该系统时间日志记录方法包括如下步骤:
步骤S201:该判断模块301用于在侦测到该主板管理控制器10生成新的系统事件日志时,判断该服务器200a的存储单元20是否已经被占满。若未占满,则执行步骤S202;若已经被占满,则执行步骤S203。
步骤S202:该控制模块303将该主板管理控制器10新生成的系统事件日志存储至该存储单元20中。
步骤S203:该检测模块302获取该存储单元20中存储的作为备份存储装置的服务器200对应的标识符,并侦测这些标识符对应的服务器200中存储单元没有被占满的服务器200。
步骤S204:该检测模块302在存储单元没有被占满的服务器200中选择一个服务器200作为暂存装置。
步骤S205:该控制模块303将主板管理控制器10新生成的系统事件日志通过通信单元30发送至该被确定暂存装置的服务器200的存储单元中进行存储。
步骤S206:该控制模块303还响应用户的操作而清除该服务器200a中的存储单元20先前存储的所有系统事件日志,并在将该该服务器200a中的存储单元20先前存储的所有系统事件日志清除后生成一回传请求信息并将该回传请求信息发送至该作为暂存装置的服务器200,使得该被作为暂存装置的服务器200接收到该回传请求信息后,将暂存在该作为暂存装置的服务器200中的系统事件日志回传至该服务器200a中。
步骤S207:该控制模块303将该回传的系统事件日志存储至该服务器200a的存储单元中。
尽管对本发明的优选实施方式进行了说明和描述,但是本领域的技术人员将领悟到,可以作出各种不同的变化和改进,这些都不超出本发明的真正范围。因此期望,本发明并不局限于所公开的作为实现本发明所设想的最佳模式的具体实施方式,本发明包括的所有实施方式都有所附权利要求书的保护范围内。

Claims (12)

1.一种系统事件日志记录系统,应用于一服务器系统中的一第一服务器内,该第一服务器与该服务器系统中的其他服务器之间通过通信单元互相通信,其中,该服务器系统中的每个服务器均对应一唯一标识符,该第一服务器包括一主板管理控制器,用于监测该第一服务器在开关机过程中是否产生异常事件,并根据异常事件的内容生成若干系统事件日志,并将该系统事件日志存储至存储单元中,其特征在于,该系统事件日志记录系统包括:
判断模块,用于在侦测到第一服务器中的该主板管理控制器生成新的系统事件日志时,判断该第一服务器的存储单元是否已经被占满;
检测模块,用于在判断模块确定该第一服务器中的存储单元被占满时,获取预先存储在该存储单元中的作为备份存储装置的服务器对应的标识符,并侦测存储的标识符对应的服务器中的存储单元是否被占满,并在确认的存储单元没有被占满的服务器中选择一个服务器作为暂存装置;以及
控制模块,用于将该主板管理控制器新生成的系统事件日志通过通信单元发送至被确定为暂存装置的服务器的存储单元中进行存储。
2.如权利要求1所述的系统事件日志记录系统,其特征在于,该控制模块还用于响应用户的操作而清除该第一服务器中的存储单元先前存储的所有系统事件日志,并在将该第一服务器中的存储单元中先前存储的所有系统事件日志清除后,生成一回传请求信息并通过通信单元将该回传请求信息发送至该被作为暂存装置的服务器,使得该被作为暂存装置的服务器接收到该回传请求信息后,将暂存在该被作为暂存装置的服务器中的系统事件日志回传至该第一服务器中,然后该控制模块将该回传的系统事件日志存储至该第一服务器的存储单元中。
3.如权利要求1所述的系统事件日志记录系统,其特征在于,该控制模块还用于在该判断模块确定该第一服务器的存储单元没有被占满时,将该主板管理控制器新生成的系统事件日志存储至该存储单元中。
4.如权利要求1所述的系统事件日志存储系统,其特征在于,该检测模块侦测作为备份存储装置的服务器的存储单元是否被占满的方法为:该检测模块生成一个包含有作为备份存储装置的服务器对应的标识符以及请求查看作为备份存储装置的服务器中的存储单元是否被占满请求的请求信息;通过通信单元将该请求信息发送至每个作为备份存储装置的服务器中,使得作为备份装置的服务器接收到该请求信息后,确认存储单元是否被占满并将确认结果回传给该第一服务器,其中该结果中包含有该作为备份存储装置的服务器的标识符;该检测模块接收到作为备份存储装置的服务器回传的结果后,确认这些作为备份存储装置的服务器中存储单元没有被占满的服务器,然后在这些存储单元没有被占满的服务器中选择一个作为暂存装置。
5.如权利要求4所述的系统事件日志记录系统,其特征在于,该检测模块在这些确认存储单元没有被占满的服务器中随机选择一个作为暂存装置。
6.如权利要求4所述的系统事件日志记录系统,其特征在于,该存储单元中存储的作为备份存储装置的服务器按照一预定的顺序进行排列,该检测模块在这些确认存储单元没有被占满的服务器中选择排在第一位的服务器作为暂存装置。
7.如权利要求1所述的系统事件日志记录系统,其特征在于,该存储单元中存储的作为备份存储装置的服务器按照一预定的顺序进行排列,该检测模块按照服务器对应的标识符在存储单元中排列的顺序依次向该标识符对应的服务器发送该请求信息,当前一个标识符对应的服务器确认存储单元被占满时,再向后一个标识符对应的服务器发送请求信息,直至找到存储单元没有被占满的服务器,并将该服务器作为暂存装置。
8.如权利要求1所述的系统事件日志记录系统,其特征在于,该系统事件日志记录系统运行于该主板管理控制器内部。
9.如权利要求1所述的系统事件日志记录系统,其特征在于,该系统事件日志记录系统存储于一移动存储装置中,其为一自动运行程序,当该移动存储装置连接至该服务器后自动运行。
10.一种系统事件日志记录方法,运行于一系统事件日志记录系统,该系统应用于一服务器系统中的第一服务器内,该第一服务器与该服务器系统中的其他服务器通过通信单元进行通信,该第一服务器包括一主板管理控制器,用于监测该第一服务器在开关机过程中是否产生异常事件并根据异常事件的内容生成若干系统事件日志,并将系统事件日志存储至存储单元中,其特征在于,该方法包括:
在侦测到该主板管理控制器生成新的系统事件日志时,判断该第一服务器的存储单元是否已经被占满;
若确定该存储单元已经被占满,则获取该存储单元中存储的作为备份存储装置的服务器对应的标识符,侦测这些标识符对应的服务器中存储单元是否被占满,并确定存储单元没有被占满的服务器;
在存储单元没有被占满的服务器中选择一个服务器作为暂存装置;
将主板管理控制器新生成的系统事件日志通过通信单元发送至该被确定暂存装置的服务器的存储单元中进行存储。
11.如权利要求10所述的系统事件日志记录方法,其特征在于,该方法还包括:
响应用户的操作而清除该第一服务器的存储单元中先前存储的所有系统事件日志;
在将该第一服务器的存储单元中先前存储的所有系统事件日志清除后,生成一回传请求信息并将该回传请求信息发送至该作为暂存装置的服务器,使得该被作为暂存装置的服务器接收到该回传请求信息后,将暂存在该作为暂存装置的服务器中的系统事件日志回传至该第一服务器;以及
将该回传的系统事件日志存储至该第一服务器的存储单元中。
12.如权利要求10所述的系统事件日志记录方法,其特征在于,侦测作为备份存储装置的服务器的存储单元是否被占满的方法为:生成一个包含有作为备份存储装置的服务器对应的标识符以及请求查看作为备份存储装置的服务器中的存储单元是否被占满请求的请求信息;通过通信单元将该请求信息发送至每个作为备份存储装置的服务器中,使得作为备份装置的服务器接收到该请求信息后,确认存储单元是否被占满并将确认结果回传给该第一服务器,其中该结果中包含有该作为备份存储装置的服务器的标识符;接收到作为备份存储装置的服务器回传的结果后,确认这些作为备份存储装置的服务器中存储单元没有被占满的服务器,然后在这些存储单元没有被占满的服务器中选择一个作为暂存装置。
CN201310732927.XA 2013-12-26 2013-12-26 系统事件日志记录系统及方法 Pending CN104753698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310732927.XA CN104753698A (zh) 2013-12-26 2013-12-26 系统事件日志记录系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310732927.XA CN104753698A (zh) 2013-12-26 2013-12-26 系统事件日志记录系统及方法

Publications (1)

Publication Number Publication Date
CN104753698A true CN104753698A (zh) 2015-07-01

Family

ID=53592855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310732927.XA Pending CN104753698A (zh) 2013-12-26 2013-12-26 系统事件日志记录系统及方法

Country Status (1)

Country Link
CN (1) CN104753698A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108958965A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108958965A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备
CN108958965B (zh) * 2018-06-28 2021-03-02 苏州浪潮智能科技有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备

Similar Documents

Publication Publication Date Title
CN108592313B (zh) 空调的无线组网方法、空调内机和空调外机
CN112732477B (zh) 一种带外自检故障隔离的方法
US9588542B2 (en) Rack server system and method for automatically managing rack configuration information
US20200033928A1 (en) Method of periodically recording for events
CN108199962B (zh) 地址迁移方法、装置、网络设备及可读存储介质
CN104346264A (zh) 系统事件日志处理系统及方法
CN103378986A (zh) 系统事件日志记录系统及方法
CN104598776A (zh) 一种对软件进行测试的方法及装置
CN111752776A (zh) 一种服务器的循环上下电测试方法和系统
CN111352779A (zh) 一种moc卡的ac电源的开关机测试方法及相关组件
CN104375930A (zh) 固件检测系统及方法
CN104657243A (zh) 服务器与服务器检测方法
CN103092718A (zh) 测试数据备份系统及方法
CN107070747A (zh) 一种在网卡绑定模式下自动化测试网卡网络连接稳定性的方法
CN101174985B (zh) 恢复配置信息的方法和装置
CN105573872A (zh) 数据存储系统的硬盘维护方法和装置
CN103339608A (zh) 诊断信息日志记录
JP2020525944A (ja) バス監視システム、方法および装置
US10791032B2 (en) Method and apparatus for determining a physical position of a device
CN104753698A (zh) 系统事件日志记录系统及方法
CN109102839B (zh) 一种坏块标记方法、装置、设备及可读存储介质
CN111030871A (zh) 基于双机热备系统的配置信息同步方法和装置
CN108985402B (zh) 一种raid卡信息获取方法及相关装置
CN110912760B (zh) 链路状态检测方法和装置
JP2020052956A (ja) Bmc、判定方法及びbmcファームウェア

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150701

WD01 Invention patent application deemed withdrawn after publication