CN115576783B - 一种vpx机箱的刀片服务器带外日志存储方法及系统 - Google Patents

一种vpx机箱的刀片服务器带外日志存储方法及系统 Download PDF

Info

Publication number
CN115576783B
CN115576783B CN202211589638.4A CN202211589638A CN115576783B CN 115576783 B CN115576783 B CN 115576783B CN 202211589638 A CN202211589638 A CN 202211589638A CN 115576783 B CN115576783 B CN 115576783B
Authority
CN
China
Prior art keywords
band
log
storage unit
blade server
management controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211589638.4A
Other languages
English (en)
Other versions
CN115576783A (zh
Inventor
刘宇洋
周永健
陈月玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Bojiang Information Technology Co Ltd
Original Assignee
Hunan Bojiang Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Bojiang Information Technology Co Ltd filed Critical Hunan Bojiang Information Technology Co Ltd
Priority to CN202211589638.4A priority Critical patent/CN115576783B/zh
Publication of CN115576783A publication Critical patent/CN115576783A/zh
Application granted granted Critical
Publication of CN115576783B publication Critical patent/CN115576783B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents
    • G06F11/3093Configuration details thereof, e.g. installation, enabling, spatial arrangement of the probes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种VPX机箱的刀片服务器带外日志存储方法及系统,本发明能够解决现有的日志存储方案在计算设备出现异常掉电时均会出现数据丢失的问题;当VPX机箱的刀片服务器正常运行时,处理器会将产生的日志文件分别存储至业务存储单元和缓存单元;当VPX机箱的刀片服务器出现运行异常时,通过带外存储管理控制器及时将缓存单元内存储的日志文件存储至所述非易失存储单元,从而实现最后VPX机箱的刀片服务器在出现异常掉电前几秒钟的关键日志信息的完整保存;后续再调取日志文件以进行异常掉电事故分析时,只需要将业务存储单元存储上的日志信息,以及非易失存储单元存储的日志信息一同提取出来,即可进行更完整的故障分析。

Description

一种VPX机箱的刀片服务器带外日志存储方法及系统
技术领域
本发明涉及VPX机箱的日志管理技术领域,具体涉及一种VPX机箱的刀片服务器带外日志存储方法及系统。
背景技术
多协议交换(Versatile Protocol Switch,VPX)标准是由VME总线国际贸易协会(VMEbus International Trade Association,VITA)组织定义的一个高速串行总线标准。是为了满足国防和航空领域越来越高的性能要求和更为恶劣环境条件下的应用需要而发展起来的的总线标准,VPX标准特别适用于航空、航天、雷达、海底勘探、声呐、视频图像处理和信号处理等领域。
刀片服务器,是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。刀片式服务器目前已经成为高性能计算集群的主流设备,由于采用刀片服务器可以极大减少所需外部线缆的数量,从而可以大大降低由于线缆连接故障带来的隐患,提高整个计算系统可靠性。
由于VPX系统具有运行稳定可靠的特点及优势,VPX系统成为了当下数据采集和分析领域的优秀方案,很多工程应用都采用了VPX相关的解决方案,VPX系统主要由刀片服务器和装载刀片服务器的VPX机箱组成,VPX机箱用于保护内部的刀片服务器,并为刀片服务器提供良好的运行环境。
网络管理可以分为带内管理和带外管理两种管理模式,其中,带内管理是指网络的管理控制信息与业务信息通过同一个逻辑信道发送,而在带外管理模式下,网络的管理控制信息与业务信息通过不同的逻辑信道发送。由于带外管理模式下管理控制信息独立于被管理设备的业务网络连接,可以用于对被管理设备的紧急救援,因此被广泛应用于数据备份管理领域。
日志(Log)是指计算机系统所指定对象的某些操作和其操作结果按时间有序的集合文件。日志文件由日志记录组成,每条日志记录描述了一次单独的操作事件。日志主要包括系统日志、应用程序日志和安全日志。
系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷,性能安全性,从而及时采取措施纠正错误。
目前,日志存储通常是通过操作系统(linux或windows)上的系统级软件进行,主要包括缓存I/O(即输入/输出(Input/Output))和直接I/O这两种方式进行日志存储;缓存I/O 的优点是能够减少对块设备的I/O 操作,缺点是相比直接I/O 多了一次的内存复制,故如果出现异常掉电,则缓存的数据将会丢失;直接I/O的优点是由于不对I/O数据块进行缓存,所以可以直接跟用户数据进行交互,从而减少一次内存复制,不容易出现数据丢失;直接I/O的缺点是每次I/O操作都直接与块设备进行交互,增加了对块设备的读写操作,更加费时。
综上,现有的VPX机箱的刀片服务器日志存储方法中,缓存I/O 的方法虽然使用简便,但是在异常情况下容易丢失部分最接近失效时间点的信息;而直接IO方式也会由于传输过程中的复杂性,以及存储设备中存在的缓存单元中出现异常掉电而导致数据丢失;这在航天、军事等领域尤其致命,由于这些领域的计算设备成本偏高,计算设备在出现问题时更需要尽可能完整的日志信息来进行针对性的优化,但现有的VPX机箱的刀片服务器日志存储方案存在数据容易丢失的问题。
发明内容
本发明的主要目的是提供一种VPX机箱的刀片服务器带外日志存储方法及系统,旨在解决现有的VPX机箱的刀片服务器日志存储方案存在数据容易丢失的问题。
本发明提出的技术方案为:
一种VPX机箱的刀片服务器带外日志存储方法,应用于VPX机箱的刀片服务器带外日志存储系统,所述系统包括VPX机箱的刀片服务器和带外日志管理模块;所述VPX机箱的刀片服务器包括处理器、主板和业务存储单元;所述VPX机箱的刀片服务器运行有操作系统;所述带外日志管理模块包括纽扣电池、缓存单元、带外存储管理控制器、非易失存储单元和状态侦测组件;所述业务存储单元和所述缓存单元均与所述处理器通信连接;所述纽扣电池用于给所述缓存单元、所述带外存储管理控制器、所述非易失存储单元和所述状态侦测组件进行供电;所述状态侦测组件、所述缓存单元和所述非易失存储单元均与所述带外存储管理控制器通信连接;所述缓存单元和所述非易失存储单元通信连接;所述方法,包括:
通过所述处理器将操作系统于所述VPX机箱的刀片服务器运行时产生的日志文件同步存储至所述业务存储单元和所述缓存单元;
通过状态侦测组件实时监测所述VPX机箱的刀片服务器是否处于运行异常的状态;
若是,通过所述带外存储管理控制器将所述缓存单元中的保存的日志文件存储至所述非易失存储单元。
优选的,所述状态侦测组件包括设置于主板的电压传感器和电流传感器;所述通过状态侦测组件实时监测所述VPX机箱的刀片服务器是否处于运行异常的状态,包括:
通过所述带外存储管理控制器获取设置于主板的电压传感器实时采集的所述主板的工作电压;
通过所述带外存储管理控制器获取设置于主板的电流传感器实时采集的所述主板的工作电流;
通过所述带外存储管理控制器判断是否满足如下条件:所述工作电压落入正常电压区间,且所述工作电流落入正常电流区间;
若是,确定所述VPX机箱的刀片服务器未处于运行异常的状态;
若否,确定所述VPX机箱的刀片服务器处于运行异常的状态。
优选的,还包括:
通过所述处理器获取所述缓存单元的剩余容量;
通过所述处理器判断所述剩余容量是否小于预设容量;
若是,通过所述处理器获取所述缓存单元中所有的日志文件,以及各日志文件对应的存储时刻;
通过所述处理器将所述缓存单元中各日志文件按照存储时刻的先后顺序依次进行删除,直到所述缓存单元的剩余容量大于所述预设容量。
优选的,所述通过所述带外存储管理控制器将所述缓存单元中的保存的日志文件存储至所述非易失存储单元,包括:
通过所述带外存储管理控制器获取当前时刻所述缓存单元中所有的日志文件,并标记为待转移文件,以及各待转移文件对应的存储时刻;
通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元。
优选的,所述通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元,还包括:
在通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元的过程中,通过所述带外存储管理控制器判断所述缓存单元中是否新增写入了日志文件;
若是,通过所述操作系统新建同步转移线程,其中,所述同步转移线程用于通过所述操作系统将所述VPX机箱的刀片服务器处于运行异常状态时产生的日志文件直接写入所述非易失存储单元的第一空间;
所述通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元,之后还包括:
通过所述带外存储管理控制器将所述缓存单元中已经存储至所述非易失存储单元的日志文件标记为已转存文件;
通过所述带外存储管理控制器实时判断所述缓存单元中是否存在除所述已转存文件之外的其他日志文件;
若是,通过所述带外存储管理控制器将所述缓存单元中除所述已转存文件之外的其他日志文件存储至所述非易失存储单元,直至所述VPX机箱的刀片服务器未处于运行异常的状态,或处于异常掉电状态。
优选的,所述状态侦测组件和所述处理器通信连接;所述状态侦测组件包括设置于带外日志管理模块的电压传感器和电流传感器;所述方法,还包括:
通过所述处理器获取设置于带外日志管理模块的电压传感器实时采集的所述缓存单元和所述非易失存储单元的运行电压;
通过所述处理器获取设置于带外日志管理模块的电流传感器实时采集的所述缓存单元和所述非易失存储单元的运行电流;
通过所述处理器判断是否满足如下条件:所述运行电压落入正常电压区间,且所述运行电流落入正常电流区间;
若否,确定带外日志管理模块处于异常运行状态;
所述处理器于所述业务存储单元创建第二空间,并将所述非易失存储单元中存储的日志文件复制写入所述第二空间,以形成备份。
优选的,还包括:
将外界设备与所述带外日志管理模块建立通信连接;
通过所述带外存储管理控制器获取外界设备发送的提取指令;
通过所述带外存储管理控制器基于所述提取指令将所述非易失存储单元中存储的日志文件全部复制写入所述外界设备,其中,将非易失存储单元中存储的日志文件写入外界设备的过程中,优先复制第一空间中的日志文件。
优选的,所述通过所述带外存储管理控制器基于所述提取指令将所述非易失存储单元中存储的日志文件全部复制写入所述外界设备,之后还包括:
通过所述带外存储管理控制器将所述非易失存储单元中已经复制写入所述外界设备的日志文件标记为已提取文件;
通过所述带外存储管理控制器每隔预设时长判断所述非易失存储单元的剩余容量是否小于所述缓存单元的额定容量;
若是,将所述已提取文件删除。
优选的,所述将所述已提取文件删除,之后还包括:
通过所述带外存储管理控制器判断所述非易失存储单元的剩余容量是否仍然小于所述缓存单元的额定容量;
若是,通过所述带外存储管理控制器获取所述非易失存储单元中所有的日志文件,以及各日志文件对应的存储时刻;
通过所述带外存储管理控制器将所述非易失存储单元中各日志文件按照存储时刻的先后顺序依次进行删除,直到所述非易失存储单元的剩余容量大于所述缓存单元的额定容量。
本发明还提出一种VPX机箱的刀片服务器带外日志存储系统,应用于如上述中任一项所述的VPX机箱的刀片服务器带外日志存储方法;所述系统包括VPX机箱的刀片服务器和带外日志管理模块;所述VPX机箱的刀片服务器包括处理器、主板和业务存储单元;所述VPX机箱的刀片服务器运行有操作系统;所述带外日志管理模块包括纽扣电池、缓存单元、带外存储管理控制器、非易失存储单元和状态侦测组件;所述业务存储单元和所述缓存单元均与所述处理器通信连接;所述纽扣电池用于给所述缓存单元、所述带外存储管理控制器、所述非易失存储单元和所述状态侦测组件进行供电;所述状态侦测组件、所述缓存单元和所述非易失存储单元均与所述带外存储管理控制器通信连接;所述缓存单元和所述非易失存储单元通信连接。
通过上述技术方案,能实现以下有益效果:
本发明提出的VPX机箱的刀片服务器带外日志存储方法能够解决现有的日志存储方案在计算设备出现异常掉电时均会出现数据丢失的问题;当VPX机箱的刀片服务器正常运行时,处理器会将产生的日志文件分别存储至业务存储单元和缓存单元;当VPX机箱的刀片服务器出现运行异常时,VPX机箱的刀片服务器会因电压或电流不稳定而导致存储至业务存储单元的日志文件出现丢失,而因缓存单元是由纽扣电池进行独立供电,故能够完整的保存处理器写入的VPX机箱的刀片服务器在运行异常状态下产生的日志文件,并通过带外存储管理控制器及时将缓存单元内存储的日志文件存储至所述非易失存储单元,从而更加安全的保存日志文件,从而实现最后VPX机箱的刀片服务器在出现异常掉电前几秒钟的关键日志信息的完整保存;后续再调取日志文件以进行异常掉电事故分析时,只需要将业务存储单元存储上的日志信息,以及非易失存储单元存储的日志信息一同提取出来,即可进行更完整的故障分析;此外,本发明提出的带外日志管理模块具有体积小巧和低功耗的优点,可以在不改变现有VPX机箱的刀片服务器的设计下安装该带外日志管理模块,从而以低成本来实现本VPX机箱的刀片服务器带外日志存储方法,进而提高VPX机箱的刀片服务器的整体运行稳定性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明提出的一种VPX机箱的刀片服务器带外日志存储方法第一实施例的流程图;
图2为本发明提出的一种VPX机箱的刀片服务器带外日志存储系统第一实施例的结构示意图。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
本发明提出一种VPX机箱的刀片服务器带外日志存储方法及系统。
如附图1和附图2所示,在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第一实施例中,本VPX机箱的刀片服务器带外日志存储方法应用于VPX机箱的刀片服务器带外日志存储系统,所述系统包括VPX机箱的刀片服务器和带外日志管理模块;所述VPX机箱的刀片服务器包括处理器、主板和业务存储单元(例如固态硬盘);所述VPX机箱的刀片服务器运行有操作系统(例如Linux操作系统);所述带外日志管理模块包括纽扣电池、缓存单元(例如内存)、带外存储管理控制器、非易失存储单元(考虑到带外日志管理模块的低功耗和长续航需求,非易失存储单元优选为SD卡)和状态侦测组件;所述业务存储单元和所述缓存单元均与所述处理器通信连接(处理器和缓存单元之间的通信线路以低速总线,以降低整体功耗);所述纽扣电池用于给所述缓存单元、所述带外存储管理控制器、所述非易失存储单元和所述状态侦测组件进行供电;所述状态侦测组件、所述缓存单元和所述非易失存储单元均与所述带外存储管理控制器通信连接;所述缓存单元和所述非易失存储单元通信连接;所述状态侦测组件设置于所述主板;本实施例包括如下步骤:
步骤S110:通过所述处理器将操作系统于所述VPX机箱的刀片服务器运行时产生的日志文件同步存储至所述业务存储单元和所述缓存单元。
具体的,处理器将日志文件写入缓存单元的方式为循环覆盖,即当缓存单元中剩余容量不足时,将较早时刻的日志文件删除,从而保证最近时刻的日志文件能够写入缓存单元。
步骤S120:通过状态侦测组件实时监测所述VPX机箱的刀片服务器是否处于运行异常的状态。
具体的,这里的运行异常主要是主板出现电压异常或电流异常,当出现运行异常时,VPX机箱的刀片服务器极有可能会出现异常掉电现象。
若是,执行步骤S130:通过所述带外存储管理控制器将所述缓存单元中的保存的日志文件存储至所述非易失存储单元。
具体的,当VPX机箱的刀片服务器出现运行异常时,通过带外存储管理控制器及时将缓存单元内存储的日志文件存储至所述非易失存储单元,从而更加安全的保存日志文件。
本发明提出的VPX机箱的刀片服务器带外日志存储方法能够解决现有的日志存储方案在计算设备出现异常掉电时均会出现数据丢失的问题;当VPX机箱的刀片服务器正常运行时,处理器会将产生的日志文件分别存储至业务存储单元和缓存单元;当VPX机箱的刀片服务器出现运行异常时,VPX机箱的刀片服务器会因电压或电流不稳定而导致存储至业务存储单元的日志文件出现丢失,而因缓存单元是由纽扣电池进行独立供电,故能够完整的保存处理器写入的VPX机箱的刀片服务器在运行异常状态下产生的日志文件,并通过带外存储管理控制器及时将缓存单元内存储的日志文件存储至所述非易失存储单元,从而更加安全的保存日志文件,从而实现最后VPX机箱的刀片服务器在出现异常掉电前几秒钟的关键日志信息的完整保存;后续再调取日志文件以进行异常掉电事故分析时,只需要将业务存储单元存储上的日志信息,以及非易失存储单元存储的日志信息一同提取出来,即可进行更完整的故障分析;此外,本发明提出的带外日志管理模块具有体积小巧和低功耗的优点,可以在不改变现有VPX机箱的刀片服务器的设计下安装该带外日志管理模块,从而以低成本来实现本VPX机箱的刀片服务器带外日志存储方法,进而提高VPX机箱的刀片服务器的整体运行稳定性。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第二实施例中,基于第一实施例,所述状态侦测组件包括设置于主板的电压传感器和电流传感器;步骤S120,包括如下步骤:
步骤S210:通过所述带外存储管理控制器获取设置于主板的电压传感器实时采集的所述主板的工作电压。
步骤S220:通过所述带外存储管理控制器获取设置于主板的电流传感器实时采集的所述主板的工作电流。
步骤S230:通过所述带外存储管理控制器判断是否满足如下条件:所述工作电压落入正常电压区间,且所述工作电流落入正常电流区间。
若是,执行步骤S240:确定所述VPX机箱的刀片服务器未处于运行异常的状态。
若否,执行步骤S250:确定所述VPX机箱的刀片服务器处于运行异常的状态。
具体的,本实施例给出了如何确定VPX机箱的刀片服务器是否处于运行异常状态的具体方案;当VPX机箱的刀片服务器的主板工作电压未落入正常电压区间,或主板工作电流未落入正常电流区间,则说明VPX机箱的刀片服务器处于运行异常的状态,这种状态下持续运行可能会导致异常掉电,故为了及时保存和有效获取运行异常期间产生的日志文件,需要在VPX机箱的刀片服务器处于运行异常时,即通过带外存储管理控制器将缓存单元中的保存的日志文件存储至非易失存储单元,从而提升日志数据的安全性,减低日志数据丢失的可能性。
此外,在本发明的另一实施例中,步骤S120,还可以包括如下步骤:
步骤S260:所述处理器获取过去第一预设时间段(例如1小时)内将日志文件存储至所述业务存储单元的过程中,出现卡顿或日志文件异常丢失的情况的次数,并标记为异常存储次数。
步骤S270:当异常次数大于第一预设时间段所对应的预设正常次数(例如1次)时,所述处理器判断在过去第一预设时间段内是否越靠近当前时刻出现卡顿或日志文件异常丢失的情况的频率越高。
若是,执行步骤S280:确定所述VPX机箱的刀片服务器处于运行异常的状态。
具体的,上述实施例给出了如何确定刀片服务器出现运行异常的另一方案,即通过判断将日志文件存储至所述业务存储单元的过程中,出现卡顿或日志文件异常丢失的情况的次数是否大于预设正常次数,且在过去第一预设时间段内是否越靠近当前时刻出现卡顿或日志文件异常丢失的情况的频率越高,进而确定VPX机箱的刀片服务器是否处于运行异常的状态。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第三实施例中,基于第一实施例,本实施例还包括如下步骤:
步骤S310:通过所述处理器获取所述缓存单元的剩余容量。
步骤S320:通过所述处理器判断所述剩余容量是否小于预设容量。
具体的,这里的预设容量可以优选为缓存单元的额定容量的30%。
若是,执行步骤S330:通过所述处理器获取所述缓存单元中所有的日志文件,以及各日志文件对应的存储时刻。
步骤S340:通过所述处理器将所述缓存单元中各日志文件按照存储时刻的先后顺序依次进行删除,直到所述缓存单元的剩余容量大于所述预设容量。
具体的,即当缓存单元剩余容量低于额定容量的30%时,为了防止后续日志文件存储至缓存单元出错,需要删除一部分已有的日志文件,从而释放缓存单元的存储空间;本实施例中,将将缓存单元中各日志文件按照存储时刻的先后顺序依次进行删除,即存储时刻越早的日志文件,越先删除,这样能够保证更新的日志文件的保持时间更久,也更利于管理人员对于日志文件的提取和分析。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第四实施例中,基于第一实施例,步骤S130包括如下步骤:
步骤S410:通过所述带外存储管理控制器获取当前时刻所述缓存单元中所有的日志文件,并标记为待转移文件,以及各待转移文件对应的存储时刻。
步骤S420:通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元。
本实施例给出了将缓存单元中的日志文件转存至非易失存储单元的具体方案,即按照各待转移文件对应的存储时刻的先后顺序依次反序存储,即最近时刻的日志文件优先存储至非易失存储单元,因最近时刻的日志文件更能够反馈出VPX机箱的刀片服务器出现运行异常时刻的运行情况,故优先存储这些日志文件,以优先保证这些日志文件的安全。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第五实施例中,基于第四实施例,步骤S420还包括如下步骤:
步骤S510:在通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元的过程中,通过所述带外存储管理控制器判断所述缓存单元中是否新增写入了日志文件。
具体的,这里的新增写入的日志文件即是缓存单元在将待转移文件转存至非易失存储单元的过程中,处理器新存入缓存单元的日志文件(也就是VPX机箱的刀片服务器处于运行异常状态时产生的日志文件),这些日志文件相比待转移文件是更新更重要的日志文件。
若是,执行步骤S520:通过所述操作系统新建同步转移线程,其中,所述同步转移线程用于于所述非易失存储单元创建第一空间,并通过所述操作系统将所述VPX机箱的刀片服务器处于运行异常状态时产生的日志文件直接写入所述非易失存储单元的第一空间。
具体的,为了保障这些新增写入的日志文件的数据安全,在通过带外存储管理控制器将待转移文件按照存储时刻的先后顺序依次反序存储至非易失存储单元的过程中,直接启用同步转移线程,以通过操作系统将VPX机箱的刀片服务器处于运行异常状态时产生的日志文件直接写入所述非易失存储单元的第一空间。
建立第一空间,是为了将VPX机箱的刀片服务器处于运行异常状态时产生的日志文件与其他日志文件进行区别,以便于后续优选提取。
步骤S420,之后还包括:
步骤S530:通过所述带外存储管理控制器将所述缓存单元中已经存储至所述非易失存储单元的日志文件标记为已转存文件。
具体的,当缓存单元中的待转移文件已经全部转存至非易失存储单元后,就将缓存单元中已经存储至所述非易失存储单元的日志文件标记为已转存文件。
步骤S540:通过所述带外存储管理控制器实时判断所述缓存单元中是否存在除所述已转存文件之外的其他日志文件。
具体的,再通过带外存储管理控制器实时判断缓存单元中是否存在除已转存文件之外的其他日志文件,实际上,这的其他日志文件,就是在缓存单元将待转移文件全部存储至非非易失存储单元后,处理器继续向缓存单元写入的日志文件,这些日志文件同样需要写入非易失存储单元以进行安全备份。
若是,执行步骤S550:通过所述带外存储管理控制器将所述缓存单元中除所述已转存文件之外的其他日志文件存储至所述非易失存储单元,直至所述VPX机箱的刀片服务器未处于运行异常的状态,或处于异常掉电状态。
具体的,在缓存单元将待转移文件全部存储至非非易失存储单元后,处理器继续向缓存单元写入的日志文件,这些日志文件同样需要写入非易失存储单元以进行安全备份,直到VPX机箱的刀片服务器未处于运行异常的状态(即处于运行正常的状态,此时即不再需要备份日志文件),或处于异常掉电状态(此时处理器已经掉电,无法继续于缓存单元写入日志文件)。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第六实施例中,基于第五实施例,步骤S550,之后还包括如下步骤:
步骤S610:通过所述带外存储管理控制器判断所述VPX机箱的刀片服务器是否处于异常掉电状态。
若是,执行步骤S620:通过所述带外存储管理控制器判断所述缓存单元中所有的日志文件是否均已存储至所述非易失存储单元。
具体的,若VPX机箱的刀片服务器处于异常掉电状态,则处理器不会再于缓存单元写入新的日志文件。
步骤S630:若所述缓存单元中所有的日志文件均已存储至所述非易失存储单元,通过所述带外存储管理控制器控制所述纽扣电池不再给所述缓存单元供电。
具体的,在VPX机箱的刀片服务器处于异常掉电状态的情况下,且若缓存单元中所有的日志文件均已存储至非易失存储单元,那么缓存单元暂时就不会有作用了,为了节约独立供电单单元的电能,以便于管理人员后续于非易失存储单元中提取日志文件,可以直接断开缓存单元的供电。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第七实施例中,基于第五实施例,所述状态侦测组件和所述处理器通信连接;所述状态侦测组件包括设置于带外日志管理模块的电压传感器和电流传感器;本实施例还包括如下步骤:
步骤S710:通过所述处理器获取设置于带外日志管理模块的电压传感器实时采集的所述缓存单元和所述非易失存储单元的运行电压。
步骤S720:通过所述处理器获取设置于带外日志管理模块的电流传感器实时采集的所述缓存单元和所述非易失存储单元的运行电流。
步骤S730:通过所述处理器判断是否满足如下条件:所述运行电压落入正常电压区间,且所述运行电流落入正常电流区间。
若否,执行步骤S740:确定带外日志管理模块处于异常运行状态。
步骤S750:所述处理器于所述业务存储单元创建第二空间,并将所述非易失存储单元中存储的日志文件复制写入所述第二空间,以形成备份。
具体的,若带外日志管理模块处于异常运行状态,则该模块中非易失存储单元中存储的日志文件同样具有丢失的风向,为了保证数据安全,可直接于业务存储单元创建第二空间,并将非易失存储单元中存储的日志文件复制写入第二空间,以形成备份。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第八实施例中,基于第五实施例,本实施例还包括如下步骤:
步骤S810:将外界设备与所述带外日志管理模块建立通信连接。
步骤S820:通过所述带外存储管理控制器获取外界设备发送的提取指令。
步骤S830:通过所述带外存储管理控制器基于所述提取指令将所述非易失存储单元中存储的日志文件全部复制写入所述外界设备,其中,将非易失存储单元中存储的日志文件写入外界设备的过程中,优先复制第一空间中的日志文件。
具体的,本实施例给出了管理人员通过外界设备来提取非易失存储单元中存储的日志文件的具体方案。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第九实施例中,基于第八实施例,步骤S830,之后还包括如下步骤:
步骤S910:通过所述带外存储管理控制器将所述非易失存储单元中已经复制写入所述外界设备的日志文件标记为已提取文件。
步骤S920:通过所述带外存储管理控制器每隔预设时长(例如一个星期)判断所述非易失存储单元的剩余容量是否小于所述缓存单元的额定容量。
若是,执行步骤S930:将所述已提取文件删除。
具体的,若非易失存储单元的剩余容量小于所述缓存单元的额定容量,则说明非易失存储单元的剩余容量不足,需要释放空间,故可直接删除已提取文件删除。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第十实施例中,基于第九实施例,步骤S930,之后还包括如下步骤:
步骤S1010:通过所述带外存储管理控制器判断所述非易失存储单元的剩余容量是否仍然小于所述缓存单元的额定容量。
若是,执行步骤S1020:通过所述带外存储管理控制器获取所述非易失存储单元中所有的日志文件,以及各日志文件对应的存储时刻。
具体的,若是,说明删除已提取文件后非易失存储单元的剩余容量仍然不足,需要进一步删除文件以释放空间。
步骤S1030:通过所述带外存储管理控制器将所述非易失存储单元中各日志文件按照存储时刻的先后顺序依次进行删除,直到所述非易失存储单元的剩余容量大于所述缓存单元的额定容量。
为此,可将非易失存储单元中各日志文件按照存储时刻的先后顺序依次进行删除,直到所述非易失存储单元的剩余容量大于所述缓存单元的额定容量;因相对而言,存储时刻越早的日志文件,其重要程度越低。
在本发明提出的一种VPX机箱的刀片服务器带外日志存储方法的第十一实施例中,基于第一实施例,所述带外日志管理模块还包括无线通信单元;所述无线通信单元用于和移动终端进行通信(这里的移动终端由管理人员随身携带);本实施例还包括如下步骤:
步骤S1110:通过所述带外存储管理控制器实时获取所述纽扣电池的剩余电量。
步骤S1120:通过所述带外存储管理控制器判断所述剩余电量是否小于预设值(这里的预设值优选为纽扣电池最大电量的20%)。
若是,执行步骤S1130:通过所述带外存储管理控制器生成续航预警信息,并通过所述无线通信单元将所述续航预警信息发送至所述移动终端。
本实施例的目的,在于当纽扣电池出现电量不足时,给管理人员及时提醒。
本发明还提出一种VPX机箱的刀片服务器带外日志存储系统,应用于如上述任一项所述的VPX机箱的刀片服务器带外日志存储方法;所述系统包括VPX机箱的刀片服务器和带外日志管理模块;所述VPX机箱的刀片服务器包括处理器、主板和业务存储单元;所述VPX机箱的刀片服务器运行有操作系统;所述带外日志管理模块包括纽扣电池、缓存单元、带外存储管理控制器、非易失存储单元和状态侦测组件;所述业务存储单元和所述缓存单元均与所述处理器通信连接;所述纽扣电池用于给所述缓存单元、所述带外存储管理控制器、所述非易失存储单元和所述状态侦测组件进行供电;所述状态侦测组件、所述缓存单元和所述非易失存储单元均与所述带外存储管理控制器通信连接;所述缓存单元和所述非易失存储单元通信连接。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

Claims (10)

1.一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,应用于VPX机箱的刀片服务器带外日志存储系统,所述系统包括VPX机箱的刀片服务器和带外日志管理模块;所述VPX机箱的刀片服务器包括处理器、主板和业务存储单元;所述VPX机箱的刀片服务器运行有操作系统;所述带外日志管理模块包括纽扣电池、缓存单元、带外存储管理控制器、非易失存储单元和状态侦测组件;所述业务存储单元和所述缓存单元均与所述处理器通信连接;所述纽扣电池用于给所述缓存单元、所述带外存储管理控制器、所述非易失存储单元和所述状态侦测组件进行供电;所述状态侦测组件、所述缓存单元和所述非易失存储单元均与所述带外存储管理控制器通信连接;所述缓存单元和所述非易失存储单元通信连接;所述方法,包括:
通过所述处理器将操作系统于所述VPX机箱的刀片服务器运行时产生的日志文件同步存储至所述业务存储单元和所述缓存单元;
通过状态侦测组件实时监测所述VPX机箱的刀片服务器是否处于运行异常的状态;
若是,通过所述带外存储管理控制器将所述缓存单元中的保存的日志文件存储至所述非易失存储单元。
2.根据权利要求1所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,所述状态侦测组件包括设置于主板的电压传感器和电流传感器;所述通过状态侦测组件实时监测所述VPX机箱的刀片服务器是否处于运行异常的状态,包括:
通过所述带外存储管理控制器获取设置于主板的电压传感器实时采集的所述主板的工作电压;
通过所述带外存储管理控制器获取设置于主板的电流传感器实时采集的所述主板的工作电流;
通过所述带外存储管理控制器判断是否满足如下条件:所述工作电压落入正常电压区间,且所述工作电流落入正常电流区间;
若是,确定所述VPX机箱的刀片服务器未处于运行异常的状态;
若否,确定所述VPX机箱的刀片服务器处于运行异常的状态。
3.根据权利要求1所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,还包括:
通过所述处理器获取所述缓存单元的剩余容量;
通过所述处理器判断所述剩余容量是否小于预设容量;
若是,通过所述处理器获取所述缓存单元中所有的日志文件,以及各日志文件对应的存储时刻;
通过所述处理器将所述缓存单元中各日志文件按照存储时刻的先后顺序依次进行删除,直到所述缓存单元的剩余容量大于所述预设容量。
4.根据权利要求1所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,所述通过所述带外存储管理控制器将所述缓存单元中的保存的日志文件存储至所述非易失存储单元,包括:
通过所述带外存储管理控制器获取当前时刻所述缓存单元中所有的日志文件,并标记为待转移文件,以及各待转移文件对应的存储时刻;
通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元。
5.根据权利要求4所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,所述通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元,还包括:
在通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元的过程中,通过所述带外存储管理控制器判断所述缓存单元中是否新增写入了日志文件;
若是,通过所述操作系统新建同步转移线程,其中,所述同步转移线程用于通过所述操作系统将所述VPX机箱的刀片服务器处于运行异常状态时产生的日志文件直接写入所述非易失存储单元的第一空间;
所述通过所述带外存储管理控制器将所述待转移文件按照存储时刻的先后顺序依次反序存储至所述非易失存储单元,之后还包括:
通过所述带外存储管理控制器将所述缓存单元中已经存储至所述非易失存储单元的日志文件标记为已转存文件;
通过所述带外存储管理控制器实时判断所述缓存单元中是否存在除所述已转存文件之外的其他日志文件;
若是,通过所述带外存储管理控制器将所述缓存单元中除所述已转存文件之外的其他日志文件存储至所述非易失存储单元,直至所述VPX机箱的刀片服务器未处于运行异常的状态,或处于异常掉电状态。
6.根据权利要求1所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,所述状态侦测组件和所述处理器通信连接;所述状态侦测组件包括设置于带外日志管理模块的电压传感器和电流传感器;所述方法,还包括:
通过所述处理器获取设置于带外日志管理模块的电压传感器实时采集的所述缓存单元和所述非易失存储单元的运行电压;
通过所述处理器获取设置于带外日志管理模块的电流传感器实时采集的所述缓存单元和所述非易失存储单元的运行电流;
通过所述处理器判断是否满足如下条件:所述运行电压落入正常电压区间,且所述运行电流落入正常电流区间;
若否,确定带外日志管理模块处于异常运行状态;
所述处理器于所述业务存储单元创建第二空间,并将所述非易失存储单元中存储的日志文件复制写入所述第二空间,以形成备份。
7.根据权利要求5所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,还包括:
将外界设备与所述带外日志管理模块建立通信连接;
通过所述带外存储管理控制器获取外界设备发送的提取指令;
通过所述带外存储管理控制器基于所述提取指令将所述非易失存储单元中存储的日志文件全部复制写入所述外界设备,其中,将非易失存储单元中存储的日志文件写入外界设备的过程中,优先复制第一空间中的日志文件。
8.根据权利要求7所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,所述通过所述带外存储管理控制器基于所述提取指令将所述非易失存储单元中存储的日志文件全部复制写入所述外界设备,之后还包括:
通过所述带外存储管理控制器将所述非易失存储单元中已经复制写入所述外界设备的日志文件标记为已提取文件;
通过所述带外存储管理控制器每隔预设时长判断所述非易失存储单元的剩余容量是否小于所述缓存单元的额定容量;
若是,将所述已提取文件删除。
9.根据权利要求8所述的一种VPX机箱的刀片服务器带外日志存储方法,其特征在于,所述将所述已提取文件删除,之后还包括:
通过所述带外存储管理控制器判断所述非易失存储单元的剩余容量是否仍然小于所述缓存单元的额定容量;
若是,通过所述带外存储管理控制器获取所述非易失存储单元中所有的日志文件,以及各日志文件对应的存储时刻;
通过所述带外存储管理控制器将所述非易失存储单元中各日志文件按照存储时刻的先后顺序依次进行删除,直到所述非易失存储单元的剩余容量大于所述缓存单元的额定容量。
10.一种VPX机箱的刀片服务器带外日志存储系统,其特征在于,应用于如权利要求1-9中任一项所述的VPX机箱的刀片服务器带外日志存储方法;所述系统包括VPX机箱的刀片服务器和带外日志管理模块;所述VPX机箱的刀片服务器包括处理器、主板和业务存储单元;所述VPX机箱的刀片服务器运行有操作系统;所述带外日志管理模块包括纽扣电池、缓存单元、带外存储管理控制器、非易失存储单元和状态侦测组件;所述业务存储单元和所述缓存单元均与所述处理器通信连接;所述纽扣电池用于给所述缓存单元、所述带外存储管理控制器、所述非易失存储单元和所述状态侦测组件进行供电;所述状态侦测组件、所述缓存单元和所述非易失存储单元均与所述带外存储管理控制器通信连接;所述缓存单元和所述非易失存储单元通信连接。
CN202211589638.4A 2022-12-12 2022-12-12 一种vpx机箱的刀片服务器带外日志存储方法及系统 Active CN115576783B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211589638.4A CN115576783B (zh) 2022-12-12 2022-12-12 一种vpx机箱的刀片服务器带外日志存储方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211589638.4A CN115576783B (zh) 2022-12-12 2022-12-12 一种vpx机箱的刀片服务器带外日志存储方法及系统

Publications (2)

Publication Number Publication Date
CN115576783A CN115576783A (zh) 2023-01-06
CN115576783B true CN115576783B (zh) 2023-03-14

Family

ID=84590710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211589638.4A Active CN115576783B (zh) 2022-12-12 2022-12-12 一种vpx机箱的刀片服务器带外日志存储方法及系统

Country Status (1)

Country Link
CN (1) CN115576783B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577121A (zh) * 2013-11-05 2014-02-12 中船重工(武汉)凌久电子有限责任公司 一种基于nand flash的高可靠线性文件存取方法
CN105117308A (zh) * 2015-09-29 2015-12-02 联想(北京)有限公司 一种数据处理方法、装置和系统
CN108491058A (zh) * 2018-04-03 2018-09-04 郑州云海信息技术有限公司 一种非易失性内存的异常掉电数据保护方法及装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9223642B2 (en) * 2013-03-15 2015-12-29 Super Talent Technology, Corp. Green NAND device (GND) driver with DRAM data persistence for enhanced flash endurance and performance
US20170091042A1 (en) * 2015-09-25 2017-03-30 Quanta Computer Inc. System and method for power loss protection of storage device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577121A (zh) * 2013-11-05 2014-02-12 中船重工(武汉)凌久电子有限责任公司 一种基于nand flash的高可靠线性文件存取方法
CN105117308A (zh) * 2015-09-29 2015-12-02 联想(北京)有限公司 一种数据处理方法、装置和系统
CN108491058A (zh) * 2018-04-03 2018-09-04 郑州云海信息技术有限公司 一种非易失性内存的异常掉电数据保护方法及装置

Also Published As

Publication number Publication date
CN115576783A (zh) 2023-01-06

Similar Documents

Publication Publication Date Title
CN112928348B (zh) 电池热失控的检测方法、装置、系统和电池管理单元
CN113246887B (zh) 一种时序电路控制方法、装置、电子设备及存储介质
CN114281788A (zh) 一种bmc固件数据提取方法、装置、终端及存储介质
CN115407943A (zh) 一种内存转储文件生成方法、装置、设备及可读存储介质
CN102339264A (zh) 一种星载电子系统设备即插即用控制方法及系统
CN113672306B (zh) 服务器组件自检异常恢复方法、装置、系统及介质
CN114816022A (zh) 一种服务器电源异常监控方法、系统及存储介质
CN115576783B (zh) 一种vpx机箱的刀片服务器带外日志存储方法及系统
CN111726563A (zh) 一种用于列车视频监控系统的视频存储装置
CN113685284A (zh) 一种电动燃油泵控制方法、装置、设备及存储介质
CN111124455A (zh) 一种电池管理系统升级方法、装置、服务器及存储介质
CN115098294B (zh) 异常事件的处理方法、电子设备及管理终端
CN115934616A (zh) 串口信息保存方法、装置、服务器、电子设备和存储介质
CN113268205B (zh) 一种车载数据存储方法、装置及车载电子设备
CN114489509A (zh) 行车记录仪的视频存储方法、装置、电子设备及存储介质
CN113540520A (zh) 一种双电堆的异步启动方法及装置
CN114661132B (zh) 一种电量监测方法、装置、打印机及存储介质
CN111542048A (zh) 侦码设备采集功能重启方法、装置、服务器及存储介质
CN110519558A (zh) 视频数据的处理方法及其主板管理控制器
CN116204502B (zh) 一种高可用性的nas存储服务方法及系统
CN106331036B (zh) 一种服务器控制方法及装置
CN114290907B (zh) 车辆电池温度异常处理方法和装置
CN113687710B (zh) 一种固定翼无人机的飞控管理计算机掉电处理方法及系统
CN218383807U (zh) 一种基于服务器的储电供电装置
CN117648055A (zh) 存储装置的坏块管理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant